Работа с программой ELAN ELAN – это очень удобная программа для аннотации аудио- или видео-записей Программа ELAN – разработана в НИИ Психолингвистики им. Макса Планка в Неймегене, Голландия, специально для архивирования записей языков, находящихся под угрозой исчезновения, в рамках проектов Фонда Фольксвагена ELAN можно бесплатно скачать со следующего сайта, где можно скачать также и другие программы, полезные в работе лингвиста: http://www.mpi.nl/research/research-projects/language-archiving-technology/tools В ELANе можно работать либо с аудиофайлом, либо с аудио- и видеофайлом вместе → последнее требует Фонд Фольксвагена 1) Создать новый файл: открыть ELAN File New Открывается окно, где нужно выбрать аудио- и/или видеофайл, который должен быть обработан.
Нужно найти нужный файл (или нужные файлы) и выбрать его с помощью стрелок [>>] в середине окна, потом нажать ОК. Если Вы хотите работать с аудио- и видеофайлом вместе, нужно сначала выбрать аудиофайл (.wav), потом выбрать видеофайл (.mpg). Открывается главное окно ELANa, где видно либо только звуковые волны (если выбрали только аудиофайл), либо звуковые волны и видео (если выбрали аудио- и видеофайл).
ФЛЕКСИНГ БРОВЕЙ | Инновационная система от ELAN
Под звуковыми волнами есть место для аннотаций. Чтобы создать уровни для аннотации, нужно сначала определить их структуру – в ELANе это называется их «тип». Есть 2 основных типа аннотаций: независимые (которые связаны прямо со звуковым файлом во времени) и зависимые (которые связаны не со звуком, а с другой аннотацией); например: орфографическая транскрипция = независимый тип аннотаций, потому что она связана прямо со звуком перевод = зависимый тип аннотаций, потому что он связан с транскрибированным предложением В ELANе надо сначала определить типы: Type Add new linguistic type Нужно назвать типы, и потом дать им «стереотип»
Место для аннотации
главные стереотипы = None (независимый тип, аннотация связана прямо со звуком, например для транскрипции), и Symbolic Association (зависимый тип, аннотация связана с другой аннотацией, например для перевода)
После того, как назвали и выбрали стереотип, нужно нажать Add, чтобы этот тип добавился:
Когда типы определены, можно определить уровни аннотации = tiers. Tiers Add new tier Каждый уровень получает определенный тип, например аннотация с эвенской орфографией = тип transcription, и аннотация с русским переводом = perevod.
Теперь нужно таким же образом дать название уровням; при этом необходимо определить выше-стоящий уровень (parent tier) и тип.
Нужно сохранить файл: File Save as. 2) Вводить аннотации Чтобы начать вводить аннотации, нужно сначала активировать тот уровень аннотации, в который Вы хотите вводить аннотации; активированный уровень = красный (на следующем фото – уровень ev для транскрибирования – активынй)
Потом нужно выделить тот кусок речи, который Вы хотите аннотировать – одно предложение, например. В этом помогает звуковая волна, где можно видеть снижающуюся интонацию, или речевые паузы.
Обзор ELAN / Колористика красителя для бровей
После этого в активированном уровне при двойном клике мышкой по выделенному фрагменту открывается окно для аннотации, куда можно вписать транскрипции (перевод, комментарий etc..).
Сохранить написанное: Strg+enter (ввод)
выделенный фрагмент = голубой
Чтобы воспроизвести звук только выделенного отрывка, можно нажать на кнопку >S ОЧЕНЬ ВАЖНО: аннотации должны быть неотрывными, поэтому нужно маркировать следующий кусочек, начиная чуть-чуть перед концом первого:
Скорость речи можно снижать через Rate – если передвинуть стрелку налево, то речь замедляется. Чтобы сохранить файлы во время работы: Strg+S (или File Save).
перекрытие конца одной аннотации началом следующей
Источник: pdfslide.net
Name already in use
A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
Cancel Create
lingdata / practicum-elan.md
- Go to file T
- Go to line L
- Copy path
- Copy permalink
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Cannot retrieve contributors at this time
185 lines (154 sloc) 16.5 KB
- Open with Desktop
- View raw
- Copy raw contents Copy raw contents Copy raw contents
Copy raw contents
Разметка мультимедийных данных в системе ELAN
ELAN — система для разметки мультимедийных (аудио- и видео-) данных, созданная в Институте Макса Планка в Неймегене (Нидерланды). Позволяет создавать слои разметки разных типов, определяемых пользователем. В ELAN-е часто делают следующие виды разметки:
- письменная расшифровка — с привязкой реплик по времени,
- жесты, мимика, направление взгляда (для видео),
- лексемы, грамматическая аннотация (глоссирование для полевых данных на малых языках),
- фонетическая транскрипция (для малых языков).
Файлы для работы
Скачайте программу ELAN со страницы Института М. Планка (основная версия, не Simple!), а также Образец разметки
На семинаре вы можете размечать свое видео или скачать Видео сказки.
1. Знакомство с системой
Запустите программу
(исполняемый файл .jnlp, согласитесь, что вы доверяете источнику, из которого получен файл),
затем откройте файл с аннотацией.
- Файл >> Открыть >> выберите в проводнике файл с аннотацией .eaf.
Подождите некоторое время, пока загрузятся файлы (одновременно загружаются и аннотация, и файлы видео и/или аудио), изучите структуру слоев разметки, запустите видео, чтобы посмотреть, как синхронизируется видео и слои разметки.
- окно видео
- окно настроек (можно замедлять воспроизведение)
- окно аудиопотоков/осциллограм
- несколько слоев разметки
Все можно масштабировать.
Независимые и связанные с родительским слои:
- принцип Time Subdivision (например, реплика членится на отдельные слова — слой не может выходить за границы начала/конца родителя),
- принцип Symbolic Association (временные метки всегда такие же, как у родительского слоя). Представление слоев как иерархии (Вид. ). Активный (редактируемый в данный момент слой) — активация слоев для редактирования двойным кликом, слои также можно скрывать и менять местами.
2. Разметка файла с нуля
Для работы вам понадобится ваш видеофайл (загрузите его на компьютер) и файл с транскрипцией (в формате .txt). Если так случилось, что у вас нет своих материалов, можно использовать следующие файлы для работы: видео
2.0. Откройте ELAN
2.1. Создайте новый пустой файл для аннотации вашего видео и(или) аудио
- Файл -> Новый
В появившемся окне выберите нужный видео/аудио и отправьте его в Выбранные файлы. Нажмите ОК.
Сохраните файл аннотации под своим именем (формат .eaf)
- Файл -> Сохранить
2.2. Импортируйте типы аннотаций из образца .eaf
Можно сразу импортировать все типы слоев из файла образца, который вы скачали с сайта Института Макса-Планка.
- Тип -> Импортировать типы.
Если нужно, так можно создать новые типы с нуля:
* Тип -> Добавьте новый тип слоев Создадим два новых типа: >> text и >> gestures (стереотип у обоих — None). Еще один тип — для интерпретации значения жестов: >> gesture-meaning (должен иметь стереотип Symbolic Association, это зависимый тип, т.к. аннотация значений привязана по времени к аннотации жестов).
2.2. Создайте слои аннотации
Проиграйте мультимедиа с помощью центральной кнопки на панели проигрывателя, определите количество участников речевой ситуации (включая и тех, кто говорит на видео «за кадром»).
- Слои можно импортировать, так же, как типы: Слой -> Импортировать слой.
2.3. Разбейте клип на микрореплики и впишите аннотации для транскриптов
Если нужно, настройте режим замедленного проигрывания видео (90-70%):
- Controls — Скорость/Rate
Чтобы начать вводить аннотации, необходимо активировать нужный слой (двойным кликом — он должен быть подкрашен розовым). Проигрывайте мультимедиа и выделяйте микрореплики — предложения или даже лучше части предложений между паузами.
Кликнув мышкой, установите красную полосу на месте примерного начала микрореплики, а затем, держа нажатой клавишу SHIFT кликните на конце микрореплики (то же можно сделать в режиме drag-and-drop, как будто вы выделяете слова). Кликните на появившемся «отрезке» дважды, откроется область для заполнения аннотации.
Сдвинуть левую/правую границу аннотации: зажав ALT, подвести курсор к границе и подвинуть. Сдвинуть аннотацию: зажав ALT и наведя курсор на аннотацию, подвинуть влево/вправо. Ctrl + Space: проиграть / поставить на паузу. Shift + Space: проиграть выделенное. Ctrl + PageUp/PageDown: промотать вперед/назад.
Уточнять области для аннотации можно с помощью панели прокрутки (например, переместить красную линию на 1 секунду вперед) и находящейся справа панели выделений (переместить красную линию к концу/началу реплики; проиграть реплику; снять выделение).
Аннотируйте реплики говорящих примерно для 30 секунд видео/аудио.
В конце работы сохраните свой файл аннотаций (он будет иметь расширение .eaf)
- Файл -> Сохранить Загрузите файл в репозиторий LiveCorpus на GitHub (создайте его, если нужно).
Список горячих клавиш и команд
Список горячих клавиш и команд
Alt+n – новый элемент разметки на слое
Alt+d – удалить элемент аннотации
Ctrl+Space – запустить/остановить проигрывание медиа файла
Alt+Left – перейти на предыдущую аннотацию
Alt+Right – перейти на следующую аннотацию
Alt+Shift+c – отменить выделение
Alt+Down – перейти на нижнюю аннотацию
Alt+Up – перейти на верхнюю аннотацию
Ctrl+/ – перевести курсор в начало/конец выделения
Ctrl+Alt+t – удалить слой разметки
Ctrl+c – копировать элемент аннотации
Ctrl+b – промотать в начало
Ctrl+e – промотать в конец
Ctrl+Left – перевести курсор на 40 ms раньше
Ctrl+PgDown – промотать вперед на “страницу”
Ctrl+PgUp – промотать назад на “страницу”
Ctrl+Right – перевести курсор на 40 ms позже
Ctrl+Shift+Left – перевести курсор на 10 ms раньше
Ctrl+Shift+Right – перевести курсор на 10 ms позже
Ctrl+Shift+t – добавить новый тип
Ctrl+t – создать новый слой разметки
Ctrl+v – вставить элемент аннотации
Ctrl+w – закрыть один из открытых проектов ELAN
Ctrl+y – повторить действие
Ctrl+z – отменить действие
Edit>Linked files (Ctrl+Alt+l) – добавить или удалить медиа файлы в проект ELAN
Edit>Preferences>Edit Shortcuts – изменить горячие клавиши
File>Automatic Backup – настройка автосохранения резервных копий проектов ELAN
File>Close (Ctrl+w) – закрыть один из открытых проектов ELAN
File>Export as – экспортировать проект ELAN в другие форматы
File>Import – импортироватьв ELANиз Toolbox, FieldWorks, PRAAT, Transcriber, Shoebox, CHAT, Recognizer и CSV-файла; File>New (Ctrl+n) – создать новый проект ELAN
File>Open (Ctrl+o) – открыть один из старых проектов ELAN
File>Print Preview (Ctrl+Alt+p) – настройка печати разметки ELAN
File>Save (Ctrl+s) – сохранить проект ELAN
Options>Annotation Mode – перейти в режим аннотации
Options>Language – изменить язык программной оболочки
Options>Segmentation Mode – перейти в режим сегментации
Options>Transcription Mode – перейти в режим транскрипции
RButton>Change attributes of – настройка параметров слоя разметки
RButton>Conected – отключить/включить связь временной оси разметки и аудио
RButton>Copy annotation (Ctrl+с) – копировать элемент аннотации
RButton>Delete annotation (Alt+d) – удалить элемент аннотации
RButton>Paste annotation (Ctrl+v) – вставить элемент аннотации
RButton>Save current frame as image – сохранить кадр как изображение
RButton>Sort tiers – сортировать слои разметки
RButton>Stereo Chanels>Merged – слияние двух аудиопотоков в один
RButton>Time ruller visible – отключить/включить временную ось
RButton>Vertical zoom – масштабирование амплитудного диапазона осцилограммы
RButton>Visible tiers – скрыть один и больше слоев разметки
RButton>Zoom – масштабирование видео
Shift+Left – перевести курсор на 1 s раньше
Shift+Right – перевести курсор на 1 s позже
Shift+Space – проиграть выделенное
Tier>Add new tier (Ctrl+t) – создать новый слой разметки
Tier>Copy tier – копировать слой разметки
Tier>Delete tier (Ctrl+Alt+t) – удалить слой разметки
Type>Add new linguistic type (Ctrl+Shift+t) – добавить новый лингвистический тип
Type>Change linguistic type – изменить лингвистический тип
Type>Delete linguistic type – удалить лингвистический тип
View>Shortcuts – посмотреть список всех команд, которые заданы горячими клавишами
View>Viewer – включить/выключить отображение каждого из окон просмотра
Window – переключение между разными проектами ELAN
Help>About ELAN>Citing ELAN. – информация о том, как ссылаться на ELAN
- Краткая инструкция по-русски (Brigitte Pakendorf)
- Подробное официальное руководство
- Другие инструкции сторонних разработчиков
- Тьюториал ELAN Г.А.Мороза
- Тьюториал Г.А.Мороза по PRAAT (как визуализировать звуковую дорожку)
- Видео и аудио для образца с сайта ELAN VideoAudio
Источник: github.com