Как упростить процесс транскрибации (расшифровки аудио- и видеозаписей)
Транскрибация — это расшифровка аудио- и видеоматериалов, их содержимое, переведённое в текст. То, о чём говорится в таких материалах, дословно или с определённой степенью цензуры отображается в текстовом документе. В этой статье будем говорить о способах упрощения транскрибации на компьютере. Казалось бы, что сложного в процессе расшифровки? Берёшь удобный медиаплеер, периодически приостанавливаешь запись и переписываешь услышанное.
1. Сложности транскрибации
Но нет, всё не так просто. Иначе заинтересованные в такой услуге лица не искали бы удалённых сотрудников на биржах фриланса.
Во-первых, не каждый сможет выполнить такую работу. Нужен выдержанный, усидчивый, способный к длительной концентрации внимания человек. Для справки: на расшифровку 1-го часа записи уходит порядка 5-ти часов.
Во-вторых, не всегда для расшифровки поставляется качественный исходник, а это, соответственно, усложняет процесс транскрибации. В таких случаях исполнитель должен быть ещё и технически подкован, чтобы решить вопрос с устранением помех записи.
В-третьих, если речь идёт о создании расшифровки для публичных целей, за выполнение работы должен взяться человек грамотный, со знанием речи. В качестве исходника редко когда поставляются студийные записи с чёткой речью диктора. Чаще расшифровывать приходится рабочие материалы — интервью, семинары, вебинары, лекции, диктовки, прослушки, протоколы заседаний и т.п. Вживую же люди говорят так, как они говорят. Исполнителю нужно ещё и перефразировать их речь – убрать диалект, междометия, слова-паразиты, мат, построить предложения грамотно, оставив суть сказанного той же.
Транскрибация – процесс ресурсоёмкий. Постоянное переключение внимания от одной задачи к другой, от одного программного окна к другому быстро истощает силы. Можно ли как-то упростить этот процесс? Увы, идеального способа автоматизации этого процесса пока что не существует. Справиться с такой задачей может только человек.
Но его работу можно упростить с помощью отдельных программных средств.
2. Windows Snap
Для удобства работы с двумя программными окнами – медиаплеера и текстового редактора – в среде современных версий Windows можно прибегнуть к функции эффективного задействования пространства экрана Snap . Окно плеера крепим к одной части экрана, окно редактора – к другой.
Совет: при расшифровке аудиоматериалов лучше использовать плееры с крупными элементами управления, как, например, приложение «Музыка Groove», поставляемое вместе с Windows 10.
3. Штатный видеоплеер Windows 10
При транскрибации видеозаписей можно задействовать компактный режим штатного видеоплеера Windows 10 – приложения «Кино и ТВ». В компактном режиме плеер превращается в закреплённое поверх других окон мини-окошко с ограниченным перечнем элементов управления. Но в этом перечне будут все нужные для работы кнопки – приостановка видео, шаги назад и вперёд.
Совет: если исходником является видео, чтобы не отвлекаться на видеоряд, можно извлечь звук в аудиофайл. И работать уже с ним. Такие операции умеют проводить программы-медиаконвертеры, к примеру, бесплатные Convertilla и Freemake Video Converter. А программы типа Adobe Audition или её бесплатного аналога Audacity помогут улучшить качество звучания, если исходное оставляет желать лучшего.
4. Сторонние видеоплееры
Сторонние видеоплееры для Windows, такие как, например, KMPlayer, GOM, VLC, предложат больший функционал, который, в частности, может быть задействован при транскрибации:
• Настраиваемые шаги вперёд и назад;
• Регулировка скорости воспроизведения;
• Установка закладок;
• Настраиваемая панель элементов управления;
• Настраиваемые горячие клавиши.
Совет: некоторые исполнители предпочитают не приостанавливать исходник, а замедлять его воспроизведение для написания под диктовку. Это не лучшая идея в целях оптимизации транскрибации. При написании диктанта важны паузы, разграничивающие даже части предложений. Плюс к этому, наше сознание входит в резонанс с замедленным воспроизведением, а это, соответственно, тормозит работу ума и набор текста.
5. Программа Express Scribe
Express Scribe – программа, специально созданная для транскрибации. В верхней части её интерфейса находится поле для добавления медиафайлов, в нижней – проигрыватель и текстовый редактор. В числе её преимуществ:
• Единое окно для работы с исходниками и текстом;
• Поддержка большого перечня медиаформатов;
• Функции замедления и ускорения проигрываемых файлов;
• Перемотка;
• Улучшение качества звучания;
• Горячие клавиши, а также возможность задействования для отдельных функций ножных педалей геймерского руля;
• Сохранение исходников и их расшифровки как проектов программы;
• Экспорт набранного текста в Microsoft Word.
Недостатки Express Scribe – отсутствие поддержки русского языка интерфейса и активное навязывание создателями программы платных её редакций при работе с бесплатной.
6. Сервисы голосового ввода данных
Веб-сервисы, предлагающие возможность голосового ввода данных – пожалуй, самый оптимальный способ упрощения транскрибации. Особенно подойдёт тем, чья скорость печати оставляет желать лучшего. Принцип работы здесь прост: запоминаем отрывки текста, повторяем их в микрофон и попутно проводим коррекцию текста – исправляем ошибки и вставляем знаки препирания.
Механизмом распознавания речи оснащён веб-сервис «Google Документы». Создаваемые в этом онлайн-редакторе документы можно надиктовывать с использованием инструмента «Голосовой ввод».
Инструмент поддерживает огромный перечень языков, включая русский. Однако он не предусматривает настройку автоотключения ввода данных. Если не говорить в микрофон пару секунд, голосовой ввод отключается. И его нужно постоянно включать вручную.
Другой веб-сервис – «Голосовой блокнот Speechpad.ru» — будет в разы эффективнее, поскольку это узкопрофильный проект, и распознавание речи является его основным направлением. Для ввода голосовых данных в форме сервиса необходимо нажать кнопку включения записи. Текст правится в результирующем поле. Внизу этого поля присутствует кнопка «+Транскрибация».
Она добавляет в форму сервиса возможность воспроизведения аудио- и видеоисходников для работы в одном программном окне. Например, чтобы сделать расшифровку ролика на YouTube, в форме сервиса необходимо выбрать его медиатип и вставить в соответствующее поле ID (часть веб-адреса после знака «=») .
Сервис кроме русского поддерживает ещё несколько других языков.
Совет: Speechpad.ru умеет распознавать два знака препинания – точку и запятую. Их можно проговаривать.
Недостаток такого способа транскрибации – несовершенство механизма распознавания человеческой речи. Сколькие из мобильных пользователей, вдоволь наигравшись с «Ок, Google» при вводе поисковых запросов, пришли к тому, что проще отыскать что-то по старинке, с помощью клавиатуры. Какой бы сервис ни использовался, всё равно в процессе работы придётся делать паузы и отслеживать распознанный текст мелкими блоками.
7. Автоматизация транскрибации
Процесс голосового ввода данных при транскрибации можно упростить по максимуму, настроив системное звучание в качестве источника звукозаписи и, соответственно, убрав из цепочки действий проговаривание услышанного в микрофон. Естественно, в случае с проблемными исходниками такой вариант не подойдёт. В итоге получим нечитаемую белиберду, которую проще будет переписать заново, чем редактировать. Если же запись более-менее качественная, попробовать стоит.
Вызываем контекстное меню на значке звука в области задач Windows, выбираем «Звуки». В появившемся окошке с помощью опций в контекстном меню отключаем микрофон и включаем стереомикшер.
Далее воспроизводим видео или аудио и расшифровываем его с помощью веб-сервиса Speechpad.ru.
Однако процесс всё равно нужно контролировать: вникать в суть информации, периодически приостанавливать воспроизведение для коррекции расшифровки, проставлять знаки препирания.
8. И самое главное …
Осуществлять транскрибацию на ноутбуке с его хрипящим динамиком проблематично. Однако в особо сложных случаях не поможет и хорошая аудиосистема. Для постоянной работы по расшифровке аудио лучше обзавестись наушниками. А если работа проводится путём распознавания речи, возможно, стоит присмотреть себе качественную гарнитуру Hands Free .
Источник: www.white-windows.ru
Как настроить программу Express Scribe для распознавания устной речи
В отличие от английского, программы для автоматического распознавания речи на русском языке допускают много ошибок. Если вам время от времени приходится записывать аудио в текст, вам пригодится программа для транскрибации Express Scribe Transcription Software.
Для чего эта программа
На первый взгляд может показаться, что такая программа не нужна, потому что все равно придется самостоятельно набирать текст. Однако она может сократить время работы примерно в два раза, так как вы не теряете время на перемотке/переслушивании аудио, переключении с мышки на клавиатуру и так далее.
Express Scribe удобна по двум причинам:
- Гибкая настройка скорости речи, то есть вы можете замедлить дорожку до того темпа, в котором будет удобно набирать текст.
- Горячие клавиши, которыми удобно перематывать, останавливать и запускать аудио на клавиатуре.
Как выглядит программа
Программа условно бесплатная. Скачиваем с официального сайта по этой ссылке.
Бесплатного набора функций вполне хватает для работы. Единственное, если вы захотите затранскрибировать видео, вам нужно будет перевести его в формат mp3.
В программе есть поле для ввода текста, но им неудобно пользоваться: шрифт мелкий, нет привычного расстояния между абзацами, автоисправления и т. д. Поэтому текст лучше набирать в любом привычном текстовом редакторе, тем более что горячие клавиши работают, даже когда программа свернута в трей.
Как настроить горячие клавиши
Чтобы настроить горячие клавиши, выберите меню Options — System-Wide Hot-Keys.
Появится меню настройки горячих клавиш.
Источник: teletype.in
Express Scribe
Express Scribe — это простое приложение, разработанное для транскрипции аудио записей в текст. Оно станет полезным инструментом для студентов, журналисток и всех, кому часто приходится писать тексты под диктовку.
Помощник наборщика текстов
Приложение позволяет контролировать скорость речи с помощью специальных педалей, подключенных к компьютеру или горячих клавиш. Например, можно настроить паузы в аудио записи, чтобы было проще записывать и проверять написанный текст.
Express Scribe поддерживает аудиозаписи в формате MP3, WAV, MPEG, OGG, RM, AVI, FLV и многих других. Она так же работает с аудиодискомами, что пригодится для написания/перевода текстов песен. Плюс программа умеет скачивать записи из Интернета, почтовых вложений или локальной сети, а также устанавливать для каждого файла сроки выполнения и делать закладки.
В программе имеются и функции, с помощью которых можно попробовать улучшить качество звука. Они включают в себя устранение фоновых шумов и усиление громкости, настройка чистоты звука и пр. Еще одна крайне полезная функция, которая может в значительной степени облегчить работу человека — распознавание речи и автоматическое создание черновых транскрипций. Вы можете бесплатно скачать Express Scribe для Windows с freeSOFT.ru.
Источник: freesoft.ru
Компьютерная программа Express Scribe — отзыв
Есть такая замечательная программа для аудиотранскрибации – Express Scribe. Она позволяет переводить аудиофайлы в текстовый формат, не автоматически, конечно, но значительно облегчает работу. Расскажу подробнее, как с ней работать.
Итак, расшифровка аудио в текст в Express Scribe Transcription Software Pro v 5.78 происходит следующим образом:
1. Скачиваем бесплатно пробную версию программы с официального сайта [ссылка].
Интерфейс у программы англоязычный, но вполне понятный. Главный минус программы — через пару-тройку загрузок она перестает работать и предлагает скачать платную версию, чего мне лично делать вообще не хочется. Но! Это дело можно обойти, просто-напросто удалив программу и поставив ее заново. Так что не удаляйте дистрибутив, пригодится!
2. Далее загружаем нужную аудиозапись – можно просто кинуть файл в верхнее окошко и готово.
Тут же видим название нашего файла, длительность звучания, дату и время его создания. Какие форматы аудио поддерживает программа? Express Scribe поддерживает следующие форматы:
MP3, WAV, AU, VOX, AIF, Windows Media, Recorder (MSV, DVF), Philips Digital Recorder, VoiceIt, Sanyo Digital Recorder, DSP TrueSpeech, RealAudio (RA и RM), Olympus, Lanier https://irecommend.ru/content/kak-perevesti-audio-v-tekst» target=»_blank»]irecommend.ru[/mask_link]