Программы озвучки текста это

Давайте рассмотрим несколько TTS-сервисов, с помощью которых можно организовать озвучку текстов для решения различных задач.

APIHOST: озвучка по очень приятной цене

  • Высокая скорость озвучки. Здесь используются распределенная система, которая разбивает большой текст на фрагменты и обрабатывает их параллельно. Озвучка 100 000 символов здесь занимает, в среднем, 5 минут, в то время как в некоторых аналогичных сервисах на это может уйти несколько часов.
  • Выбор голоса. Пользователям сервиса предлагается более 800 мужских и женских голосов, среди которых 64 русских. Среди них есть, как максимально «человечные», так и очевидно синтезированные программой. Также регулярно добавляются новые голоса.
  • Высота голоса. Может регулироваться в сторону увеличения (от +1.1 до +3.0) и уменьшения (от 0.9 до 0.7).
  • Громкость и темп речи. Возможные значения: нормальный, динамичный, мягкий и шепот.
  • Скорость речи.
  • Длина паузы между словами (до 0.5 сек). Также можно добавлять дополнительные паузы вручную, с помощью специального символа «-». Паузы, ударения и другая специализированная разметка здесь не учитывается при подсчете количества символов для озвучки.
  • Эмоциональная окраска. Доступна для определенного набора голосов.
  • Поддержка фонем и возможность расстановки ударений в словах вручную. Для этого в программе озвучки используется символ «+».

Есть возможность выбора формата аудиофайла, в котором будет сохраняться результат озвучки. Доступные на данный момент варианты: mp3 и wav.

Успешные примеры использования озвучки нейросетями для создания видео на Ютубе

Zvukogram: умеет озвучивать даже диалоги

  • Обрезка полученного аудиофайла.
  • Возможность разбивки результатов озвучивания на несколько файлов.
  • Функционал для переозвучки фрагментов внутри большого текста.
  • Настройка произношения и простановки ударения через Международный фонетический алфавит (МФА).

Конечно же, здесь реализованы и характерные для большинства сервисов этого класса типовые возможности и опции. Сервис предлагает более 30 голосов: профессиональные, обычные, а также имитирующие разговор бота. Есть возможность управления звуком, причем усиливать можно фрагменты текста по-отдельности. Сервис также предлагает опцию для управления интонацией голоса. Она может быть нейтральной, дружеской или раздраженной.

Для расчетов в Zvukogram используются внутренние токены, которые покупаются пакетами (от 100 рублей). Приобретя минимальный пакет за 100 рублей, вы сможете озвучить обычными голосами 105000 символов или премиальными — 21000 симв.

VoxWorker: простой и удобный, все на одной странице

Сервис озвучки текста VoxWorker переводит текст в голос на русском, английском и украинском языках. Преимуществом сервиса является простота интерфейса, все инструменты собраны на одной странице, а также бесплатность сервиса.

  • Простая и понятная расстановка ударений. Ударный звук отмечается с помощью символа «+», размещающегося перед ним.
  • Возможность добавления пауз. Для этого в панели сервиса нужно нажать специальную кнопку.
  • 8 градаций скорости произношения. Вы можете регулировать ее от значения «очень медленно» до тройной скорости.
  • Регулировка высоты голоса. Регулируется в диапазоне от -0.6 до +1.8.
  • Хранение голосовых файлов. По умолчанию файлы зарегистрированных пользователей хранятся 96 часов. Но есть возможность активировать опцию их постоянного хранения, чтобы делиться онлайн.

Результаты озвучки сохраняются в формате mp3. Озвучивание и запись в файл происходит практически мгновенно, нужно только нажать кнопку «скачать». Для озвучивания текста в VoxWorker используются 5 голосов на выбор. 3 из них женские, 2 — мужские. Есть функционал для работы с черновиками.

Бесплатная озвучка текста. И как на этом заработать?! Сравнение ТОП 3 нейросети.

Источник: citforum.ru

Преимущества использования «говорилок»

Озвучка текста специальными программами нацелена на упрощение человеческой жизни. С ее помощью люди могут экономить время, которое могло бы уйти на чтение книг и статей, ответы на сообщения и телефонные звонки, и тратить его на более важные дела. Приложения с синтезаторами речи позволяют людям обучаться чему-то новому, работать и развлекаться.

Читайте также:
Лучшая бесплатная программа для монтажа видео на русском для компьютера

Достоинства

Озвучивание текста машинами считается большим достижением науки. Разработанные синтезаторы имеют массу достоинств, среди которых выделяют:

  • большое разнообразие приложений, так что каждый пользователь сможет найти сервис, полностью удовлетворяющий его потребности;
  • возможность прослушивать текст на самых популярных мировых языках с использованием разной стилистики;
  • многие сервисы подстраиваются под пользователя и разрешают ему самостоятельно выставлять основные настройки — скорость прочтения и тембр голоса;
  • наличие возможности работать без подключения к интернету;
  • бесплатные версии и пробные периоды, которые помогают разобраться с программами для дальнейшего использования.

Среди недостатков заметное место занимает восприимчивость информации. Людям сложно привыкать к роботизированному голосу, который все еще используется многими разработчиками из-за дешевизны и простоты.

Алгоритм озвучивания текста

После того как человек поставил перед собой цель внедрить в свою жизнь озвучку текста, что поможет ему на работе, в повседневных делах или на отдыхе, ему следует понять, что делать дальше. Для начала необходимо найти специальный синтезатор, который будет работать либо в режиме онлайн, либо без подключения к интернету. Многие программы прилагают подробную инструкцию, которая подскажет, как справиться с поставленной задачей.

Общие правила использования сервисов для озвучивания текстовой информации:

  1. Найти подходящую программу для синтеза речи.
  2. Выбрать необходимый язык, глубину, битрейт и частоту.
  3. Внести в специальное поле текстовую информацию. Ее объем может быть ограничен в пробной версии.
  4. Запустить прочтение текста и при необходимости внести корректировки.
  5. Закончить работу и сохранить файл в аудиоформате.

Перед работой с приложением по озвучке речи рекомендуется ознакомиться с правилами и условиями пользования. Не стоит сразу же приобретать платную версию, опираясь только на достоинства программы. Сначала необходимо изучить интерфейс и понять, как управлять разными функциями. Если бесплатная версия удовлетворила запросы пользователя, то, вероятнее всего, платный вариант справится еще лучше.

В наши дни сложно представить жизнь без озвучивания информации. Люди слышат тексты в исполнении других людей или программ в транспорте, по телевизору, из телефонов, по радио. Информация позволяет человеку развиваться, а для упрощения ее получения и восприятия используются специальные сервисы, выполняющие качественный синтез.

Источник: dubna.ru

TTS для ИТ

Категорически приветствую коллег.
Хочу поделиться опытом использования TTS для быстрого создания аудиокниг из текстовых форматов.

Постановка задачи

В те давние, давние годы, когда слово «удаленка» было из области фантастики, а путь на работу и обратно занимал заметную часть жизни, чтение книг было практически единственным способом не свихнуться в пути. Особенно остро вставал вопрос в командировке. Это приводило к тому, что до половины веса багажа составляли бумажные тома. При переезде я отнес три здоровенных рюкзака в ближайшую библиотеку, и это только те книги, перечитывать которые я точно не планировал.

Годы шли и наконец настал день, когда я приобрел Palm IIIc, заменивший стопку книг в багаже. Потом было чтение книг на крохотном экране телефона Samsung M75, затем первый андроид. К сожалению, пока развивалась техника, я не молодел, глаза стали сдавать.

PALM IIIc

Чтобы глаза поберечь, появилась идея слушать аудиокниги. Какое же было мое разочарование после нескольких попыток это сделать.

Что же мне не понравилось при озвучке людьми:

  • скорость чтения — я привык к гораздо более быстрой подачи информации.
  • лишняя эмоциональность чтецов, игра голосом когда не надо. Мое воображение и воображение человека, который читает книгу различно, и часто не совпадает.
  • Плавающая громкость чтения, когда чтец играет голосом, особенно заметно в машине или в общественном транспорте.
  • Часто попадаются чтецы, голос которых раздражает, их вообще невозможно слушать.
  • Далеко не все книги есть в аудио версии.
Читайте также:
Как убрать программу с автозапуска флешки

Поиск решения привел меня к компоненту TTS (Text To Speech). Из доступных приложений я остановился на замечательной OpenSource программе RHVoice Ольги Яковлевой.

Пробовал платные предложения, но сильного повышения качества не обнаружил (по крайней мере на тот момент). Программа требует персональной настройки. Из недостатков, что режут мне слух с установками этой программы по умолчанию, это ударения передОхнул, вместо передохнУл. Поэтому рекомендую подключать словарь. Периодически встречаются другие косяки озвучки, но я как-то привык и этого уже не замечаю.

Данная программа доступна для Windows, Linux и Android. Доступность для Mac не проверял, бо с ним не работал. Такая доступность очень удобна, так как позволяет использовать одни и те же настройки как на компе с разными ОС, так и на телефоне.

Не торопитесь плеваться с первой попытки прослушать фрагмент текста. Для нормального результата нужно подобрать три параметра:

Например, я в последнее время использую следующие установки для русского языка:

  • Голос Anna
  • Скорость 105%
  • Тембр 80%

Получается четкий, разборчивый мужской голос . Скорее всего, ваши установки будут другими, т.к. на вкус и цвет все фломастеры разные.

Периодически в дистрибутиве появляются новые голоса, например раньше я использовал голос Aleksandr, да и качество озвучки повышается от версии к версии.
Более менее актуальный список голосов RHVoice с комментариями можно посмотреть тут.

C чего начать (Windows)?

Для начала устанавливаем SAPI5 поддержку TTS RHVoice. К сожалению, под Windows требуется установка каждого голоса отдельно.

Качаем готовые русские голоса Aleksandr, Aleksandr-HQ, Anna.
Внимание! Выбирайте SAPI5 (не NVDA!), с github.
Дополнительно, качаем английские голоса Alan, Clb и устанавливаем их.

Прямые ссылки на голоса приводить не стал, так как они ведут на файлы вида RHVoice-voice—-setup.exe.

После установки, чтобы познакомиться с TTS, начните с программы Balabolka.
В этом случае вы сможете интерактивно поиграться с голосами, скоростью и тембром, чтобы выбрать наилучший результат для Ваших ушей.

Дополнительно, Если планируете в будущем автоматизировать процесс генерации аудиокниг, рекомендую скачать консольное приложение balabolka_console и консольную утилиту для извлечения текста из файлов.

Далее все просто: вставляем текст для проверки и подбираем голос, скорость и тембр.

Экран

К сожалению, под Windows SAPI5 шкалы настройки этих параметров указываются не в %, а в относительной шкалах -10..+10 с 0 в середине, причем шаг шкалы целочисленный. То есть установить скорость +0.5 не получится.

Используя меню «Сервис», можно запустить полуавтоматическое преобразование текстовых книг в аудио файлы.

C чего начать (Linux)?

Если у Вас в дистрибутиве уже доступен данный TTS, то просто устанавливаете его.
Например для ubuntu 22.04 (все необходимые голоса уже будут установлены):

sudo apt install rhvoice rhvoice-english rhvoice-russian lame xsltproc

Если Вам не повезло, и в дистрибутивах RHVoice нет, то можно скомпилировать.

Дополнительно, можно установить словари/препроцессоры от г-на vantu5z.

Начинаем подбирать параметры под свое ухо, вот пример подбора параметров для моей дражжжжжайшей половинки:

$ fc -l 100 | grep RHVoice-test 346 cat b.test | RHVoice-test -R 360 -p anna -r 105 -t 100 -v 130 -q max -o — | aplay 347 cat b.test | RHVoice-test -R 360 -p anna -r 105 -t 90 -v 130 -q max -o — | aplay 348 cat b.test | RHVoice-test -R 360 -p anna -r 105 -t 80 -v 130 -q max -o — | aplay 349 cat b.test | RHVoice-test -R 360 -p alexander-hq -r 105 -t 80 -v 130 -q max -o — | aplay 351 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 105 -t 80 -v 130 -q max -o — | aplay 352 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 110 -t 80 -v 130 -q max -o — | aplay 353 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 80 -v 130 -q max -o — | aplay 354 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 90 -v 130 -q max -o — | aplay 355 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 100 -v 130 -q max -o — | aplay 356 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 80 -v 130 -q max -o — | aplay 357 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 70 -v 130 -q max -o — | aplay 358 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 60 -v 130 -q max -o — | aplay 359 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 70 -v 130 -q max -o — | aplay 360 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 130 -t 60 -v 130 -q max -o — | aplay 361 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 120 -t 60 -v 130 -q max -o — | aplay 362 cat b.test | RHVoice-test -R 360 -p aleksandr-hq -r 110 -t 60 -v 130 -q max -o — | aplay

Читайте также:
Adguard хорошая программа или нет

Как только параметры подобраны, можно двигаться дальше.

Для автоматического преобразования форматов fb2 или txt, я использую свой скрипт fb2mp3.sh
Для его использования скопируйте его и файлы deutf8.sh, fb2txt.xslt в директорию $HOME/bin.

Что выполняет этот скрипт:

1) Устанавливает переменные окружения:
TEXTSPLIT_SIZE=20000
PARALLEL_COUNT=8
TXT_TO_WAV
WAV_TO_MP3
Если в текущей директории есть имя rena, устанавливает ее настройки, если нет, то мои.

2) Ищет fb2 или txt файлы начиная с текущей директории.

3) Создает поддиректорию по имени файла (без расширения).

4) режет полученный текст на куски TEXTSPLIT_SIZE. Для установленного по умолчанию размера в 20000 байт, для кодировки UTF-8, время каждого mp3 файла получается около 10 минут. Дополнительно на этом этапе вырезает из текста спецсимволы, url линки заменяет на слово link. Поверьте, слушать невозможно что-то вроде такой абракадабры:
«https://site.domain/a/1wK3oT3chhCKzQEHTDCtGkzpZRX777nbKYwCBdV»

5) В параллельном режиме запускает потоки преобразования полученных txt файлов в mp3

6) создает m3u файл

7) удаляет техническую директорию txt

8) Ищет следующую книгу

После того, как срипт отработает, остается скопировать полученные файлы на телефон и используя любой проигрыватель mp3/m3u начать прослушивать книгу.

На Android я использую приложение Mort Player Audio books. Хотя это очень старое приложение и уже не поддерживается, оно оказалось очень удобным для этих целей.

Android

Я предпочитаю просто прослушивать подготовленные mp3 файлы, но есть возможность использовать RHVoice напрямую, для этого:

1) устанавливаете приложение RHVoice
2) Заходите в него, и скачиваете нужные голоса для русского языка.
3) Установите флажок «наилучшее качество речи».
4) Можно добавить словарь и прописать его в файле RHVoice.conf
5) заходите в настройки системы, ищите настройку: «озвучивание текста»
6) устанавливаете движок синтеза речи на RVoice
7) Настраиваете нужный голос, скорость, тембр по умолчанию.

В дальнейшем, озвучивание будет доступно например в FB Reader или приложении author.today.

Некоторые полезные ссылки:

  1. Домашняя страница проекта
  2. Дистрибутивы RHVoice для Windows
  3. Программа «Балаболка» для Windows
  4. Хороший справочник по голосам RHVoice
  5. Дополнительные словари и препроцессоры для RHVoice
  6. Мой скрипт fb2mp3.shhttps://github.com/whiterat1962/fb2mp3

Источник: habr.com

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru