Хотя голосовые ассистенты уже давно не новость (они умеют управлять умным домом, колонками и даже автомобилями), на ПК функция находится в зачаточном состоянии уже много лет подряд и практически не развивается ни гигантами вроде Microsoft, ни сторонними разработчиками. Это странно, так как возможность управлять компьютером посредством голоса многим бы упростила жизнь, но, вероятно расширить голосовое управление на ПК или просто сделать его более глубоким слишком сложно. С другой стороны, при желании некоторые функции голосом выполнять всё же можно — нужно лишь немного потрудиться и скачать софт.
Telegram-канал создателя Трешбокса про технологии
Алиса — полноценный ассистент с базовыми функциями
Алиса от Яндекса сама по себе очень умная и удобная в использовании — русский язык понимает отлично, может отвечать на вопросы, советовать фильмы и так далее. При желании это всё можно интегрировать в систему поиска Windows, дабы получать ответы в более удобном формате. Впрочем, стоит сразу отметить, что в 98% случаев Алиса на ПК предоставляет тот же набор функций, что и в браузере или мобильном приложении, тогда как на непосредственное управление ПК отведено всего 2% возможностей. Собственно, управление непосредственно компьютером сводится к возможности выключить систему, отправить её в сон или перезагрузить ПК.
ИМПРОВИЗАЦИЯ НА ТНТ | Михаил Галустян
Также пользователь может открыть Проводник, запросить быстрый доступ к какому-либо сайту (например, можно сказать «Алиса, открой Википедию»), просмотреть историю браузера (для браузера Яндекс) или включить/выключить звук. В теории, ассистент должен уметь открывать и приложения вроде Word или других офисных компонентов, но на текущий момент это не работает и помощник просто отправляет в поисковую выдачу. Естественно, в связке с умной колонкой функций будет гораздо больше, но все они завязаны на возможностях самой колонки, а не функциях компьютера.
Laitis — пожалуй, самый гибкий софт на рынке
Приложение Laitis не выделяется особо привлекательным интерфейсом, но при желании этот софт может существенно упростить вам множество процессов. Дело в том, что программа позволяет создавать специальные команды, выполнение которых активируется посредством голоса. Например, вы можете создать правило на закрытие окна или запуск приложения, после чего продиктовать голосом команду, чтобы софт распознал голос, и потом закрывать приложения короткой фразой «закрой Google Chrome» без мышки или клавиатуры. И таких функций у приложения огромное множество — оно даже умеет запускать .bat-файлы или JS-скрипты.
Как я делаю анимации, моё рабочее место (Анимация)
Список поддерживаемых функций на самом деле просто огромен — можно запускать любые приложения на ПК, отправлять курсор по нужным координатам, отображать окно поверх всех остальных, планировать события и многое другое. Но отдельно стоит упомянуть возможность взаимодействовать с веб-сайтами посредством голоса — например, направлять функцию фокуса на отдельный CSS-селектор или кликать по необходимому элементу на странице. Это очень удобно для людей с ограниченными возможностями, под нужды которых разработчики сайтов не спешат настраивать доступность.
Typle — динозавр, который до сих пор работает
Хотя софт, безусловно, достаточно старый (я его успешно протестирован на Windows 10), он всё равно способен выполнять поставленные перед ним задачи. Для этого достаточно создать пользователя и указать ему нужную базовую команду (например, «Открыть»), после чего перейти непосредственно к доступным командам для записи. В списке есть все установленные на компьютере приложения, также можно открывать системные утилиты, сайты и гибко настраивать параметры по отдельным параметрам. И после того, как команда сформирована и предварительные фразы записаны, можно приступать к управлению голосом — достаточно нажать на кнопку прослушивания и проговорить необходимую команду.
Для тех, кто часто запускает какие-либо приложения или открывает одни и те же сайты (на работе, к примеру), это очень удобное приложение, потому что можно назначить сразу несколько команд, после чего проговорить их, и все нужные ссылки будут открыты без лишних действий. Правда, нужно очень чётко проговаривать слова при первой записи и стараться потом при диктовке тоже проговаривать каждый звук, иначе программа собъётся и не поймёт, что вы хотели. И, конечно, основной недостаток софта в том, что из фона он не работает — нужно каждый раз открывать окно, нажимать на кнопку и проговаривать команду.
Встроенные голосовые команды Windows 11 — шикарный и недоступный инструмент
Пожалуй, наибольшей глубиной взаимодействия с функциями компьютера посредством голосовых команд может похвастаться операционная система Windows 11, которая в этом плане на три головы выше предшественника. Встроенные инструменты распознавания голоса, которые работают даже без подключения к интернету, позволяют переводить систему в сон или выключать её, открывать и закрывать приложения, создавать и переименовывать файлы или папки, открывать страницы в браузере и многое другое. Разработчики операционной системы действительно потрудились над этим вопросом и в Windows 11 компьютером можно полностью (практически) управлять только за счёт голоса.
Более того, встроенными же инструментами можно даже набирать текст — операционная система умеет правильно распознавать слова и ставить знаки препинания на основе интонации даже на русском языке, хотя, конечно, ошибки тоже встречаются и очень часто. Единственная проблема голосовых команд в Windows 11 заключается в том, что поддерживается исключительно английский язык — команды на русском не работают. Это не совсем удобно при полном отсутствии познаний в английском, но, с другой стороны, не нужно быть знатоком языков, чтобы сказать «open google chrome» или «close window».
Материалы по теме:
- Эта утилита показывает, где используется выбранный файл в Windows и что мешает удалить его
- Мод Windows 10 для игр: тестирую Atlas OS, из которого вырезали лишнее ради производительности
- Стандартные курсоры в Windows надоели — нашла 15 альтернатив. Рассказываю, как их установить
- Windows 7 мертва. Как стала лучшей и почему осталась такой до сих пор
- 10 приложений, которые нужно сразу установить на новый компьютер
Источник: trashbox.ru
Голосовой ввод в Windows 11
Привет, друзья. В этой публикации будем говорить о такой примечательной особенности Windows 11, как голосовой ввод. Это функция, с помощью которой мы можем, если у нас к компьютеру подключён микрофон, надиктовывать текст в любые формы ввода в среде операционной системы и программ. Такая функция с поддержкой русского давно есть на мобильных устройствах на базе iOS и Android.
Windows же традиционно в области современных пользовательских функций отстаёт от мобильных операционных систем. В самой Windows технология распознавания речи присутствует ещё со времён Windows 7, но доступна она только для английского и ещё некоторых языков, в число которых русский не входит. Поддержка русского не появилась даже в Windows 10. Русский для голосового ввода стал доступен лишь в Windows 11. С реализацией этой функции пока что не всё гладко, но, давайте обо всём подробнее.
↑ Голосовой ввод в Windows 11
↑ Как использовать голосовой ввод в Windows 11
Итак, друзья, функция голосового ввода в Windows 11. В предшественнице Windows 10 эта функция недоступна для русского языка. В Windows 10 мы можем использовать только сторонние средства русскоязычного голосового ввода. Новая же Windows 11 наконец-то открывает нам, русскоязычным пользователям штатные возможности операционной системы по диктовке текста.
Эти возможности можем использовать где-угодно – в системных функциях и приложениях Windows 11, в браузерах, текстовых редакторах и прочих сторонних программах. Для активации голосового ввода в Windows 11 жмём клавиши Win+H и жмём на небольшой панельке кнопку микрофона.
Далее этими же клавишами можем запускать системный голосовой ввод, находясь внутри приложений с формами ввода текста. Голосовой ввод у Microsoft умный, может сам расставлять знаки препинания. Но для этого автоматическую вставку знаков препинания необходимо включить в параметрах панельки голосового ввода.
Также в параметрах панельки при необходимости можем включить постоянное отображение кнопки запуска голосового ввода. Последняя весьма удобна при активной работе с голосовым набором текста: небольшая плавающая панелька с кнопкой включения голосового ввода может скромно ютиться в каком-нибудь неприметном уголке экрана и всегда быть на подхвате. Когда она нам понадобится, жмём микрофон и надиктовываем текст.

Кликаем кнопку микрофона и надиктовываем.
↑ Команды для диктовки в Windows 11
Голосовой ввод Windows 11 поддерживает команды для диктовки, правда, на русском их гораздо меньше, чем на английском, и не всегда они корректно срабатывают. Успешно функция справляется пока что только с командами ввода точки, запятой, вопросительного знака, двоеточия, нового абзаца.
Для их ввода необходимо чётко произнести слова, соответственно, «точка», «запятая», «вопросительный знак», «двоеточие», «новый абзац». В числе стабильно работающих команд для диктовки также выделение и удаление последнего слова: для этого произносим, соответственно, «выделить это» и «удалить это». Работоспособность других команд пока что оставляет желать лучшего, а многие ещё даже и не переведены на русский язык. Тем не менее потенциал у функции есть. Друзья, со всеми командами для диктовки голосового ввода в Windows 11 можете ознакомиться на сайте поддержки компании Microsoft .
↑ Технологии распознавания речи Microsoft
Ну а теперь давайте поговорим о самих технологиях, на которых зиждется голосовой ввод в Windows 11. Его базисом являются две технологии распознавания речи Microsoft, одна локальная, та, что присутствует внутри операционной системы, другая – облачная, т.е. технология, доступная по Интернету.
Облачная технология распознавания речи Microsoft более продвинутая, чем локальная, она точнее распознаёт человеческую речь и преобразовывает её в текст. Облачная технология также используется в работе голосового ассистента Cortana, портала смешанной реальности, а также в поддерживаемых современных приложениях из Microsoft Store.
Исключительно на базе локальной технологии распознавания речи в Windows работает экранный диктор. По умолчанию в Windows 11 для голосового ввода используется локальная технология, улучшенную облачную технологию необходимо задействовать в системных настройках Windows 11. В приложении «Параметры» идём по пути «Конфиденциальность и безопасность > Голосовые функции».
И включаем настройку «Распознавание голоса в сети».
И давайте ещё, друзья, поговорим о щепетильном вопросе отправки данных Microsoft.
Компания решила всерьёз заняться технологией распознавания речи на русском, потому призывает нас стать добровольцами и поставлять ей для оттачивания технологии образцы своей речи.
Поставляемые Microsoft образцы нашей речи анонимны, они не привязываются к учётной записи Microsoft или каким-то иным нашим данным. Компания официально гарантирует конфиденциальность при использовании образцов и утверждает, что хранятся они на зашифрованных серверах компании до 2-х лет.
Так что, друзья, если хотите помочь Microsoft в усовершенствовании функции голосового ввода на русском, в приложении «Параметры» по тому же пути «Конфиденциальность и безопасность > Голосовые функции» внизу можете настроить отправку ваших голосовых фрагментов.


Источник: remontcompa.ru
Microsoft Dictate
Программа предназначена для голосового набора текста. Поддерживается функция автоматического перевода на иностранные языки в режиме реального времени.
Дата обновления:
Русский язык:
Разработчик:
Microsoft Corporation
Версия Windows:
Windows 7, Windows 8, Windows 8.1, Windows 10
Microsoft Dictate – приложение для Windows, способное преобразовывать речь в текст. Утилита работает в режиме реального времени и обеспечивает возможность голосового набора. Поддерживается интеграция с Microsoft Word, Excel, PowerPoint и другими офисными программами. Также доступна функция управления при помощи голосовых команд.
Голосовой ввод
После установки утилиты пользователи могут включить расширение и выбрать параметры преобразования. Для работы плагина необходимо подключить к компьютеру микрофон. Далее следует указать язык и нажать кнопку Start. Программа распознаёт речь и преобразовывает ее в текст.
Поддерживается более 20 языков, в том числе русский, английский, испанский, корейский, французский, итальянский и другие. Работа утилиты основана на API Bing Speech и Microsoft Translator, что позволяет обеспечить высокую точность преобразования. Кроме того, поддерживается функция мгновенного перевода текста на другие языки.
Управление
Программа позволяет настроить параметры голосового управления. С помощью команд пользователи могут форматировать текст, удалять символы, вставлять знаки препинания и выполнять многие другие операции.
Стоит отметить, что в настоящее время расширение не поддерживается разработчиком.
Особенности
- приложение можно скачать и использовать бесплатно;
- утилита представляет собой надстройку, необходимую для голосового ввода текста;
- поддерживается 29 языков;
- есть возможность создавать голосовые команды для управления;
- доступна функция автоматического перевода текста в режиме реального времени;
- программа совместима с актуальными версиями Windows.
Источник: iowin.net