Голосовыми помощниками называются программы с искусственным интеллектом. Они способны распознавать речь, давать ответы, выполнять команды. Продвинутые помощники умеют шутить, запоминать предпочтения пользователя, автоматически воспроизводить операции. Это как друг, который готов поддержать, поговорить и ответить на все вопросы в любое время суток.
Программы никогда не устают, ничего не забывают. То, что раньше считалось невероятным приспособлением далекого будущего, теперь доступно большинству потребителей.
Голосовые помощники совместимы со смартфонами, компьютерами, планшетами, колонками и автомобилями. Главным удобством является их взаимодействие с человеком: чем больше команд дано, тем лучше они понимают его предпочтения и интересы. Очень легко произносить распоряжения за рулем, с ребенком на руках, в процессе приготовления еды. Самые крупные компании мира соревнуются за создание лучшего голосового помощника. Мы отобрали 10 номинантов, которые заслуживают вашего внимания.
Алиса заменит Google ассистент
Топ-10 лучших голосовых помощников
10 Ozlo
★ Помогает найти развлекательные заведения, быстро учится
Страна: США
Рейтинг (2023): 4.4
Пользователям Андроид доступен простой помощник Ozlo. Он создан только для того, чтобы быстро проложить маршрут до места назначения, найти лучший ресторан или кафе поблизости. Ассистент анализирует карту пунктов питания, может запоминать предпочтения человека. Для сопоставления результатов привлекает сервисы рейтингов Foursquare и Yelp.
Понравившиеся заведения собираются в карточки, которые появляются на телефоне. Если Ozlo что-то не понял, он переспросит или уточнит команду. Программа регулярно совершенствуется с учетом запросов пользователей.
Ассистент особо не любезничает с хозяином, но запоминает имя. Он выполняет только те команды, которым обучен. Зато помощник значительно сокращает время на поиск заведения, отлично работает в путешествиях по России. Он действует и за границей, но немного глючит. Производитель уверяет, что перечень команд неокончательный.
9 SoundHound Hound
★ Большой проект от известного распознавателя музыки
Страна: США
Рейтинг (2023): 4.4
За рубежом название SoundHound известно многим: популярный сервис для распознавания музыки является достойным конкурентом Spotify. В России он не снискал такого признания, зато смог пробраться в смартфоны соотечественников. Голосовой помощник Hound – результат 9 лет работы лучших инженеров мира. Он способен обрабатывать длинные предложения, понимать несколько запросов подряд.
Ассистент выполнит задание, даже если прямая команда отсутствует. Он предлагает самый мощный функционал поиска песен по тексту и мотиву.
Основатель SoundHound Киван Мохаер говорит, что их голосовой помощник способен не только перечислить продукты в холодильнике, но и составить рецепты из них. Компания заключила договоры с сервисами стриминга музыки. Она сотрудничает с Expedia, ассистент знает имена всех музыкантов, их альбомы, концерты. Hound подскажет, что сейчас в моде, составит плейлист. В России доступен далеко не весь функционал, но самые главные команды сохранены.
Битва ассистентов: Алиса / Google / Siri / Маруся. Кто лучше?
8 Typle
★ Управление компьютером голосом
Страна: Россия
Рейтинг (2023): 4.5
Typle – простой голосовой помощник для ПК на системах Windows 7, 8 и 10. Программа значительно уступает лидерам рейтинга, выполняет только короткие команды. Она ищет запросы в интернете, запускает или закрывает приложения. Доступно 2 версии: бесплатная и по подписке. После установки на компьютере появляется окошко, которое попросит произнести слово.
Ассистент запоминает голос и акцент, реагирует только на него. Все команды, которые будут использованы, нужно произнести при первом подключении.
Судя по комментариям, с базовыми функциями Typle справляется на отлично. Несмотря на простоту, помощник имеет мощную систему распознавания речи. Команды, которые он запомнил однажды, выполняются без ошибок. Для правильной работы нужны микрофоны: чем они мощнее, тем отзывчивее станет ассистент. Тогда Typle разберет запрос в шумной комнате, распознает голос хозяина среди других.
7 Xiao Ai
★ Помогает контролировать социальные сети
Страна: Китай
Рейтинг (2023): 4.6
Самый новый голосовой помощник на рынке Xiao Ai от китайского бренда постепенно внедряется в российские смартфоны. Он работает только с телефонами Xiaomi. Функционал во многом повторяет Siri и Google Assistant, о которых мы поговорим ниже. Программа контролирует умную технику, отправляет фото в социальные сети, воспроизводит музыку.
Короткими фразами пользователи устанавливают будильник, составляют расписание. В отличие от Siri, Xiao Ai умеет отправлять надиктованные сообщения.
Голосовой помощник является частью умного дома Mi Home, только в паре с другими устройствами видны его лучшие стороны. Например, включение очистителя воздуха, пылесоса, чайника. Помощнику не нужно открывать собственное приложение для выполнения команды, он отправляет их напрямую. Это сокращает время ответа на запрос. Главным минусом Xiao Ai является ориентация на китайского пользователя и их приложения, русские сервисы не поддерживаются.
6 Robin
★ Уникальный спутник водителей
Страна: США
Рейтинг (2023): 4.7
Владельцы смартфонов Андроид, которые много времени проводят в дороге, оценили Robin. Голосовой помощник управляет телефоном вместо человека, водители не отвлекаются на нажатие кнопок. Он отвечает на простые вопросы, диктует новости, сообщает об изменениях в социальных сетях, отправляет СМС, звонит, анализирует прогноз погоды. Пользователь может скорректировать расписание, включить будильник, составить список покупок. Robin отлично распознает русскую речь.
Новые пользователи проходят быстрое иллюстрированное обучение. Ассистент имеет ограниченный функционал, особенно если сравнить его с лучшими в рейтинге. С другой стороны, у истоков адаптации программы стоят Yandex Labs и Google Moscow, которые понимают потребности отечественных пользователей. Разработчики регулярно расширяют функционал, обучают Robin акцентам.
Из дополнительных возможностей доступны советы, цитаты и анекдоты. Но запросы пользователя должны быть простыми.
5 Siri
★ Лучшая поддержка русского языка
Страна: США
Рейтинг (2023): 4.7
Среди зарубежных голосовых помощников только Siri со всей серьезностью отнеслась к отечественному потребителю. Фирма-производитель была первой, кто добавил русский язык в программу, обогнав даже Яндекс.Алису (она вышла позднее). Сири является самой простой в управлении, она понимает короткие команды.
Искусственный интеллект подстраивается под человека, начинает лучше откликаться на хозяина. Распознавание голоса значительно возрастает через несколько недель использования. Siri можно поправить, подсказать произношение.
Голосовой помощник является лучшим выбором для обладателей техники Apple: iPhone, iPad, Mac, Watch, TV. Он встраивается в автомобили с функцией CarPlay. Однако и функциональность зависит от устройства, старые смартфоны не поддерживают большинство команд. Современные гаджеты пользуются преимуществами совместимости с Bluetooth-наушниками. С их помощью удобнее делать запросы, отвечать на звонки и сообщения.
4 Microsoft Cortana
★ Самый продвинутый помощник для ПК и ноутбуков
Страна: США
Рейтинг (2023): 4.8
Microsoft Cortana изначально была доступна на ПК и ноутбуках этого производителя. На этих устройствах раскрывается весь функционал. Однако со временем голосовой помощник появился на смартфонах с Андроид. Он позволяет выполнять задания на ходу, затрачивать меньше времени. В отличие от программ Google и Apple, которые используют браузер Chrome, Кортана задействует разработку Microsoft Bing.
Ассистент добавлен в умный динамик Harmon Kardon Invoke и консоль Xbox One.
В отличие от Siri, которая полностью зависит от голосовых команд, Microsoft Cortana является полноценным помощником. Можно вводить уникальные функции. Ассистент их запомнит и будет выполнять автоматически. Например, снизит звук во время важной встречи. Это очень помогает, если голосовая команда не распознается.
Ассистент ведет записную книжку, подстраивается под пользователя. Он напомнит о матче любимой команды, подскажет наиболее посещаемый ресторан.
3 Amazon Alexa
★ Лучший функционал
Страна: США
Рейтинг (2023): 4.8
Amazon Alexa появилась в колонке производителя, постепенно переместившись на мобильные устройства. Она является частью умного дома, контролирует огромное количество вещей. Например, открывает жалюзи и двери гаража, включает свет и телевизор, настраивает термостат и систему кондиционирования. Искусственный интеллект обучается, Amazon регулярно выпускает обновления. Голосовой помощник уверенно занял место лучших в 2015 году, и не собирается сдавать позиции.
В отзывах покупатели с восхищением говорят о функциональности ассистента. Он читает утренние новости, проигрывает любимые песни, ставит будильники, диктует аудиокниги, вызывает такси. Вместе с Amazon Alexa проходят тренировки, планируется расписание на день, совершаются звонки. Несмотря на самый обширный функционал, пользоваться помощником просто. Алекса в колонке от Амазон имеет 7 встроенных микрофонов, слышит команды со всех сторон, даже если в комнате шумно.
2 Яндекс Алиса
★ Отечественная технологичная разработка
Страна: Россия
Рейтинг (2023): 4.9
Отечественные производители не отстают от современных трендов, предлагая собственные голосовые помощники. Яндекс Алиса – их лучшее достижение, которое не уступает программе от Amazon и Microsoft. Во многом она их превосходит, ведь функционал рассчитан на российского пользователя.
Алиса рассказывает о погоде и последних новостях, включает музыку, запускает программы, поддерживает беседу. Она работает в мобильном Яндекс.Браузере, на Андроид и iOS. Помощник способен определять товары на картинках, находить их на Яндекс.Маркет.
Покупатели умиляются Алисе, когда она рассказывает сказки или шутит. Голосовому помощнику хватает интеллекта говорить разными голосами, играть, уточнять детали, давать рекомендации. Он конвертирует валюту, предупреждает о пробках. После каждого задания Алисе можно ставить оценки. Это подсказывает разработчикам, в каком направлении двигаться.
1 Google Assistant
★ Лучшая отзывчивость на команды
Страна: США
Рейтинг (2023): 5.0
Мировой гиганг Гугл был одним из первых, кто сделал голосовых помощников доступными. Google Assistant – это обновленная версия программы, которая работает на Андроид, iOS и в браузере Chrome. Она понимает разговорную речь, поддерживает самые простые диалоги. Ассистент постепенно обучается функциям, которые нужны пользователю.
Например, может звонить, бронировать билеты и места в ресторанах, «висеть» на телефоне в ожидании ответа оператора. Программа прослушает все вставки автоответчика и оповестит пользователя, когда трубку возьмет человек.
Голосовой помощник проложит лучший маршрут до места назначения, выдаст информацию о ресторанах и достопримечательностях. Он использует Google Карты и остальные сервисы компании. Занятые люди узнают планы на день и управляют календарем голосом, получают напоминания о встречах. Ассистент за секунды добавляет и удаляет заметки, ставит будильник и таймер, составляет список покупок.
+4 Понравилась статья?
Какой голосовой помощник выбрать?
В настоящее время пользователям гаджетов предлагают выбор между головыми помощниками. Каждый из них имеет свои плюсы и минусы. В нашей статье мы составили рейтинг из 6 самых востребованных голосовых систем подобного рода. Предлагаем рассмотреть их подробнее.
Алиса
Самый популярный официальный помощник с множеством функций и возможностей среди имеющиехся в России. Алиса создана Яндексом, она разговаривает на русском языке, ориентирована на Android и iOS и может взаимодействовать с системами Умного дома.
Во время выполнения голосовых команд Алиса прибегает к сервисам Яндекса. Она ищет информацию в браузере, узнает погоду в Яндекс.Погода, данные о пробках в Яндекс.Картах, поиск музыки с помощью приложения Яндекс и т.д. Так что, если вы будете активно пользоваться этими сервисами и иметь подписку на Яндекс.Плюс, вы сможете проверить функционал помощника в полной мере.
Помимо основных функций помощника, Алиса может стать еще и развлекательным центром: играть с детьми в головоломки, рассказывать сказки и анекдоты и даже делать тосты. Полный список возможностей Алисы можно найти на ее странице в Яндексе.
Плюсы:
- говорит и шутит на русском;
- работает с сервисами яндекса;
- поддерживается бытовой техникой для российского рынка.
Недостатки:
- приложение необходимо устанавливать отдельно;
- не подходит для тех, кто пользуется сервисами Google или Apple.
Google Ассистент
Голосовой помощник Google по умолчанию установлен на всех Android-смартфонах с поддержкой GMS, так как он разработан той же компанией, что и операционная система. Обычно Ассистент предлагает настроить себя при первом включении устройства, несколько раз произнося «Окей, Google». Затем мастер запускается голосовой командой или долгим нажатием кнопки «Пуск».
Логично, что при работе вы обращаетесь к сервисам Google: ищите ролики на YouTube, прокладываете маршрут с помощью карт Google и т.д. Кроме того, Ассистент совместим со многими бытовыми приборами, например техникой из экосистемы Mi Home.
Если вы думаете, кто лучше, Алиса или Google Ассистент, вы можете начать с пользовательских настроек: если вы часто пользуетесь поиском Яндекса, браузером и другими сервисами, то вам стоит поставить Алису на свой телефон. Если вы верны Gmail, Google Maps и слушаете YouTube Music, то было бы разумнее использовать собственный Ассистент. Кстати, Google Assistant работает и на iPhone, однако его приложение нужно будет устанавливать отдельно.
Плюсы:
- говорит на русском;
- поддерживает системы умного дома;
- работает с сервисами гугл;
- установлен по умолчанию на устройствах Android.
Недостатки:
- не подходит тем, кто пользуется сервисами Яндекс или Apple.
Siri
Apple Assistant, который используется по умолчанию на iPhone и iPad. Его главное преимущество заключается в том, что Siri работает с системными приложениями Apple: вы можете использовать его для ответа на звонки и сообщения, создания заметок и напоминаний, установки будильника, прокладки маршрута и т.д. Siri совместима с Apple Watch и даже может помочь вам найти потерянные AirPods.
Сравнивая, какой голосовой помощник лучше, Алисия или Сири, вам снова нужно учитывать, какими услугами вы пользуетесь чаще всего. Если вы не пользуетесь сервисами Apple и работаете, например, с Яндекс картами, вам будет удобнее использовать Алису вместо Siri. Siri также поддерживает только Apple Music, для которой требуется платная подписка. Теоретически вы можете создавать быстрые команды для мастера для работы с приложениями, но это делается на уровне разработки с использованием набора инструментов SiriKit.
Плюсы:
- говорит на русском;
- совместим с системой умного дома Apple;
- работает с сервисами Apple;
- установлен по умолчанию в гаджетах Apple.
Недостатки:
- не подходит тем, кто пользуется сервисами Яндекс или Google;
- не работает на устройствах Android.
Маруся
Помощник, разработанный российской компанией Mail.ru. Сервис молодой, но он уже активно входит в бытовую технику и даже имеет свою умную колонку: Капсула. По характеристикам Маруся внешне похожа на Алису, но пользуется услугами родной компании: поиском и электронной почтой, музыкой ВКонтакте, онлайн-кинотеатром Wink. Мастер умеет сообщать новости и гороскопы, устанавливать будильники и напоминания, решать головоломки и играть словами.
Приложение Marusi не является частью какой-либо системы и устанавливается отдельно. Удобно, что он доступен для iOS и Android и даже для устройств Huawei / Honor, как показано в AppGallery. Однако Алисия тоже здесь.
Плюсы:
- говорит на русском;
- работает с сервисами Mail.ru.
Недостатки:
- не подходит для тех, кто пользуется другими услугами подробнее;
- приложение необходимо устанавливать отдельно.
Ассистент Дуся
Приложение Dusi Assistant доступно в Google Play только для владельцев смартфонов Android. Мастер привлечет вундеркиндов и любителей самостоятельно настраивать функции программы и не довольствоваться стандартным набором. В приложении уже есть более 150 готовых скриптов, которые автоматически запускают различные функции смартфона: навигацию, календарь, заметки и т.д.
Вы также можете управлять Дусей с помощью ПК или чата Telegram, отправляя ей текстовые команды. Мастер также распознает управление жестами и поддерживает запуск функций прямо из виджета. Главное преимущество Dusi — это возможность настраивать скрипты практически для любого приложения на смартфоне.
Плюсы:
- понимаете русский, можете настроить функции как хотите;
- поддерживает команды Telegram и ПК.
Недостатки:
- нужно разбираться в настройках скрипта;
- вам нужна платная версия (бесплатная работает только неделю).
Amazon Alexa
Американский голосовой помощник впервые появился на умных колонках Amazon. Они не продаются в России, к тому же программы Alexa нет в наших магазинах приложений. Вы можете установить его на свой смартфон только в том случае, если в вашей учетной записи Apple или Google указана другая страна.
Ассистент он не говорит по-русски и не поддерживает отечественные сервисы, такие как Яндекс и Mail.ru. Однако вы можете использовать его, если говорите команды на английском языке.
С помощью Alexa вы можете воспроизводить музыку из Apple Music и Spotify, создавать списки дел, редактировать свой календарь и искать информацию в Интернете; в целом все так же, как и с «нашими» голосовыми помощниками.
Интересно, что помощник Amazon совместим с устройствами умного дома Xiaomi, поэтому с его помощью можно будет управлять лампочками, пылесосами и другой бытовой техникой из экосистемы Mi Home.
Плюсы:
- поддерживает сервисы Apple и Spotify;
- работает с умным домом Xiaomi.
Минусы:
- официально не работает в России.
Источник: strana-it.ru
Голосовые помощники: эволюция, устройство и основные игроки
Уточнить у Siri рецепт сырников во время готовки или попросить Алису прочитать сказку — вполне привычные для нашей жизни сценарии. А как это работает? Как звук превращается в понятные виртуальному помощнику команды, которые сразу же исполняются? Кто главные игроки на рынке? Какие еще заботы могут снять с нас голосовые помощники?
Редакция DTI Algorithmic собрала ответы на все эти вопросы — и помогали нам в этом наши программисты и союзники. В результате получился информационно насыщенный лонгрид, который мы будем публиковать по частям. Сегодня — про эволюцию голосовых помощников, их устройство и основных игроков на рынке.
Эволюция голосовых помощников
История голосовых ассистентов начинается с конца 1930-х годов, когда ученые начали предпринимать попытки распознать голос силами технологий. Тогда созданию качественного помощника мешали две большие проблемы:
- существование омонимов — слов с одинаковым звучанием, но с разным значением,
- постоянный шумовой фон, из которого система должна выбирать речь пользователя.
#справка Подробнее про историю и эволюцию технологии распознавания речи на Medium
Сейчас для решения этих проблем разработчики используют машинное обучение. Оно учит нейронные сети самостоятельно анализировать контекст и эффективно определять основной источник звука. Однако пришли разработчики к этому не сразу — потребовалось как минимум 80 лет подготовительных работ:
1939 год. Советский физик Лев Мясников создал аппарат, способный распознавать человеческую речь — несколько гласных и согласных звуков.
1952 год. Сотрудники лаборатории Bell разработали механизм, который распознавал продиктованные по телефону числа от 1 до 9.
1962 год. Компания IBM представила собственную технологию распознавания речи — Shoebox. Машина распознавала 16 английских слов, 10 цифр и 6 арифметических команд.
Презентация системы распознавания речи Shoebox от IBM
1980 год. Инженеры научились применять методы «Скрытой модели Маркова». Со временем это позволило голосовым системам лучше распознавать речь. Они обрабатывают слово, учитывая несколько предыдущих и предсказывая, что может с ними сочетаться.
#справка Скрытая модель Маркова описывает генерацию случайных событий в зависимости от текущего состояния объекта. Пример: человек может находиться в одном из четырех состояний и не в каждое их них может перейти сразу (схема ниже). Например, если человек лежит, то он не может моментально пойти куда-либо — нужно сесть, встать и только потом идти
1987 год. В США компания Worlds of Wonder начала продавать говорящую куклу Джулию, которая училась распознавать речь ребенка во время игры. В куклу был встроен процессор, который позволял ей реагировать и генерировать речь. Джули воспринимала восемь высказываний: «Джули», «да», «нет», «хорошо», «притворяйся», «голодна», «пой» и «молчи».
Реклама интерактивной игрушки — куклы «Джули»
1990-е годы. Появилась коммерческая программа Dragon Dictate, ориентированная на массовый рынок. Она распознавала речь и записывала надиктованный текст в файл.
1996 год. Появилось полноценное голосовое меню VAL от BellSouth. Система обрабатывала телефонные справочные запросы и помогала покупателям в поиске нужной информации об интересующих товарах.
Позже компания запустила Info by Voice — интерактивные голосовые «желтые страницы» с информацией о ближайших ресторанах, такси и некоторых магазинах. Система также могла рассказать о новостях и котировках акций, погоде, телепрограмме, гороскопе и спортивных событиях.
2001 год. Компания Microsoft добавила голосовой ввод текста в офисный пакет Office XP.
2002 год. Google запустил Voice Search — сервис для голосового поиска в интернете. Проект приостановили из-за неудобства использования — чтобы выполнить поиск, надо было позвонить на специальный номер. На Voice Search основан современный интерактивный помощник компании — Google Assistant.
2007 год. Центр исследования искусственного интеллекта SRI International начал разработку Siri. Siri стала первой голосовой помощницей — система умела не только искать информацию в интернете или работать как голосовое меню, но и вести с пользователем диалог.
2011–2014 годы. Google интегрировал функцию голосового поиска в браузер Chrome. Компания также запустила персонализированного ассистента Google Now с расширенными возможностями голосового поиска — сервис подбирал актуальную информацию с учетом местоположения пользователя, истории браузера и других поисковых запросов.
У Microsoft также появилась собственная виртуальная голосовая помощница — Cortana.
#интересное Ассистент Microsoft назван в честь персонажа из игровой серии шутеров Halo. Фразы для него записала актриса озвучки Джен Тейлор, озвучившая Кортану в игре
2014 год. Amazon представил первую в мире умную колонку Amazon Echo с голосовой ассистенткой Alexa.
#справка Alexa от Amazon была вдохновлена компьютерной голосовой и диалоговой системой на борту Starship Enterprise в научно-фантастических сериалах и фильмах вселенной «Star Trek»
2017 год. Alibaba представила умную колонку Tmall Genie с голосовым помощником AliGenie.
2018 год. Яндекс выпустил умную колонку Яндекс.Станция с голосовой помощницей Алисой.
2019 год. Банк «Тинькофф» запустил собственного голосового ассистента «Олега». Mail.Ru Group представила голосовую помощницу «Марусю».
Как устроены современные голосовые помощники
Голосовые помощники пассивно считывают все звуковые сигналы, и для активной работы им необходима активация при помощи кодовой фразы. Например, произнесите: «Окей, Google», потом можете задать свой вопрос или отдать команду без пауз.
Математик Ханна Фрай исследует, как работает программное обеспечение для распознавания голоса, используемое в в домашней технике.
В момент голосового запроса автоматическая система распознавания речи (ASR system) преобразовывает звуковой сигнал в текст. Это происходит в четыре этапа:
- Фильтрация. Система убирает из звукового сигнала шумовой фон и помехи, возникающие при записи.
- Оцифровывание. Звуковые волны преобразуются в понятный компьютеру цифровой вид. Параметры получаемого кода в том числе определяют качество записи.
- Анализ. В сигнале выделяются участки, содержащие речь. Система оценивает ее параметры — к какой части речи относится слово, в какой оно форме, насколько вероятна связь между двумя словами.
- Выявление шаблонов данных. Полученную информацию система включает в словарь — собирает разные варианты произношения одного и того же слова. Чтобы точнее распознавать новые запросы, ассистенты сравнивают слова в них с шаблонами.
Если после обработки запроса виртуальный помощник не понимает команду или не может найти ответ, он просит перефразировать вопрос. В некоторых случаях могут понадобиться дополнительные данные — например, при вызове такси ассистент может уточнить местоположение пассажира и пункт назначения.
Основные игроки на рынке
По данным Microsoft, самые популярные голосовые помощники в США — Google Assistant, Siri от Apple, Alexa от Amazon и Cortana от Microsoft. Русский язык из них понимают только первые два, однако на российском рынке также работает Алиса от Яндекса, а на китайском — AliGenie от Alibaba. Сравнили основные характеристики умных колонок с поддержкой этих пяти голосовых ассистентов:
Голосовой помощник
Компания-производитель
Источник: medium.com