27 июля 2018
Что день грядущий нам готовит? Немного о создании навыков для Алисы
Уже в эту субботу в офисе разработки СКБ Контура пройдет хакатон по созданию навыков для голосовых помощников. Речь пойдет, конечно же, про Алису.
Наш арт-директор Дарья Прокуда будет в жюри. А мы тем временем поговорили с нашим тимлидом Виталием Семячкиным о том, с какими ограничениями и возможностями Алисы сейчас сталкиваются разработчики и с чем столкнулись мы сами, когда начали исследовать эту тему.
Вот что узнали. С точки зрения разработчика, Алиса и Яндекс.Станция — это чат-бот, который умеет общаться голосом, а не текстом. Но даже по сравнению с чат-ботами для Телеграма это пока более ограниченная история.
Почему?
-
В некоторых чат-ботах мы умеем проводить оплату, а в Алисе — пока нет. Дело, конечно, в среде, где существует бот, но тем не менее.
-
В чат-боте мы можем идентифицировать пользователя, а здесь у нас есть только ID устройства — и мы как разработчики не знаем, что сейчас с Алисой разговаривает конкретный Иван Петрович с таким-то аккаунтом на Яндексе. А может, это сын Иван Петровича? Или гость Иван Петровича?
-
Мы никак не можем инициировать события самостоятельно, пока пользователь явным образом не обозначит вызов навыка — мы не можем реализовать возможность послушать и что-то сказать, отреагировать на какое-то событие в фоне. Это существенно ограничивает построение систем умного дома, потому что все же работает на триггерах. И когда триггер срабатывает, было бы здорово уметь реагировать. Но нет, с Алисой так нельзя, а в чат-боте в Телеграме, например, можно.
При этом есть и несомненные плюсы:
-
в Алисе, таки да, голос;
-
из коробки можно обрабатывать запросы на естественном языке.
По сути, сейчас навыки для Алисы — это диалоговый опыт. Мы строим диалог. Пользователь что-то нам сообщает, в текстовом виде эта информация попадает к разработчику, разработчик делает какие-то выводы в процессе обработки информации и может ответить пользователю только голосом.
В качестве возможностей для ответа пользователю у разработчика есть три инструмента: голос, изображение или группа изображений, кнопка с зашитой ссылкой. А доступа к управлению самой колонкой нам не дали. Мы не можем голосом через разработанный навык, например, изменить громкость, включить-выключить саму колонку. Даже поставить будильник не можем. Да, такая возможность есть у самой Алисы, но у разработчиков нет к ней доступа. Например, мы не можем сделать навык как в Алексе: «Разбуди меня чем-нибудь приятным из Black Sabbath» или «Разбуди меня в 5 утра с Радио Радонеж».
При этом надо понимать, что Алиса в Яндекс.Браузере, в приложении и в Яндекс.Станции — это одно и то же API для разработчиков, один и тот же голосовой интерфейс, просто разные точки входа.
Итак, что сейчас доступно для разработчиков:
-
документация по API — оно несильно развесистое, понятное и простое (даже по сравнению с Алексой);
-
взаимодействовать с пользователем мы можем только в формате «вопрос-ответ»,
-
сейчас создание навыков для Алисы — это проектирование и программирование диалогового сценария, как в RPG-играх: есть реплики, деревья вариантов и кольца; именно поэтому много навыков с играми типа крестиков-ноликов, пятнашек, покера и прочего;
-
по сути, это голосовой интерфейс для бота.
Что касается нашего опыта, то как только Яндекс открыл прием заявок на сертификацию веб-студий и агентств в партнеры Яндекс.Диалогов — мы сразу же вписались.
А копать в сторону использования голосовых помощников начали еще раньше. Например, на базе Алексы от Amazon собрали у себя в офисе «умную переговорку». Она умеет по голосовому запросу:
-
включать-выключать камеру,
-
делать скриншоты с экрана, сохранять их на гугл-диск,
-
выводить изображения на экран через проектор,
-
делать копию экрана: например, что-то на экране нарисовали, сделали копию, вывели на экран, запись можно стереть, а информация останется — ее можно дополнять поверх,
-
можно выводить на экран мокапы пустого айфона или пустого браузера, разные сетки и графики (это суперполезно при клиентских встречах и митапах рабочих групп).
Все то же самое сейчас можно сделать на базе Алисы — нет проблем, только она еще и отвечать будет по-русски. Красота!
И еще до запуска приема заявок на сертификацию в партнеры Яндекс.Диалогов мы штурмили про потенциально полезные навыки для Алисы. Сейчас фильтруем, что из нами придуманного можно реализовать без потери ценности с возможностями текущего открытого API. Например, можно использовать Алису для людей с ограниченными возможностями или при оказании первой медицинской помощи и вызова медицинского чат-бота с помощью голосового помощника.
В любом случае, Алиса от Яндекса будет развиваться. Посмотрим, что придумают ребята на хакатоне)
Подробности про него тут: https://habr.com/company/skbkontur/blog/417419/
Возможно вас заинтересует