Блог огненных новостей

Все про нашу работу и жизнь,

достижения, приключения и вообще

27 июля

Что день грядущий нам готовит? Немного о создании навыков для Алисы

Уже в эту субботу в офисе разработки СКБ Контура пройдет хакатон по созданию навыков для голосовых помощников. Речь пойдет, конечно же, про Алису.

Наш арт-директор Дарья Прокуда будет в жюри. А мы тем временем поговорили с нашим тимлидом Виталием Семячкиным о том, с какими ограничениями и возможностями Алисы сейчас сталкиваются разработчики и с чем столкнулись мы сами, когда начали исследовать эту тему.


Вот что узнали. С точки зрения разработчика, Алиса и Яндекс.Станция — это чат-бот, который умеет общаться голосом, а не текстом. Но даже по сравнению с чат-ботами для Телеграма это пока более ограниченная история.

Почему?

  • В некоторых чат-ботах мы умеем проводить оплату, а в Алисе — пока нет. Дело, конечно, в среде, где существует бот, но тем не менее.

  • В чат-боте мы можем идентифицировать пользователя, а здесь у нас есть только ID устройства — и мы как разработчики не знаем, что сейчас с Алисой разговаривает конкретный Иван Петрович с таким-то аккаунтом на Яндексе. А может, это сын Иван Петровича? Или гость Иван Петровича?

  • Мы никак не можем инициировать события самостоятельно, пока пользователь явным образом не обозначит вызов навыка — мы не можем реализовать возможность послушать и что-то сказать, отреагировать на какое-то событие в фоне. Это существенно ограничивает построение систем умного дома, потому что все же работает на триггерах. И когда триггер срабатывает, было бы здорово уметь реагировать. Но нет, с Алисой так нельзя, а в чат-боте в Телеграме, например, можно.


При этом есть и несомненные плюсы:

  • в Алисе, таки да, голос;

  • из коробки можно обрабатывать запросы на естественном языке.

 

По сути, сейчас навыки для Алисы — это диалоговый опыт. Мы строим диалог. Пользователь что-то нам сообщает, в текстовом виде эта информация попадает к разработчику, разработчик делает какие-то выводы в процессе обработки информации и может ответить пользователю только голосом.

В качестве возможностей для ответа пользователю у разработчика есть три инструмента: голос, изображение или группа изображений, кнопка с зашитой ссылкой. А доступа к управлению самой колонкой нам не дали. Мы не можем голосом через разработанный навык, например, изменить громкость, включить-выключить саму колонку. Даже поставить будильник не можем. Да, такая возможность есть у самой Алисы, но у разработчиков нет к ней доступа. Например, мы не можем сделать навык как в Алексе: «Разбуди меня чем-нибудь приятным из Black Sabbath» или «Разбуди меня в 5 утра с Радио Радонеж».

При этом надо понимать, что Алиса в Яндекс.Браузере, в приложении и в Яндекс.Станции — это одно и то же API для разработчиков, один и тот же голосовой интерфейс, просто разные точки входа.


Итак, что сейчас доступно для разработчиков:

  • документация по API — оно несильно развесистое, понятное и простое (даже по сравнению с Алексой);

  • взаимодействовать с пользователем мы можем только в формате «вопрос-ответ»,

  • сейчас создание навыков для Алисы — это проектирование и программирование диалогового сценария, как в RPG-играх: есть реплики, деревья вариантов и кольца; именно поэтому много навыков с играми типа крестиков-ноликов, пятнашек, покера и прочего;

  • по сути, это голосовой интерфейс для бота.



Что касается нашего опыта, то как только Яндекс открыл прием заявок на сертификацию веб-студий и агентств в партнеры Яндекс.Диалогов — мы сразу же вписались.

А копать в сторону использования голосовых помощников начали еще раньше. Например, на базе Алексы от Amazon собрали у себя в офисе «умную переговорку». Она умеет по голосовому запросу:

  • включать-выключать камеру,
  • делать скриншоты с экрана, сохранять их на гугл-диск,
  • выводить изображения на экран через проектор,
  • делать копию экрана: например, что-то на экране нарисовали, сделали копию, вывели на экран, запись можно стереть, а информация останется — ее можно дополнять поверх,
  • можно выводить на экран мокапы пустого айфона или пустого браузера, разные сетки и графики (это суперполезно при клиентских встречах и митапах рабочих групп).

Все то же самое сейчас можно сделать на базе Алисы — нет проблем, только она еще и отвечать будет по-русски. Красота!

И еще до запуска приема заявок на сертификацию в партнеры Яндекс.Диалогов мы штурмили про потенциально полезные навыки для Алисы. Сейчас фильтруем, что из нами придуманного можно реализовать без потери ценности с возможностями текущего открытого API. Например, можно использовать Алису для людей с ограниченными возможностями или при оказании первой медицинской помощи и вызова медицинского чат-бота с помощью голосового помощника.


В любом случае, Алиса от Яндекса будет развиваться. Посмотрим, что придумают ребята на хакатоне)
Подробности про него тут: https://habr.com/company/skbkontur/blog/417419/