Почему голосовые помощники всё ещё глупые?

Голосовые помощники давно стали частью нашей жизни. Мы обращаемся к ним, чтобы поставить будильник, включить музыку или узнать погоду. Но стоит задать что-то чуть сложнее — и вот уже ответ не по делу, переспрашивание, путаница. Так почему же голосовые ассистенты всё ещё не понимают нас как человек? Попробуем разобраться — по-простому и по-человечески.

Они не думают — они угадывают

Голосовой помощник — не волшебник. Это не разум, а программа. Её задача — распознать, что вы сказали, перевести речь в текст, «догадаться», что вы хотите, и подобрать подходящий ответ или действие.

Когда мы говорим: «Поставь будильник на завтра», всё работает отлично. Это знакомая фраза, она есть в базе, и алгоритм знает, что делать. Но если мы скажем: «Разбуди меня не очень рано, но до встречи с Ларисой» — помощник просто теряется. Он не знает, кто такая Лариса, во сколько с ней встреча и что значит «не очень рано».

Так что проблема не в том, что ассистент глупый. Он просто не понимает контекст и не умеет по-настоящему мыслить.

Сложный язык — сложная задача

Человеческий язык — это больше, чем слова. Мы используем интонации, паузы, эмоции, и часто говорим не совсем то, что хотим сказать. Например:

  • «Погода нормальная?» — иногда это просьба показать прогноз.
  • «Что бы поесть?» — это не вопрос, а надежда, что кто-то предложит идею.
  • «Ну ты понял» — это вообще магия.

Голосовому помощнику с этим трудно. Он буквально пытается сопоставить слова с командами. А когда в них заложено настроение, привычка или шутка — он теряется.

И да, нейросети уже умеют многое. Но чтобы по-настоящему понимать, им нужно то, чего у них нет: жизненного опыта и контекста общения.

Голосовой помощник — это не ИИ, а его часть

Многие думают, что Siri, Алиса или Marusya — это искусственный интеллект в чистом виде. На самом деле, голосовой помощник — это лишь оболочка. За ней работают десятки систем: распознавание речи, синтез голоса, поисковики, сценарии ответов и база знаний.

Чтобы ассистент «вёл беседу», нужно, чтобы все эти системы работали слаженно и в реальном времени. А это сложно. Даже для больших компаний с мощными серверами и разработчиками.

К тому же, у разных пользователей — разные привычки, акценты, запросы. Научить помощника понимать всех — почти как научить ребёнка говорить на всех языках мира сразу.

А ещё есть приватность

Голосовой помощник мог бы быть умнее, если бы знал о вас больше: кто вы, где вы, что любите, с кем живёте, о чём думаете. Но мы же не хотим, чтобы он знал слишком много?

Вот и приходится разработчикам балансировать: или безопасность, или удобство. Поэтому помощники пока работают с ограниченным количеством информации и боятся «лишнего вмешательства».

Но ведь они становятся лучше?

Конечно. Если вы не пользовались голосовым помощником пару лет — попробуйте снова. Они стали быстрее, лучше распознают речь, понимают простые разговорные фразы. Некоторые уже умеют шутить, рассказывать сказки, поддерживать диалог. Но всё это — пока в пределах заранее заданных сценариев.

Иногда кажется, что они почти «живые». Но стоит выйти за рамки — и опять неловкая пауза, «не поняла ваш запрос», «повторите, пожалуйста».

Так в чём надежда?

Надежда — в развитии технологий. Новые модели нейросетей уже умеют понимать контекст, запоминать предыдущие вопросы и даже адаптироваться под стиль пользователя. Но чтобы это стало нормой, а не исключением — нужно время. И работа, и осторожность. А пока — голосовой помощник остаётся полезным инструментом, но не собеседником.

Евпатория (многоквартирные дома)
Центр обслуживания абонентов: +7 918 018 55 22

Продолжая использовать наш сайт, Вы соглашаетесь на использование файлов Cookie,
а также на обработку ваших персональных данных с использованием метрических программ. Подробнее