Як голосовий бот може розмовляти з людиною?

«Щоби перевірити стан рахунку — натисніть один». Усі ми знаємо, як іноді незручно спілкуватися з першим поколінням програм автоматизації телефонних дзвінків та як це час від часу дратує. Але за останнє десятиріччя технології еволюціонували настільки, що ми можемо щодня розмовляти з роботами й навіть не здогадуватися, що по той бік слухавки — не жива людина, а комп’ютер. Як машині вдається маскуватися під реального співбесідника? Таємниці технологій розкриває Олена Дишкант, засновниця та СЕО Olenka.ai.

Комментарии 899

«Коли ми говоримо про голосового робота, більшість уявляє механічний голос, який не надто приємно слухати навіть не через його монотонну синтетичність. Зазвичай він сповіщає про необхідність сплатити гроші, запис до лікаря — таку собі дратівливу рутину, якої ніяк не уникнути. Але ера IVR поступово закінчується — скоро його замінить розмовний штучний інтелект, здатний розмовляти, ніби справжнісінька людина. Уже за кілька років саме з роботами споживачі контактуватимуть у 75–80 % взаємодій із бізнесами та брендами», — говорить Олена.

Отже, AI, artificial intelligence або штучний інтелект. Простими словами, — це імітація людського інтелекту комп’ютером, точніше сучасними технологічними продуктами. Його сутність полягає в тому, що машина може навчатися, як дитина, — методом спроб та помилок — і згодом розвинути «формальне мислення». Програми вчаться думати, аналізувати, прораховувати, передбачати наслідки, приймати рішення — тобто поводитися, як людина.

«Штучний інтелект — це значущий крок у розробці продуктів для автоматизації. Сучасний голосовий робот вчиться на історії діалогів, вміє аналізувати сказане співбесідником та спілкується максимально природно. Наприклад, з 1 000 абонентів, котрим телефонує наш бот, «викрити» його виходить менш ніж в 10 людей», — ділиться СЕО Olenka.ai.

Голосовий робот: розбір технології

Розумний бот — це програма автоматичного обдзвону. Зазвичай його використовують для масових голосових розсилок, коли потрібно проінформувати, опитати, запросити сотні й тисячі людей. Завдяки використанню IP-телефонії він одночасно телефонує на сотні номерів та «начитує» заздалегідь прописаний текст — скрипт. Потім програма продовжує розмову залежно від того, що на запитання чи пропозицію відповідає клієнт. Як він це робить?

«Голосовий робот — це складна сукупність технологій. Окрім ІР-телефонії до головних ми відносимо безпосередньо штучний інтелект, технології розуміння природної мови та машинного навчання. Штучний інтелект дозволяє роботові імітувати поведінку людини та працювати з величезними масивами BigData, які постійно оновлюються. У цьому боти значно перевершують можливості людини. Уявіть, що ви постійно вчитеся новому. Що трапляється з більш давніми знаннями? Вони забуваються, ви можете згадати щось за потреби або більше не згадати взагалі. Робот «пам’ятає» все й завжди. Нові знання йому допомагає здобувати машинне навчання, а технологія розуміння природної мови — це такий собі перекладач із людської на комп’ютерну й навпаки», — пояснює засновниця Olenka.ai.

Розмова для робота — це цикл послідовних дій, який повторюється з кожним новим запитанням. Щоби ефективно спілкуватися з людиною, він має:

  1. почати діалог за написаним скриптологами сценарієм;
  2. зрозуміти, що саме відповідає клієнт;
  3. проаналізувати відповідь та визначити її значення;
  4. правильно обрати наступну репліку для продовження розмови.

«Переважна більшість голосових роботів працює за правилами, які визначають лінгвісти та маркетологи. Вони визначають ключові варіанти розвитку діалогу: клієнтові цікаво або ні, які уточнювальні питання він може поставити тощо. Під кожну з цих груп спеціалісти складають перелік тригерних слів, усі вони означають приблизно одне й те саме. «Так», «звісно», «авжеж», «обов’язково» — приклад того, як можна висловити згоду. Робот чує тригер і обирає «прив’язану» до нього репліку. Усе ніби й працює, але рівно до того моменту, коли клієнт скаже незнайоме йому слово, неправильно поставить наголос абощо. Тому ми пішли далі та відмовились від тригерів», — розповідає Олена Дишкант. Отже, розбираємо.

Як робот розуміє людську мову?

Одна з технологій, на яких працює розмовний штучний інтелект, — Speech To Text. Вона трансформує усне мовлення в текст. Цей текст він перетворюється на масив цифрових даних, зрозумілих для алгоритмів програми обдзвону. Далі програма шукає відповідності — словникове тлумачення кожного слова.

Що прийшло на заміну тригерам?

Голосові роботи нового покоління працюють поза межами правил — для них уже не потрібно формувати списки тригерних слів та навіть деталізувати скрипт завдяки технології розуміння природної мови.

«Природна мова часто неструктурована й навіть неправильна. Ми не дотримуємось правил граматики, іноді несвідомо заміщуємо одні поняття другими. Навіть іншій людині буває важко нас зрозуміти, що ж уже говорити про голосового бота? Тому ми використовуємо NLU — технологію не обробки, як більшість розробників ботів, а саме розуміння природної мови. Завдяки їй робот розпізнає слова — їхні значення — не окремо одне від одного, а в загальному контексті. Так він розуміє намір людини, навіть тоді, коли співрозмовник формулює думку двозначно або й вуалює те, що хоче сказати насправді», — описує технологію СЕО Olenka.ai.

Завдяки NLU робот кожну фразу «розбирає» на наміри та сутності (умови, за яких намір може здійснитись). Так машина визначає сенс репліки.

«Припустимо, робот телефонує, щоби провести NPS-опитування. Клієнт лояльний, постійний, але має ідеї покращення сервісу та саме в цей момент не має часу розмовляти, тож пропонує зв’язатися завтра в першій половині дня. Наміри тут — «згоден», «перетелефонуйте», «потрібні покращення», а сутності — «завтра» та «перша половина дня», — наводить приклад Олена.

Як робот обирає відповідь?

Розмовні роботи від початку мають доступ до великого масиву даних, зазвичай — фрагментів діалогів. Частина з них може бути маркованою позначками відповідності. Тобто коли робот «зустрічає» певну фразу, він одразу «знаходить» ті, що відповідають їй за змістом чи логікою. Це стало можливим завдяки використанню технології машинного навчання — робот отримує нові дані, структурує їх та вчиться знаходити для них відповідності, які і використовує потім у діалогах.

«Перевага машинного навчання в тому, що тепер ми не маємо складати нескінченні переліки тригерів. Навіть коли абонент скаже слово, якого й поготів немає в скрипті, голосовий бот нового покоління знатиме, що саме воно значить. Звичайно, не виключено, що вряди-годи штучний інтелект неправильно розшифрує мову абонента. Тому можна перестрахуватися: додатково «завантажити» в базу даних робота реальні фрагменти діалогів, на які він також міг би орієнтуватися. Так система почне «розуміти» ще і специфіку бізнесу», — радить Олена Дишкант.

Що можна автоматизувати з голосовим роботом?

Для бізнесів автоматизація — це запорука розвитку та масштабування. Завдяки їй спрощуються та пришвидшуються рутинні (нескладні та повторювані) процеси, скорочуються витрати на персонал, зростають обсяги продажів та доходи.

Програма для обдзвону — ефективний інструмент для кампаній різних типів.

  1. Холодні дзвінки. Їх запускають із метою пошуку нових та повернення старих клієнтів, аналізу ринку та конкурентів, розповсюдження рекламної інформації тощо.
  2. Опитування. Бота можна використовувати для проведення соціологічних, маркетингових, комерційних досліджень, збір та обробка інформації.
  3. Нагадування. Після інтеграції з CRM телефонний бот матиме доступ до історії взаємодій із клієнтами та ситуативно нагадуватиме їм про призначені події, зустрічі, необхідність поновити запаси певної продукції і т. ін.;
  4. Запрошення. Телефонний робот за лічені години збере людей на вебінар, концерт та будь-який інший івент;
  5. Актуалізація клієнтської бази. Робот обдзвонить усіх клієнтів та оновить їхні контакти, інформацію про потреби, рід діяльності, сімейний стан, хобі тощо.
  6. Сервісне обслуговування. Програма обдзвона підтвердить замовлення, повідомить деталі доставки, розкаже про поточні акції та запропонує придбати супутні товари.
  7. Рекрутинг. Робот обдзвонить кандидатів та навіть проведе перший тур співбесід.

Голосовий робот — універсальна програма, яку завдяки індивідуального підходу до написання скриптів можна використовувати також в різних галузях.

«Мій досвід роботи з розмовним штучним інтелектом показав, що значно підвищити конверсію за допомогою голосових розсилок можна в інфобізнесі, освітньому, аграрному, фінансовому, логістичному секторах, продажах та телемаркетингу. Вихідний обдзвін також добре працює в сервісних центрах, службах підтримки, медичних, спортивних закладах тощо», — розповідає Олена.

Сьогодні голосові роботи бувають настільки реалістичними, що їх майже неможливо відрізнити від людини, а працюють вони набагато якісніше. Програми обдзвону розпізнають та інтерпретують фрази будь-якої довжини, тональності та емоційності, відокремлюють мову від сторонніх шумів, вивчають невідомі раніше слова й поняття, покращують рівень обслуговування клієнтів. Але справжня запорука їхньої ефективності — чітке розуміння, що та заради чого варто покращувати. Тому з питань впровадження таких технологій краще звертатися до професіоналів.

Обсудить с другими читателями:
Погода