Домашня » як » Alexa, Siri і Google не розуміють слова, про яке ви говорите

    Alexa, Siri і Google не розуміють слова, про яке ви говорите

    Amazon

    Голосові помічники, такі як Alexa, Google Assistant і Siri, пройшли довгий шлях за останні кілька років. Але, при всьому їхньому поліпшенні, одна річ утримує їх: вони вас не розуміють. Вони занадто покладаються на конкретні голосові команди.

    Розпізнавання мовлення - це просто магічний трюк

    Amazon

    Голосові помічники вас не розуміють. Не дуже, так чи інакше. Коли ви розмовляєте з Домашньою службою Google або відлунням Amazon, воно, по суті, перетворює ваші слова на текстовий рядок, а потім порівнює це з очікуваними командами. Якщо він знаходить точну відповідність, то він слідує набору інструкцій. Якщо це не так, вона шукає альтернативу, що робити на основі тієї інформації, яку вона має, і якщо це не допоможе, ви отримаєте повідомлення про помилку, наприклад: "Мені дуже шкода, але я не знаю, що Це трохи більше, ніж магія руки, щоб змусити вас думати, що він розуміє.

    Він не може використовувати контекстні підказки для кращого припущення, або навіть використовувати розуміння подібних тем для інформування своїх рішень. Це не важко подолати голосових помічників. В той час, як ви можете попросити Alexa «Ви працюєте для NSA?» І отримати відповідь, якщо ви запитаєте: «Ви таємно є частиною NSA?», Ви отримуєте відповідь «я не знаю того» (принаймні на час написання).

    Люди, які щиро розуміють мову, не працюють так. Припустимо, ви запитаєте людини: “Що таке кларвейн на небі? Той, що вигнутий, і повний смугастих кольорів, таких як червоний, оранжевий, жовтий і синій. «Незважаючи на те, що klarvain є вигаданим словом, людина, яку ви запитали, може зрозуміти з контексту, що ви описуєте веселку.

    Хоча можна стверджувати, що людина перетворює мову на ідеї, людина може потім застосувати знання і розуміння, щоб укласти відповідь. Якщо ви запитаєте людину, якщо вони таємно працюють для АНБ, вони дадуть вам відповідь «так» або «ні», навіть якщо ця відповідь є брехнею. Людина не сказала б "я не знаю цього" на таке питання. Те, що люди можуть брехати - це те, що приходить з реальним розумінням.

    Асистенти голосу не можуть вийти за межі їхнього програмування

    Голосові помічники в кінцевому рахунку обмежуються запрограмованими очікуваними параметрами, а блукання поза ними порушить процес. Цей факт показує, коли відтворюються пристрої сторонніх виробників. Як правило, команда для взаємодії з ними дуже громіздка, що означає «скажіть виробнику пристрою, щоб він вніс додатковий аргумент». Точний приклад: «Скажіть Whirlpool, щоб призупинити роботу сушильної машини». майстерність керує деякими піч GE. Користувач навички повинен пам'ятати, що «розповісти Женеві», а не «сказати GE», а потім решту команди. І хоча ви можете попросити його підігріти духовку до 350 градусів, ви не зможете домогтися прохання збільшити температуру ще на 50 градусів. Хоча людина може виконувати ці запити.

    Amazon і Google дуже працювали над тим, щоб подолати ці перешкоди, і це показує. Там, де ви повинні були слідувати вищевказаній послідовності, щоб керувати смарт-замком, тепер ви можете сказати "замок передніх дверей". Alexa використовували, щоб бути збентежені "розповісти мені жарт собаки," але попросіть сьогодні, та це попрацює. Вони додали варіації до команд, які ви використовуєте, але в кінцевому рахунку, ви все одно повинні знати правильну команду, щоб сказати. Необхідно використовувати правильний синтаксис у правильному порядку.

    І якщо ви думаєте, що це дуже схоже на командний рядок, ви не помилитеся.

    Голосові помічники - це незвичайна командна лінія

    Командний рядок вузько визначений для виконання простих завдань, але тільки якщо ви знаєте правильний синтаксис. Якщо ви вислизнете з цього правильного синтаксису і введете dyr замість dir, то командний рядок дасть вам повідомлення про помилку. Ви можете використовувати псевдоніми для зручніших для запам'ятовування команд, але ви повинні уявити, якими були оригінальні команди, як вони працюють, і як ефективно використовувати псевдоніми. Якщо ви не знайдете час для вивчення вхідних та вихідних команд, ви ніколи не вийдете з цього.

    Голосові помічники нічим не відрізняються. Ви повинні знати правильний спосіб висловити команду або задати питання. І ви повинні знати, як налаштувати групи для Google і Alexa, чому групувати пристрої необхідно, і як назвати свої смарт-пристрої. Якщо ви не виконуєте цих необхідних кроків, ви відчуєте розчарування, якщо попросите вашого голосового помічника вимкнути дослідження лише для того, щоб його запитали, "яке дослідження" слід вимкнути.

    Навіть якщо ви використовуєте правильний синтаксис у правильному порядку, процес може завершитися невдало. Або з неправильною реакцією, або з дивовижним результатом. Два будинки Google в одному будинку можуть дати погоду для дещо інших місць, навіть якщо вони мають доступ до однієї інформації про обліковий запис користувача та підключення до Інтернету.

    У наведеному вище прикладі дається команда "Встановити таймер на півгодини". Головний центр Google створив таймер з назвою "Година", а потім запитав, як довго має бути таймер. І все ж повторення тієї ж команди три рази працювало правильно і створило 30-хвилинний таймер. Використання команди «Встановити таймер на 30 хвилин» працює правильно на більш послідовній основі.

    Хоча розмовляти з Google Home або Echo можуть бути більш текучими, під голосом асистенти голосу і командних рядків працювати однаково. Можливо, вам не доведеться вивчати нову мову, але вам потрібно вивчити новий діалект.

    Вузьке розуміння голосових помічників обмежить зростання

    Нічого з цього не заважає голосові помічники, як Google Assistant і Alexa працювати досить добре (хоча Кортана це інша історія). Асистент Google і Alexa та пошукові запитання в Інтернеті пристойно, хоча й не дивно, що Google краще здійснює пошук і може відповідати на основні питання, такі як перетворення вимірювань і проста математика. З правильно налаштованим розумним будинком і добре навченим користувачем, більшість розумних домашніх команд працюватимуть за призначенням. Але це сталося через роботу і зусилля, а не розумове розуміння.

    Раніше таймери та сигнали були спрощеними. Згодом було додано іменування, потім можливість додавати час до таймера. Вони перейшли від спрощеного до більш складного. Голосові помічники можуть відповісти на більше запитань, і кожен день приносить нові навички та можливості. Але це не є продуктом самозростання, який виникає в результаті навчання та розуміння.

    І нічого з цього не забезпечує притаманну можливість використовувати те, що, як відомо, досягає невідомого. Для кожної команди і питання, які працюють, завжди буде три, які не роблять. Без прориву в А.І. що надає людині здатність до розуміння, голосові помічники взагалі не є помічниками. Вони просто голосові командні рядки - корисні у правильному сценарії, але обмежені тими сценаріями, які були запрограмовані для розуміння.

    Іншими словами: машини вивчають речі, але не можуть їх зрозуміти.