Майбутнє розумного дому настало багато років тому – і воно не працює, як обіцяли. Незважаючи на ажіотаж навколо генеративного штучного інтелекту, сьогоднішні голосові помічники менш надійні, ніж їхні попередники, їм важко справлятися навіть із базовими завданнями, як-от увімкнути світло чи заварити каву. Головна проблема полягає не у відсутності інтелекту, а в фундаментальній невідповідності між тим, як працюють ці нові системи ШІ, і тим, що потрібно розумним будинкам.
Ілюзія прогресу
У 2023 році Дейв Лімп з Amazon натякнув на прорив: голосовий помічник, який розуміє контекст, легко інтегрується зі смарт-пристроями та полегшує домашню автоматизацію. Перенесімося до 2025 року, і хоча такі помічники, як Alexa Plus і Gemini for Home звучать розумніше, вони часто не мають базових функцій. Поточні «оновлення» надають пріоритет розмовним можливостям, а не послідовності. Користувачі повідомляють, що їхні пристрої не можуть надійно виконувати команди навіть після багатьох років налаштування.
Ситуація настільки поширена, що технологічні компанії визнають проблему. Проблема не обмежується лише розумними будинками: навіть ChatGPT іноді має проблеми з базовою логікою. Ця невдача сталася не через лінь, а через неправильний підхід.
Чому штучний інтелект не може з цим впоратися
Перехід від старих голосових помічників, що “відповідають шаблонам”, до нових систем на основі LLM (Large Language Model) створив фундаментальний розрив. Старі помічники були жорсткі, але надійні; вони передбачувано виконували точні команди. LLMs, хоча вони більш універсальні, вводять випадковість. Той самий запит може щоразу давати різні результати, що робить базові завдання ненадійними.
*«Програми LLM просто не створені для того, щоб робити те, що робили попередні голосові помічники на основі команд і управління», — пояснює Марк Рідл, професор Технологічного інституту Джорджії. Цим новим системам важко стабільно виконувати завдання, з якими старі моделі справлялися з легкістю. LLM тепер мають будувати цілі послідовності коду для API, що створює більше точок відмови.
Ціна “інтелекту”
Технічні компанії не відмовляються від старих технологій; вони переслідують більш амбітну мету: штучний інтелект на основі агентів, який розуміє природну мову та динамічно поєднує завдання. Це вимагає пожертвувати короткостроковою надійністю заради потенціалу набагато більших можливостей.
Дхрув Джайн, директор лабораторії Soundability в Університеті Мічигану, підсумовує: * «Питання полягає в тому, чи розширений діапазон можливостей, які пропонує нова технологія, коштує більше, ніж 100-відсоткова точна недетермінована модель».* Нинішній підхід, по суті, є бета-тестуванням у реальних будинках.
Що далі?
Компанії експериментують із гібридними моделями, такими як Gemini Live від Google, щоб збалансувати потужність і точність. Але навіть ці рішення залишаються недосконалими. Основна проблема полягає в тому, що LLM недостатньо навчені розрізняти ситуації, які вимагають абсолютної точності, від тих, які цінують гнучкість.
Збої в системі штучного інтелекту розумного дому викликають ширші питання щодо готовності технології для більш важливих додатків. Якщо ШІ не може надійно ввімкнути світло, наскільки ми можемо довіряти його здатності справлятися зі складними завданнями? Шлях вперед передбачає використання випадковості LLM, але ціною глибини розмови.
Ця порушена обіцянка розумного дому є застереженням: швидко рухатись і ламати речі не завжди є прогресом. Технічні компанії повинні вирішити, чи потенціал передового ШІ переважує миттєве розчарування ненадійними пристроями. Наразі багатьом користувачам залишається розумніший, але більш дратівливий розумний домашній досвід.
































































