Просто виведіть переклад. Не додавайте жодних коментарів, пояснень чи метатекстів:
Він був запущений з такою кількістю помилок у написанні, що це схоже на прояви божевілля у Каліфорнії 60-х років.
Факти були перекручені до невпізнання. Інтернет все це пам’ятав. Через два роки, за допомогою моделі Gemini, суми резюме стали більш точними. Але це лише часткове вирішення проблеми. Видавці ненавидять такий підхід, а користувачі зазнають його.
Ключова проблема залишилася незмінною: штучний інтелект все ще не може правильно вважати літери в словах.
Жахливо.
Ви, мабуть, пам’ятаєте інцидент із словом “strawberry”. Модель переплутала літери і втратила голову через те, що “r” може бути в слові. Це сталося два роки тому. У вівторок з’явився новий виклик: Наомі Рохатін поставила просте запитання:
“Скільки букв ‘e’ у слові ‘astronomical’?”
Штучний інтелект відповів упевнено, що їх рівно дві. Він навіть пояснив, як пишеться це слово: “a-s-t-r-e-n-o-mi-c-a-e-l”.
Ми провели тест. Виявилося, що результати були такими самими. Схоже, модель працює також для будь-якого слова, що має більше трьох складів. Соціальні мережі були шоковані. Люди вважали це смішним. Чому ми маємо дивуватися?
Чому вона не може правильно рахувати літери?
Я не хочу звучати як Біллі Медісон, який готується до ярмарку, але подумайте про це: якщо штучний інтелект веде до зниження рівня клікабельності, то резюме має бути точним. Воно має бути надійним. Ця логіка здається розумною. Але реалізація не така.
Моделі мови не читають як ми. Вони обробляють токени, а чи не літери. Уявіть, що модель читає значення, а чи не символи. Якщо попросити її рахувати окремі літери, вона не зможе це зробити. Токенізація перетворює слова на числові ідентифікатори. Слово “astronomical” стає одним блоком. Але модель не може автоматично знайти літери “e” або “t”. Вона розуміє саму концепцію.
Я попросив Gemini зробити це. Він відповів прямо:
“Я не читаю текст так, як ви.”
Коли ви пишете apple, ваш мозок бачить п’ять окремих символів. Модель Gemini бачить один блок – токен. Вона знає, що таке яблуко. Але вона може розуміти, що у концепції є дві літери “p”, якщо не змусити її розділити слова окремі блоки.
“Тому що я обробляю слова як цілі блоки… Я не можу автоматично писати букви.”
Це структурне обмеження, а чи не брак інтелекту. Принаймні так кажуть.
Mashable звернувся до Google. Вони не одразу запропонували виправлення для цієї проблеми.
Машинне навчання справді добре розуміє контекст. Але алфавіт залишається лінійним. Модель бачить ліс, але забуває дерева та листя.
Хто тепер вважатиме літери?
