Искусственный интеллект Google все еще не может правильно писать слова. Мы смеемся над этим.

20

Просто выведите перевод. Не добавляйте никаких комментариев, объяснений или метатекстов:

Он был запущен с таким количеством ошибок в написании, что это похоже на проявления безумия в Калифорнии 60-х годов.

Факты были извращены до неузнаваемости. Интернет помнил все это. Два года спустя, с помощью модели Gemini, суммы резюме стали более точными. Но это лишь частичное решение проблемы. Издатели ненавидят такой подход, а пользователи терпят его.

Ключевая проблема осталась прежней: искусственный интеллект все еще не может правильно считать буквы в словах.

Ужасно.

Вы, наверное, помните инцидент с словом “strawberry”. Модель перепутала буквы и потеряла голову из-за того, сколько “r” может быть в слове. Это произошло два года назад. Во вторник появился новый вызов: Наоми Рохатин задала простой вопрос:

“Сколько букв ‘e’ в слове ‘astronomical’?”

Искусственный интеллект ответил уверенно, что их ровно две. Он даже объяснил, как пишется это слово: a-s-t-r-e-n-o-mi-c-a-e-l.

Мы сами провели тест. Оказалось, что результаты были такими же. Похоже, модель работает так же для любого слова, имеющего более трех слогов. Социальные сети были в шоке. Люди считали это смешным. Почему мы должны удивляться?

Почему она не может правильно считать буквы?

Я не хочу звучать как Билли Мэдисон, готовящийся к ярмарке, но подумайте об этом: если искусственный интеллект ведет к снижению уровня кликабельности, то резюме должно быть точным. Оно должно быть надежным. Эта логика кажется разумной. Но реализация не такова.

Модели языка не читают, как мы. Они обрабатывают токены, а не буквы. Представьте, что модель читает значения, а не символы. Если попросить ее считать отдельные буквы, она не сможет это сделать. Токенизация превращает слова в числовые идентификаторы. Слово “astronomical” становится одним блоком. Но модель не может автоматически найти буквы “e” или “t”. Она понимает саму концепцию.

Я попросил Gemini сделать это. Он ответил прямо:

“Я не читаю текст так, как вы.”

Когда вы пишете “apple”, ваш мозг видит пять отдельных символов. Модель Gemini видит один блок – токен. Она знает, что такое яблоко. Но она не может понимать, что в концепции есть две буквы “p”, если только не заставить ее разделить слова на отдельные блоки.

“Потому что я обрабатываю слова как целые блоки… Я не могу автоматически ‘писать’ буквы.”

Это структурное ограничение, а не недостаток интеллекта. По крайней мере, так говорят.

Mashable обратился к Google. Они не сразу предложили исправления для этой проблемы.

Машинное обучение действительно хорошо понимает контекст. Но алфавит остается линейным. Модель видит лес, но забывает деревья и листья.

Кто теперь будет считать буквы?