Просто выведите перевод. Не добавляйте никаких комментариев, объяснений или метатекстов:
Он был запущен с таким количеством ошибок в написании, что это похоже на проявления безумия в Калифорнии 60-х годов.
Факты были извращены до неузнаваемости. Интернет помнил все это. Два года спустя, с помощью модели Gemini, суммы резюме стали более точными. Но это лишь частичное решение проблемы. Издатели ненавидят такой подход, а пользователи терпят его.
Ключевая проблема осталась прежней: искусственный интеллект все еще не может правильно считать буквы в словах.
Ужасно.
Вы, наверное, помните инцидент с словом “strawberry”. Модель перепутала буквы и потеряла голову из-за того, сколько “r” может быть в слове. Это произошло два года назад. Во вторник появился новый вызов: Наоми Рохатин задала простой вопрос:
“Сколько букв ‘e’ в слове ‘astronomical’?”
Искусственный интеллект ответил уверенно, что их ровно две. Он даже объяснил, как пишется это слово: a-s-t-r-e-n-o-mi-c-a-e-l.
Мы сами провели тест. Оказалось, что результаты были такими же. Похоже, модель работает так же для любого слова, имеющего более трех слогов. Социальные сети были в шоке. Люди считали это смешным. Почему мы должны удивляться?
Почему она не может правильно считать буквы?
Я не хочу звучать как Билли Мэдисон, готовящийся к ярмарке, но подумайте об этом: если искусственный интеллект ведет к снижению уровня кликабельности, то резюме должно быть точным. Оно должно быть надежным. Эта логика кажется разумной. Но реализация не такова.
Модели языка не читают, как мы. Они обрабатывают токены, а не буквы. Представьте, что модель читает значения, а не символы. Если попросить ее считать отдельные буквы, она не сможет это сделать. Токенизация превращает слова в числовые идентификаторы. Слово “astronomical” становится одним блоком. Но модель не может автоматически найти буквы “e” или “t”. Она понимает саму концепцию.
Я попросил Gemini сделать это. Он ответил прямо:
“Я не читаю текст так, как вы.”
Когда вы пишете “apple”, ваш мозг видит пять отдельных символов. Модель Gemini видит один блок – токен. Она знает, что такое яблоко. Но она не может понимать, что в концепции есть две буквы “p”, если только не заставить ее разделить слова на отдельные блоки.
“Потому что я обрабатываю слова как целые блоки… Я не могу автоматически ‘писать’ буквы.”
Это структурное ограничение, а не недостаток интеллекта. По крайней мере, так говорят.
Mashable обратился к Google. Они не сразу предложили исправления для этой проблемы.
Машинное обучение действительно хорошо понимает контекст. Но алфавит остается линейным. Модель видит лес, но забывает деревья и листья.
Кто теперь будет считать буквы?
