Umělá inteligence Google stále neumí správně hláskovat slova. Smějeme se tomu.

7

Stačí zadat překlad. Nepřidávejte žádné komentáře, vysvětlení ani metatext:

Byl spuštěn s tolika překlepy, že to vypadá jako šílenství v Kalifornii 60. let.

Fakta byla překroucena k nepoznání. Internet si tohle všechno pamatoval. O dva roky později se pomocí modelu Gemini zpřesnily částky životopisů. Ale to je jen částečné řešení problému. Vydavatelé tento přístup nenávidí a uživatelé jej tolerují.

Klíčový problém zůstává stejný: umělá inteligence stále nedokáže správně počítat písmena ve slovech.

Hrozný.

Pravděpodobně si pamatujete na příhodu se slovem „jahoda“. Modelka si zamíchala písmena a ztratila hlavu nad tím, kolik „r“ může být ve slově. Stalo se to před dvěma lety. V úterý se objevila nová výzva: Naomi Rohatyn položila jednoduchou otázku:

“Kolik “e” je ve slově “astronomický”?”

Umělá inteligence sebevědomě odpověděla, že jsou rovnou dva. Dokonce vysvětlil, jak se toto slovo píše: a-s-t-r-e-n-o-mi-c-a-e-l.

Test jsme dělali sami. Ukázalo se, že výsledky jsou stejné. Zdá se, že model funguje stejně pro každé slovo s více než třemi slabikami. Sociální sítě byly v šoku. Lidem to přišlo vtipné. Proč bychom se měli divit?

Proč nemůže správně počítat písmena?

Nechci znít, jako by se Billy Madison chystal na veletrh, ale zamyslete se nad tím: pokud umělá inteligence vede k nižší míře prokliku, pak musí být životopis přesný. Musí to být spolehlivé. Tato logika se zdá být rozumná. Ale realizace taková není.

Jazykové modely se nečtou jako my. Zpracovávají žetony, ne dopisy. Představte si, že model čte hodnoty spíše než znaky. Pokud ji požádáte, aby počítala jednotlivá písmena, nezvládne to. Tokenizace mění slova na číselné identifikátory. Slovo „astronomický“ tvoří jeden blok. Ale model nemůže automaticky najít písmena „e“ nebo „t“. Chápe koncept.

Požádal jsem Blížence, aby to udělal. Odpověděl přímo:

“Nečtu text jako ty.”

Když napíšete „jablko“, váš mozek vidí pět samostatných znaků. Model Gemini vidí jeden blok – token. Ví, co je jablko. Ale nemůže pochopit, že v konceptu jsou dvě p, pokud není nucena rozdělit slova do samostatných bloků.

“Protože zpracovávám slova jako celé bloky… nemohu automaticky ‘psát’ písmena.”

Jde o strukturální omezení, nikoli o nedostatek inteligence. Alespoň se to tak říká.

Mashable oslovil Google. Okamžitě nenabídli řešení tohoto problému.

Strojové učení je opravdu dobré v porozumění kontextu. Ale abeceda zůstává lineární. Model vidí les, ale zapomíná na stromy a listí.

Kdo teď bude počítat písmena?