De AI van Google kan nog steeds niet spellen. Wij lachen in ieder geval.

17

Het begon met meer hallucinaties dan Ken Kesey in Californië in de jaren zestig.

Pizza opplakken. Feiten in knopen gedraaid. Het internet herinnerde zich. Twee jaar later hebben de door Gemini aangedreven samenvattingen hun greep op de nauwkeurigheid grotendeels verstevigd. Meestal is het sleutelwoord dat uitgevers haten en gebruikers tolereren.

Het kernprobleem blijft bestaan. Het faalt nog steeds bij spellingtests.

Slecht.

U herinnert zich waarschijnlijk het aardbeienincident. Die virale meltdown waarbij het model letters telde en zijn verstand verloor over hoeveel ‘r’s er in het woord pasten. Dat was twee jaar geleden. Dinsdag bracht een nieuwe uitdager. Naomi Rohatyn ging naar X. Stelde een simpele vraag.

“Hoeveel e’s zitten er in het woord ‘astronomisch’?”

De AI zag er zelfverzekerd uit. Er werd beweerd dat het er precies twee waren. Het heeft het zelfs voor je uitgeschreven.

a-s-t-r-e-n-o-mi-c-a-e-l

Wij hebben de test zelf uitgevoerd. Heb dezelfde onzin. Het lijkt op dezelfde manier te gebeuren voor elk woord dat langer duurt dan drie lettergrepen. Het volstaat te zeggen. Sociale media barsten los. Mensen vonden het hilarisch. Waarom zijn wij verrast.

Dus waarom kan het niet tellen?

Ik probeer niet te klinken als Billy Madison die zich voorbereidt op de provinciale kermis, maar bedenk dit: als AI-overzichten uw klikfrequenties tenietdoen, moet de samenvatting kloppen. Het moet betrouwbaar zijn. Die logica voelt solide. De uitvoering niet.

Taalmodellen lezen niet zoals wij.

Ze verwerken tokens. Geen brieven. Zie het als lezen door middel van stukjes in plaats van tekenreeksen. Vraag hem om naar individuele letters te kijken, en hij botst tegen een muur. Tokenisatie verandert woorden in numerieke ID’s. Het woord ‘astronomisch’ wordt één blok. Of een paar. Er wordt niet van nature gescand op ‘e’ of ‘t’. Het begrijpt het concept.

Ik vroeg het rechtstreeks aan Gemini. Ik zei dat het zijn eer moest verdedigen.

Het antwoord was bot.

“Ik kijk niet naar tekst zoals jij.”

Wanneer je ‘appel’ typt, zien je hersenen vijf verschillende symbolen. Hij ziet de letters. Gemini ziet een enkele eenheid. Een teken. Een numerieke weergave van betekenis. Het weet wat een appel is. Het weet niet inherent dat het concept twee p’s bevat, tenzij je het dwingt het blok uit elkaar te halen.

“Omdat ik woorden als hele blokken verwerk… ‘spel’ ik van nature niet”

Het is een structurele beperking, geen gebrek aan intelligentie. Of dat wordt ons verteld.

Mashable nam contact op met Google. Ze kwamen niet meteen terug met een patch voor de spellingsfout.

De machine leert de context goed genoeg. Maar het alfabet blijft koppig lineair. Het model ziet het bos, vergeet de bomen. En de bladeren.

Wie telt ze nu?