Il a démarré avec plus d’hallucinations que Ken Kesey dans la Californie des années 60.
Collez sur la pizza. Les faits se sont tordus. Internet s’en souvient. Deux ans plus tard, les résumés propulsés par Gemini ont pour l’essentiel renforcé leur emprise sur l’exactitude. Principalement étant le mot clé que les éditeurs détestent et que les utilisateurs tolèrent.
Le problème central demeure. Il échoue toujours aux tests d’orthographe.
Gravement.
Vous vous souvenez probablement de l’incident des fraises. Cet effondrement viral où le mannequin a compté les lettres et a perdu la tête quant au nombre de « r » contenus dans le mot. C’était il y a deux ans. Mardi a amené un nouveau challenger. Naomi Rohatyn est allée voir X. Elle a posé une question simple.
“Combien y a-t-il de e dans le mot ‘astronomique’ ?”
L’IA avait l’air confiante. Il prétendait qu’il y en avait exactement deux. Il vous l’a même expliqué.
a-s-t-r-e-n-o-mi-c-a-e-l
Nous avons effectué le test nous-mêmes. J’ai les mêmes bêtises. Il semble se décomposer de la même manière pour tout mot dépassant trois syllabes. Il suffit de le dire. Les réseaux sociaux ont éclaté. Les gens ont trouvé ça hilarant. Pourquoi sommes-nous surpris.
Alors pourquoi ça ne compte pas ?
Je n’essaie pas de ressembler à Billy Madison se préparant pour la foire du comté, mais considérez ceci : si les aperçus de l’IA tuent vos taux de clics, le résumé doit être correct. Il doit être digne de confiance. Cette logique semble solide. L’exécution ne l’est pas.
Les modèles de langage ne se lisent pas comme nous.
Ils traitent les jetons. Pas des lettres. Considérez-le comme une lecture signifiant des morceaux plutôt que des chaînes de caractères. Demandez-lui de regarder des lettres individuelles et il se heurte à un mur. La tokenisation transforme les mots en identifiants numériques. Le mot « astronomique » devient un bloc. Ou quelques-uns. Il ne recherche pas naturellement « e » ou « t ». Il comprend le concept.
J’ai demandé directement aux Gémeaux. Je lui ai dit de défendre son honneur.
La réponse a été brutale.
“Je ne regarde pas le texte comme toi.”
Lorsque vous tapez « pomme », votre cerveau voit cinq symboles distincts. Il voit les lettres. Les Gémeaux voient une seule unité. Un jeton. Une représentation numérique du sens. Il sait ce qu’est une pomme. Il ne sait pas intrinsèquement que le concept contient deux p, à moins que vous ne le forciez à briser le bloc.
“Parce que je traite les mots comme des blocs entiers… je ne les épelle pas naturellement”
C’est une limitation structurelle, pas un manque d’intelligence. C’est du moins ce qu’on nous dit.
Mashable a contacté Google. Ils ne se sont pas immédiatement précipités avec un correctif pour le bug d’orthographe.
La machine apprend assez bien le contexte. Mais l’alphabet reste obstinément linéaire. Le modèle voit la forêt, oublie les arbres. Et les feuilles.
Qui les compte maintenant ?






























