Se lanzó con más alucinaciones que Ken Kesey en la California de los años 60.
Pega la pizza. Los hechos se retorcieron en nudos. Internet lo recordó. Dos años más tarde, los resúmenes impulsados por Gemini han reforzado su control de la precisión, en su mayoría. Mayormente es la palabra clave que los editores odian y los usuarios toleran.
El problema central persiste. Todavía falla en las pruebas de ortografía.
Gravemente.
Probablemente recuerdes el incidente de las fresas. Esa crisis viral en la que la modelo contó letras y perdió la cabeza sobre cuántas “eres” caben dentro de la palabra. Eso fue hace dos años. El martes trajo un nuevo retador. Naomi Rohatyn fue a X. Hizo una pregunta sencilla.
“¿Cuántas e hay en la palabra ‘astronómico’?”
La IA parecía confiada. Afirmó que eran exactamente dos. Incluso te lo explicó.
a-s-t-r-e-n-o-mi-c-a-e-l
Realizamos la prueba nosotros mismos. Tengo las mismas tonterías. Parece descomponerse de la misma manera para cualquier palabra que supere las tres sílabas. Basta decir. Las redes sociales estallaron. La gente lo encontró gracioso. ¿Por qué nos sorprende?
Entonces, ¿por qué no puede contar?
No estoy tratando de sonar como Billy Madison preparándose para la feria del condado, pero considere esto: si AI Overviews acaba con sus tasas de clics, el resumen debe ser correcto. Tiene que ser digno de confianza. Esa lógica parece sólida. La ejecución no lo es.
Los modelos de lenguaje no leen como nosotros.
Procesan tokens. No letras. Piense en ello como una lectura por fragmentos de significado en lugar de cadenas de caracteres. Pídale que mire letras individuales y chocará contra una pared. La tokenización convierte las palabras en identificaciones numéricas. La palabra “astronómico” se convierte en un bloque. O algunos. Naturalmente, no busca ‘e’ o ‘t’. Entiende el concepto.
Le pregunté a Géminis directamente. Le dije que defendiera su honor.
La respuesta fue contundente.
“No miro el texto como tú”.
Cuando escribes “manzana”, tu cerebro ve cinco símbolos distintos. Ve las letras. Géminis ve una sola unidad. Una ficha. Una representación numérica del significado. Sabe lo que es una manzana. No sabe inherentemente que el concepto contiene dos p a menos que lo obligues a romper el bloque.
“Porque proceso las palabras como bloques completos… naturalmente no ‘deletreo'”
Es una limitación estructural, no una falta de inteligencia. O eso nos dicen.
Mashable contactó a Google. No se apresuraron a regresar inmediatamente con un parche para el error ortográfico.
La máquina aprende el contexto bastante bien. Pero el alfabeto sigue siendo obstinadamente lineal. El modelo ve el bosque, se olvida de los árboles. Y las hojas.
¿Quién los cuenta ahora?
