Foi lançado com mais alucinações do que Ken Kesey na Califórnia dos anos 60.
Cole na pizza. Fatos distorcidos em nós. A internet lembrou. Dois anos depois, os resumos desenvolvidos pelo Gemini aumentaram principalmente o controle da precisão. Principalmente sendo a palavra-chave que os editores odeiam e os usuários toleram.
O problema central permanece. Ele ainda falha nos testes de ortografia.
Seriamente.
Você provavelmente se lembra do incidente do morango. Aquele colapso viral em que a modelo contou letras e perdeu a cabeça pensando em quantos ‘r’s cabiam dentro da palavra. Isso foi há dois anos. Terça-feira trouxe um novo desafiante. Naomi Rohatyn foi até X. Fez uma pergunta simples.
“Quantos e tem a palavra ‘astronômico’?”
A IA parecia confiante. Alegou que havia exatamente dois. Até explicou isso para você.
a-s-t-r-e-n-o-mi-c-a-e-l
Nós mesmos fizemos o teste. Tenho o mesmo absurdo. Parece funcionar da mesma maneira para qualquer palavra que ultrapasse três sílabas. Basta dizer. As redes sociais explodiram. As pessoas acharam isso hilário. Por que estamos surpresos.
Então por que não pode contar?
Não estou tentando parecer Billy Madison se preparando para a feira do condado, mas considere o seguinte: se as visões gerais de IA matam suas taxas de cliques, o resumo precisa estar correto. Tem que ser confiável. Essa lógica parece sólida. A execução não é.
Os modelos de linguagem não leem como nós.
Eles processam tokens. Não cartas. Pense nisso como uma leitura por pedaços de significado em vez de cadeias de caracteres. Peça para ele olhar letras individuais e ele bate na parede. A tokenização transforma palavras em IDs numéricos. A palavra “astronômico” torna-se um bloco. Ou alguns. Naturalmente, ele não procura ‘e’ ou ‘t’. Ele entende o conceito.
Perguntei diretamente a Gêmeos. Disse-lhe para defender a sua honra.
A resposta foi direta.
“Eu não vejo o texto como você.”
Quando você digita “maçã”, seu cérebro vê cinco símbolos distintos. Ele vê as letras. Gêmeos vê uma única unidade. Um token. Uma representação numérica do significado. Ele sabe o que é uma maçã é. Ele não sabe inerentemente que o conceito contém dois p’s, a menos que você o force a quebrar o bloco.
“Porque eu processo palavras como blocos inteiros… eu não ‘soletra’ naturalmente”
É uma limitação estrutural, não uma falta de inteligência. Ou pelo menos é o que nos dizem.
Mashable entrou em contato com o Google. Eles não voltaram imediatamente com um patch para o erro ortográfico.
A máquina aprende o contexto bem o suficiente. Mas o alfabeto permanece teimosamente linear. A modelo vê a floresta, esquece as árvores. E as folhas.
Quem os conta agora?
