Es begann mit mehr Halluzinationen als Ken Kesey im Kalifornien der 60er Jahre.
Pizza aufkleben. Fakten zu Knoten verdreht. Das Internet erinnerte sich. Zwei Jahre später haben die von Gemini betriebenen Zusammenfassungen ihren Einfluss auf die Genauigkeit größtenteils verschärft. Meistens ist das entscheidende Wort, das Verlage hassen und Benutzer tolerieren.
Das Kernproblem bleibt bestehen. Bei Rechtschreibtests schlägt es immer noch fehl.
Schlecht.
Sie erinnern sich wahrscheinlich an den Vorfall mit der Erdbeere. Dieser virale Zusammenbruch, bei dem das Model die Buchstaben zählte und nicht mehr wusste, wie viele „r“ in das Wort passen. Das war vor zwei Jahren. Der Dienstag brachte einen neuen Herausforderer. Naomi Rohatyn ging zu X. Hat eine einfache Frage gestellt.
„Wie viele e enthält das Wort ‚astronomisch‘?“
Die KI wirkte zuversichtlich. Es wurde behauptet, dass es genau zwei waren. Es hat es dir sogar erklärt.
„a-s-t-r-e-n-o-mi-c-a-e-l“.
Wir haben den Test selbst durchgeführt. Habe den gleichen Unsinn. Bei jedem Wort, das länger als drei Silben ist, scheint es auf die gleiche Weise zu funktionieren. Es genügt zu sagen. Die sozialen Medien brachen aus. Die Leute fanden es urkomisch. Warum sind wir überrascht.
Warum kann es also nicht zählen?
Ich versuche nicht, wie Billy Madison zu klingen, der sich auf den Jahrmarkt vorbereitet, aber bedenken Sie Folgendes: Wenn KI-Übersichten Ihre Klickraten zerstören, muss die Zusammenfassung stimmen. Es muss vertrauenswürdig sein. Diese Logik fühlt sich solide an. Die Ausführung ist nicht.
Sprachmodelle lesen sich nicht so wie wir.
Sie verarbeiten Token. Keine Briefe. Betrachten Sie es als Lesen anhand von Bedeutungsblöcken und nicht als Zeichenfolgen. Bitten Sie es, einzelne Buchstaben anzuschauen, und es stößt gegen eine Wand. Durch die Tokenisierung werden Wörter in numerische IDs umgewandelt. Das Wort „astronomisch“ wird zu einem Block. Oder ein paar. Es sucht natürlich nicht nach „e“ oder „t“. Es versteht das Konzept.
Ich habe Gemini direkt gefragt. Habe ihm gesagt, dass er seine Ehre verteidigen soll.
Die Antwort war unverblümt.
„Ich betrachte Texte nicht so wie Sie.“
Wenn Sie „Apfel“ eingeben, sieht Ihr Gehirn fünf verschiedene Symbole. Es sieht die Buchstaben. Zwillinge sehen eine einzelne Einheit. Ein Token. Eine numerische Darstellung der Bedeutung. Es weiß, was ein Apfel ist. Es weiß von Natur aus nicht, dass das Konzept zwei ps enthält, es sei denn, Sie zwingen es, den Block aufzubrechen.
„Weil ich Wörter als ganze Blöcke verarbeite … Ich kann von Natur aus nicht buchstabieren.“
Es handelt sich um eine strukturelle Einschränkung, nicht um einen Mangel an Intelligenz. Zumindest wird uns das gesagt.
Mashable hat sich an Google gewandt. Sie kamen nicht sofort mit einem Patch für den Rechtschreibfehler zurück.
Die Maschine lernt den Kontext gut genug. Doch das Alphabet bleibt hartnäckig linear. Das Model sieht den Wald, vergisst die Bäume. Und die Blätter.
Wer zählt sie jetzt?
