Ini diluncurkan dengan lebih banyak halusinasi daripada Ken Kesey di California tahun 60an.
Rekatkan pada pizza. Fakta dipelintir menjadi simpul. Internet ingat. Dua tahun kemudian, ringkasan yang didukung Gemini sebagian besar telah memperketat cengkeraman mereka pada akurasi. Kebanyakan menjadi kata kunci yang dibenci penerbit dan ditoleransi oleh pengguna.
Masalah intinya masih ada. Itu masih gagal dalam tes ejaan.
Dengan buruk.
Anda mungkin ingat kejadian stroberi. Kehancuran viral saat model menghitung huruf dan kehilangan akal mengenai berapa banyak huruf yang cocok di dalam kata tersebut. Itu terjadi dua tahun lalu. Selasa membawa penantang baru. Naomi Rohatyn pergi ke X. Mengajukan pertanyaan sederhana.
“Berapa huruf e pada kata ‘astronomi’?”
AI tampak percaya diri. Diklaim tepat ada dua. Itu bahkan menjelaskannya untuk Anda.
a-s-t-r-e-n-o-mi-c-a-e-l
Kami menjalankan tes sendiri. Mendapat omong kosong yang sama. Tampaknya cara penguraiannya sama untuk kata apa pun yang melewati tiga suku kata. Cukuplah untuk mengatakan. Media sosial meledak. Orang-orang menganggapnya lucu. Mengapa kami terkejut.
Jadi kenapa tidak bisa dihitung?
Saya tidak mencoba untuk terdengar seperti Billy Madison yang sedang mempersiapkan pekan raya daerah, tetapi pertimbangkan ini: jika Ikhtisar AI mematikan rasio klik-tayang Anda, ringkasannya harus benar. Itu harus dapat dipercaya. Logika itu terasa kokoh. Eksekusinya tidak.
Model bahasa tidak terbaca seperti kita.
Mereka memproses token. Bukan surat. Anggap saja membaca berdasarkan potongan makna, bukan rangkaian karakter. Mintalah ia untuk melihat satu per satu huruf, dan huruf itu membentur dinding. Tokenisasi mengubah kata menjadi ID numerik. Kata “astronomi” menjadi satu blok. Atau beberapa. Itu tidak secara alami memindai ‘e’ atau ‘t’. Ia memahami konsep.
Saya bertanya langsung kepada Gemini. Menyuruhnya untuk mempertahankan kehormatannya.
Jawabannya blak-blakan.
“Saya tidak melihat teks seperti Anda.”
Saat Anda mengetik ‘apel’, otak Anda melihat lima simbol berbeda. Ia melihat surat-surat itu. Gemini melihat satu kesatuan. Sebuah tanda. Representasi makna numerik. Ia tahu apa itu apel itu. Ia tidak secara inheren mengetahui bahwa konsep tersebut mengandung dua p kecuali Anda memaksanya untuk memecah blok tersebut.
“Karena saya memproses kata-kata secara keseluruhan… Saya tidak ‘mengeja’ secara alami”
Ini adalah keterbatasan struktural, bukan kurangnya kecerdasan. Atau begitulah yang diberitahukan kepada kita.
Mashable menghubungi Google. Mereka tidak segera kembali dengan perbaikan untuk bug ejaan.
Mesin mempelajari konteks dengan cukup baik. Namun alfabetnya tetap linier. Sang model melihat hutan, melupakan pepohonan. Dan daunnya.
Siapa yang menghitungnya sekarang?
