Nejnovější zprávy a články

Anthropic vysvětluje fenomén „smršťování umělé inteligence“: jak technické změny snížily Claudův výkon

25.04.2026

Komunita umělé inteligence už týdny bije na poplach ohledně vnímaného poklesu inteligence vlajkových modelů Anthropic. Uživatelé na platformách jako GitHub, X a Reddit ohlásili fenomén, který nazvali AI shrinkflation – trend, kdy Claude přestal být schopen složitých úvah, dělal více chyb a začal utrácet tokeny méně efektivně.

Ačkoli společnost Anthropic zpočátku popírala tvrzení, že by model záměrně nerfovala, aby mohla spravovat zatížení serveru, společnost nyní po vyšetřování zveřejnila technickou zprávu. Ukazuje se, že zatímco základní váhy neuronové sítě zůstaly nezměněny, tři specifické úpravy svazku – softwarové vrstvy obklopující model – nechtěně podkopaly jeho účinnost.

Důkaz degradace

Nespokojenost uživatelů nebyla pouhým subjektivním názorem; bylo podpořeno vážnými technickými údaji. Začátkem dubna 2026 se diskuse o Claudově „hlouposti“ dočkala široké veřejnosti díky několika klíčovým zjištěním:

Rozsáhlé audity: Stella Lorenzo, vrchní ředitelka skupiny AI ve společnosti AMD, prověřila více než 6 800 relací Claude Code a 234 000 volání nástrojů. Její data ukázala prudký pokles hloubky uvažování: model se často zasekl v opakováních nebo zvolil nejjednodušší řešení místo toho nejpřesnějšího.
Pokles skóre v benchmarku: Testování třetí strany společností BridgeMind ukázalo významný zásah do Claude Opus 4.6, přičemž skóre přesnosti kleslo z 83,3 % na 68,3 %, což model spadlo z druhého na desáté místo v žebříčku odvětví.
Neefektivita zdrojů: Uživatelé hlásili, že limity využití se vyčerpávají mnohem rychleji než obvykle. To vyvolalo podezření, že se model stal více „podrobný“ nebo méně účinný při zpracování informací.

Důvody toho, co se stalo: tři techničtí viníci

Anthropic objasnil, že „mozky“ AI (hmotnosti modelu) se nezměnily. Místo toho problémy vyvstaly ze změn uživatelského rozhraní a pokynů, které řídí chování modelu:

1. Snížení intenzity uvažování

Aby se vyřešil problém se zpožděním uživatelského rozhraní (kdy se zdálo, že obrazovka zamrzla, zatímco model „přemýšlel“), Anthropic snížil výchozí úroveň intenzity uvažování z vysoké na střední pro Claude Code. Díky tomu bylo rozhraní citlivější, ale zbavilo model výpočetní hloubky potřebné pro složité inženýrské problémy.

2. Chyba v logice ukládání do mezipaměti

Aktualizace z 26. března, navržená tak, aby optimalizovala paměť odstraněním zastaralých myšlenkových dat z neaktivních relací, obsahovala kritickou chybu. Namísto vymazání starých dat jednou po hodině nečinnosti chyba vymazala „krátkodobou paměť“ modelu při každé následující interakci. To vedlo k tomu, že se Claude stal „zapomnětlivým“ a náchylným k opakování.

3. Meze výřečnosti

Ve snaze učinit odpovědi stručnějšími zavedl Anthropic nové pokyny, které omezují množství textu mezi voláním nástroje a konečnými odpověďmi. Toto zaměření na „stručnost“ selhalo: hodnocení ukázala 3% snížení kvality kódování, protože model měl potíže s vyjádřením složité logiky v rámci přísných limitů počtu slov.

Obnovení důvěry a budoucí ochrany

Důsledky těchto chyb ovlivnily Claude Code CLI, Claude Agent SDK a Claude Cowork, ačkoli hlavní Claude API zůstalo nedotčeno. Aby se situace napravila a zabránilo se opakování podobných incidentů, zavádí Antropic řadu strukturálních změn:

Pokročilé „interní testování“ (dogfooding): Více zaměstnanců společnosti bude nyní muset používat stejná veřejná sestavení jako zákazníci k identifikaci regresí, než půjdou na trh.
Přísné testování: Společnost zavádí vylepšené sady nástrojů k vyhodnocení, jak každá malá změna v „systémové výzvě“ ovlivní celkovou inteligenci modelu.
Kompenzace předplatitelů: Anthropic si uvědomuje frustraci uživatelů a plýtvání tokeny a resetuje limity použití pro všechny předplatitele od 23. dubna.

„Nikdy nebudeme záměrně degradovat naše modely,“ řekl Anthropic a zdůraznil, že jejich cílem je zajistit, aby uživatelská zkušenost odpovídala vysokým standardům jejich základních technologií.

Závěr: Společnost Antropic zjistila, že nedávný pokles výkonu byl způsoben spíše pokusy o optimalizaci softwarové vrstvy než změnami samotné AI. Odvoláním těchto změn a zpřísněním interního testování se společnost snaží obnovit reputaci Claude jako nástroje s nejvyšší úrovní logického myšlení.