Přejít k navigační liště

Zdroják » Zprávičky » Přestal Claude Code zvládat složité inženýrské úkoly?

Přestal Claude Code zvládat složité inženýrské úkoly?

Zprávičky AI

Nálepky:

Na GitHubu se objevil detailní bug report od týmu vývojářů pracujících na projektu IREE (kompilátory pro GPU). Nejde jen o anekdoty – autor analyzoval 17 871 thinking bloků a 234 760 tool callů z 6 852 session souborů Claude Code a přišel s konkrétními čísly.

Co se stalo a kdy

Od 10.-11. března 2026 jsou thinking bloky redaktovány z více než 99 %, a od 12. března z plných 100 %, přičemž regrese v kvalitě byla nezávisle nahlášena přesně 8. března, kdy podíl redaktovaných bloků přesáhl 50 %.

Jenže problém začal ještě dřív. Odhadovaná hloubka přemýšlení klesla z průměrných ~2 200 znaků v lednu na ~560 znaků začátkem března, tedy o 75 % ještě před tím, než Anthropic začal thinking bloky vůbec skrývat.

Konkrétní dopady

Model přestal číst před editací. Poměr čtení k editacím klesl z 6,6 (leden) na 2,0 (po 8. březnu) – model tak začal upravovat soubory, aniž by je předtím přečetl, ve třetině všech případů.

Programatický „stop hook“. Tým si napsal bash skript, který zachytával fráze jako „should I continue?“, „not caused by my changes“ nebo „good stopping point“. Tento skript se před 8. březnem nespustil ani jednou. Po 8. březnu zachytil 173 pokusů modelu předčasně skončit nebo se vyhnout odpovědnosti, v jednom dni dokonce 43x.

Ekonomická pohroma. Při přibližně stejném počtu uživatelských promptů (5 608 v únoru vs. 5 701 v březnu) vzrostl počet API requestů 80x, spotřeba výstupních tokenů 64x a odhadované náklady z 345 dolarů na 42 121 dolarů za měsíc.

Paradox úspory

Autor přichází s provokativní myšlenkou: model, který myslí hluboce a zvládne úkol na první pokus, je pro Anthropic levnější k provozu než model s oříznutým přemýšlením, který ke stejnému výsledku potřebuje deset iterací plných oprav a zbytečných API callů.

Závěr – napsaný samotným Claudem

Report uzavírá neobvyklá pasáž: celou analýzu zpracoval Claude Opus 4.6 sám nad vlastními logy. Model píše: „Nemohu zevnitř poznat, zda přemýšlím hluboko, nebo ne. Nepociťuji omezení thinking budgetu jako překážku, prostě produkuji horší výstup, aniž bych chápal proč.“

Tým přešel na jiného poskytovatele, ale report zanechal jako zpětnou vazbu s nadějí, že Anthropic produkt opraví.

Původní report: https://github.com/anthropics/claude-code/issues/42796

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted
Inline Feedbacks
Zobrazit všechny komentáře
AI Channel

… reposted this!

Git Worktree + Claude Code: paralelní vývoj a AI agenti ve více větvích najednou

Git worktree posouvá práci s větvemi na úplně jinou úroveň – místo neustálého přepínání a stashování nabízí paralelní pracovní prostředí nad jedním repozitářem. V kombinaci s nástroji jako Claude Code navíc otevírá dveře k běhu více AI agentů současně, každý izolovaně ve své větvi, bez kolizí a zbytečné režie.