Přejít k navigační liště

Zdroják » Zprávičky » Přestal Claude Code zvládat složité inženýrské úkoly?

Přestal Claude Code zvládat složité inženýrské úkoly?

Zprávičky AI

Nálepky:

Na GitHubu se objevil detailní bug report od týmu vývojářů pracujících na projektu IREE (kompilátory pro GPU). Nejde jen o anekdoty – autor analyzoval 17 871 thinking bloků a 234 760 tool callů z 6 852 session souborů Claude Code a přišel s konkrétními čísly.

Co se stalo a kdy

Od 10.-11. března 2026 jsou thinking bloky redaktovány z více než 99 %, a od 12. března z plných 100 %, přičemž regrese v kvalitě byla nezávisle nahlášena přesně 8. března, kdy podíl redaktovaných bloků přesáhl 50 %.

Jenže problém začal ještě dřív. Odhadovaná hloubka přemýšlení klesla z průměrných ~2 200 znaků v lednu na ~560 znaků začátkem března, tedy o 75 % ještě před tím, než Anthropic začal thinking bloky vůbec skrývat.

Konkrétní dopady

Model přestal číst před editací. Poměr čtení k editacím klesl z 6,6 (leden) na 2,0 (po 8. březnu) – model tak začal upravovat soubory, aniž by je předtím přečetl, ve třetině všech případů.

Programatický „stop hook“. Tým si napsal bash skript, který zachytával fráze jako „should I continue?“, „not caused by my changes“ nebo „good stopping point“. Tento skript se před 8. březnem nespustil ani jednou. Po 8. březnu zachytil 173 pokusů modelu předčasně skončit nebo se vyhnout odpovědnosti, v jednom dni dokonce 43x.

Ekonomická pohroma. Při přibližně stejném počtu uživatelských promptů (5 608 v únoru vs. 5 701 v březnu) vzrostl počet API requestů 80x, spotřeba výstupních tokenů 64x a odhadované náklady z 345 dolarů na 42 121 dolarů za měsíc.

Paradox úspory

Autor přichází s provokativní myšlenkou: model, který myslí hluboce a zvládne úkol na první pokus, je pro Anthropic levnější k provozu než model s oříznutým přemýšlením, který ke stejnému výsledku potřebuje deset iterací plných oprav a zbytečných API callů.

Závěr – napsaný samotným Claudem

Report uzavírá neobvyklá pasáž: celou analýzu zpracoval Claude Opus 4.6 sám nad vlastními logy. Model píše: „Nemohu zevnitř poznat, zda přemýšlím hluboko, nebo ne. Nepociťuji omezení thinking budgetu jako překážku, prostě produkuji horší výstup, aniž bych chápal proč.“

Tým přešel na jiného poskytovatele, ale report zanechal jako zpětnou vazbu s nadějí, že Anthropic produkt opraví.

Původní report: https://github.com/anthropics/claude-code/issues/42796

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted
Inline Feedbacks
Zobrazit všechny komentáře

WebGPU už mají všechny hlavní enginy. Hotový standard z něj W3C dělat nechce

Na jaře 2026 už WebGPU není jen záležitost Chromia nebo preview buildů. Chrome, Edge, Safari i Firefox ho dodávají v produkčních verzích, ale ne na stejných platfórmach a ne se stejnými limity. WebGPU navíc podle aktuální charty pracovní skupiny nemíří z Candidate Recommendation do W3C Recommendation. Pro vývojáře je proto důležitější konkrétní podpora, fallbacky a limity paměti než formální status standardu.

Aktualizace WordPressu: Co se děje pod kapotou, když kliknete na tlačítko

Kliknete na „Update" a za chvíli je hotovo. Jenže co se přesně stalo? WordPress stáhl balíček, přepsal stovky souborů, upravil databázi — a na pár vteřin váš web zmizel pro všechny návštěvníky. Většinou to proběhne bez problémů. Ale když se to rozbije, chcete přesně vědět kde a proč. Pojďme si celý proces rozebrat od začátku do konce.