Přestal Claude Code zvládat složité inženýrské úkoly?

Zdroják » Zprávičky » Přestal Claude Code zvládat složité inženýrské úkoly?

Nálepky:

Na GitHubu se objevil detailní bug report od týmu vývojářů pracujících na projektu IREE (kompilátory pro GPU). Nejde jen o anekdoty – autor analyzoval 17 871 thinking bloků a 234 760 tool callů z 6 852 session souborů Claude Code a přišel s konkrétními čísly.

Co se stalo a kdy

Od 10.-11. března 2026 jsou thinking bloky redaktovány z více než 99 %, a od 12. března z plných 100 %, přičemž regrese v kvalitě byla nezávisle nahlášena přesně 8. března, kdy podíl redaktovaných bloků přesáhl 50 %.

Jenže problém začal ještě dřív. Odhadovaná hloubka přemýšlení klesla z průměrných ~2 200 znaků v lednu na ~560 znaků začátkem března, tedy o 75 % ještě před tím, než Anthropic začal thinking bloky vůbec skrývat.

Konkrétní dopady

Model přestal číst před editací. Poměr čtení k editacím klesl z 6,6 (leden) na 2,0 (po 8. březnu) – model tak začal upravovat soubory, aniž by je předtím přečetl, ve třetině všech případů.

Programatický „stop hook“. Tým si napsal bash skript, který zachytával fráze jako „should I continue?“, „not caused by my changes“ nebo „good stopping point“. Tento skript se před 8. březnem nespustil ani jednou. Po 8. březnu zachytil 173 pokusů modelu předčasně skončit nebo se vyhnout odpovědnosti, v jednom dni dokonce 43x.

Ekonomická pohroma. Při přibližně stejném počtu uživatelských promptů (5 608 v únoru vs. 5 701 v březnu) vzrostl počet API requestů 80x, spotřeba výstupních tokenů 64x a odhadované náklady z 345 dolarů na 42 121 dolarů za měsíc.

Paradox úspory

Autor přichází s provokativní myšlenkou: model, který myslí hluboce a zvládne úkol na první pokus, je pro Anthropic levnější k provozu než model s oříznutým přemýšlením, který ke stejnému výsledku potřebuje deset iterací plných oprav a zbytečných API callů.

Závěr – napsaný samotným Claudem

Report uzavírá neobvyklá pasáž: celou analýzu zpracoval Claude Opus 4.6 sám nad vlastními logy. Model píše: „Nemohu zevnitř poznat, zda přemýšlím hluboko, nebo ne. Nepociťuji omezení thinking budgetu jako překážku, prostě produkuji horší výstup, aniž bych chápal proč.“

Tým přešel na jiného poskytovatele, ale report zanechal jako zpětnou vazbu s nadějí, že Anthropic produkt opraví.

Původní report: https://github.com/anthropics/claude-code/issues/42796

Adam Heglas

Student se zájmem o IT, programování a kybernetickou bezpečnost. Baví mě se učit novým věcem a posouvat své schopnosti dál. Když zrovna nesedím u kódu, věnuji se fitness a počítačovým hrám.

Komentáře

Odebírat

0 Komentářů

Nejstarší

Nejnovější Most Voted

GitHub vyhrál pohodlím. Stejné pohodlí dnes ztěžuje odchod

GitHub kdysi působil jako přesný opak SourceForge: rychlý, přehledný a přirozený. Dnešní projekt na něm ale často nemá jen kód. Má tam issues, pull requesty, CI, balíčky, bezpečnostní pravidla i AI agenty. Lock-in nevzniká tím, že by nešel odnést Git repozitář, ale tím, že se běžný provoz týmu postupně přesune do jedné platformy.

Nedostatek hardwaru už ochromuje byznys. Výrobci serverů nejsou schopni garantovat cenu ani termín dodání, varuje ČMIS

Dostupnost enterprise hardwaru narazila na dno. Zatímco v posledních měsících trh trápilo pouze zdražování, nyní se firmy potýkají s kritickým nedostatkem komponentů, který přímo ohrožuje jejich provoz. Podle technologické společnosti ČMIS již výrobci…

TypeScript 7 v Go: rychlejší buildy, chybějící API

Betaverze TypeScriptu 7.0 ukazuje víc než rychlejší tsc. Microsoft převádí kompilátor a jazykovou službu z původní kódové základny psané v TypeScriptu a běžící jako JavaScript do Go, přidává paralelní typovou kontrolu a připravuje novou editorovou část postavenou na LSP. Pro část nástrojů ale nepůjde o prostou výměnu binárky: TypeScript 7 zatím nemá stabilní náhradu dnešního Compiler API.

Přestal Claude Code zvládat složité inženýrské úkoly?

Nálepky:

Co se stalo a kdy

Konkrétní dopady

Paradox úspory

Závěr – napsaný samotným Claudem

Adam Heglas

Komentáře

GitHub vyhrál pohodlím. Stejné pohodlí dnes ztěžuje odchod

Nedostatek hardwaru už ochromuje byznys. Výrobci serverů nejsou schopni garantovat cenu ani termín dodání, varuje ČMIS

TypeScript 7 v Go: rychlejší buildy, chybějící API

Sledujte Zdroják:

Hádej co? Cookies!