Přestal Claude Code zvládat složité inženýrské úkoly?

Zdroják » Zprávičky » Přestal Claude Code zvládat složité inženýrské úkoly?

Nálepky:

Na GitHubu se objevil detailní bug report od týmu vývojářů pracujících na projektu IREE (kompilátory pro GPU). Nejde jen o anekdoty – autor analyzoval 17 871 thinking bloků a 234 760 tool callů z 6 852 session souborů Claude Code a přišel s konkrétními čísly.

Co se stalo a kdy

Od 10.-11. března 2026 jsou thinking bloky redaktovány z více než 99 %, a od 12. března z plných 100 %, přičemž regrese v kvalitě byla nezávisle nahlášena přesně 8. března, kdy podíl redaktovaných bloků přesáhl 50 %.

Jenže problém začal ještě dřív. Odhadovaná hloubka přemýšlení klesla z průměrných ~2 200 znaků v lednu na ~560 znaků začátkem března, tedy o 75 % ještě před tím, než Anthropic začal thinking bloky vůbec skrývat.

Konkrétní dopady

Model přestal číst před editací. Poměr čtení k editacím klesl z 6,6 (leden) na 2,0 (po 8. březnu) – model tak začal upravovat soubory, aniž by je předtím přečetl, ve třetině všech případů.

Programatický „stop hook“. Tým si napsal bash skript, který zachytával fráze jako „should I continue?“, „not caused by my changes“ nebo „good stopping point“. Tento skript se před 8. březnem nespustil ani jednou. Po 8. březnu zachytil 173 pokusů modelu předčasně skončit nebo se vyhnout odpovědnosti, v jednom dni dokonce 43x.

Ekonomická pohroma. Při přibližně stejném počtu uživatelských promptů (5 608 v únoru vs. 5 701 v březnu) vzrostl počet API requestů 80x, spotřeba výstupních tokenů 64x a odhadované náklady z 345 dolarů na 42 121 dolarů za měsíc.

Paradox úspory

Autor přichází s provokativní myšlenkou: model, který myslí hluboce a zvládne úkol na první pokus, je pro Anthropic levnější k provozu než model s oříznutým přemýšlením, který ke stejnému výsledku potřebuje deset iterací plných oprav a zbytečných API callů.

Závěr – napsaný samotným Claudem

Report uzavírá neobvyklá pasáž: celou analýzu zpracoval Claude Opus 4.6 sám nad vlastními logy. Model píše: „Nemohu zevnitř poznat, zda přemýšlím hluboko, nebo ne. Nepociťuji omezení thinking budgetu jako překážku, prostě produkuji horší výstup, aniž bych chápal proč.“

Tým přešel na jiného poskytovatele, ale report zanechal jako zpětnou vazbu s nadějí, že Anthropic produkt opraví.

Původní report: https://github.com/anthropics/claude-code/issues/42796

Adam Heglas

Student se zájmem o IT, programování a kybernetickou bezpečnost. Baví mě se učit novým věcem a posouvat své schopnosti dál. Když zrovna nesedím u kódu, věnuji se fitness a počítačovým hrám.

Komentáře

Odebírat

0 Komentářů

Nejstarší

Nejnovější Most Voted

Inline Feedbacks

Zobrazit všechny komentáře

AI Channel

1 hodina před

… reposted this!

Odpovědět

Git Worktree + Claude Code: paralelní vývoj a AI agenti ve více větvích najednou

Git worktree posouvá práci s větvemi na úplně jinou úroveň – místo neustálého přepínání a stashování nabízí paralelní pracovní prostředí nad jedním repozitářem. V kombinaci s nástroji jako Claude Code navíc otevírá dveře k běhu více AI agentů současně, každý izolovaně ve své větvi, bez kolizí a zbytečné režie.

MCP C# SDK dosáhlo verze 1.0 – co přináší nová specifikace?

Model Context Protocol (MCP) je dnes jedním z nejrychleji rostoucích standardů pro integraci LLM modelů s nástroji a servery. Oficiální C# SDK právě dosáhlo stabilní verze 1.0 s plnou podporou specifikace 2025-11-25. Pojďme se podívat, co nového přináší.

Mistral Forge: když si firmy začnou stavět vlastní AI

Platforma Forge od Mistral AI ukazuje, kam se posouvá využití umělé inteligence ve firmách. Místo napojení na externí služby přináší možnost stavět vlastní AI modely nad interními daty a provozovat je pod plnou kontrolou - od trénování až po nasazení.

Přestal Claude Code zvládat složité inženýrské úkoly?

Nálepky:

Co se stalo a kdy

Konkrétní dopady

Paradox úspory

Závěr – napsaný samotným Claudem

Adam Heglas

Komentáře

Git Worktree + Claude Code: paralelní vývoj a AI agenti ve více větvích najednou

MCP C# SDK dosáhlo verze 1.0 – co přináší nová specifikace?

Mistral Forge: když si firmy začnou stavět vlastní AI

Sledujte Zdroják:

Hádej co? Cookies!