Přejít k navigační liště

Zdroják » Zprávičky » Přestal Claude Code zvládat složité inženýrské úkoly?

Přestal Claude Code zvládat složité inženýrské úkoly?

Zprávičky AI

Nálepky:

Na GitHubu se objevil detailní bug report od týmu vývojářů pracujících na projektu IREE (kompilátory pro GPU). Nejde jen o anekdoty – autor analyzoval 17 871 thinking bloků a 234 760 tool callů z 6 852 session souborů Claude Code a přišel s konkrétními čísly.

Co se stalo a kdy

Od 10.-11. března 2026 jsou thinking bloky redaktovány z více než 99 %, a od 12. března z plných 100 %, přičemž regrese v kvalitě byla nezávisle nahlášena přesně 8. března, kdy podíl redaktovaných bloků přesáhl 50 %.

Jenže problém začal ještě dřív. Odhadovaná hloubka přemýšlení klesla z průměrných ~2 200 znaků v lednu na ~560 znaků začátkem března, tedy o 75 % ještě před tím, než Anthropic začal thinking bloky vůbec skrývat.

Konkrétní dopady

Model přestal číst před editací. Poměr čtení k editacím klesl z 6,6 (leden) na 2,0 (po 8. březnu) – model tak začal upravovat soubory, aniž by je předtím přečetl, ve třetině všech případů.

Programatický „stop hook“. Tým si napsal bash skript, který zachytával fráze jako „should I continue?“, „not caused by my changes“ nebo „good stopping point“. Tento skript se před 8. březnem nespustil ani jednou. Po 8. březnu zachytil 173 pokusů modelu předčasně skončit nebo se vyhnout odpovědnosti, v jednom dni dokonce 43x.

Ekonomická pohroma. Při přibližně stejném počtu uživatelských promptů (5 608 v únoru vs. 5 701 v březnu) vzrostl počet API requestů 80x, spotřeba výstupních tokenů 64x a odhadované náklady z 345 dolarů na 42 121 dolarů za měsíc.

Paradox úspory

Autor přichází s provokativní myšlenkou: model, který myslí hluboce a zvládne úkol na první pokus, je pro Anthropic levnější k provozu než model s oříznutým přemýšlením, který ke stejnému výsledku potřebuje deset iterací plných oprav a zbytečných API callů.

Závěr – napsaný samotným Claudem

Report uzavírá neobvyklá pasáž: celou analýzu zpracoval Claude Opus 4.6 sám nad vlastními logy. Model píše: „Nemohu zevnitř poznat, zda přemýšlím hluboko, nebo ne. Nepociťuji omezení thinking budgetu jako překážku, prostě produkuji horší výstup, aniž bych chápal proč.“

Tým přešel na jiného poskytovatele, ale report zanechal jako zpětnou vazbu s nadějí, že Anthropic produkt opraví.

Původní report: https://github.com/anthropics/claude-code/issues/42796

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted
Inline Feedbacks
Zobrazit všechny komentáře

EU AI Act: co musí vývojářské týmy vědět do 2. srpna 2026

Druhého srpna začnou v EU platit povinnosti pro poskytovatele i provozovatele high-risk AI systémů: posouzení shody, technická dokumentace a quality management na straně providerů, uchovávání logů a dohled nad provozem na straně deployerů. Samostatně vstupují v platnost transparentní pravidla pro chatboty, generativní AI a deepfaky, a ta se týkají všech, nejen high-risk systémů. Kdo nasazuje AI v recruitmentu, credit scoringu nebo HR hodnocení, je v zóně. Čekání na odklad přes Digital Omnibus je sázka na legislativní proces, který ještě neskončil. A kdo si myslí, že se ho to netýká, protože „jen používá ChatGPT" v use casu z Annexu III, pravděpodobně špatně přečetl nařízení.

Vibe coding a skutečná cena kódu, který nikdo nečte

AI
Komentáře: 1
Andrej Karpathy pojmenoval vibe coding v únoru 2025 jako víkendový experiment, kdy vývojář nečte kód a nechá AI dělat všechno. Collins Dictionary z toho udělal slovo roku, startupy kolem toho vyrostly na desítky miliard dolarů. Jenže nejrigoróznější nezávislá studie zjistila, že AI nástroje zkušené vývojáře zpomalují o 19 %, přestože si oni sami mysleli, že zrychlili o 20 %. Mezi tím, co o vibe codingu věříme, a tím, co o něm víme, zeje díra – a je načase se do ní podívat.

MCP vyhrál. Teď musí dokázat, že si tu výhru zaslouží

Model Context Protocol se za sedmnáct měsíců proměnil z interního experimentu Anthropic v de facto standard pro propojení AI modelů s nástroji — s 97 miliony stažení SDK měsíčně a podporou všech velkých hráčů. Jenže adopce ještě není totéž co produkční zralost. Kontextová inflace, tool poisoning a naivní obalování REST API ukazují, že skutečný problém MCP není protokol sám, ale způsob, jakým ho vývojáři používají.