Přejít k navigační liště

Zdroják » Zprávičky » Bug: Claude Code vyčerpá Pro Max kvótu za 1,5 hodiny

Bug: Claude Code vyčerpá Pro Max kvótu za 1,5 hodiny

Zprávičky AI

Uživatel molu0219 nahlásil na GitHubu závažnou chybu v Claude Code, která se týká nečekaně rychlého vyčerpání kvóty u předplatného Pro Max 5x.

Co se stalo?

Po resetu kvóty uživatel při středně náročném používání (zejména Q&A a lehký vývoj) vyčerpal celou kvótu během pouhých 1,5 hodiny. Pro srovnání, předchozí okno trvalo 5 hodin při výrazně intenzivnějším vývoji.

Pravděpodobná příčina

Investigace odhalila, že tokeny načtené z cache (cache_read_input_tokens) se pravděpodobně počítají plnou sazbou do rate limitu, místo očekávané desetinové sazby (1/10). To prakticky anuluje přínos prompt cachování pro účely kvóty.

Jinými slovy: uživatel si platí za výhodu cachování, ale pro účely limitu mu stejně odečítají jako by cache neexistovala.

Další přispívající faktory

Tři věci situaci dále zhoršují. Za prvé, pozadí sessiony – otevřené terminály s jinými Claude Code relacemi stále konzumovaly kvótu i bez aktivní interakce uživatele (v konkrétním případě až 78 % kvóty). Za druhé, auto-compact – při automatickém zhušťování kontextu dojde k jednomu API volání s plným kontextem (~966k tokenů), což vytvoří obrovský jednorázový spike. Za třetí, 1M kontextové okno problém zesiluje – čím větší kontext, tím více tokenů na každé volání.

Co uživatel navrhuje?

Mezi navrhovanými vylepšeními jsou: jasná dokumentace toho, jak se cache_read tokeny počítají do limitu, počítání cache_read tokenů sníženou sazbou (1/10) i pro rate limiting, detekce nečinných sessiony a zobrazení spotřeby tokenů v reálném čase přímo v Claude Code.

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted

Frugal computing: architektura pro dobu dražší infrastruktury

Vývojáři se naučili zrychlovat dotazy, přidávat cache, škálovat služby a hlídat účet za cloud. Frugal computing začíná o jednu otázku dřív: musí se výpočet, přesun dat, volání modelu nebo uložení vůbec stát? Rostoucí spotřeba datových center a nové evropské reportování ho posouvají do návrhu architektury, dřív než do závěrečné poznámky o udržitelnosti v prezentaci.

Odysseus: PewDiePie vydal open-source AI workspace, který běží na vašem vlastním hardwaru

AI
Komentáře: 0
Felix Kjellberg, youtuber se 110 miliony odběratelů, strávil rok učením se programovat a fine-tuningem vlastních AI modelů. Výsledkem je Odysseus – bezplatný, open-source workspace pro práci s umělou inteligencí, který neposílá žádná data do cloudu. Projekt má týden, přes 61 000 hvězdiček na GitHubu a znovu otevírá otázku, komu vlastně patří váš digitální kontext.

Když Git už nestačí: jak izolovat databázový stav pro pokusy AI agentů

Gitová větev vývojářům oddělí kód, ale databáze často zůstává společná. U AI agentů je to slabé místo: rychle spouštějí migrace, mění data a zkoušejí víc cest najednou. Databázová větev jim dá vlastní pracovní prostor, jenže tím práce nekončí. Ještě je potřeba řešit citlivá data, oprávnění, životnost větve i zbytek stavu aplikace.