Task budgets v Claude Opus 4.7: konec AI účtů, které vás zaskočí

Zákazník mi v lednu volal v devět ráno. “Účet od Anthropicu za noc je 14 000 dolarů.” AI agent měl zacyklenou smyčku, která se týden netušila, dokud nepřišla faktura.
Tohle by se s task budgets v Opus 4.7 nestalo.
Co jsou task budgets
Task budgets je nová funkce v Claude Opus 4.7, vydaná 16. dubna 2026. Jednoduše: modelu řeknete, kolik tokenů má rezervu na celou agentickou smyčku — myšlení, volání nástrojů, výsledky nástrojů, finální výstup.
Když rezervu vyčerpá, model sám zastaví práci a vrátí to nejlepší, co má.
Před task budgets jste měli dvě volby: nechat model jet bez limitu (a doufat) nebo ho ručně zastavit, když mu došel “rozumný” počet kroků. Žádná z nich nebyla dobrá.
Proč je to revoluce pro firemní použití
1. Předvídatelné náklady
Pokud platíte za AI per-token (a všichni teď platíme), agent bez budgetu je černá díra. Můžete měřit průměry, ale outliers—to jsou ty 14 000 dolarů přes noc.
S budgetem řeknete, “tento agent má 100 000 tokenů na úkol.” Maximum nákladu = 100 000 × cena = pevné číslo. Spí se vám líp.
2. Mírnější chyby v produkci
Agent, který má v cyklu chybu (volá stejný nástroj dokola), zatím spotřeboval všechno, co mu padlo do ruky. S budgetem dojde k limitu, vrátí varování a vy víte, že je něco špatně.
Místo dvouhodinového ticha s vysokým účtem máte rychlou negativní zpětnou vazbu. To je mnohem lepší developer experience.
3. Lepší škálování
Když znáte cenu jednoho úkolu, můžete předem říct, kolik úkolů zvládnete za den. To vám dovolí říct produktovému týmu reálné odhady, ne odhad-na-odhadu-přes-odhad.
Jak to funguje technicky
V API request přidáte parametr task_budget_tokens. Model dostane informaci, kolik má rozpočtu, a sám si plánuje:
“json { “model”: “claude-opus-4–7”, “task_budget_tokens”: 50000, “messages”: […] } ’’’
Model vidí, kolik už spotřeboval. Pokud blíží konec, zkrátí myšlení, méně volá nástroje a soustředí se na to, aby výstup byl nejlepší možný.
Není to tvrdý cut-off uprostřed věty. Je to chytré rozhodování o prioritách.
Praktický příklad: research agent
Mám klienta s research agentem, který:
- Dostane otázku (“Najdi mi tři dodavatele X”)
- Hledá na webu (10–30 volání nástrojů)
- Načítá konkrétní stránky (5–15 volání)
- Sumarizuje výsledky
Bez budgetu: průměr 80 000 tokenů, max 350 000 (když narazí na složitý dotaz). Náklad při výjimce: až $9.
S budgetem 100 000 tokenů: průměr 75 000 (model je úspornější, když ví, že má limit), max přesně 100 000. Náklad: max $2.50.
Stejné výsledky, předvídatelnější náklady. Zajímavé pozorování: když má model mantinely, je často efektivnější, ne horší. Lidi to dělají taky.
Kdy task budgets Nepoužít
Pár scénářů, kdy je budget škodlivý:
- Kreativní úkoly bez deadline — psaní článku, návrh strategie. Tam chcete, aby model měl prostor.
- První iterace nového agenta — než víte, kolik který úkol potřebuje, je rozumnější běžet bez limitu a měřit.
- Jednorázové analytické dotazy — když jednou za měsíc spustíte hluboký research, budget vám jen zúží výsledek.
Budgets jsou pro produkční opakované úkoly, ne pro experimentování.
Co to znamená pro AI architekturu firmy
Pokud máte AI v produkci, na seznam evaluace si přidejte:
- Audit současných agentů — kolik tokenů průměrně? Jaký je 99. percentil? Jaký je outlier?
- Stanovte budget na základě 95. percentilu — pokrývá 95% úkolů s rezervou, outliers chytá.
- Přidejte alerting — když agent dosáhne 80% budgetu opakovaně, znamená to, že úkol je těžší než se čekalo. Buď zvedněte budget, nebo zkoumejte proč.
- Měřte před a po — předpokládejte, že kvalita zůstane stejná. Pokud klesne, budget je moc nízko.
Závěr
Task budgets nejsou jen feature. Jsou to změna myšlení: z “AI je nepředvídatelná” na “AI má rozpočet jako jakýkoli jiný proces ve firmě.”
Anthropic to udělal jako první. Předpokládám, že OpenAI, Google a další to do tří měsíců dohánějí. Pokud na vás budget tlačí už teď, máte výhodu—můžete to nasadit hned.
Řešíte ROI AI agenta a stresují vás nepředvídatelné náklady? Napište mi. Audit existujícího agenta a nastavení rozumných budgets je něco, co dělám pro klienty pravidelně. Obvykle se mi vrací investice do hodin.