24. 4. 2026

DeepSeek V4: open-source AI dohnal uzavřené modely. A je 10× levnější.

DeepSeek V4: realistické testování open-source modelu a nákladového dashboardu

Pokud je v AI něco důležitého na duben 2026, je to tohle: open-source modely teď reálně konkurují vlajkovým uzavřeným modelům. A DeepSeek V4 je toho nejlepší příklad.

DeepSeek 24. dubna 2026 vydal V4-Pro (1,6 trilionu parametrů) a V4-Flash (284 miliard). Pro firmy, které mají citlivá data nebo regulační omezení, je to nejdůležitější release roku.

Co se mění

1. Open-source vede v agentic coding

Terminal-Bench 2.0 — agentic coding (%) GPT-5.5 82.7% DeepSeek V4-Pro 67.9% Qwen 3.6-Max 65.4% Claude Opus 4.6 65.4%

V4-Pro je nejlepší dostupný open-source model. Můžete ho stáhnout, spustit on-premise, a být blíž k state-of-the-art než kdy předtím. Bez vendor lock-in. Bez exportu dat.

2. LiveCodeBench — dokonce předbíhá uzavřené

LiveCodeBench — generování kódu DeepSeek V4-Pro 93.5 Gemini 3.1 Pro 91.7 Claude Opus 4.6 88.8

V4-Pro vede LiveCodeBench. Open-source je v generování kódu rychlejší než uzavřený Claude.

Pro firmy, které kód generují masivně, je to obrovský zlom.

3. Codeforces — soutěžní programování

Codeforces rating — soutěžní programování DeepSeek V4-Pro 3206 GPT-5.4 3168 Gemini 3052

3 206 bodů na Codeforces je úroveň mezinárodního grandmastera. To je v lidské populaci 0,01 % programátorů.

Když tohle umí váš agent, automatizace algoritmicky náročných úkolů je reálná.

4. 1M kontextu

V4-Pro má 1 milion tokenů kontextu. To je úroveň GPT-5.5 a 5× víc než Claude Opus 4.7.

Pro firmy s velkými dokumenty, dlouhými codebases nebo extenzivními logy je to funkční transformace, ne kosmetické zlepšení.

Co zůstává stejné — a co je slabost

Slabší v general knowledge

V4-Pro skóruje 37,7 % na Humanity's Last Exam (faktické otázky napříč obory). Pro porovnání: GPT-5.5 a Claude Opus 4.7 jsou v kategorii 41–47 %.

Když se modelu zeptáte na fakta o dějinách, geografii, kultuře — uzavřené modely stále vědí víc.

Praktický důsledek: pro RAG-based aplikace (chatbot na vaší vlastní dokumentaci) je to jedno. Vaše data dodáváte vy. Pro general-purpose asistenty je to omezení.

Vyžaduje infrastrukturu

V4-Pro je 1,6 trilionu parametrů. To není model, který spustíte na laptopu. Provoz vyžaduje 8× H100 GPU minimum pro produkční nasazení. To je $200K+ hardware nebo $30/hod cloud.

V4-Flash (284B) je realističtější. Spustí se na 4× H100, případně rychlé cloud GPU instanci.

Cenová tabulka

Model Vstup ($/M tok) Výstup ($/M tok) Self-hosting
DeepSeek V4-Pro (API) $0.55 $2.20 ✅ Možné
DeepSeek V4-Flash (API) $0.20 $0.80 ✅ Možné
GPT-5.5 $5.00 $30.00 ❌ Ne
Claude Opus 4.7 $5.00 $25.00 ❌ Ne
Qwen 3.6-Max $0.80 $3.00 Limited

V4-Pro přes API je 10× levnější než GPT-5.5. Self-hosted? Po amortizaci hardware může být cena per-token blízko nuly.

Pro firmy s citlivými daty, které dnes platí milion korun ročně OpenAI za API, je tohle kandidát na 80% snížení nákladů.

Jak vám to pomůže v každodenní práci

Firmám s GDPR / citlivými daty

  • On-premise nasazení. Zdravotnictví, finance, právní sektor, vláda. Data nikdy neopustí vaši infrastrukturu.
  • Compliance audit. Můžete jednoduše dokázat, kde data jsou. Žádné "snad to OpenAI nepoužije na trénink."
  • Custom fine-tuning. Open-source = můžete si model dotrénovat na vašem oboru. Specializovaný model pro váš use-case.

Vývojářům

  • Code generation v IDE bez limit. Jakmile máte server, používáte tolik, kolik chcete. Žádné quota.
  • Privátní github copilot. Generování kódu na proprietárním codebase, který nesmí ven.
  • Soutěžní algoritmy. 3206 Codeforces rating znamená, že modelu svěříte i nestandardní algoritmické úkoly.

Datovým týmům

  • Analýza obrovských datasetů. 1M kontext + lokální nasazení = analýza dat, která jinam pustit nemůžete.
  • ETL transformace s AI. Generování SQL, dataflow, validace dat — bez exportu dat do cloudu.
  • Document processing pipeline. Smlouvy, faktury, regulátorní podání — vše v rámci vaší infrastruktury.

Manažerům — kdy to dává smysl

Praktická matematika. Self-hosting V4-Pro se vyplatí, když:

  • Platíte víc než $3 000 / měsíc za AI API služby (break-even při amortizaci hardware za 18 měsíců)
  • Máte regulační požadavek na data residency (zdravotnictví, finance, regulované B2B)
  • Máte interní DevOps tým, který infrastrukturu zvládne (provoz LLM není jako provoz Wordpressu)

Pokud něco z toho neplatí: API access je výhodnější. $0.55 / $2.20 stále nepřebije nikdo na trhu.

Kde si zatím počkat

  • Knowledge-heavy chatboty bez RAG. General knowledge V4 je slabší.
  • Náročné agentic UI úlohy. GPT-5.5 v Operator je dál.
  • Multimodální zpracování s vysokým rozlišením. Claude Opus 4.7 v 3,75 MP obrázcích je lepší.

Závěr

DeepSeek V4 je technologický zlom v open-source AI. Není to "skoro tak dobré jako uzavřené modely." Je to lepší v některých kategoriích a 10× levnější.

Pro firmy, které mají citlivá data nebo platí v AI velké částky, se vyplatí audit. Možná zjistíte, že stávající nasazení vyměníte za lepší a levnější alternativu — a investujete uspořené peníze do něčeho, co zákazníci poznají.


Plánujete on-premise AI nasazení a nevíte, jestli má smysl V4-Pro nebo V4-Flash? Napište mi. Architekturní review + odhad ROI je něco, co dělám pro klienty pravidelně. Obvykle se vejde do dvou hodin konzultace.


Zdroje: DeepSeek release notes (24. 4. 2026), Hugging Face model cards, Geeky Gadgets benchmarks, llm-stats.com.