DeepSeek V4: open-source AI dohnal uzavřené modely. A je 10× levnější.

Pokud je v AI něco důležitého na duben 2026, je to tohle: open-source modely teď reálně konkurují vlajkovým uzavřeným modelům. A DeepSeek V4 je toho nejlepší příklad.
DeepSeek 24. dubna 2026 vydal V4-Pro (1,6 trilionu parametrů) a V4-Flash (284 miliard). Pro firmy, které mají citlivá data nebo regulační omezení, je to nejdůležitější release roku.
Co se mění
1. Open-source vede v agentic coding
V4-Pro je nejlepší dostupný open-source model. Můžete ho stáhnout, spustit on-premise, a být blíž k state-of-the-art než kdy předtím. Bez vendor lock-in. Bez exportu dat.
2. LiveCodeBench — dokonce předbíhá uzavřené
V4-Pro vede LiveCodeBench. Open-source je v generování kódu rychlejší než uzavřený Claude.
Pro firmy, které kód generují masivně, je to obrovský zlom.
3. Codeforces — soutěžní programování
3 206 bodů na Codeforces je úroveň mezinárodního grandmastera. To je v lidské populaci 0,01 % programátorů.
Když tohle umí váš agent, automatizace algoritmicky náročných úkolů je reálná.
4. 1M kontextu
V4-Pro má 1 milion tokenů kontextu. To je úroveň GPT-5.5 a 5× víc než Claude Opus 4.7.
Pro firmy s velkými dokumenty, dlouhými codebases nebo extenzivními logy je to funkční transformace, ne kosmetické zlepšení.
Co zůstává stejné — a co je slabost
Slabší v general knowledge
V4-Pro skóruje 37,7 % na Humanity's Last Exam (faktické otázky napříč obory). Pro porovnání: GPT-5.5 a Claude Opus 4.7 jsou v kategorii 41–47 %.
Když se modelu zeptáte na fakta o dějinách, geografii, kultuře — uzavřené modely stále vědí víc.
Praktický důsledek: pro RAG-based aplikace (chatbot na vaší vlastní dokumentaci) je to jedno. Vaše data dodáváte vy. Pro general-purpose asistenty je to omezení.
Vyžaduje infrastrukturu
V4-Pro je 1,6 trilionu parametrů. To není model, který spustíte na laptopu. Provoz vyžaduje 8× H100 GPU minimum pro produkční nasazení. To je $200K+ hardware nebo $30/hod cloud.
V4-Flash (284B) je realističtější. Spustí se na 4× H100, případně rychlé cloud GPU instanci.
Cenová tabulka
| Model | Vstup ($/M tok) | Výstup ($/M tok) | Self-hosting |
|---|---|---|---|
| DeepSeek V4-Pro (API) | $0.55 | $2.20 | ✅ Možné |
| DeepSeek V4-Flash (API) | $0.20 | $0.80 | ✅ Možné |
| GPT-5.5 | $5.00 | $30.00 | ❌ Ne |
| Claude Opus 4.7 | $5.00 | $25.00 | ❌ Ne |
| Qwen 3.6-Max | $0.80 | $3.00 | Limited |
V4-Pro přes API je 10× levnější než GPT-5.5. Self-hosted? Po amortizaci hardware může být cena per-token blízko nuly.
Pro firmy s citlivými daty, které dnes platí milion korun ročně OpenAI za API, je tohle kandidát na 80% snížení nákladů.
Jak vám to pomůže v každodenní práci
Firmám s GDPR / citlivými daty
- On-premise nasazení. Zdravotnictví, finance, právní sektor, vláda. Data nikdy neopustí vaši infrastrukturu.
- Compliance audit. Můžete jednoduše dokázat, kde data jsou. Žádné "snad to OpenAI nepoužije na trénink."
- Custom fine-tuning. Open-source = můžete si model dotrénovat na vašem oboru. Specializovaný model pro váš use-case.
Vývojářům
- Code generation v IDE bez limit. Jakmile máte server, používáte tolik, kolik chcete. Žádné quota.
- Privátní github copilot. Generování kódu na proprietárním codebase, který nesmí ven.
- Soutěžní algoritmy. 3206 Codeforces rating znamená, že modelu svěříte i nestandardní algoritmické úkoly.
Datovým týmům
- Analýza obrovských datasetů. 1M kontext + lokální nasazení = analýza dat, která jinam pustit nemůžete.
- ETL transformace s AI. Generování SQL, dataflow, validace dat — bez exportu dat do cloudu.
- Document processing pipeline. Smlouvy, faktury, regulátorní podání — vše v rámci vaší infrastruktury.
Manažerům — kdy to dává smysl
Praktická matematika. Self-hosting V4-Pro se vyplatí, když:
- Platíte víc než $3 000 / měsíc za AI API služby (break-even při amortizaci hardware za 18 měsíců)
- Máte regulační požadavek na data residency (zdravotnictví, finance, regulované B2B)
- Máte interní DevOps tým, který infrastrukturu zvládne (provoz LLM není jako provoz Wordpressu)
Pokud něco z toho neplatí: API access je výhodnější. $0.55 / $2.20 stále nepřebije nikdo na trhu.
Kde si zatím počkat
- Knowledge-heavy chatboty bez RAG. General knowledge V4 je slabší.
- Náročné agentic UI úlohy. GPT-5.5 v Operator je dál.
- Multimodální zpracování s vysokým rozlišením. Claude Opus 4.7 v 3,75 MP obrázcích je lepší.
Závěr
DeepSeek V4 je technologický zlom v open-source AI. Není to "skoro tak dobré jako uzavřené modely." Je to lepší v některých kategoriích a 10× levnější.
Pro firmy, které mají citlivá data nebo platí v AI velké částky, se vyplatí audit. Možná zjistíte, že stávající nasazení vyměníte za lepší a levnější alternativu — a investujete uspořené peníze do něčeho, co zákazníci poznají.
Plánujete on-premise AI nasazení a nevíte, jestli má smysl V4-Pro nebo V4-Flash? Napište mi. Architekturní review + odhad ROI je něco, co dělám pro klienty pravidelně. Obvykle se vejde do dvou hodin konzultace.
Zdroje: DeepSeek release notes (24. 4. 2026), Hugging Face model cards, Geeky Gadgets benchmarks, llm-stats.com.