DeepSeek V4 Pro a V4 Flash — Hybrid Attention a 1M kontext

Čo priniesol V4

24. apríla 2026 DeepSeek uviedol preview verzie V4 Flash a V4 Pro. Hlavné inovácie:

Hybrid Attention Architecture — model si lepšie pamätá informácie naprieč dlhými konverzáciami
1 milión tokenov kontextu — celý codebase alebo kniha v jednom volaní
Top-tier výsledky v kódovaní — konkurencieschopné s Claude aj GPT v SWE-bench
Agentné úlohy — lepšie plánuje, hodnotí výsledky a opravuje chyby

Prečo Hybrid Attention

Klasický transformer má kvadratickú zložitosť s dĺžkou kontextu — 1M tokenov by spotrebovalo enormne pamäti. Hybrid Attention kombinuje lokálnu dense pozornosť s redšími long-range vzormi, čo drží náklady použiteľné.

Dopad na trh

DeepSeek vlani rozhýbal Silicon Valley svojím efektívnym prístupom. V4 to opakuje — výkon na úrovni západných hráčov za zlomok nákladov. Pre firmy, ktoré riešia súkromie dát alebo náklady inferencie, je open-weight DeepSeek vážna alternatíva.

Odporúčanie

Ak robíte interný AI tooling a citlivosť dát bráni použiť cloud OpenAI, otestujte si V4 lokálne. Self-hosting modelu tejto úrovne bol ešte pred rokom nemysliteľný.