22. 4. 2026

Qwen 3.6-Max-Preview: čínská odpověď, která už není jen alternativa

Qwen 3.6-Max-Preview: realistické benchmarky a model evaluation na pracovním stole

Před rokem byl Qwen pro západní firmy "ten zajímavý čínský model, ale produkčně to neuděláte." V dubnu 2026 to už neplatí.

Alibaba 22. dubna 2026 vydala Qwen 3.6-Max-Preview — model, který v některých kategoriích vede globální benchmarky. A za zlomek ceny.

Co se mění

1. Skok ve vědeckém kódování

Qwen 3.6-Max je nejsilnější dostupný model na SciCode (programování pro vědecký výzkum):

SciCode — programování pro vědu (zlepšení vs. Qwen 3.6-Plus, body) SciCode 10.8 bodů SkillsBench 9.9 bodů QwenChineseBench 5.3 bodů NL2Repo 5 bodů Terminal-Bench 2.0 3.8 bodů ToolcallFormatIFBench 2.8 bodů SuperGPQA 2.3 bodů

Pro firmy v R&D, biotechu, výzkumu materiálů, kvantitativních financích je Qwen 3.6-Max teď serióznější volba. Ne kvůli značce, ale kvůli číslům.

2. Reálné agentic kódování

SWE-bench Pro — agentic real-world coding (%) Claude Opus 4.7 64.3% GPT-5.5 58.6% Qwen 3.6-Max 58.4% GLM-5.1 56.6%

Třetí místo, 0,2 bodu od GPT-5.5. Není to vítěz, ale není to ani slabost. Pro firmy, které dnes platí GPT, je rozdíl 0,2 bodu zanedbatelný — a Qwen je výrazně levnější.

3. Preserve thinking

Tohle je tichá novinka, kterou si všimne málokdo. Při konverzaci s nástroji Qwen umí zachovat řetěz myšlení napříč voláními. Konkrétně:

  • agent volá nástroj A, dostane výsledek
  • pak volá nástroj B
  • v rozhodování o nástroji B vidí původní reasoning, ne jen výsledky

Pro autonomní agenty s víceúrovňovým rozhodováním je to rozdíl mezi "občas se neztratí" a "drží linku".

4. Druhé místo v Intelligence Indexu

Na Artificial Analysis Intelligence Index v4.0 (komplexní reasoning + knowledge + matematika + kódování) Qwen 3.6-Max boduje 52. Druhé místo, hned za Muse Spark.

Medián v jeho cenové kategorii? 14. Qwen je 3,7× chytřejší než průměrný model za podobnou cenu.

Co zůstává stejné

  • Závislost na čínské infrastruktuře — pokud máte ve smlouvě "data se nesmí zpracovávat v Číně," nepoužijete. Zatím není evropský / americký endpoint s plnou jistotou.
  • Censura citlivých témat (politika, určité historické události) — funguje stejně jako u dřívějších verzí. Pro většinu firemních use-case je to irelevantní, ale vědět to je nutné.
  • API formát — kompatibilní s OpenAI SDK. Migrace z GPT je hodina práce.

Cenová tabulka

Model Vstup ($/M tok) Výstup ($/M tok) Vztah ke konkurenci
Qwen 3.6-Max-Preview $0.80 $3.00 nejlevnější top model
GPT-5.5 $5.00 $30.00 6× dražší vstup, 10× výstup
Claude Opus 4.7 $5.00 $25.00 6× dražší vstup, 8× výstup
DeepSeek V4-Pro $0.55 $2.20 levnější, ale slabší v reasoning

Tady je důvod, proč o Qwen mluvit: úspora 80–90 % nákladů při ztrátě 5–10 % výkonu na běžných úkolech. Pro objemové use-case (customer support, content generation, document processing) to dělá rozdíl tisíců dolarů měsíčně.

Jak vám to pomůže v každodenní práci

Vědcům a inženýrům

  • Programování simulací. Qwen 3.6-Max vede SciCode benchmark — pro fyziky, chemiky, biology je to praktické zlepšení.
  • Datová analýza s Pythonem. Generování notebooků, transformace dat, vizualizace.
  • Generování dokumentace pro vědecké projekty. Z kódu udělá srozumitelný popis pro ne-technické členy týmu.

Vývojářům

  • Code generation s úspornou cenou. Pokud používáte AI v IDE 8 hodin denně, Qwen vám sníží AI účet o desítky procent.
  • Refactoring s preserve thinking. Agent, který refactoruje napříč 50 souborů, neztratí kontext.
  • Multi-step debugging. Komplexní bug reprodukce, hypotézy, testování — drží linku reasoning přes celý workflow.

Customer support a content

  • Chatbot s vysokým objemem dotazů. Při 100 000 konverzacích měsíčně Qwen ušetří $5 000 – $15 000 oproti GPT. Při kvalitě, kterou zákazníci nepoznají.
  • Generování produktových popisů. Tisíce SKU, různé jazyky (Qwen má silnou multilingvální podporu). Cenově nedostižné.
  • Sumarizace zpětné vazby. 10 000 reviews → strukturovaný insight report.

Manažerům

  • Levné experimentování. Než se zamknete v drahém modelu, vyzkoušejte use-case na Qwen. Pokud funguje na něm, na Claude/GPT bude fungovat ještě lépe — a víte, že máte fallback.
  • Internal tools pro netechnický tým. Asistenti pro HR, marketing, nákup. Levný = snadno škálovatelný napříč firmou.

Komu Qwen NEDOPORUČUJU

Praktická upřímnost:

  • Firmy s GDPR-citlivými daty zákazníků bez evropského endpointu. Vyřešte právní situaci dřív než technickou.
  • Mission-critical agenty s nulovou tolerancí chyby. Tady stále radim Claude nebo GPT s dvojitou validací.
  • Use-case, kde čínský původ modelu je PR riziko. B2C aplikace, kde uživatelé citliví na privacy, nemusí čínského provider tolerovat.

Závěr

Qwen 3.6-Max-Preview už není druhořadá volba. Je to top-3 model světa s top-1 cenou. Pro objemové firemní use-case je to nejvýhodnější vlajkový model dnešního trhu.

Otázka už není "je Qwen dostatečně dobrý." Otázka je "jste schopní vyřešit data residency?" Pokud ano, nemáte výmluvu.


Zvažujete migraci z OpenAI/Anthropic na Qwen kvůli nákladům? Napište mi. Audit data residency rizik a A/B testovací plán je něco, co dělám pravidelně. Obvykle se mi vrací investice za první kvartál po nasazení.


Zdroje: Qwen blog (22. 4. 2026), Artificial Analysis Intelligence Index v4.0, TokenMix, OpenRouter pricing.