Přejít k navigační liště

Zdroják » Zprávičky » Alibaba vydala Qwen3.6-35B-A3B: otevřený model s překvapivým výkonem za zlomek nákladů

Alibaba vydala Qwen3.6-35B-A3B: otevřený model s překvapivým výkonem za zlomek nákladů

Zprávičky AI

Nálepky:

Tým Qwen z Alibaby dnes vydal nový open-source multimodální model Qwen3.6-35B-A3B. Jde o architekturu typu sparse Mixture-of-Experts (MoE) s 35 miliardami celkových parametrů, přičemž při každém výpočtu jsou aktivní pouze 3 miliardy z nich – model je tedy výrazně úspornější, než by napovídalo jeho označení.

Model je vydán pod licencí Apache 2.0, což znamená, že ho firmy i vývojáři mohou volně používat, upravovat a stavět na něm vlastní aplikace.

Proč je to zajímavé?

Právě architektura je tím, co dělá tento model výjimečným. Díky aktivaci pouhých 3 miliard parametrů při inferenci nabízí Qwen3.6-35B-A3B ekonomiku malého modelu, přičemž čerpá ze znalostní kapacity modelu mnohem většího. Výsledky v benchmarcích to potvrzují: v agenturních programovacích úkolech konkuruje, a v řadě případů předčí husté modely desetkrát větší velikosti aktivních parametrů. Na Terminal-Bench 2.0 (agenturní terminálové programování) dosahuje skóre 51,5 oproti 42,9 u Gemma4-31B od Googlu.

Model také výrazně překonává svého předchůdce Qwen3.5-35B-A3B v téměř všech benchmarcích, což naznačuje, že mezigenerační posun je podstatný, nikoli postupný.

Multimodalita a délka kontextu

Qwen3.6 je nativně multimodální a podporuje jak „myšlenkový“ (thinking), tak „přímý“ (non-thinking) režim. Vývojáři tak mohou volit mezi krok-za-krokem uvažováním nebo rychlými odpověďmi. Nativně zvládá kontext délky 262 144 tokenů, rozšiřitelný až na přibližně jeden milion tokenů.

Alibaba tvrdí, že ve většině multimodálních úloh se výkon modelu vyrovná Claude Sonnet 4.5 a v prostorové inteligenci ho dokonce překonává – dosahuje 92,0 na RefCOCO a 50,8 na ODInW13.

Model je dostupný na Hugging Face i ModelScope.

Zdroj: https://qwen.ai/blog?id=qwen3.6-35b-a3b

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted

Frugal computing: architektura pro dobu dražší infrastruktury

Vývojáři se naučili zrychlovat dotazy, přidávat cache, škálovat služby a hlídat účet za cloud. Frugal computing začíná o jednu otázku dřív: musí se výpočet, přesun dat, volání modelu nebo uložení vůbec stát? Rostoucí spotřeba datových center a nové evropské reportování ho posouvají do návrhu architektury, dřív než do závěrečné poznámky o udržitelnosti v prezentaci.

Odysseus: PewDiePie vydal open-source AI workspace, který běží na vašem vlastním hardwaru

AI
Komentáře: 0
Felix Kjellberg, youtuber se 110 miliony odběratelů, strávil rok učením se programovat a fine-tuningem vlastních AI modelů. Výsledkem je Odysseus – bezplatný, open-source workspace pro práci s umělou inteligencí, který neposílá žádná data do cloudu. Projekt má týden, přes 61 000 hvězdiček na GitHubu a znovu otevírá otázku, komu vlastně patří váš digitální kontext.

Když Git už nestačí: jak izolovat databázový stav pro pokusy AI agentů

Gitová větev vývojářům oddělí kód, ale databáze často zůstává společná. U AI agentů je to slabé místo: rychle spouštějí migrace, mění data a zkoušejí víc cest najednou. Databázová větev jim dá vlastní pracovní prostor, jenže tím práce nekončí. Ještě je potřeba řešit citlivá data, oprávnění, životnost větve i zbytek stavu aplikace.