Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook
Google dnes představil čtvrtou generaci svých open modelů Gemma. Pod licencí Apache 2.0 přináší frontier schopnosti na běžný hardware – od mobilů přes laptopy až po vývojářské workstations.
Gemma 4 jsou nejinteligentnější open modely, jaké Google dosud vydal, navržené především pro pokročilé uvažování a agentické workflow. Přestože jsou open source, 31B model aktuálně obsazuje třetí příčku mezi open modely ve světě v žebříčku Arena AI a v porovnání s uzavřenými modely Gemma 4 překonává modely dvacetkrát větší.
Čtyři velikosti pro každé nasazení
Gemma 4 vychází ve čtyřech variantách: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) a 31B Dense.
Větší modely (26B a 31B) jsou cíleny na vývojářské stroje. Nekomprimované váhy ve formátu bfloat16 se vejdou na jediné NVIDIA H100 GPU s 80 GB VRAM, kvantizované verze pak běží i na spotřebitelských GPU. Model 26B MoE přitom při inferenci aktivuje jen 3,8 miliardy parametrů, což přináší výrazně vyšší rychlost generování tokenů.
Menší modely E2B a E4B jsou naopak navrženy pro mobilní zařízení a IoT – ve spolupráci s týmem Google Pixel a výrobci čipů Qualcomm a MediaTek zvládají běžet zcela offline s minimální latencí na telefonech, Raspberry Pi nebo NVIDIA Jetson Orin Nano.
Co Gemma 4 umí
Z pohledu vývojáře jsou klíčové zejména tyto schopnosti:
Agentické workflow – nativní podpora function callingu, strukturovaného JSON výstupu a systémových instrukcí umožňuje stavět autonomní agenty schopné pracovat s různými nástroji a API.
Multimodalita – všechny modely nativně zpracovávají video a obrázky včetně variabilního rozlišení a zvládají úlohy jako OCR nebo porozumění grafům. E2B a E4B navíc podporují přímý vstup zvuku pro rozpoznávání řeči.
Dlouhý kontext – edge modely nabízejí 128K tokenů, větší modely až 256K, takže lze v jediném promptu předat celý repozitář nebo rozsáhlý dokument.
140+ jazyků – modely jsou nativně trénovány na více než 140 jazycích.
Apache 2.0 a ekosystém
Po kritice předchozích generací Google tentokrát zvolil plnohodnotnou open-source licenci. Gemma 4 je dostupná pod licencí Apache 2.0, která vývojářům dává plnou kontrolu nad daty, infrastrukturou i modely a umožňuje nasazení v libovolném prostředí.
Od prvního dne je dostupná podpora v Hugging Face (Transformers, TRL, Transformers.js), vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth, Keras a dalších nástrojích.
Za zmínku stojí i praktické výsledky: INSAIT na základě Gemma vytvořil průkopnický bulharský jazykový model BgGPT a Yale University model Cell2Sentence-Scale pro objevování nových způsobů léčby rakoviny.
Od vydání první generace si vývojáři stáhli modely Gemma přes 400 milionů krát a vzniklo více než 100 000 variant. Gemma 4 na tuto komunitu přímo navazuje a posouvá laťku výkonu dostupného na vlastním hardwaru výrazně výše.
Zdroj: Google Blog
… reposted this!
… liked this!
Díky za info vyzkouším :)