Přejít k navigační liště

Zdroják » Zprávičky » Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Zprávičky AI

Nálepky:

Google dnes představil čtvrtou generaci svých open modelů Gemma. Pod licencí Apache 2.0 přináší frontier schopnosti na běžný hardware – od mobilů přes laptopy až po vývojářské workstations.

Gemma 4 jsou nejinteligentnější open modely, jaké Google dosud vydal, navržené především pro pokročilé uvažování a agentické workflow. Přestože jsou open source, 31B model aktuálně obsazuje třetí příčku mezi open modely ve světě v žebříčku Arena AI a v porovnání s uzavřenými modely Gemma 4 překonává modely dvacetkrát větší.

Čtyři velikosti pro každé nasazení

Gemma 4 vychází ve čtyřech variantách: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) a 31B Dense.

Větší modely (26B a 31B) jsou cíleny na vývojářské stroje. Nekomprimované váhy ve formátu bfloat16 se vejdou na jediné NVIDIA H100 GPU s 80 GB VRAM, kvantizované verze pak běží i na spotřebitelských GPU. Model 26B MoE přitom při inferenci aktivuje jen 3,8 miliardy parametrů, což přináší výrazně vyšší rychlost generování tokenů.

Menší modely E2B a E4B jsou naopak navrženy pro mobilní zařízení a IoT – ve spolupráci s týmem Google Pixel a výrobci čipů Qualcomm a MediaTek zvládají běžet zcela offline s minimální latencí na telefonech, Raspberry Pi nebo NVIDIA Jetson Orin Nano.

Co Gemma 4 umí

Z pohledu vývojáře jsou klíčové zejména tyto schopnosti:

Agentické workflow – nativní podpora function callingu, strukturovaného JSON výstupu a systémových instrukcí umožňuje stavět autonomní agenty schopné pracovat s různými nástroji a API.

Multimodalita – všechny modely nativně zpracovávají video a obrázky včetně variabilního rozlišení a zvládají úlohy jako OCR nebo porozumění grafům. E2B a E4B navíc podporují přímý vstup zvuku pro rozpoznávání řeči.

Dlouhý kontext – edge modely nabízejí 128K tokenů, větší modely až 256K, takže lze v jediném promptu předat celý repozitář nebo rozsáhlý dokument.

140+ jazyků – modely jsou nativně trénovány na více než 140 jazycích.

Apache 2.0 a ekosystém

Po kritice předchozích generací Google tentokrát zvolil plnohodnotnou open-source licenci. Gemma 4 je dostupná pod licencí Apache 2.0, která vývojářům dává plnou kontrolu nad daty, infrastrukturou i modely a umožňuje nasazení v libovolném prostředí.

Od prvního dne je dostupná podpora v Hugging Face (Transformers, TRL, Transformers.js), vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth, Keras a dalších nástrojích.

Za zmínku stojí i praktické výsledky: INSAIT na základě Gemma vytvořil průkopnický bulharský jazykový model BgGPT a Yale University model Cell2Sentence-Scale pro objevování nových způsobů léčby rakoviny.

Od vydání první generace si vývojáři stáhli modely Gemma přes 400 milionů krát a vzniklo více než 100 000 variant. Gemma 4 na tuto komunitu přímo navazuje a posouvá laťku výkonu dostupného na vlastním hardwaru výrazně výše.

Zdroj: Google Blog

Komentáře

Odebírat
Upozornit na
guest
1 Komentář
Nejstarší
Nejnovější Most Voted
Inline Feedbacks
Zobrazit všechny komentáře
AI Channel

… reposted this!

abbadc

Díky za info vyzkouším :)

Git Worktree + Claude Code: paralelní vývoj a AI agenti ve více větvích najednou

Git worktree posouvá práci s větvemi na úplně jinou úroveň – místo neustálého přepínání a stashování nabízí paralelní pracovní prostředí nad jedním repozitářem. V kombinaci s nástroji jako Claude Code navíc otevírá dveře k běhu více AI agentů současně, každý izolovaně ve své větvi, bez kolizí a zbytečné režie.