Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Zdroják » Zprávičky » Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Nálepky:

Google dnes představil čtvrtou generaci svých open modelů Gemma. Pod licencí Apache 2.0 přináší frontier schopnosti na běžný hardware – od mobilů přes laptopy až po vývojářské workstations.

Gemma 4 jsou nejinteligentnější open modely, jaké Google dosud vydal, navržené především pro pokročilé uvažování a agentické workflow. Přestože jsou open source, 31B model aktuálně obsazuje třetí příčku mezi open modely ve světě v žebříčku Arena AI a v porovnání s uzavřenými modely Gemma 4 překonává modely dvacetkrát větší.

Čtyři velikosti pro každé nasazení

Gemma 4 vychází ve čtyřech variantách: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) a 31B Dense.

Větší modely (26B a 31B) jsou cíleny na vývojářské stroje. Nekomprimované váhy ve formátu bfloat16 se vejdou na jediné NVIDIA H100 GPU s 80 GB VRAM, kvantizované verze pak běží i na spotřebitelských GPU. Model 26B MoE přitom při inferenci aktivuje jen 3,8 miliardy parametrů, což přináší výrazně vyšší rychlost generování tokenů.

Menší modely E2B a E4B jsou naopak navrženy pro mobilní zařízení a IoT – ve spolupráci s týmem Google Pixel a výrobci čipů Qualcomm a MediaTek zvládají běžet zcela offline s minimální latencí na telefonech, Raspberry Pi nebo NVIDIA Jetson Orin Nano.

Co Gemma 4 umí

Z pohledu vývojáře jsou klíčové zejména tyto schopnosti:

Agentické workflow – nativní podpora function callingu, strukturovaného JSON výstupu a systémových instrukcí umožňuje stavět autonomní agenty schopné pracovat s různými nástroji a API.

Multimodalita – všechny modely nativně zpracovávají video a obrázky včetně variabilního rozlišení a zvládají úlohy jako OCR nebo porozumění grafům. E2B a E4B navíc podporují přímý vstup zvuku pro rozpoznávání řeči.

Dlouhý kontext – edge modely nabízejí 128K tokenů, větší modely až 256K, takže lze v jediném promptu předat celý repozitář nebo rozsáhlý dokument.

140+ jazyků – modely jsou nativně trénovány na více než 140 jazycích.

Apache 2.0 a ekosystém

Po kritice předchozích generací Google tentokrát zvolil plnohodnotnou open-source licenci. Gemma 4 je dostupná pod licencí Apache 2.0, která vývojářům dává plnou kontrolu nad daty, infrastrukturou i modely a umožňuje nasazení v libovolném prostředí.

Od prvního dne je dostupná podpora v Hugging Face (Transformers, TRL, Transformers.js), vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth, Keras a dalších nástrojích.

Za zmínku stojí i praktické výsledky: INSAIT na základě Gemma vytvořil průkopnický bulharský jazykový model BgGPT a Yale University model Cell2Sentence-Scale pro objevování nových způsobů léčby rakoviny.

Od vydání první generace si vývojáři stáhli modely Gemma přes 400 milionů krát a vzniklo více než 100 000 variant. Gemma 4 na tuto komunitu přímo navazuje a posouvá laťku výkonu dostupného na vlastním hardwaru výrazně výše.

Zdroj: Google Blog

Adam Heglas

Student se zájmem o IT, programování a kybernetickou bezpečnost. Baví mě se učit novým věcem a posouvat své schopnosti dál. Když zrovna nesedím u kódu, věnuji se fitness a počítačovým hrám.

Komentáře

Odebírat

1 Komentář

Nejstarší

Nejnovější Most Voted

Inline Feedbacks

Zobrazit všechny komentáře

AI Channel

1 den před

… reposted this!

Odpovědět

Laḫmu 𒀭𒌊

1 den před

… liked this!

Odpovědět

abbadc

1 den před

Díky za info vyzkouším :)

Odpovědět

Git Worktree + Claude Code: paralelní vývoj a AI agenti ve více větvích najednou

Git worktree posouvá práci s větvemi na úplně jinou úroveň – místo neustálého přepínání a stashování nabízí paralelní pracovní prostředí nad jedním repozitářem. V kombinaci s nástroji jako Claude Code navíc otevírá dveře k běhu více AI agentů současně, každý izolovaně ve své větvi, bez kolizí a zbytečné režie.

MCP C# SDK dosáhlo verze 1.0 – co přináší nová specifikace?

Model Context Protocol (MCP) je dnes jedním z nejrychleji rostoucích standardů pro integraci LLM modelů s nástroji a servery. Oficiální C# SDK právě dosáhlo stabilní verze 1.0 s plnou podporou specifikace 2025-11-25. Pojďme se podívat, co nového přináší.

Mistral Forge: když si firmy začnou stavět vlastní AI

Platforma Forge od Mistral AI ukazuje, kam se posouvá využití umělé inteligence ve firmách. Místo napojení na externí služby přináší možnost stavět vlastní AI modely nad interními daty a provozovat je pod plnou kontrolou - od trénování až po nasazení.

Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Nálepky:

Čtyři velikosti pro každé nasazení

Co Gemma 4 umí

Apache 2.0 a ekosystém

Adam Heglas

Komentáře

Git Worktree + Claude Code: paralelní vývoj a AI agenti ve více větvích najednou

MCP C# SDK dosáhlo verze 1.0 – co přináší nová specifikace?

Mistral Forge: když si firmy začnou stavět vlastní AI

Sledujte Zdroják:

Hádej co? Cookies!