Přejít k navigační liště

Zdroják » Zprávičky » Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Google vydal Gemma 4: nejschopnější open-source modely, které zvládne i váš notebook

Zprávičky AI

Nálepky:

Google dnes představil čtvrtou generaci svých open modelů Gemma. Pod licencí Apache 2.0 přináší frontier schopnosti na běžný hardware – od mobilů přes laptopy až po vývojářské workstations.

Gemma 4 jsou nejinteligentnější open modely, jaké Google dosud vydal, navržené především pro pokročilé uvažování a agentické workflow. Přestože jsou open source, 31B model aktuálně obsazuje třetí příčku mezi open modely ve světě v žebříčku Arena AI a v porovnání s uzavřenými modely Gemma 4 překonává modely dvacetkrát větší.

Čtyři velikosti pro každé nasazení

Gemma 4 vychází ve čtyřech variantách: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) a 31B Dense.

Větší modely (26B a 31B) jsou cíleny na vývojářské stroje. Nekomprimované váhy ve formátu bfloat16 se vejdou na jediné NVIDIA H100 GPU s 80 GB VRAM, kvantizované verze pak běží i na spotřebitelských GPU. Model 26B MoE přitom při inferenci aktivuje jen 3,8 miliardy parametrů, což přináší výrazně vyšší rychlost generování tokenů.

Menší modely E2B a E4B jsou naopak navrženy pro mobilní zařízení a IoT – ve spolupráci s týmem Google Pixel a výrobci čipů Qualcomm a MediaTek zvládají běžet zcela offline s minimální latencí na telefonech, Raspberry Pi nebo NVIDIA Jetson Orin Nano.

Co Gemma 4 umí

Z pohledu vývojáře jsou klíčové zejména tyto schopnosti:

Agentické workflow – nativní podpora function callingu, strukturovaného JSON výstupu a systémových instrukcí umožňuje stavět autonomní agenty schopné pracovat s různými nástroji a API.

Multimodalita – všechny modely nativně zpracovávají video a obrázky včetně variabilního rozlišení a zvládají úlohy jako OCR nebo porozumění grafům. E2B a E4B navíc podporují přímý vstup zvuku pro rozpoznávání řeči.

Dlouhý kontext – edge modely nabízejí 128K tokenů, větší modely až 256K, takže lze v jediném promptu předat celý repozitář nebo rozsáhlý dokument.

140+ jazyků – modely jsou nativně trénovány na více než 140 jazycích.

Apache 2.0 a ekosystém

Po kritice předchozích generací Google tentokrát zvolil plnohodnotnou open-source licenci. Gemma 4 je dostupná pod licencí Apache 2.0, která vývojářům dává plnou kontrolu nad daty, infrastrukturou i modely a umožňuje nasazení v libovolném prostředí.

Od prvního dne je dostupná podpora v Hugging Face (Transformers, TRL, Transformers.js), vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth, Keras a dalších nástrojích.

Za zmínku stojí i praktické výsledky: INSAIT na základě Gemma vytvořil průkopnický bulharský jazykový model BgGPT a Yale University model Cell2Sentence-Scale pro objevování nových způsobů léčby rakoviny.

Od vydání první generace si vývojáři stáhli modely Gemma přes 400 milionů krát a vzniklo více než 100 000 variant. Gemma 4 na tuto komunitu přímo navazuje a posouvá laťku výkonu dostupného na vlastním hardwaru výrazně výše.

Zdroj: Google Blog

Komentáře

Odebírat
Upozornit na
guest
1 Komentář
Nejstarší
Nejnovější Most Voted
abbadc

Díky za info vyzkouším :)

Frugal computing: architektura pro dobu dražší infrastruktury

Vývojáři se naučili zrychlovat dotazy, přidávat cache, škálovat služby a hlídat účet za cloud. Frugal computing začíná o jednu otázku dřív: musí se výpočet, přesun dat, volání modelu nebo uložení vůbec stát? Rostoucí spotřeba datových center a nové evropské reportování ho posouvají do návrhu architektury, dřív než do závěrečné poznámky o udržitelnosti v prezentaci.

Odysseus: PewDiePie vydal open-source AI workspace, který běží na vašem vlastním hardwaru

AI
Komentáře: 0
Felix Kjellberg, youtuber se 110 miliony odběratelů, strávil rok učením se programovat a fine-tuningem vlastních AI modelů. Výsledkem je Odysseus – bezplatný, open-source workspace pro práci s umělou inteligencí, který neposílá žádná data do cloudu. Projekt má týden, přes 61 000 hvězdiček na GitHubu a znovu otevírá otázku, komu vlastně patří váš digitální kontext.

Když Git už nestačí: jak izolovat databázový stav pro pokusy AI agentů

Gitová větev vývojářům oddělí kód, ale databáze často zůstává společná. U AI agentů je to slabé místo: rychle spouštějí migrace, mění data a zkoušejí víc cest najednou. Databázová větev jim dá vlastní pracovní prostor, jenže tím práce nekončí. Ještě je potřeba řešit citlivá data, oprávnění, životnost větve i zbytek stavu aplikace.