Přejít k navigační liště

Zdroják » Zprávičky » Google představil Gemma 4 12B: výkonný AI model, který poběží i na vašem laptopu

Google představil Gemma 4 12B: výkonný AI model, který poběží i na vašem laptopu

Zprávičky AI

Nálepky:

Google DeepMind představil nový model Gemma 4 12B – a jeho největší předností je, že výkon na úrovni blízké většímu 26B modelu nabídne ve výrazně menší paměťové stopě, takže ho lze spustit lokálně na běžném laptopu s 16 GB RAM nebo unifikované paměti.

Co dělá Gemma 4 12B zajímavým?

Model přichází s unikátní „encoder-free“ architekturou, místo oddělených enkodérů pro obraz a zvuk zpracovává vizuální i audio vstupy přímo v jazykovém jádru modelu. To snižuje latenci a nároky na paměť. Jde také o první středně velký model v řadě Gemma s nativní podporou audio vstupů.

Model je vybaven Multi-Token Prediction (MTP) draftery pro snížení latence a vychází pod licencí Apache 2.0.

Oblíbenost Gemma roste

Modely Gemma 4 díky vývojářské komunitě překročily 150 milionů stažení. Komunita s nimi staví věci od robotických pomůcek pro osoby s postižením až po bezpečnostní AI nástroje pro firmy.

Kde to vyzkoušet?

Model je dostupný přes Hugging Face a Kaggle, lokálně ho lze spustit například přes Ollama nebo LM Studio, v produkci pak přes Google Cloud.

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted

Frugal computing: architektura pro dobu dražší infrastruktury

Vývojáři se naučili zrychlovat dotazy, přidávat cache, škálovat služby a hlídat účet za cloud. Frugal computing začíná o jednu otázku dřív: musí se výpočet, přesun dat, volání modelu nebo uložení vůbec stát? Rostoucí spotřeba datových center a nové evropské reportování ho posouvají do návrhu architektury, dřív než do závěrečné poznámky o udržitelnosti v prezentaci.