Google představil Gemma 4 12B: výkonný AI model, který poběží i na vašem laptopu
Google DeepMind představil nový model Gemma 4 12B – a jeho největší předností je, že výkon na úrovni blízké většímu 26B modelu nabídne ve výrazně menší paměťové stopě, takže ho lze spustit lokálně na běžném laptopu s 16 GB RAM nebo unifikované paměti.
Co dělá Gemma 4 12B zajímavým?
Model přichází s unikátní „encoder-free“ architekturou, místo oddělených enkodérů pro obraz a zvuk zpracovává vizuální i audio vstupy přímo v jazykovém jádru modelu. To snižuje latenci a nároky na paměť. Jde také o první středně velký model v řadě Gemma s nativní podporou audio vstupů.
Model je vybaven Multi-Token Prediction (MTP) draftery pro snížení latence a vychází pod licencí Apache 2.0.
Oblíbenost Gemma roste
Modely Gemma 4 díky vývojářské komunitě překročily 150 milionů stažení. Komunita s nimi staví věci od robotických pomůcek pro osoby s postižením až po bezpečnostní AI nástroje pro firmy.
Kde to vyzkoušet?
Model je dostupný přes Hugging Face a Kaggle, lokálně ho lze spustit například přes Ollama nebo LM Studio, v produkci pak přes Google Cloud.
… reposted this!
… liked this!