Přejít k navigační liště

Zdroják » Zprávičky » Gemini 3.1 Pro

Gemini 3.1 Pro

Zprávičky AI

Nálepky:

Google zveřejnil model Gemini 3.1 Pro, který představuje aktuálně nejpokročilejší variantu řady Gemini určenou pro náročné multimodální úlohy. Model je navržen pro práci s textem, obrazem, zvukem i videem v rámci jednoho kontextu a cílí především na složité analytické a vývojářské scénáře.

Gemini 3.1 Pro disponuje výrazně rozšířeným kontextovým oknem – zvládá až 1 milion vstupních tokenů a až 64 000 výstupních tokenů. To umožňuje práci s rozsáhlými dokumenty, dlouhými konverzacemi, velkými repozitáři kódu nebo kombinovanými multimediálními vstupy bez nutnosti jejich dělení na menší části.

Model vychází z architektury předchozí verze Gemini 3 Pro, přičemž přináší další zlepšení v oblasti kvality odpovědí, stability a schopnosti hlubšího uvažování nad komplexními zadáními. Nativní multimodalita znamená, že dokáže současně analyzovat například textový popis spolu s obrázkem či videem a vyvozovat z nich souvislosti.

Gemini 3.1 Pro je dostupný prostřednictvím několika kanálů – v aplikaci Gemini, přes Google Cloud (Vertex AI), Gemini API i nástroje určené vývojářům a experimentátorům. Model je tak cílen jak na běžné uživatele, tak na firmy a vývojáře, kteří potřebují pokročilé AI schopnosti integrovat do vlastních aplikací.

Podle zveřejněné modelové karty je Gemini 3.1 Pro určen především pro komplexní analýzy, práci s rozsáhlými datovými vstupy, vývoj softwaru, výzkum a další profesionální scénáře, kde je klíčová kombinace dlouhého kontextu a multimodálního porozumění.

BenchmarkNotesGemini 3.1 ProThinking (High)Gemini 3 ProThinking (High)Sonnet 4.6Thinking (Max)Opus 4.6Thinking (Max)GPT-5.2Thinking (xhigh)GPT-5.3-CodexThinking (xhigh)
Humanity’s Last Exam
Academic reasoning (full set, text + MM)
No tools44.4%37.5%33.2%40.0%34.5%
Search (blocklist) + Code51.4%45.8%49.0%53.1%45.5%
ARC-AGI-2
Abstract reasoning puzzles
ARC Prize Verified77.1%31.1%58.3%68.8%52.9%
GPQA Diamond
Scientific knowledge
No tools94.3%91.9%89.9%91.3%92.4%
Terminal-Bench 2.0
Agentic terminal coding
Terminus-2 harness68.5%56.9%59.1%65.4%54.0%64.7%
Other best self-reported harness62.2%(Codex)77.3%(Codex)
SWE-Bench Verified
Agentic coding
Single attempt80.6%76.2%79.6%80.8%80.0%
SWE-Bench Pro (Public)
Diverse agentic coding tasks
Single attempt54.2%43.3%55.6%56.8%
LiveCodeBench Pro
Competitive coding problems from Codeforces, ICPC, and IOI
Elo288724392393
SciCode
Scientific research coding
59%56%47%52%52%
APEX-Agents
Long horizon professional tasks
33.5%18.4%29.8%23.0%
GDPval-AA Elo
Expert tasks
13171195163316061462
τ2-bench
Agentic and tool use
Retail90.8%85.3%91.7%91.9%82.0%
Telecom99.3%98.0%97.9%99.3%98.7%
MCP Atlas
Multi-step workflows using MCP
69.2%54.1%61.3%59.5%60.6%
BrowseComp
Agentic search
Search + Python + Browse85.9%59.2%74.7%84.0%65.8%
MMMU-Pro
Multimodal understanding and reasoning
No tools80.5%81.0%74.5%73.9%79.5%
MMMLUMultilingual Q&A92.6%91.8%89.3%91.1%89.6%
MRCR v2 (8-needle)
Long context performance
128k (average)84.9%77.0%84.9%84.0%83.8%
1M (pointwise)26.3%26.3%Not supportedNot supportedNot supported

Původní zpráva: https://deepmind.google/models/model-cards/gemini-3-1-pro/

Komentáře

Odebírat
Upozornit na
guest
0 Komentářů
Nejstarší
Nejnovější Most Voted

Odysseus: PewDiePie vydal open-source AI workspace, který běží na vašem vlastním hardwaru

AI
Komentáře: 0
Felix Kjellberg, youtuber se 110 miliony odběratelů, strávil rok učením se programovat a fine-tuningem vlastních AI modelů. Výsledkem je Odysseus – bezplatný, open-source workspace pro práci s umělou inteligencí, který neposílá žádná data do cloudu. Projekt má týden, přes 61 000 hvězdiček na GitHubu a znovu otevírá otázku, komu vlastně patří váš digitální kontext.

Když Git už nestačí: jak izolovat databázový stav pro pokusy AI agentů

Gitová větev vývojářům oddělí kód, ale databáze často zůstává společná. U AI agentů je to slabé místo: rychle spouštějí migrace, mění data a zkoušejí víc cest najednou. Databázová větev jim dá vlastní pracovní prostor, jenže tím práce nekončí. Ještě je potřeba řešit citlivá data, oprávnění, životnost větve i zbytek stavu aplikace.

GitHub vyhrál pohodlím. Stejné pohodlí dnes ztěžuje odchod

GitHub kdysi působil jako přesný opak SourceForge: rychlý, přehledný a přirozený. Dnešní projekt na něm ale často nemá jen kód. Má tam issues, pull requesty, CI, balíčky, bezpečnostní pravidla i AI agenty. Lock-in nevzniká tím, že by nešel odnést Git repozitář, ale tím, že se běžný provoz týmu postupně přesune do jedné platformy.