Google představil Gemini 3, nový generativní model, který kombinuje multimodální porozumění s rozšířenými schopnostmi uvažování a agentními funkcemi. Verze Gemini 3 Pro je v preview a podle oznámení je dostupná v řadě produktů Google, včetně aplikace Gemini, AI Studia a Vertex AI.
Podle webu Google model staví na předchozích generacích Gemini a má zlepšit rozpoznávání kontextu a záměru uživatele, zkrátit potřebu podrobného zadávání a podporovat komplexní tvůrčí a analytické úlohy.
Gemini 3 Pro dosahuje podle uvedených testů výrazně lepších výsledků než předchozí verze: získal 1501 Elo na žebříčku LMArena a dosahuje vysokých skóre v řadě benchmarků — například 37,5 % na Humanity’s Last Exam bez použití nástrojů, 91,9 % na GPQA Diamond, 23,4 % na MathArena Apex, 81 % na MMMU-Pro, 87,6 % na Video-MMMU a 72,1 % na SimpleQA Verified. Model má také kontextové okno až na 1 milion tokenů a zvládá text, obrázky, video, audio i kód.
Gemini 3 Deep Think představuje vylepšený režim pro náročnější uvažování; v testech překonává Gemini 3 Pro — dosahuje 41,0 % na Humanity’s Last Exam bez nástrojů, 93,8 % na GPQA Diamond a 45,1 % na ARC-AGI-2 při vykonávání kódu. Tento režim má být nejprve zpřístupněn testerům bezpečnosti a následně předplatitelům Google AI Ultra.
Model je určen pro učení, vývoj a plánování: autoři uvádějí příklady jako převod ručně psaných receptů do sdílené kuchařky, analýzu dlouhých přednášek s generováním interaktivních pomůcek, nebo analýzu videa sportovního výkonu s návrhem tréninkového plánu. Ve vývoji pro vývojáře Gemini 3 potvrzuje zlepšení v kódování: 1487 Elo na WebDev Arena, 54,2 % na Terminal-Bench 2.0 a 76,2 % na SWE-bench Verified. K dispozici je také nové agentní vývojové prostředí Google Antigravity.
Sundar Pichai, Demis Hassabis a Koray Kavukcuoglu v doprovodných sděleních zdůraznili, že Gemini 3 je nasazován ve vybraných produktech a že společnost pokračuje ve vylepšování modelu.
