Google 發布最新一代人工智能模型 Gemini 3，標誌公司 AI 策略進入全新階段。Google 首次在發布日將 Gemini 模型整合至 Google Search，打破過往需數周甚至數月才能將新模型部署至核心產品的慣例。Gemini 3 在多項國際基準測試中刷新紀錄，其中在 LMArena 排行榜取得突破性的 1,501 Elo 分數，超越 OpenAI 於 8 月發布的 GPT-5 及 Anthropic 於 9 月推出的 Claude Sonnet 4.5，成為目前全球表現最佳 AI 模型。

推理能力大幅提升

Google DeepMind 行政總裁 Demis Hassabis 表示，Gemini 3 在推理能力方面取得重大突破。該模型在 Humanity’s Last Exam 測試中取得 37.5% 博士級推理分數，在 GPQA Diamond 測試達到 91.9% 準確率，展現處理複雜科學及數學問題的能力。模型也在 MathArena Apex 數學測試創下 23.4% 新紀錄，並在事實準確性測試 SimpleQA Verified 取得 72.1% 分數。

Gemini 3 多模態推理能力也顯著提升，在 MMMU-Pro 測試獲得 81% 分數，在 Video-MMMU 影片理解測試達到 87.6%。Google 指出模型能更準確理解用戶意圖及查詢背後細微差異，減少用戶需重複提問次數。

深度思考模式挑戰 AGI

Google 同步推出 Gemini 3 Deep Think 深度思考模式，進一步提升模型推理及多模態理解能力。Deep Think 模式在 Humanity’s Last Exam 達到 41.0% 分數，GPQA Diamond 測試取得 93.8% 準確率，較標準版 Gemini 3 Pro 再有提升。該模式在 ARC-AGI-2 測試更取得 45.1% 史無前例成績，展示解決全新挑戰的能力。

Deep Think 模式目前正進行安全測試，Google 計劃在未來數周向 Google AI Ultra 訂閱用戶提供。

生成式介面改革搜尋體驗

Gemini 3 在 Google Search 引入全新「生成式介面」(Generative UI) 功能，能根據用戶查詢即時建立個人化視覺佈局、互動工具及模擬程式。模型會分析問題並自動生成最有用佈局，包含圖片、表格及網格等視覺元素。

Google 舉例說明，當用戶查詢三體問題物理原理時，系統會生成互動模擬程式，讓用戶調整變數並觀察引力相互作用。若用戶研究按揭貸款，Gemini 3 會即時建立個人化貸款計算機，方便比較不同方案長期成本。

開發者工具全面升級

Google 推出全新代理開發平台 Google Antigravity，利用 Gemini 3 推理及代理編程能力，將 AI 從開發工具提升為合作夥伴。Antigravity 代理系統可直接存取編輯器、終端機及瀏覽器，自主規劃及執行複雜端到端軟件任務。

Gemini 3 在編程能力測試表現出色，在 WebDev Arena 排行榜取得 1,487 Elo 分數登頂。模型在 Terminal-Bench 2.0 工具使用測試獲得 54.2% 分數，在衡量編程代理能力的 SWE-bench Verified 測試達到 76.2%，大幅超越前代 Gemini 2.5 Pro。

開發者可透過 Google AI Studio、Vertex AI、Gemini CLI 及 Google Antigravity 使用 Gemini 3。該模型也整合至 Cursor、GitHub、JetBrains、Manus、Replit 等第三方開發平台。

代理功能進駐日常應用

Gemini 3 在長期規劃能力方面取得進展，在測試較長期規劃的 Vending-Bench 2 排行榜登頂。該測試模擬管理自動售賣機業務一整年，Gemini 3 能維持一致工具使用及決策，在不偏離任務情況下創造更高回報。

Google AI Ultra 訂閱用戶現可在 Gemini app 使用 Gemini Agent 代理功能。該功能結合深度推理及改良工具使用能力，能代表用戶處理預訂本地服務或整理收件匣等複雜多步驟工作流程。Google 表示將很快擴展至更多產品。

安全評估史上最全面

Google 表示 Gemini 3 是該公司迄今最安全模型，經歷最全面安全評估。模型在減少奉承回應、抵抗提示注入攻擊及防止網絡攻擊濫用方面均有改善。

Google 除了內部測試外，也與全球主要領域專家合作評估，並向英國 AI 安全研究所 (AISI) 提供早期存取。公司也獲得 Apollo、Vaultis、Dreadnode 等業界專家獨立評估。

逐步推出至各平台

Gemini 3 Pro 現已在 Gemini app 向所有用戶開放，美國 Google AI Pro 及 Ultra 訂閱用戶可在 Google Search 的 AI Mode 使用。開發者可透過 AI Studio 的 Gemini API、Google Antigravity 及 Gemini CLI 使用該模型。企業用戶可在 Vertex AI 及 Gemini Enterprise 平台使用。

Google 計劃未來數周在美國向所有用戶推出 AI Mode 的 Gemini 3，Pro 及 Ultra 訂閱用戶將享有更高使用限制。公司也表示將很快發布 Gemini 3 系列其他模型。

資料來源：Google Blog

Google 發佈 Gemini 3 破天荒即時整合到 Google Search 中 – unwire.hk 香港