
商傳媒|何映辰/台北報導
在年度開發者大會 Google I/O 2026 即將於明日(5月19日)揭幕之際,兩款備受關注的人工智慧(AI)模型——Anthropic 的 Claude Mythos 與谷歌(Google)的 Gemini 3.2 Flash-Lite-Live——卻提前以意外方式浮出水面,預示著 AI 領域的最新進展。
Anthropic 最強大的模型 Claude Mythos 於 5 月 16 日出現在 Google Cloud Console 中,且移除了「預覽」(Preview)標籤。此一發展引發市場高度關注,因其前身 Opus 4.7 也曾循此模式,在公開發布前現身於 Google Cloud Console。Claude Mythos 早在 3 月 26 日因配置錯誤意外洩漏,並於 4 月 7 日正式宣布預覽版。據報導,該模型在未經特定資安訓練的情況下,已找出包括 OpenBSD 存在 27 年之久的漏洞在內,數千個作業系統與瀏覽器的零日漏洞。
儘管 Anthropic 多次強調不打算讓 Mythos 全面上市,但其走向廣泛應用的路徑已大致確立:首先測試 Opus 模型的安全防護措施,接著防禦性擴展 Project Glasswing,然後提供有限的企業 API 存取。市場預期 Mythos 的企業 API 存取最快將落在 2026 年第三至第四季,而消費者版本可能要等到 2027 年甚至更晚。有使用者看好 Mythos 有望解決 Claude 在規劃方面的弱點,但也有批評者指出其高昂定價、嚴格的使用上限,以及 Anthropic 在安全聲明上存在的不一致性。
同一時間,谷歌的 Gemini 3.2 Flash 模型也悄然現身。該模型最早於 5 月 5 日在 iOS Gemini app 和 Google AI Studio 內部曝光,隨後有 Reddit 用戶觀察到其模型選擇器在 24 小時內即時切換版本,最終穩定在 3.2 Flash。隨後,其 Flash-Lite-Live 版本於 5 月 16 日現身 Google Cloud Console。此命名方式從 3.1 直接跳至 3.2,而非 3.5,顯示谷歌可能正轉向更為迭代、軟體式的更新週期,頻繁推出增量改進而非偶爾進行大幅版本跳躍。
早期在 LM Arena 基準測試的結果顯示,Gemini 3.2 Flash 在特定創意編程任務中表現超越 Gemini 3.1 Pro,例如在 ASCII 動畫基準測試中,3.1 Pro 產出的程式碼有誤,而 3.2 Flash 卻能在兩分鐘內成功完成。該模型在 SVG 生成、互動式 3D 環境編程及動畫處理方面均展現出顯著優勢。外洩的 API Studio 資料顯示,Gemini 3.2 Flash 的定價為每百萬輸入代幣 0.25 美元,每百萬輸出代幣 2.00 美元,在輸出成本上比現有的 Gemini 3 Flash 更低,輸入成本則與 Flash-Lite 相同。若此定價屬實,這意味著開發者能以接近高用量、低複雜度任務的價格,獲得接近 Pro 級的編程能力。業界消息人士亦透露,谷歌可能在正式發布前將其重新命名為 Gemini 3.5 Flash,以暗示其為更大幅度的世代躍進。
這兩款 AI 模型的洩漏,恰逢 OpenAI 於 5 月 5 日推出強調高準確度與減少幻覺問題的 GPT-5.5 Instant。谷歌此次外洩的模型則側重於編程的成本效益。分析師指出,當模型訊號同時出現在行動應用程式介面、開發者控制台和盲測基準測試這三種不同管道時,該模型真實且即將推出的可能性超過九成。對於正評估谷歌 AI 堆疊的開發者而言,未來幾天(Google I/O 2026期間)將對成本效益產生顯著影響。若 Anthropic 同時發布 Mythos 企業 API,並由谷歌宣布 Gemini 3.2 Flash 的全面上市,這將構成今年最具影響力的兩款 AI 產品接連發布事件。
