
商傳媒|葉安庭/綜合外電報導
Google旗下的生成式人工智慧模型Gemini近期迎來多項功能更新與整合,大幅提升其在研究、內容創作及自動化任務上的應用潛力,有望成為生產力工具使用者不可或缺的助手。
根據《Fast Company Middle East》報導,Gemini現在不僅能迅速產出全面的研究報告,更具備建構儀表板與製作資訊圖表的能力。在今年3月13日,Google發布了「Ask Maps」功能,讓用戶可以直接向Gemini查詢地圖相關資訊,例如尋找附近附有照明設施的開放網球場。此外,自3月10日起,Gemini也擴展了與Google文件、試算表及簡報的整合,使資料處理與呈現更為流暢。
在內容生成方面,Gemini的圖像生成功能能協助用戶製作簡報圖表、說明性圖片或社論漫畫,甚至能將用戶上傳的螢幕截圖或手繪草圖作為參考,進行視覺創作。其「深度研究」工具(Deep Research)可針對特定地點、人物、事件或技術等主題,依據用戶指定的用途、理解程度、偏好來源與風格(如表格、條列、圖表)生成詳盡報告。Gemini的上下文視窗高達一百萬個tokens,意即每次查詢可吸收並處理約1,500頁的文字內容。
為滿足個人化與自動化需求,Gemini推出了「Gems」功能,允許用戶根據特定指令建立客製化的Gemini版本,作為重複性任務的範本,例如自動生成替代文字(alt-text)、搜尋引擎優化(SEO)文本,甚至是發票或費用報告。用戶也可設定Gem來檢查內容是否存在偏見或盲點。此外,透過「Canvas」工具,Gemini能夠生成程式碼,用於建構網站、遊戲、工具、儀表板或互動式資訊圖表,並能依據用戶輸入的指標與設定的「思考模式」(Thinking mode),提供策略建議。
與其他AI模型相比,報導指出Gemini在多功能性上表現出色,特別是在生成圖像、影片及歌曲,以及分析影片內容方面,是Claude無法達成的。Gemini與Google旗下的NotebookLM整合程度優於ChatGPT,能同步查詢多個筆記本的內容。儘管ChatGPT擁有更多自定義GPTs和與Canva、Figma等設計工具的內建應用程式,但Gemini在Google文件、試算表及簡報的深度整合仍是其獨特優勢,能直接從Google雲端硬碟的資料建立儀表板或生成可編輯的簡報。
