Google I/O 十大重點懶人包!Gemini變AI代理人、Ask YouTube登場

▲Google在今天凌晨的開發者大會,宣布Gemini再進化,AI影像生成大超車,同時推出24小時代理人。(圖/翻攝官網)
記者周淑萍/綜合報導-2026-05-20 02:48:31
Google年度開發者大會Google I/O 2026登場,Google執行長Sundar Pichai以「agentic Gemini era」為主軸,宣布Gemini將從AI聊天助理,進一步變成可協助使用者執行任務的個人AI代理人。從Gemini App、Google搜尋、YouTube、Docs、Gmail、Keep到Chrome,Google正把AI全面導入日常服務,讓AI不只回答問題,也能幫忙整理資訊、生成內容,甚至在背景執行長時間任務,同時也發表了全新Google智慧眼鏡,audio glasses可在耳邊提供語音協助;display glasses則能在使用者需要時顯示資訊,兩者都可透過Gemini以語音操作,預計今年秋季推出

▲Google執行長Sundar Pichai以「agentic Gemini era」為主軸,宣布Gemini將從AI聊天助理,進一步變成可協助使用者執行任務的個人AI代理人。(圖/翻攝直播影片)
1.Google AI用量暴增!每月處理token破3.2千兆

Google指出,旗下服務每月處理的tokens數量,從2024年5月的9.7兆、2025年I/O約480兆,成長到目前每月超過3.2千兆,年增達7倍。Google也表示,目前每月已有超過850萬名開發者使用Google模型打造App與體驗,模型API每分鐘約處理190億tokens。

2.Google搜尋升級!AI Overview月活突破25億

搜尋仍是Google AI化的最重要入口。Google宣布,AI Overviews目前月活躍用戶已超過25億;AI Mode推出約一年,月活躍用戶也突破10億。Pichai形容AI Mode是Google搜尋史上最大升級,使用者不再只是輸入單次關鍵字查資料,而是更像與搜尋引擎進行連續對話。

3.Gemini App月活破9億!Nano Banana已生成逾500億張圖

Google表示,Gemini App去年I/O時月活躍用戶為4億,今年已突破9億,等於一年內成長超過一倍;同期間每日請求量也成長超過7倍。Google並指出,Nano Banana影像生成模型至今已生成超過500億張圖片,顯示生成式AI已從文字問答,快速擴展到影像創作與個人化應用。

▲Google宣布測試Ask YouTube,使用者可用提問方式尋找YouTube影片。(圖/翻攝官網)
4.Ask YouTube登場!AI直接跳到影片重點片段

YouTube也加入更深度的AI搜尋體驗。Google宣布測試Ask YouTube,使用者可用提問方式尋找YouTube影片,系統不只會推薦符合需求的影片,還會直接跳到影片中最相關的片段,降低使用者在大量影片中自行篩選的時間。Google表示,Ask YouTube目前已開始測試,預計今年夏天在美國廣泛推出。

5.Docs Live 語音整理成文件

另一項與工作效率有關的新功能是Docs Live。過去使用者若要透過Gemini生成Google文件,通常需要輸入清楚提示詞;Docs Live則可讓使用者直接用語音,把想法說出來後交給Gemini整理成文件。Google表示,Docs Live將於今年夏天向訂閱用戶推出,相關語音能力也會延伸到Gmail



模型方面,Google發表Gemini Omni,定位為可從任何輸入生成任何輸出形式的新模型,首波將從影片輸出開始,未來再擴展至圖片與文字。第一款Omni家族模型Gemini Omni Flash即日起可在Gemini App、Google Flow與YouTube Shorts體驗,未來數週也會透過API開放給開發者與企業客戶。



Google也推出Gemini 3.5 Flash,主打前沿智慧、低延遲與可執行任務能力。Google宣稱,以輸出tokens速度來看,Gemini 3.5 Flash比其他前沿模型快4倍,價格不到同級模型一半。該模型即日起在Google產品與API開放,Gemini 3.5 Pro則預計下月推出。

8.Gemini Spark個人AI代理人可24小時幫跑任務

本次最受關注的新功能之一,是Google發表Gemini Spark。Google將其定位為Gemini App中的個人AI代理人,能在使用者指示下協助處理數位生活任務。Gemini Spark會在Google Cloud專用虛擬機上運行,因此可24小時執行長時間任務,不需要使用者一直開著電腦。

9.Google還更新AI浮水印!OpenAI也加入SynthID

隨著生成式AI內容愈來愈逼真,Google也宣布擴大SynthID與內容驗證工具。Google指出,SynthID推出以來,已為超過1000億張圖片與影片、以及6萬年長度的音訊資產加入肉眼不可見的AI浮水印。Google也將在產品中加入Content Credentials驗證,協助使用者辨識內容來源是AI生成、相機拍攝,或是否曾經由生成式AI工具編輯。

10.全新Google智慧眼鏡

Google也公布智慧眼鏡進展,包含audio glasses與display glasses兩種方向。audio glasses可在耳邊提供語音協助;display glasses則能在使用者需要時顯示資訊,兩者都可透過Gemini以語音操作,主打免持與抬頭使用。Google表示,audio glasses會率先上市,預計今年秋季推出

我是廣告 請繼續往下閱讀

我是廣告 請繼續往下閱讀