Google近期悄悄推出全新AI影片生成模型 ,國外有少數Gemini App使用者,發現「Gemini Omni」模型出現的提示,社群平台也出現了相關的實測影片畫面。
根據科技媒體9to5google報導,Gemini 似乎即將推出一種全新的影片生成模型,而這款「Omni」已經取得了一些相當令人印象深刻的初步成果。
影片生成是生成式 AI 中最令人印象深刻,但也最具爭議的環節之一。Google 開發影片生成模型 Veo 已有一段時間,但現在看來似乎有新的計畫正在醞釀中。
Gemini Omni功能被發現
近期有少部分Gemini用戶收到了「使用 Gemini Omni 進行創作」的提示,Google官方對其這樣敘述,「體驗我們全新的影片生成模式。您可以重新混剪影片、直接在對話中編輯、嘗試使用模板等更多功能。」
「Omni」如何融入 Gemini 和 Veo 的架構目前尚不完全清楚,但根據後設資料數據推測顯示,「Omni」是 Veo 的延伸進階版本。
Gemini Omni生成影片 數字與計算處理已相當精確
在社群平台上流出許多Gemini Omni的影片成果,其中一段影片吸引數百萬觀看,一位教授在黑板上用粉筆寫下三角函數並進行講解的片段,在處理影片中的文字和數學的部分相當正確,影像方面也表現得非常好。
第二段影片則是兩個男子吃義大利麵的場景,這是參考了著名的「威爾史密斯吃義大利麵測試」,同樣獲得了相當逼真的結果。雖並非完全開創性的突破,但輸出品質相當不錯。
報導提到,Google 尚未正式發表 Gemini Omni,但在今年稍早OpenAI宣布放棄Sora模型進行影片生成後,Google 曾表示影片技術將長期發展,宣示對AI影片技術的承諾。
Google預計於5月19日在加州山景城舉辦 I/O 開發者大會,預期將介紹新一代Gemini模型,Omni是否會在那時亮相備受關注。