Google近日推出Gemini 2.5 Flash Image,之前代號為Nano Banana,該模型是全新的多模態圖像模型,可以結合文字理解、影像生成,可以讓上傳的照片有一致性,場景可以輕鬆切換,還可以多圖融合。除了生成好玩的公仔,還可以應用在專業形象照,甚至把一般的生活照改為正式的大頭照或是韓式證件照,也能修改背景、服裝人物表情等,且最重要的是「免費」,目前還沒有使用次數上限。
▲官網顯示可以將多張照片和成為一張圖片。(圖/翻攝官網) Google 最新推出的 Gemini 2.5 Flash Image,這款圖像生成模型延續 AI 玩圖熱潮,被認為是在AI繪圖領域上大幅升級的版本,甚至被網友譽為最強的圖片生成引擎。可以發現在角色一致性、局部編輯與邏輯推理能力等方面表現真的很強,解決了以往 AI 常見的異變問題,且大幅減少AI感。
記者實際測試,覺得Gemini 2.5 Flash Image不同於以往 ChatGPT 或其他 AI 圖像工具偏向藝術插畫風格,Gemini 2.5 Flash Image 在處理材質、光影與比例方面更貼近實體質感,生成出來的作品,搭配場景甚至能混淆真假。還可以把一般的生活照改成正式的大頭照,直接放在履歷表上感覺也不會覺得很有AI感。但建議上傳清晰正面全身照、背景乾淨,能大幅提升AI判斷準確度,如果可以更仔細描述,成品會更貼近理想。
使用方式:
直接進入Gemini(網址直接點),檢查上方是否顯示為「2.5 Flash 模型」> 下方「+」上傳照片並點選「圖像」輸入指令,系統就會自動生成。
實際測試:
生活照改成證件照
指令:將照片人物修改成為白色背景證件照,衣服為正式服裝,全身(或半身),表情自信。
▲一般生活照改為證件照。(圖/Gemini 生成) 更換照片背景、衣服
指令:將照片人物改為夏威夷風格襯衫、短褲、夾腳拖,兩人表情輕鬆,背景在海灘上。
▲可以修改衣服、背景、人物表情。(圖/Gemini 生成) 生成公仔
指令:用寫實風格,在真實環境中,創作1/6比例的商品化相片的中的人物模型。模型放置在蘋果iMac電腦前,模型底座為圓形透明壓克力,底座上沒有文字,iMac電腦螢幕上顯示的內容是該模型的建模過程。電腦螢幕旁邊是一個印有原圖的BANDAl風格玩具包裝盒。
▲網路上最夯的就是生成公仔。(圖/Gemini 生成)
我是廣告 請繼續往下閱讀
記者實際測試,覺得Gemini 2.5 Flash Image不同於以往 ChatGPT 或其他 AI 圖像工具偏向藝術插畫風格,Gemini 2.5 Flash Image 在處理材質、光影與比例方面更貼近實體質感,生成出來的作品,搭配場景甚至能混淆真假。還可以把一般的生活照改成正式的大頭照,直接放在履歷表上感覺也不會覺得很有AI感。但建議上傳清晰正面全身照、背景乾淨,能大幅提升AI判斷準確度,如果可以更仔細描述,成品會更貼近理想。
使用方式:
直接進入Gemini(網址直接點),檢查上方是否顯示為「2.5 Flash 模型」> 下方「+」上傳照片並點選「圖像」輸入指令,系統就會自動生成。
實際測試:
生活照改成證件照
指令:將照片人物修改成為白色背景證件照,衣服為正式服裝,全身(或半身),表情自信。
指令:將照片人物改為夏威夷風格襯衫、短褲、夾腳拖,兩人表情輕鬆,背景在海灘上。
指令:用寫實風格,在真實環境中,創作1/6比例的商品化相片的中的人物模型。模型放置在蘋果iMac電腦前,模型底座為圓形透明壓克力,底座上沒有文字,iMac電腦螢幕上顯示的內容是該模型的建模過程。電腦螢幕旁邊是一個印有原圖的BANDAl風格玩具包裝盒。