可以不用學英文了嗎?Google正式推出全新Gemini 3.5 Live Translate模型,打破語言隔閡,提供「即時語音翻譯」,過去使用翻譯App,要等對方講完一句話,系統辨識後再翻成另一種語言,從官方釋出的影片來看,Gemini 3.5 Live Translate已經呈現邊聽邊翻,能在說話者持續發言時,同步產生翻譯後的語音,類似隨身口譯員。

我是廣告 請繼續往下閱讀
Gemini 3.5 Live Translate是什麼?

Gemini 3.5 Live Translate是Google最新音訊模型,提供即時語音翻譯,類似「AI即時口譯員」的功能,能聽懂一種語言,再快速用另一種語言說出來。Google官方表示,Gemini 3.5 Live Translate可自動偵測70多種語言,並產生自然流暢的翻譯語音,且能盡量保留說話者原本的語調、節奏與音高,讓翻譯結果聽起來不會太過生硬。

和一般翻譯App差在哪?

過去使用翻譯App時,使用者多半要先按下錄音、說完一句話,等待系統辨識文字,再翻譯成另一種語言播放。如果對話很長,或兩個人來回交談,就容易出現等待空檔,溝通節奏也會被打斷。Gemini 3.5 Live Translate更接近「同聲傳譯」的模式,可以在對方還在說話時持續處理音訊並產生翻譯語音,類似耳邊有個即時口譯員在翻譯。

Gemini 3.5 Live Translate何時可以用?

Google指出,Gemini 3.5 Live Translate已開始在Android與iOS版Google翻譯App全球陸續推出,使用者只要連接耳機,就能透過Live translate功能聽到更自然的即時翻譯。實際功能出現時間,仍可能依地區、帳號與App版本分批推送,記者目前的Pixel 10的手機上尚未看到新功能。

Google Meet也會升級

Google也將Gemini 3.5 Live Translate導入Google Meet。官方表示,Google Meet的語音翻譯功能將從原本支援5種語言,提升到70多種語言,單場會議中可支援超過2000種語言組合,不再只是以英文作為主要中介語言,未來有機會成為跨國視訊會議的最佳幫手。

生活怎麼用?出國、跨國會議、外語YouTube都能即時翻譯

這項功能未來最實用的場景,就是出國旅行。旅客到國外問路、點餐、搭車或入住飯店時,不必再一直打字翻譯,也不需要把手機螢幕拿給對方看半天。只要開啟即時翻譯,就能用自己的語言開口,讓對方聽到翻譯後的內容,自己也能聽懂對方回應。覺得最實用的還有到國外旅遊,參加英文導覽團,這時只要有該功能就能即時

對上班族來說,之後如果有跨國會議,不同國家的與會者可望用自己熟悉語言收聽會議內容,降低英文能力落差造成的溝通壓力。在教育場域,外籍講師授課、國際線上課程、海外研討會,都有機會透過即時語音翻譯讓學生同步理解內容。對影音創作者與媒體產業來說,未來直播、Podcast、YouTube影片或線上發布會,也可能更容易即時轉換成多國語言,讓內容觸及更多海外觀眾。目前該功能自2026年6月起,先向部分Google Workspace商務客戶開放私測,預計今年稍晚擴大推出。

▲Google也將Gemini 3.5 Live Translate導入Google Meet,未來跨國會議會更加方便。(圖/翻攝官網)
▲Google也將Gemini 3.5 Live Translate導入Google Meet,未來跨國會議會更加方便。(圖/翻攝官網)
AI生成加入SynthID浮水印

SynthID是Google用來標記AI生成內容的技術。Google表示,Gemini 3.5 Live Translate產生的音訊都會加入SynthID浮水印,協助辨識這些聲音是AI生成內容。這類標記不一定會被一般人直接聽出來,但可作為日後判斷AI音訊來源的輔助工具,降低被濫用或誤導的風險。

從文字翻譯、語音辨識,到即時語音對語音翻譯,Google把AI翻譯推向更接近「隨身口譯員」的使用情境。未來不論是出國旅行、跨國工作、線上學習,還是觀看外語直播與影片,語言可能不再是最大門檻。


周淑萍編輯記者

現為《NOWnews今日新聞》資深記者,主跑科技、醫療。

記者經歷從《蘋果日報》為起點,同時伴隨著iPhone發展史,從蘋果 iPhone 3 開始持續到現在,每一代、每一年推出的iPhone 都沒錯過。信仰加值的每一年,除...