▲雖然網路上已經有很多美國前總統歐巴馬的惡搞剪接影片,但這個科技肯定可以讓它變得更多……(圖/轉載自華盛頓大學研究人員YouTube頻道)
▲雖然網路上已經有很多美國前總統歐巴馬的惡搞剪接影片,但這個科技肯定可以讓它變得更多……(圖/轉載自華盛頓大學研究人員YouTube頻道)

這已經不是一個眼見為憑的時代了,因為各種電腦圖像合成技術的進步,只要使用修圖軟體,就算是一般人都可以製造出假的照片或圖片。現在最新的影像科技來自美國華盛頓大學,研究人員創造出新的工具,能夠以一個人說話的聲音轉換成說話的表情變化動作、並且合成到影片中,最終成為一個人說話的影片。

實驗影片以美國前總統歐巴馬為範本,因為歐巴馬的高畫質影片來源非常豐富,適合用在影像合成上。在示範影片中,研究人員將歐巴馬說話的聲音以電腦演算模擬出說話時的嘴巴形狀,再將這樣的影像拼貼到歐巴馬的某個談話影片上。儘管在某些嘴角的動作看起來有些模糊或不協調,但整體影片看起來是非常擬真的。

研究人員Ira Kemelmacher表示,這段不到2分鐘的影片,他們實際上花了17小時追蹤、複製並整合歐巴馬說話的嘴型,但是未來他們能夠以更進步並熟練的技術將後製時間壓縮到1小時內。

研究團隊表示這項技術可以應用在像是Skype這樣的網路聊天工具,用戶可以收集並編輯他們自己的聲音,當他們與其他人交談時,他們的聲音可以自動合成為影像傳送給對方。在網路不穩定的環境中,這能夠取代視訊的功能。

當然,這樣的工具也可能被利用來製作假影片或假新聞,可能進一步使影像的真實性受到世人懷疑,特別是當這樣的技術持續改良後,只需要短暫的聲音來源或影像就可能合成出幾可亂真的後製影片。類似的研究已經能夠做出大幅改變一張照片中人臉的表情、或是以幾張照片做出人臉的立體模組。

華盛頓大學的研究團隊表示他們理解這樣的情形、並避免這些用途的發展,明確表示僅會以歐巴馬為實驗的模擬對象。教授Steve Seitz表示:「你總不可能讓歐巴馬搭配其他人的聲音。我們不會把某人的聲音放在其他人的影像上。」不過,理論上這項技術是能夠做到這個地步的,如果技術在未來普及,很難擔保所有人都不會這樣做。