研究:小振動還原音頻 薯片袋可竊聽
當你打算說出心底最深藏的祕密時,要小心身邊有沒有綠色植物或洋芋片包,因為看似安靜的它們很可能會透露你的祕密。
美國麻省理工學院(MIT)、微軟和Adobe的研究人員共同開發一種新的技術,可以通過分析影片中物體的極小振動來重新組成音頻訊號。在一項實驗中,他們成功利用一段在4.6公尺外隔音玻璃後面拍攝的洋芋片包裝振動的影片,還原出可以辨認的人聲。研究人員使用的技術是一種用於分析微小振動的影片處理運算法,可以將很小的振動放大,如同顯微鏡一樣。
在另一個實驗中,研究人員用揚聲器對一株盆栽植物發出「瑪莉有一隻小羊羔」的語音,用高速攝影機拍攝無聲影片,再利用處理運算法分析,從肉眼看不到的微小振動中提取音頻訊號並還原聲音。在其他實驗中,他們還成功地從鋁箔、一杯水的水面振動的影片中還原出音頻訊號。
據美國有線新聞網(CNN)報導,參與此項目、來自微軟的邁克爾.魯賓斯坦(Michael Rubinstein)說:「起初,我們不能肯定這是可能的,因為這些震動如此微小,所以我們採用了揚聲器,並用聲音讓一些物體振動,用高速攝影機拍攝這些物體。我們很快地發現,影片中存在音頻訊號,可以用技術把它提取出來。」
他說:「我們和這些物體說話,或對它們大聲喊叫好多次,這是很有趣的實驗。」
從影片提取音頻訊號
研究論文將在今年國際圖形學年會(Siggraph)上發布。據MIT新聞報導,論文第一作者、MIT電氣工程和計算機科學研究生艾比.戴維斯(Abe Davis)介紹:「當聲波接觸到物體時,會引起物體的振動。這種振動是一個十分不明顯的視覺訊號,通常用肉眼看不到。」
這項技術也有局限性,從影片中重構音頻訊息要求影片每秒的張數要高於音頻訊號的頻率,每秒的張數高,還原的音頻品質就比較好。
在一些實驗中,研究者使用了高速攝影機,每秒可以捕捉2,000~6,000張圖像,遠快於智慧型手機每秒60張的速度,但是比起最好的商業高速攝影機每秒10萬張的速度還相距甚遠。
在另一些實驗中,研究者們僅使用普通數位相機。雖然這樣重構出來的音頻保真度不如利用高速攝影機還原的音頻,但是已經足夠辨別出講話者的性別和人數,如果能配合足夠精確的講話者的聲學特性,人們甚至可以辨別出說話者的身分。
魯賓斯坦表示,不是每一種物體對細微聲音敏感,最成功的視覺竊聽物品是那些輕便、硬質的物體,例如:塑膠袋、保麗龍杯、錫紙、水和植物,磚頭等重物就很難達到效果。
如同現實版好萊塢驚悚片
這項技術目前處於概念階段,但是,人們可以想到它的應用前景,偵探們可以利用攝影機替代竊聽器和擴音器。
除了犯罪領域,魯賓斯坦表示,也許我們可以通過音樂廳或錄音室影片檢測它們的聲學系統;我們也可以透過太空望遠鏡,在聲波無法傳遞的空間還原太空中的聲音。
戴維斯更關心該技術是否可能成為一種「新的成像方式」。他說:「從物體上還原聲音,這一過程不僅為我們提供大量關於物體周圍的聲音訊息,也提供很多物體本身的訊息,因為不同物體對聲波會有不同反應。」
在未來的實驗中,研究者已經開始嘗試利用短脈衝聲波來判斷物體的材料和結構特點。
加州大學柏克萊分校電氣工程與計算機科學教授阿萊克西.艾弗羅斯(Alexei Efros)表示,這項研究讓人耳目一新。他說:「身為科學家,有時我們也看電影,例如:《007》這類影片,會認為這些只是好萊塢的戲劇效果,太不現實。但是,真的有人做到這種不可思議的事。這個研究結果就像好萊塢驚悚片,看到監視器影片中有包洋芋片在振動,然後就看到兇手已經承認自己有罪。」
艾弗羅斯也認為,利用這一技術來分析材料特性是卓越有效的應用,他補充說:「肯定還有令人意想不到的應用。很高興能看到這種富有創造性的研究。」
魯賓斯坦表示,目前還無需擔心這項技術對人們隱私的潛在風險。◇