AI換臉技術(shù),有“侵犯隱私”之嫌?
□ 本報(bào)記者 謝詩(shī)涵
前不久,社交媒體平臺(tái)上一款名為“螞蟻呀嘿”的特效火爆全網(wǎng),許多網(wǎng)友都將自己的照片導(dǎo)入換臉軟件Avatarify中,照片便可以被算法驅(qū)動(dòng),生成一段表情夸張扭曲且跟著節(jié)奏晃動(dòng)的換臉短視頻。短短幾天后,正如此前火爆一時(shí)的換臉軟件ZAO一樣,Avatarify被下架,許多人猜測(cè)下架原因是AI換臉可能涉及隱私問(wèn)題。AI換臉技術(shù)的原理是什么?換臉是否會(huì)造成個(gè)人隱私泄露?帶著網(wǎng)友的提問(wèn),《科技周刊》記者專訪東南大學(xué)網(wǎng)絡(luò)空間安全學(xué)院副教授宋宇波,為我們揭開AI換臉技術(shù)的秘密。
問(wèn):AI換臉技術(shù)背后的原理是什么?
宋宇波:最早實(shí)現(xiàn)換臉是通過(guò)修圖(Photoshop)的方式實(shí)現(xiàn)的,不僅耗時(shí)耗力,其換臉效果也不佳。而目前比較流行的換臉軟件,實(shí)際上是運(yùn)用了生成式對(duì)抗網(wǎng)絡(luò)(GAN)技術(shù),這是深度學(xué)習(xí)模型中的一種。簡(jiǎn)單來(lái)說(shuō),就是機(jī)器通過(guò)事先采集大數(shù)據(jù)中的人臉表情特征,再結(jié)合換臉人本身的一些特征信息,通過(guò)“對(duì)抗博弈”的方式不斷進(jìn)化,最終生成我們所希望得到的換臉視頻。這種方式不僅可以快速地實(shí)現(xiàn)自動(dòng)換臉,其生成的圖像也更逼真。
問(wèn):什么是生成式對(duì)抗網(wǎng)絡(luò)?
宋宇波:盡管生成式對(duì)抗網(wǎng)絡(luò)中包含“網(wǎng)絡(luò)”一詞,但它和我們通常所說(shuō)的“互聯(lián)網(wǎng)”并不是一回事,它本質(zhì)上是一個(gè)數(shù)學(xué)算法。由于生成式對(duì)抗網(wǎng)絡(luò)采用的是深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,故而保留了“網(wǎng)絡(luò)”兩個(gè)字。
生成式對(duì)抗網(wǎng)絡(luò)框架通過(guò)讓兩個(gè)神經(jīng)網(wǎng)絡(luò)相互博弈的方式進(jìn)行學(xué)習(xí),其中一個(gè)是生成器,另一個(gè)是判別器。生成器根據(jù)預(yù)置的規(guī)則嘗試生成數(shù)據(jù),而判別器則會(huì)去判別是否是真實(shí)數(shù)據(jù),并把判別結(jié)果反饋給生成器,生成器會(huì)根據(jù)反饋信息進(jìn)行調(diào)整,從而輸出新的數(shù)據(jù),兩者反復(fù)博弈直到判別器將生成器生成的數(shù)據(jù)判別為真實(shí)數(shù)據(jù)為止。例如當(dāng)我們想生成一個(gè)笑臉時(shí),判別器會(huì)自動(dòng)識(shí)別生成器隨機(jī)生成的表情是否為笑臉;如果不是,此信息會(huì)被駁回,生成器會(huì)根據(jù)反饋重新調(diào)整生成數(shù)據(jù),經(jīng)過(guò)層層判別,最終輸出的人臉里既會(huì)包含換臉人本身的特征,同時(shí)也包含我們所期望的笑臉表情。
值得注意的是,機(jī)器前期采集的喜怒哀樂(lè)等通用表情信息主要來(lái)源于大數(shù)據(jù)圖庫(kù),而并非換臉人的個(gè)人表情信息。這也就意味著,利用對(duì)抗生成網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)的換臉僅需要不多的個(gè)人人臉照片即可。該換臉技術(shù)誕生最初大概需要300-500張換臉人的圖片,而隨著近年技術(shù)的不斷改進(jìn),現(xiàn)在僅僅需要3-5張相關(guān)照片就可以生成需要的換臉照片或者視頻。
在機(jī)器學(xué)習(xí)中,生成式對(duì)抗網(wǎng)絡(luò)的應(yīng)用非常多,其最主要的用途就是生成我們想要的數(shù)據(jù)。目前大部分應(yīng)用集中于視頻和圖像創(chuàng)造,例如我們?cè)谂臄z中需要一些動(dòng)畫或者特定場(chǎng)景,原本可能需要制作道具或者耗費(fèi)人工進(jìn)行手繪,而現(xiàn)在利用這一技術(shù),則可以變得非常高效。
問(wèn):AI換臉是否存在個(gè)人隱私泄露風(fēng)險(xiǎn)?偽視頻、偽圖片能攻破人臉識(shí)別系統(tǒng)嗎?
宋宇波:任何一種技術(shù)都存在兩面性,如果單純是為了搞笑消遣而制作換臉視頻,本身并沒(méi)有太多的危害,但如果這一技術(shù)被不法分子利用,則會(huì)產(chǎn)生極大危害。信息被濫用、個(gè)人生物識(shí)別特征被泄露等風(fēng)險(xiǎn),是這類軟件頻繁引發(fā)質(zhì)疑的一個(gè)重要原因。對(duì)于政治人物或明星來(lái)說(shuō),將他們的臉移植到一些他們本不該出現(xiàn)的場(chǎng)景中,很有可能造成負(fù)面影響;而對(duì)于個(gè)人來(lái)說(shuō),目前許多金融場(chǎng)所都依賴于視頻線上識(shí)別來(lái)進(jìn)行身份核實(shí),如果不法分子運(yùn)用深度合成中的表情操縱方法生成偽視頻,則很可能造成個(gè)人金錢損失。
2019年11月底,國(guó)家網(wǎng)信辦、文旅部和國(guó)家廣電總局等三個(gè)部門聯(lián)合發(fā)布的《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》指出,利用基于深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等新技術(shù)新應(yīng)用制作、發(fā)布、傳播非真實(shí)音視頻信息的,應(yīng)當(dāng)以顯著方式予以標(biāo)識(shí);不得利用相關(guān)的音視頻技術(shù)“侵害他人名譽(yù)權(quán)、肖像權(quán)、隱私權(quán)、知識(shí)產(chǎn)權(quán)和其他合法權(quán)益”。全國(guó)政協(xié)十三屆四次會(huì)議新聞發(fā)言人郭衛(wèi)民也表示,目前《個(gè)人信息保護(hù)法》草案已經(jīng)提請(qǐng)全國(guó)人大常委會(huì)審議,這一法律的頒布和實(shí)施,對(duì)保護(hù)個(gè)人信息安全將發(fā)揮重要作用。由此可見,個(gè)人信息安全問(wèn)題已經(jīng)引起相關(guān)部門重視。盡管此類軟件大多聲明不會(huì)采集和存儲(chǔ)用戶敏感個(gè)人信息,但網(wǎng)友在上傳個(gè)人照片給第三方后,第三方自身平臺(tái)的防護(hù)系統(tǒng)是否安全?是否會(huì)被惡意攻破從而造成隱私泄露?這些方面都應(yīng)該得到更多關(guān)注。
就目前而言,通過(guò)App下載的換臉圖片或者視頻,由于計(jì)算量有限,其圖像質(zhì)量還比較差,仔細(xì)觀察后還是存在面部不自然等問(wèn)題。而那些圖像質(zhì)量高到可以欺騙人眼的換臉圖片和視頻,在相關(guān)檢測(cè)算法的判別下通常也都會(huì)“原形畢露”,因此,普通用戶不必過(guò)于擔(dān)心人臉識(shí)別系統(tǒng)會(huì)被攻破。但隨著技術(shù)的不斷改進(jìn),未來(lái)這類軟件很可能對(duì)我們的個(gè)人隱私造成較大威脅,因此我們也呼吁相關(guān)法規(guī)盡快出臺(tái)。