0
Deepfake負面應用正在愈演愈烈。
上個月,“一鍵脫衣”AI(DeepNude)盜用社交網絡自拍照生成裸體刷爆網絡,短短幾天,致使68萬女性受害。近日,再次有外媒爆出在Reddit社區中,一個名為r / GeneratedPorn Subreddit正在散播大量色情淫穢作品,而制作這些色情作品的正是造假軟件—Deepfake。

這些虛假的色情作品已在Twitter,Facebook,Reddit多個社交網絡,以及XVideos,Pornhub等色情網站上被瘋狂傳播。

不同于DeepNude利用社交網絡中的私人照片,這次Deepfake造假軟件利用的是現有的成人色情作品。創建者認為在原有色情作品上,利用Deepfake生成不存在的人臉進行二次創作可以避免法律上的懲罰和道德上的譴責。
但事實可能并非如此,目前Reddit、XHamster等多個網站已經將該軟件封殺,并強調,
Reddit網站政策禁止非自愿色情內容的分享和傳播,包括Deepfake作品。
Deepfake的深度造假能力到底有多強?它除了支持換頭、換臉、對口型,以及脫衣外,甚至還可以生成一張完全不存在的人臉。像這樣,連頭發絲都顯得逼真自然。

然而,正是這項原本被廣泛用于影視業的逼真造假技術,被一名博士生用來創建了大量淫穢視頻。
這款Deepfake造假軟件被命名為GeneratedPorn,簡稱GP。GP所利用的色情數據集全部來自于捷克的一家色情制造公司——Czech Casting。
多年來,該公司拍攝了成千上萬的女性視頻,并托管在共享網站支持免費下載。視頻中每個女性都被數字編號,并站在白色背景下進行360°無死角拍攝,甚至包括局部生殖器官的鏡頭特寫。

這些高清、無死角的視頻內容非常符合機器學習算法的訓練要求。GP的創建者從中提取了7500張圖像,他說,
之所以選擇該數據源是因為,生成式對抗模型(GAN)需要學習生成對象類的圖像結構,如果圖像在結構上相似,則模型可以了解有關對象類的更精確的細節,比如精確到臉上的酒窩或雀斑,這樣可以獲得更高質量的結果。
GAN,全稱 Generative Adversarial Networks ,是一種深度學習模型,是近年來復雜分布上無監督學習最具前景的方法之一。該模型分為生成模型和鑒別模型,兩個模型在相互博弈中,可以獲得逼真的圖像輸出結果。
繼2016年GAN首次被提出之后,英偉達在此基礎上研發出了StleGAN,并在2019年升級為StyleGAN2.如之前所說,StyleGAN2在生成人臉,尤其是生存逼真且不存在的人臉方面已經達到了最高性能,更重要的是,該模型已經在GitHub開源。

https://github.com/NVlabs/stylegan2
GP創建者表示,它利用的就是開源的StyleGAN2模型,并用色情數據集加載到其中進行訓練。這一過程與其他換臉Deepfake相似,但不同的是,GP使用的不是一張人臉多種表情組成的數據集,而是多個數據集中提取的數據。
同時,他也強調雖然GP生成的色情內容非常逼真,甚至肉眼看不出任何破綻,但它生成的是不存在的人臉。
今年9月份,這位博士生在Reddit上開設論壇,開始炫耀其用GP軟件生成的色情作品。按他的說法,在創建GP之初,已經曾考慮過道德層面的問題了。
最后之所以選擇現有色情作品作為訓練數據集,部分原因也是出于道德層面的考慮。
這位博士生是一位計算機專業的學生,同時也一位AI技術狂熱愛好者。他說,
這一切的開始都是出于對技術的好奇和熱愛,尤其是轉向生成色情作品以后,這是一項非常酷的技術。
一開始,他計劃制作一個OnlyFans,提供定制化的AI裸體視頻,但是這一想法遭到了好友的反對,因此,他將目標轉向了色情公司的作品集。在他看來,利用成人色情作品,并切換成不存在的人臉圖像,創建的色情圖像可以避免道德上的譴責。

但事實可能并非如此。盡管是成人作品,但涉及到的女性并未給與授權,因此依然屬于非法盜用。此外,其數據集所屬公司Czech Casting正在面臨刑事訴訟。
警方指控該公司通過販賣人口和強奸來非法獲取女性色情圖像和視頻,并勒令其向22名視頻中的女性支付近1300萬美元的精神賠償。同時,其創始人也正被聯邦調查局(FBI)通緝。
而他對此并非不了解,對此,他解釋了兩點:
一是要通過算法生成完整的裸露身體,需要更多真實且裸露的圖像和視頻,而Czech Casting的視頻無疑是最佳資源。
二是有些女性是專門從事這項工作的,我無法通過圖片判斷其背后的故事,因此只能假設這些資源是可以利用的。
此外,雖然一再強調已經盡力在規避道德問題,但他還是在XVideos,Pornhub,XHamster,Twitter,Facebook多個網站上開通了個人賬戶并分享其色情作品。
目前,多個社交平臺已經將其賬號封禁。其中,XHamster已刪除GP用戶資料的,同時也表示,
這些類型的內容確實屬于灰色地帶,我們需要與自己的機器學習團隊以及TOS團隊一起審查,以確定該如何評估和預防。
除了GP,DeepNude創建者也是出于對技術研究的熱忱。
但無論是出于什么原因,他們的做法確實濫用AI技術產生了惡劣的影響。而且如果從技術的角度來講,他們應該處理好數據隱私問題,包括數據集授權以及社交網絡分享。
這一點可以借鑒Facebook的做法。
2019年,Facebook為應對社交網絡中充斥的色情視頻造假問題,發起了Deepfake挑戰賽 (Deepfakes Detection Challenge)。

該挑戰賽的所用數據集就包含了100,000張色情演員的表演視頻,供研究人員使用。但重點是,該數據集已付費并獲得了授權,同時技術測試內容也禁止任何社交平臺分享。正如數據科學家喬杜里(Chowdhury)所說:“在未經授權的情況下使用數據庫圖像的AI是不道德的”。
但事實上,除了專業機構外,大部分利用AI生成的虛假視頻均未獲得授權,而且其中色情視頻占比最高達到了96%。據了解,Facebook托管在Kaggle的色情數據集也曾多次被盜取。(Kaggle是為開發商,數據科學家提供舉辦機器學習競賽、托管數據庫、編寫和分享代碼的專業平臺)
正因如此,Deepfake也逐漸淪為了一個臭名昭著的造假軟件。為遏制虛假內容的生成,Facebook的努力已經初見成效(識別準確率可達 82.56%)。但要想完全關上潘多拉魔盒,還需要更多企業、學界以及開發者的共同努力。
引用鏈接:
https://www.vice.com/en/article/bjye8a/reddit-fake-porn-app-daisy-ridley
雷鋒網雷鋒網雷鋒網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。