Facebook 的深度學習系統可造出以假亂真的圖像

36氪 於 21/06/2015 發表 收藏文章

在Google、微軟、百度等巨頭的推動下,人工智能技術的發展突飛猛進。能識別圖像已經不算什麼本領了,現在Faebook的AI技術已經幾乎可以以假亂真,令受試者在40%的時間把計算機生成的圖樣當作是真的照片。

這項成果是由Facebook人工智能實驗室的三位研究人員Soumith Chintala、Arthur Szlam、Rob Fergus與紐約大學庫朗計算機科學研究所的Emily Denton聯合完成的,論文題目叫做《用對抗網絡拉普拉斯金字塔的深度生成式圖像模型(Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks)》,Facebook已經把論文提交到即將在蒙特利爾舉行的神經信息處理系統大會(NIPS,AI業界最著名的會議之一)上供討論。不僅如此,Facebook還打算稍後(可能下週末)將工作的代碼開源出來供大家參考。

簡單來説,Facebook的AI技術可以自主生成一些含有飛機、汽車、小鳥等東西在內的場景圖像樣本令觀看者信以為真。Facebook這項研究成果的特別之處是,其AI採用的是無監督學習。以往包括Faebook在內的大公司和初創企業採用的普遍都是監督式學習,即需要利用大量帶標籤的數據去訓練人工神經網絡,後者才能逐漸學會識別東西。比方説,給它看1000張貓的圖片,看多了之後AI才會逐步對貓建立模型並識別新的圖像。


Google的人工神經網絡可以根據原圖生成帶魔幻色彩的圖像,但Facebook的Rob Fergus認為,自家生成以假亂真圖像取得的技術進展更高。

而無監督學習中樣本數據是不包含標籤的。這更接近於人學習認東西的方式。比方説,看過1、2部手機之後,我們很快就能認出第3部。在實現上,Facebook採用了兩套受訓神經網絡,一套是產生式的,賦予其隨機向量後就能生成圖像;而另一套則用來確定圖像是否看起來是真的。目前這套系統能生成64x64像素的圖像。

由於不需要對訓練數據打上標籤,這項技術無疑可以幫助Facebook更好地進行圖像、視頻、語音的識別工作,自然語言處理技術也可以相應提高。Google前兩天也公佈了自己的一項AI成果,利用人工神經網絡生成迷幻圖像。儘管看起來很酷,但Facebook的研究科學家Rob Fergus認為,與Facebook可生成以假亂真圖像相比,自家的技術顯然更難,取得的學術進展更多。當然,64x64的分辨率尚不具備使用價值,Facebook的下一步計劃是逐步提高生成圖像的分辨率,屆時,虛擬與現實的界限將進一步模糊,人類距離AI的聖盃越來越近了。

本文參考了多個信息來源:venturebeat.comarxiv.orggoogleresearch.blogspot.com


資料來源:36Kr
標籤: Facebook  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→