Facebook 的深度學習系統可造出以假亂真的圖像精選

由 36氪於 21/06/2015 發表收藏文章

http://a.36krcnd.com/nil_class/e5f77d38-6753-45dd-9d51-ba3d2cf36340/Facebook-Deep-Generative-Image-Models.jpg!heading

圖片來源：a.36krcnd.com

在Google、微軟、百度等巨頭的推動下，人工智能技術的發展突飛猛進。能識別圖像已經不算什麼本領了，現在Faebook的AI技術已經幾乎可以以假亂真，令受試者在40%的時間把計算機生成的圖樣當作是真的照片。

這項成果是由Facebook人工智能實驗室的三位研究人員Soumith Chintala、Arthur Szlam、Rob Fergus與紐約大學庫朗計算機科學研究所的Emily Denton聯合完成的，論文題目叫做《用對抗網絡拉普拉斯金字塔的深度生成式圖像模型（Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks）》，Facebook已經把論文提交到即將在蒙特利爾舉行的神經信息處理系統大會（NIPS，AI業界最著名的會議之一）上供討論。不僅如此，Facebook還打算稍後（可能下週末）將工作的代碼開源出來供大家參考。

簡單來説，Facebook的AI技術可以自主生成一些含有飛機、汽車、小鳥等東西在內的場景圖像樣本令觀看者信以為真。Facebook這項研究成果的特別之處是，其AI採用的是無監督學習。以往包括Faebook在內的大公司和初創企業採用的普遍都是監督式學習，即需要利用大量帶標籤的數據去訓練人工神經網絡，後者才能逐漸學會識別東西。比方説，給它看1000張貓的圖片，看多了之後AI才會逐步對貓建立模型並識別新的圖像。

http://a.36krcnd.com/nil_class/1151aecf-4513-47a3-8e60-ecba839af2d6/ibis.png

圖片來源：a.36krcnd.com

Google的人工神經網絡可以根據原圖生成帶魔幻色彩的圖像，但Facebook的Rob Fergus認為，自家生成以假亂真圖像取得的技術進展更高。

而無監督學習中樣本數據是不包含標籤的。這更接近於人學習認東西的方式。比方説，看過1、2部手機之後，我們很快就能認出第3部。在實現上，Facebook採用了兩套受訓神經網絡，一套是產生式的，賦予其隨機向量後就能生成圖像；而另一套則用來確定圖像是否看起來是真的。目前這套系統能生成64x64像素的圖像。
由於不需要對訓練數據打上標籤，這項技術無疑可以幫助Facebook更好地進行圖像、視頻、語音的識別工作，自然語言處理技術也可以相應提高。Google前兩天也公佈了自己的一項AI成果，利用人工神經網絡生成迷幻圖像。儘管看起來很酷，但Facebook的研究科學家Rob Fergus認為，與Facebook可生成以假亂真圖像相比，自家的技術顯然更難，取得的學術進展更多。當然，64x64的分辨率尚不具備使用價值，Facebook的下一步計劃是逐步提高生成圖像的分辨率，屆時，虛擬與現實的界限將進一步模糊，人類距離AI的聖盃越來越近了。

本文參考了多個信息來源：venturebeat.com、arxiv.org、googleresearch.blogspot.com

資料來源：36Kr

標籤: Facebook

留言

我要評論
請按此登錄後留言。未成為會員? 立即註冊

專欄簡介

36氪 36氪（36Kr.com）是中國領先的科技新媒體，我們報導最新的互聯網科技新聞以及最有潛力的互聯網創業企業。我們的目標是，通過對互聯網行業及最新創業企業的關注，為中文互聯網...

編輯簡介

36氪 36氪（36Kr.com）是中國領先的科技新媒體，我們報導最新的互聯網科技新聞以及最有潛力的互聯網創業企業。我們的目標是，通過對互聯網行業及最新創業企業的關注，為中文互聯網讀者提供一個最佳的了解互聯網...

快捷鍵：←

快捷鍵：→

Facebook 的深度學習系統可造出以假亂真的圖像 精選

留言

專欄簡介

編輯簡介

下載 FanPiece 手機 App

Facebook 的深度學習系統可造出以假亂真的圖像精選