大肆宣傳的東西看起來像科學,但實際上不是
Spectrum:炒作毫無疑問是有害的,但你為什麼説這是「危險的」?
LeCun:因為這給基金會、公眾、潛在客户、創業公司和投資者帶來了預期,他們會因此相信我們正處在風口浪尖——我們正在建造一些像大腦一樣強大的系統,但實際上我們離這個目標還差的很遠。這很容易導致另一次的「寒冬週期」。
這裏會出現一些「草包族科學」(cargo cult science),這是理查·費曼的表達,指描述某些事物貌似科學,但實際上不是(譯者注:這出自理查·費曼1974年在加州理工學院的一場畢業典禮演説,描述某些事物貌似科學,卻遺漏了「科學的品德,也就是進行科學思考時必須遵守的誠實原則」)。
Spectrum:能舉幾個例子嗎?
LeCun:在「草包族科學」下,你往往是複製了機器的表象,卻沒有深入理解機器背後的原理。或者,在航空領域,你製造飛機時會完全複製鳥類的樣子,它的羽毛、翅膀等等。19世紀的人們很喜歡這麼做,但取得的成就非常有限。
在人工智能領域也是如此,他們嘗試着對我們所知曉的神經元和神經突觸的所有細節進行復制,然後在一台超級計算機上啟動一套龐大的模擬神經網絡,希望從中孕育出人工智能。這就是「草包族科學」的人工智能。有許多拿到大筆基金支持的嚴肅的研究者基本上快要相信這些了。
Spectrum:你認為IBM的True North項目(譯者注:IBM的類人腦芯片,集成了 54 億個硅晶體管、 4096 個內核、100 萬個「神經元」和2.56 億個「突觸」)屬於「草包族科學」嗎?
LeCun:這聽起來會有些刺耳。但我的確認為,IBM團隊所聲稱的東西有點偏差並容易造成誤解。從表面上看,他們的公告令人印象深刻,但實際上沒有實現任何有價值的東西。在True North之前,那個團隊用IBM的超級計算機來「模擬了一個老鼠級別的大腦」。但這只是一個隨機的神經網絡,除了消耗CPU運算週期以外沒有發揮任何作用。
True North芯片的悲劇在於它本來可以很有用,如果它當初沒有堅持與生物學走的太近以及沒有使用「spiking integrate-and-fireneurons」模型的話。因此在我看來——我曾是一個芯片設計者——當你在開發一個芯片之前,你必須確信無疑它能做些有用的事情。如果你打造了一個卷積網絡芯片——很清楚如何去做——它能立刻應用到計算設備中。IBM創造了錯誤的東西,我們無法用它去完成任何有用的事情。
Spectrum:還有其他例子嗎?
LeCun:從根本上説,歐盟人腦計劃(Human Brain Project)中的很大部分也是基於這樣一種理念:我們應該建造一種模擬神經元功能的芯片,越接近越好,然後將芯片用於建造超級計算機,當我們用一些學習規則來開啟它時,人工智能就出現了。我認識這純屬胡説八道。
誠然,我剛才指的是歐盟人腦計劃。並不是諷刺蔘與這個項目的每個人。許多人蔘與該項目的原因僅僅是因為它能獲得鉅額資助,這是他們所無法拒絕的。
無監督學習——機器需要的學習方式
Spectrum:對於一般意義上的機器學習,還有多少是有待發掘的?
LeCun:太多了。我們在實際的深度學習系統中使用的學習方式還是存在侷限的。在具體實踐中發揮作用的其實是「有監督學習」。你將一張圖片展現給系統並告訴它這是一輛車,它就會相應調整它的參數並在下一次説出「車」。然後你再展現給它一把椅子、一個人。在幾百個例子、耗費幾天到幾周的計算時間(取決於系統規模)之後,它就弄明白了。
但人類和動物不是這種學習方式。當你還是嬰兒時,你並沒有被告知你所看到的所有物體的名字。然而你卻能學會這些物體的概念,你知道世界是三維的,當我把物體放在另一個的後面,你還是知道它的存在。這些概念不是與生俱來的,是你將它們學會了。我們把這種類型的學習稱作「無監督」學習。
2000s中期,我們中的許多人蔘與到了深度學習的復興運動中,包括Geoff Hinton、Yoshua Bengio和我自己——這就是所謂的「深度學習團體」——還有Andrew Ng,從此使用無監督學習而非有監督學習的理念開始興起。無監督學習可以幫助特定的深度網絡進行「預訓練」。我們在這方面取得了不少成果,但最終能夠應用於實踐的還是過去那些能與卷積網絡相結合的出色的有監督學習,我們在20年前(1980s)所做的事情。
但從研究的角度來看,我們一直感興趣的是如何恰當地做好無監督學習。我們現在已經擁有了可以實用的無監督技術,但問題在於,我們僅需要收集更多數據,再配合有監督學習就能擊敗它。這就是為什麼在現階段的產業中,深度學習的應用基本上都是有監督的。但將來不會再是這種方式。
從本質上來説,在無監督學習方面,大腦遠好於我們的模型,這意味着我們的人工智能學習系統缺失了許多生物機理學習的基本原則。
請按此登錄後留言。未成為會員? 立即註冊