Google 大腦的 2016 實現了哪八個小目標?Jeff Dean 親自撰文回顧

雷鋒網 於 16/01/2017 發表 收藏文章

提起 Google Brain(Google大腦)團隊,它在 2016 年因為推出了基於神經網絡的機器翻譯功能火了一把。雷鋒網編輯近日參加了矽谷人工智能前沿論壇 AI Frontier,會上Google大腦團隊負責人 Jeff Dean 解析了Google大腦及 Tensorflow 的相關研究進展,雷鋒網此前也編譯了一篇關於 Google Brain 的長篇特寫,詳情可參看《Google大腦是如何煉成的:萬字無刪減版全解密》系列 。

而在今天,Jeff Dean 代表整個團隊撰文回顧了Google大腦的 2016 年,並發表於 Google Research Blog 上,讓我們和雷鋒網 AI 科技評論一起了解,這個為世界帶來科技驚喜的團隊究竟如何看待自己的 2016 年吧。雷鋒網進行了不改變原意的整理和編輯,未經許可不得轉載。

Google大腦團隊的宏願一如既往:團隊致力於通過多領域的純研究及應用性研究,創造更多的智能軟件及智能系統,以此提升人們的生活水平。

“雖然這一藍圖是我們仰望星空的長期願景,但我們也需要腳踏實地,回顧一下我們過去一年完成的小目標,並與你們一同分享那些會為 2017 年新成就奠基的點點滴滴。”

一、科研刊發,碩果累累

在國際頂級的期刊及學術會議(如 ICML、NIPS 及 ICLR)上提交論文是科研水平的質量保證,Google大腦團隊同樣寄望於此。過去一年間,團隊共有 27 篇論文實現了這個小目標,領域涉獵廣泛,包括:(雷鋒網附上了所對應論文/文章的鏈接,方便讀者查閲)

引用
……

Google大腦還在許多其它優秀期刊及學術會議上提交了論文,包括:

引用
  • 自然語言處理(ACL 及 CoNNL);
  • 語音識別(ICASSP);
  • 視覺領域(CVPR);
  • 機器人(ISER);
  • 計算機系統(OSDI)等。

團隊目前已經向機器學習研究的頂尖學術會議 ICLR 2017 提交了 34 篇論文。雷鋒網附上了提交論文的清單,如果感興趣的用户可以點擊查看。

二、自然語言理解

Google大腦研究的重點方向之一在於如何讓計算機更好地理解人類語言。

  • 2014 年年底,三位Google大腦團隊的成員發佈了一篇名為《利用神經網絡實現序列到序列的學習》的論文,提出了此方法可應用於機器翻譯。
  • 2015 年,團隊證明了此方法同樣能夠應用於生成圖像標題、分析句子成分及解決計算化的幾何問題當中。
  • 2016 年,Google大腦團隊與Google翻譯團隊進行密切合作,將Google翻譯算法以一種完全端到端的學習系統所取代。該系統縮小了原有系統與人類高質量翻譯之間的差距,而這一數字達到了 85%。
  • 在數週後,Google大腦團隊又發佈了「zero-shot」翻譯系統,即使是系統之前從沒學習過的樣本對,機器也能夠順利翻譯出來。目前,這一系統已經順利上線Google翻譯,而它所處理的語言對數量也在不斷增加。

Jeff Dean 還特別專門提及了雷鋒網(公眾號:雷鋒網)於本文開始時提及的文章,這篇發佈於《紐約時報》,原名為《超級 AI 正在覺醒》的文章詳細描述了Google翻譯是如何一步步進階深度學習的。


三、教機器人學會學習

Jeff Dean 也回顧了Google大腦在機器人領域取得的成果,他表示,傳統機器人的控制算法是通過精心設計並進行人工編程而實現的,因此,如何將新的能力「傳授」給原有的機器人也成為一個挑戰。Google大腦團隊相信,機器人如果能掌握機器學習能力,那麼讓它自動掌握這些新的技能也絕非難事。


在 2016 年,Google大腦團隊與 Google X 團隊合作實現了機械臂的手眼協調功能,並經過 80 萬次的抓取實驗,讓它們在不斷的學習過程中汲取自學經驗,雷鋒網此前也做過報道和覆蓋。

引用“隨後,我們探索了三種機器人學習新技能的三種可能方式,包括強化學習、通過機器與物體的交互,以及人類的操作示範等。Google大腦團隊將在這些工作的基礎上繼續前行,以實現讓機器人在複雜的現實環境中習得新技能,併成功運用的目標。”

值得一提的是,為了讓其它機器人研究者也能嘗試在該領域探索,Google大腦團隊共享了數個機器人數據庫。

四、醫學影像領域:提升診斷效率

機器學習有着巨大潛力,包括應用於醫學診斷領域。Google大腦同樣注意到了這一進步,並在今年 6 月的美國醫學學會刊物上(Journal of the American Medical Association)發佈了一篇名為《深度學習算法的應用及有效性:因糖尿病引致的視網膜病變》的論文,詳細了目前機器學習系統在疾病診斷上的新成果。「如果沒能篩查出早期的視網膜病變,將會有四億人面臨失明風險。通過這項技術,我們希望能夠幫助更多人口在眼科醫生稀缺的情況下獲得適當的檢查。」雷鋒網了解到,Google DeepMind 目前已經與英國國家醫療服務體系(NHS)進行了二度合作,將和 Moorfields 眼科醫院一同開發識別視覺疾病的機器學習系統。

除此之外,Google大腦團隊也致力於拓展醫學影像的其它領域,並相信機器學習能夠在接下來一年內又好又快地提升醫患的就醫體驗。

五、創作,從音樂到藝術


不論是印刷出版、電影或是電吉他,人們利用科技定義媒體內容的創造與分享。在 2016 年,Google大腦成立了一個名為 Magenta 的項目,以探索藝術與機器智能的靈感火花,並利用機器學習豐富人類的創造力。(可參看雷鋒網此前報道:Google新研究項目Magenta:利用人工智能創作藝術

先是用機器學習建立起音樂與圖像生成之間的聯繫,再是文本生成與虛擬現實,Magenta 正在成為內容創作的最佳生成模型。

Google大腦團隊通過舉辦研討會及展覽會的方式,對音樂創作及藝術風格遷移等主題進行探討。而這些探索也同樣獲得了學界的認可, demo 在年底的 NIPS 2016 上獲得了最佳獎項的首肯。

六、安全公平,AI 有責

「當我們開發出強大且完善的 AI 系統,並廣泛應用於這個世界之時,Google大腦團隊同樣也心繫安全與公平。我們同樣希望擁有能幫助人類更好理解機器生產的工具。」

在 AI 安全領域,Google大腦通過與斯坦福、伯克利及 OpenAI 等機構的合作,發佈了名為《AI 安全的具體問題》的白皮書,提及了人工智能領域可能設計的具體安全問題,而Google大腦團隊也致力於在訓練數據的隱私問題、涉及不同項目的隱私界定,以及知識遷移技術方面提出可行的保護方案。

而在另一篇名為《監督學習中的機會公平性》的文章中,Google大腦也以 FICO 評分系統為例,嘗試通過調整訓練的預測因子,以避免結果出現不必要的歧視。

如果你對此感興趣,歡迎通過他們的可視化項目了解。

七、TensorFlow 初長成


TensorFlow 於 2015 年 11 月開源,當時作為一個希望機器學習社區都能從中受益的開源平台而存在。一年來,TensorFlow 已經成為了 GitHub 上最受歡迎的機器學習項目,擁有超過 570 貢獻者的上萬次提交。而得益於社區的貢獻,TensorFlow 目前僅在 GitHub 上就有多於 5000 個與 TensorFlow 相關的項目了。

Google大腦團隊表示,TensorFlow 目前已經得到了許多研究團隊與大型企業的認可(如 DeepMind),此外在尋找海牛或幫助日本農夫選黃瓜等特別的小項目中也取得了喜人的進展。

(雷鋒網此前報道:Google用深度學習守衞海洋:如何在 4.5 萬張照片中找到一隻瀕危的“美人魚”?

一根優秀的黃瓜應該具備什麼素質?GoogleAI告訴你 |新智造

而Google為 TensorFlow 所做的還不止這些:

引用
  • TensorFlow 目前已經在性能上已經有了大量改進,增加了分佈式訓練的支持;
  • 兼容 iOS、樹莓派和 Windows,此外還與大數據框架進行了整合;
  • 拓展了可視化系統 TensorBoard,能夠用於可視化計算圖表及 embedding;
  • 開放了 Go、Rust 及 Haskell 的接口;
  • 發佈了最優秀的圖像分類模型;
  • 回答了 GitHub、StackOverflow 等論壇及 TensorFlow 郵件裏收到的上千個問題;
  • TensorFlow Serving 得以簡化 TensorFlow 模型在生產應用的難度;
  • 獲得了 Google Cloud Machine Learning 的託管服務。
  • 在慶祝 TensorFlow 成立一週年之際(詳情可查看雷鋒網此前報道),Google大腦還在 OSDI 上提交了一篇名為《TensorFlow:大範圍機器學習系統》的論文。
  • 通過與編譯器團隊的合作,Google大腦也在致力開發用於 TensorFlow 的後端編譯器 XLA,並已經在其中添加了一個 alpha 版本。

八、初探機器學習社區

Google大腦同樣也在努力教育指導人們如何使用機器學習,並開展相關研究。

2016 年 1 月,Google大腦團隊的一名研究負責人 Vincent Vanhoucke 在優達學城上開設了一門免費的深度學習在線課程。此外,團隊還組織了 TensorFlow Playground,這個交互式系統能夠通過可視化的方式,幫助人們更好地理解簡單的神經網絡學習是如何完成任務的。

在去年 6 月,首屆 Google Brain Resident 項目在 2200 名申請者中篩選出了 27 名學員,並在過去的 7 個月時間內開展了大量原創研究,並完成了 21 篇論文。

8 月份,許多Google大腦的成員都參與了 Reddit 的 MachineLearning 小組上的 AMA 問答,為網友們解答了機器學習社區及對團隊的種種疑問。

在 2016 年,我們接納了 46 名實習生(大部分是博士生),他們與團隊成員一同開展了研究。

九、讓機器學習無處不在

除了上述公開活動外,Google大腦也在Google內部開展工作,以期將機器學習專業及精神滲透到其它產品團隊中。Google大腦團隊希望公司能做為一個整體,接納並利用新生的機器學習研究成果。比如與平台團隊緊密合作,為在 Google I/O 大會上提及的機器學習加速器 ASIC(張量處理單元 TPU)提出了個性化且高水平的目標。這種定製芯片能夠在數量級上提升機器學習的性能,並廣泛應用於Google產品中,包括 RankBrain、神經機器翻譯系統,還有在 3 月份擊敗李世石的 AlphaGo。

總而言之,對於Google大腦團隊及Google上上下下所有同事與合作伙伴而言,2016 是令人為之歡欣鼓舞的一年,而團隊也同樣期待機器學習研究能在 2017 年更上一層樓。
via google blog,雷鋒網編譯

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知



資料來源:雷鋒網
作者/編輯:奕欣

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→