技術流的Google今年力推“機器學習”

36氪 於 11/11/2015 發表 收藏文章

Google 每年一度的亞太媒體溝通會議,今年將 “機器學習” 作為主題。

就在一天前,11月9日,Google CEO Sundar Pichai 在 Google 官方博客上宣佈開源 Google 的機器學習系統 TensorFlow,任何研究者包括競爭對手都可以使用。11月10日 舉辦的溝通會上, Alphabet 執行主席埃裏克·施密特連線表示,開源 TensorFlow 不斷擴大機器學習網絡,組成更大的知識基礎,獲得更多回饋,進而有更多發現。

Google 將自己的技術免費開放,希望可以加速機器學習領域的發展,所有研究者都會幫助該領域整體向前,並將成果反饋回來。而越來越多數據進入,反過來也有助於幫助 Google 自己的系統來修正模型,加速學習效果。

機器學習領域被寄予了高度重視,已經成為 Google 內部第三重要的領域,它的研究進展將支撐 Google 多個業務。

目前機器學習已在 Google 多個產品上應用,例如在 Gmail 中機器來判斷是否為垃圾郵件;從大量圖片中識別出顯示的物體是什麼,比如搜索與貓類似的貓咪圖片,Google 能將沒有人工標註是貓的照片呈現出來;Google 翻譯中的圖像識別翻譯、Youtube 中推薦視頻都有機器學習在其中。在上週發佈的 Gmail 自動回覆功能中,也使用了機器學習,系統能夠自動判斷是否需要回復,如果系統判斷需要回復,會給用户三個簡短答覆,用户可以直接發送或者編輯修改後發送郵件。

Google Photos 產品經理 Chris Perry 以該產品舉例,在 Google Photos 中,機器可以根據人、地點和事物等等將用户所拍的所有照片進行整理分類,用户並沒有對照片進行人工文字標註和分類,但是 Google Photos 會自動根據不同維度對照片進行分類,比如人像、自拍、風景等等。當用户搜索比如 “父親、遠足” 關鍵詞時,Google Photo 會把幾年前你與父親一起遠足的照片找到。

機器學習的原理概要地説是通過不斷獲取數據對模型(簡單理解類似 y=ax+b 這樣的公式,但實際上沒有這麼簡單)進行調整,最終能形成一個可靠的模型,給一個輸入變量後能得到一個靠譜的結果。舉個例子,當機器經過大量數據不斷修正 “參數”(類似公式中的 a 和 b)將模型訓練好後,即使機器不懂什麼是貓這種生物,也能給出用户想要的貓的結果,例如貓的圖片。而不斷調整的過程,用户也可以參與其中。用户上傳大量關於貓的圖片就能幫助機器識別什麼是貓。大量數據對於訓練模型至關重要。

過去人們對於程序的做法是設定規則,告訴機器按照這個規則去做,類似 IF “條件” then “結果”,比如電子郵件如果包含 “V!agra” 這樣字就判定為垃圾郵件。而在機器學習領域,我們建立程序從例子中學習,例如對郵件進行分類(用户報告是垃圾郵件),模型根據用户點擊結果不斷改變自己,減少錯誤,反覆循環這個過程,無意間實現了自我進化。

用户在報告垃圾郵件的過程就相當於是幫助機器自我調整參數,如果用户在搜索貓的圖片時,真正顯示是貓的圖片終將會被用户大量點擊,而不是貓的則點擊很少,包括用户行為在內的持續的動態修正過程一直在幫助機器變得更精明。

由於計算能力在最近幾年的提升,過去十幾年前就已存在的機器學習的點子將得以實現落地。機器學習領域發展很快,但仍需要更多的研究。Google 研究員 Greg Corrado 稱,“我們鼓勵大家從不同角度研究機器學習,即使是在 Google 內部也有從不同角度研究的路徑。目前,學術界的研究和業界差異也很大。”

“Google 約 2010年 在移動設備上開始應用機器學習。機器學習自 5年 前在實驗室誕生之際起,至今已有超過十億的用户。機器學習開始從理論轉向實際,今天 Google 所有的核心產品都在利用機器學習來為用户提供更快速、更智能也更便捷的服務。 ” 埃裏克·施密特説

隨着 Google 本身對機器學習系統 TensorFlow 的開放,可預見今後該領域進展產品化將加速出現。

注:題圖為 Google 研究員 Greg Corrado。

原創文章,作者:周昶帆,如若轉載,請註明出處:http://36kr.com/p/5039525.html

“看完這篇還不夠?如果你也在創業,並且希望自己的項目被報道,請戳這裏告訴我們!”


資料來源:36Kr

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→