Google發佈最新版 AI 系統,圖像配文準確率高達 93.9%

雷鋒網 於 26/09/2016 發表 收藏文章

近日,Google發佈了最新版機器學習系統,通過識別圖像中的內容,配上對應文字,效果達到了歷史最佳。Google已經在 TensorFlow 上開源了這項成果。自 2014 年以來,Google一直致力於這個項目,現在這個算法描述圖像的準確率已經高達 93.9% 。

因為他們正在使用一個使用一個開始架構的最新的迭代,所以對於Google團隊來説,有個大問題是該算法是否可以做的比簡單識別圖像中的對象更多。要真正解釋和描述一張照片,人工智能不僅需要了解圖片中是什麼,更要了解圖像中這些對象有什麼相互關係。Google的開發人員表示這不只是一個數據的倒推。該算法必須能夠自然地理解圖像中的對象和它們的用途。

Google研究的博客發文説:“令人興奮的是,在展示全新情境時,我們的模型的確可以產生準確的配文,這顯示出系統對圖像中目標和背景的理解更深了。”同樣重要的是,“它還學會了如何表示知識在自然的英語短語,儘管它只讀了人類給的説明字幕,沒有在接受其他額外的訓練。”

至少從目前來説,相對於視頻,機器學習算法能更好地理解靜止圖像的內容。

via Google Research Blog

推薦閲讀:

洪小文獨家解讀: 直到AI可以自己編程 它才有資格跟 “路人甲” 比智能


資料來源:雷鋒網
作者/編輯:陳楊英傑

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→