眼部追蹤技術迎來新突破,幾十萬成本的硬件設備將被手機取代

雷鋒網 於 05/07/2016 發表 收藏文章
眼部追蹤技術一直擁有廣泛應用前景,然而過去40年來,由於其昂貴的硬件成本(高達幾十萬),使得它距離普通消費級應用十分遙遠。此前也有廠商嘗試過將這一技術應用於消費產品中,三星S4 基於普通攝像頭的眼部追蹤翻動手機頁面功能,然而產生的最大問題就是精度差,受環境光影響嚴重,不同人種更是差異巨大,所以三星後來去掉了這一功能。

近日,MIT與喬治亞大學的人工智能研究院希望可以改變這一現狀。他們藉助兩款名為GazeCapture 和iTracker(與蘋果的手機防盜追蹤軟件iTracker不是同一個)的App, 可以將任何一部手機都變成眼球追蹤裝置,大大降低了眼部追蹤技術應用的成本,並且精度提高一大截。


圖片來自:MIT Technology Review

關於此項技術的一篇論文在6月28日的計算機視覺和模式識別大會上發佈,論文的作者之一Aditya Khosla表示,相比於之前同行的研究,他們的優勢在於數據。Khosla 介紹,他們已經通過GazeCapture蒐集了超過1500個手機用户的注視模型,而在此之前,最大的數據樣本是大概也只有50個用户。

為什麼他們能蒐集到如此多的數據?答案是“眾包”模式。研究人員選擇亞馬遜的“土耳其機器人”(Amazon Mechanical Turk)眾包平台,發佈使用GazeCapture 任務,用户可以登錄“土耳其機器人” 攬活。在下載這款App(目前只提供iOS版)之後,GazeCapture 會在屏幕上展示一個顫動的小點,並在小點裏寫上“L”或“R” (分別代表左右),以確保用户集中注意力。用户則通過點擊屏幕左側或右側來作出響應,然後藉助前置攝像頭記錄用户的目光。用户在完成每次任務之後,都可以獲得一筆“小費”。

通過以上方法,GazeCapture 幫助研究人員蒐集了豐富注視模型數據。此前,大多數的研究機構都是召集人們來實驗室採集數據,有50個數據樣本就非常不錯了。


圖片來自:Amazon Mechanical Turk 網站

對於iTracker 軟件,一款目前只能在蘋果手機上運行的卷積神經網絡系統App。iTracker 能識別出頭部和眼球的位置與方向,確定用户的目光究竟看向屏幕的哪個位置。目前iTracker 誤差範圍縮小到了1.5釐米,比以往實驗的精度提高了2倍。在論文提交之後,研究團隊又加入了700個用户的數據,平均每個用户有1600張照片。在這一輪訓練中,誤差範圍更是縮小至1釐米,研究人員預測如果用户達到1萬人,那麼精度會提高為0.5釐米。不過,這樣的精度對於商業用途來説,已經十分足夠了。

對於iTracker來説,存在的最大問題是,神經網絡是一個很大的系統,在手機端的運行效率會很低。不過,研究人員通過採用“Dark Knowledge”(並非黑科技的意思)的處理方法,能夠將神經網絡規模縮小到20%,使得iTracker 可以在手機端處理15幀/秒的畫面,哪怕最短暫的眼神都可以清楚記錄。

對於眼球識別技術的重大突破,康奈爾大學教授 Noah Snavely 評論稱:

引用“在計算機視覺和人機交互領域,眼部追蹤一直都是人們十分感興趣的領域,但是它成本太貴了,讓普通用户的手機就可以實現這一技術,非常令人驚歎。在我看來,他們達到的精度,似乎可以讓這個領域的人羣開始做些有趣的事了,這一項成果將會引發業內的一輪快速發展。”


資料來源:雷鋒網
作者/編輯:亞萌

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→