編者按:最近,Pokémon Go 成功吸引了人們的眼球,這款遊戲的火爆讓用户體驗到了 AR 遊戲的魅力,但是 AR 與現實世界的交互遠不止於此。 AI 驅動的圖像識別技術公司 Cortica 的聯合創始人兼CEO Igal Raichelgauz 發表了對未來 AR 的看法。
引用真正的 AR 需要計算機視覺和對現實環境的動態映射。
Pokémon Go 中的角色只依賴 Google Maps 中的固定緯度和經度。如果在遊戲中應用真正的 AR 技術,實時深度映射和物體識別功能會讓遊戲角色與現實世界互動,而不是將他們放在不協調的遊樂區之外。
真正的 AR 仍然是一個聖盃,讓 AR 技術真正發揮作用的關鍵是 AI 驅動的圖像識別技術,這種技術可以進行“無監督學習”,人們可以使用設備即時觀看任何圖像和視頻,並儘可能的理解內容。
當前 AI 的侷限性
在了解“無監督學習”之前,首先讓我們來了解一下目前的狀況。Google、IBM 和 Facebook 等大公司一直致力於開發、實踐 AI 技術,改善圖像識別能力,但是他們都有缺陷,當前該領域的大部分工作主要集中在“深度學習”技術上。
深度學習提供了海量的計算能力,但是有兩個重要的缺陷:
第一,當深度學習系統觸達第1000個計算層之後,計算能力達到頂峰,但是沒有繼續形成規模的能力。
第二,機器學習需要讓人們進行數百個小時的指導,我們將其稱之為“監督學習”。計算機科學家會修正錯誤的答案,最終該系統會從錯誤中進行學習。針對特定的數據集,這是有效的,例如,回答智力競賽節目中的問題,或者玩棋盤遊戲,但是它無法被應用到不斷變化的環境中,例如自然界。
“人性化” AI
我們需要考慮的一個關鍵詞語是:自然。將深度學習應用到 AR 中不太適用,因為這是讓人工系統了解自然環境。當然,這些任務對人類來説並不是困難。為了確保計算機可以精確地理解環境,這需要一個過程,就像人類的自然進化一樣。最新的腦部研究表明,無監督學習才是答案。
無監督學習與深度學習不同,因為它不需要人類的參與,不需要給它一定的數據集,從問題中得到正確或錯誤的答案——“這是一隻貓,這不是一隻貓”,無人監督的學習系統會基於每張圖片相同/不相同的特點,分析出上千個特徵,包括顏色、形狀、複雜組合,等等。
真正的 AI 驅動的 AR 可以做什麼?
通過對此更加深入的了解,AI 驅動的 AR 遊戲將會把虛構角色的活動和遊戲設定整合到自然場景中。但是完善的遊戲設定只是冰山一角。
由 AI 驅動的 AR 是強大的技術,可以顛覆無數行業。例如,消費者很快就能很好地利用自己手機和其他設備中的照片。想象一下,內嵌的AI助手可以自動管理圖片和視頻,在一毫秒的時間內進行精確的搜索,根據圖片的主題進行分享推薦。數百萬張被遺忘的照片突然獲得了新生,可視化搜索的潛力被釋放。
通過無監督學習進行圖像識別可以讓自動駕駛汽車的安全性成指數倍增長。汽車可以完全看清行人,完美辨別道理障礙。
在醫療領域,手術過程中,醫生可以獲知更及時的信息,並與上百個相關的操作進行對比,基於世界範圍內的解決方案指導醫生進行操作。
AR 是一種趨勢,但是只有當這種技術完美無瑕地整合在社會中時,才能發揮更大的作用。Pokémon Go 遠沒有達到這種水平,但是這種技術很快就會被使用。通過非監督學習的驅動,可以讓一個虛擬的比卡超藏在一棵真正的樹下,這種突破將會從根本上改變 AI、AR 在世界中的運行方式。
資料來源:36Kr
請按此登錄後留言。未成為會員? 立即註冊