微軟用AI為Word和PPT增加解讀圖像能力,讓盲人也能“看”圖

36氪 於 04/12/2016 發表 收藏文章

對於盲人來説,輔助性技術對電腦使用起到了關鍵作用。比如,TTS(文本轉語音)技術對盲人就很關鍵,這讓他們可以閲讀文章。但是媒體不僅僅是由文字構成的,圖像也是很重要的一部分。而圖像和視頻在數字世界中正日益佔據着更顯著的位置。視力受損者看不到這部分內容實在是一件憾事。不過微軟正在為他們彌補這一遺憾,近日Office 官方博客宣佈,已經增強了該辦公套件的輔助選項功能,其中就包括利用人工智能來描述Word和PowerPoint文檔中的圖像,讓盲人也能“看”到圖片的內容。這些新特性將會在2017年初正式推出,Office 365訂户可以在PC版的Word和PowerPoint先睹為快。



PPT或Word的圖片原來都有一項Alt Text(可選文字,右鍵圖片—設置圖片格式—可選文字可以設置)功能,通過它可以設置圖片的標題和描述,目的就是為了讓視力或者認知能力存在障礙的人能理解圖片而設計的。遺憾的是,絕大部分人都不會輸入這部分的信息。而對於盲人來説,可選文字其實應該是必選的。


為了改變這一現狀,微軟決定自動完成這個圖片描述的過程。其解決方案是利用自己的認知服務計算機視覺(Cognitive Services Computer Vision)API,通過這項API將圖片自動用文字描述出來,文檔作者只需右鍵點擊圖片然後勾選“自動完成可選文字(Automatic Alt Text)”即可。該API就會自動對圖片做出描述,然後再由屏幕閲讀器把圖片標題和描述讀出來。

微軟的圖像識別技術為深度學習技術,它可以識別圖片當中的對象,然後想出最適當的文字來表述整幅圖像。鑑於這項技術背後採用的是機器學習技術,所以使用這項功能的人越多,其表述能力就會越強。

除了微軟以外,Google、Facebook、蘋果、Twitter等也都開發了類似的圖片描述技術。比如Facebook就利用了類似技術給用户分享的圖片添加標題,這樣盲人用户通過iPhone手機瀏覽新聞流時,內嵌的VoiceOver屏幕閲讀器就會把圖片的標題讀出來,幫助盲人用户更好地理解相關內容。


資料來源:36Kr

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→