一名來自斯坦福大學的學生Andrej Karpathy,發佈了一項叫Lua的代碼,它能模仿人類語言。Karpathy的項目頁面中已經有一些點子和例子,而真正需要採樣的是能用來建立複發性神經網絡(RNN)的材料,也就是人類語言的材料。
最近,藝術家兼新媒體人Samim做了一項測試,證明用該算法可以很好地模仿奧巴馬演講。奧巴馬的RNN是基於一項Lua代碼,首先,Samim建立了一個網絡爬蟲來收集奧巴馬所有的公共演講,並對訪談和辯論內容進行分析,所有的這一切都被送入Karpathy的RNN模型中,然後用一小段話作引子(被稱為種子),算法就能生成一段演講。
奧巴馬的演講並不少,像“希望”和“Yes we can”都是很熟悉的主題了。自2007年以來,奧巴馬的演講稿撰稿人已經寫了730895字的文本,然而這還不包括採訪和辯論。
算法生成的奧巴馬語錄如下:
種子:反恐戰爭
引用大家好,非常感謝,上帝保佑美國。我們已經開始在全世界收集醫療保險信息。我們辛勤付出卻得不到發展。
種子:中國
引用非常感謝你,請大家坐下;非常感謝你;你們很友善;謝謝。
種子:工作
引用下午好,上帝保佑;國家增加預算來面對全新的挑戰——事實是由我們自己產生的。
從中可以看出,算法的表現並不令人樂觀。“最搞笑的是奧巴馬的RNN真的很喜歡禮貌地説:下午好,美好的一天,上帝保佑你,上帝保佑美國,謝謝。”Samim説道,不過他還沒有完全完成實驗。
不過總統的演講往往確實包含不少套話,這也難怪算法會學到這一手。而且我們已經有了能寫新聞稿和欣賞攝影作品的機器人了,説不定總統的演講稿真的可以用算法來寫。
via mb
關注腦洞微信號(hackmind),帶你領略更多前沿技術
本文轉載請註明來源:http://www.leiphone.com/news/201506/nloqbUgnwH3EwpPo.html
資料來源:雷鋒網
作者/編輯:羅比
請按此登錄後留言。未成為會員? 立即註冊