在人工智能和新聞的結合上,國外媒體已經飛起來了?

36氪 於 06/12/2016 發表 收藏文章

編者按:本文來自微信公眾號“刺蝟公社”(ID:ciweigongshe),作者陳璐、劉晨陽,36氪經授權發佈。

本文為 AI+News 系列報道,系列一:在人工智能和新聞的結合上,國內媒體到底做得怎麼樣了?

從沒有任何一個時代比如今這般更讓媒體人如履薄冰,內部變革困難重重、外部環境動盪更迭、核心生產力更存在被徹底顛覆的可能性。正如海水覆蓋着海底千溝萬壑,讓表面平靜蔚藍一樣,在社會環境看似平緩的變化下,同樣掩蓋着無數的陣痛、失敗和探索。

但我們相信,任何變革和進步的根本,只會發生在生產力和產業的深入結合上,新聞行業也一樣。為此,刺蝟做了關於AI+News的專題報道,希望通過觀察人工智能在新聞領域的應用,引起自己和讀者對當下的環境的思考。

這是該專題的第二篇,國外媒體在技術輔助新聞報道上,遠比國內靠前。

機器人寫稿2.0



《財富》雜誌説:“現在只要隨便伸手抓來一家科技公司,都會發現它已經涉足了AI界。”如果把“科技公司”換成國外媒體,這句話同樣成立。相較於國內媒體的試水《在人工智能和新聞的結合上,國內媒體到底做得怎麼樣了?》,入局較早的國外媒體在“人工智能+新聞”領域的探索時間更長,探索結果也更為深入。在這篇稿件中,刺蝟君將試着從新聞生產流程入手,觀察外媒在將人工智能和新聞實驗室結合時做的種種嘗試。

提到人工智能在新聞業的應用,表現最出色的當屬機器人寫稿,比較早將這一方式應用於實踐的是一家名為“敍事科學”(NarrativeScience)的服務公司。該公司早在2010年就推出了一款名為Quill的寫作軟件,能從不同角度將數字轉化為有故事情節的敍述文。Quill曾被用來撰寫電視及網絡上棒球賽事的比賽報告,福布斯網站曾使用NarrativeScience的技術自動製作財報和房地產相關報告等。

在此之後,包括美聯社、《華盛頓郵報》、《洛杉磯時報》等在內的很多國外媒體都先後加入了這種嘗試。

1.美聯社:機器人寫稿,還要轉換為廣播

2014年7月,美聯社(AP)與科技公司AutomatedInsights(簡稱AI)公司達成合作,使用他們的Wordsmith平台自動編髮企業財報。具體流程是每當公司發佈財報,Automated Insights會自動抓取收到的財報,基於美聯社預先編輯好的寫作結構,幾秒鐘之內生成一篇150-300字的新聞快訊。這套系統每季度能生產近4000篇財報新聞,而在此之前美聯社的編輯們每季度只能寫出400篇財報。

除了更大的數量和更快的速度,WordSmith的自主“學習”能力同樣驚豔。短短三個月,該系統就已經自主掌握了新聞寫作的基本規範,其差錯率比人類職業編輯更低。寫作機器人在改變數量的同時也在優化稿件質量。

到了2015年,美聯社將自動化新聞報道的範圍擴大到了體育板塊。今年6月,美聯社嘗試與MLBAM(美國職棒大聯盟媒體)合作報道棒球比賽,將觀眾習以為常的比分式報道轉換為文字故事。

作為最早將人工智能運用到新聞寫作之中的媒體之一,美聯社也在持續探索新的領域。今年10月,美聯社戰略企業發展部高級副總裁JimKennedy,在接受哈佛尼曼新聞實驗室(TheNiemanJournalismLab)記者Joseph Lichterman的採訪時,透露了其人工智能應用的下一個方向:將文字新聞自動轉換為廣播。該項目的設想是,開發團隊集中於一項特定的體育項目,製作出將文字轉換為廣播的模板,在此基礎上開發出適用於這一轉換的算法。Kennedy還透露,與外部公司合作開發從文字到廣播的識別系統可能要耗時6個月,目前的設計樣品仍需專門的編輯進行審核。他們的最終目標是讓智能技術達到不需要人工編輯審校即可發佈的水準。

2.洛杉磯時報:專注突發與犯罪

2014年3月,美國加州發生4.4級地震,《洛杉磯時報》成為當時最快在網站報道該消息的媒體,從撰寫到發佈僅用了3分鐘。該條新聞出自機器人之手,《洛杉磯時報》地震新聞自動生成系統在收到美國地質勘探局發來地震信息的第一時間,迅速將數據內嵌至系統模板中,生成突發新聞。

除了寫地震突發的機器人,《洛杉磯時報》還有一台專門蒐集洛杉磯當地自殺新聞的機器人(2010年起),依靠人工智能建立起了一個犯罪庫,使編輯追蹤新聞變得更容易。但從時間上看,《洛杉磯時報》在人工智能輔助新聞報道的嘗試來得更早,但機器人的作用集中在整合、嵌套消息上,尚未涉足更深入的領域。
3.華盛頓郵報:更多體裁

今年的里約奧運上,《華盛頓郵報》也派出了機器人團隊進行賽事報道。寫稿機器人Heliograf從體育數據公司Stats.com和美聯社獲取奧運會的最新信息,並自動組成短消息作為即時新聞發佈,比如奧運會的積分榜、獎牌榜以及其他以數字為核心的報道。


奧運會結束之後,Heliograf又投入到了對美國眾議院、參議院和州長等大選新聞的報道當中,利用從美聯社得到的數據和選舉結果,實時撰寫新聞並自動更新到郵報網站和社交媒體上。

負責《華盛頓郵報》新數字項目的傑雷米·吉爾伯特(Jeremy Gilbert)希望能夠把帶有人工智能軟件的新聞內容“注入到”人力記者製作的內容之中,讓機器人的新聞作品更像人力記者。

機器人編輯

既然機器人能寫新聞,為什麼編輯新聞不用它呢?《衞報》、《紐約時報》和路透社在新聞編輯流程中進行了一些嘗試,難度、深淺不一。

1.衞報Open001:算法生成的報紙

2013年11月,英國《衞報》先和NewspaperClub合作發行了一份名為The Long Good Read的新報紙,讓Newspaper Club開發的一款在線頁面佈局工具試了試自動排版。

之後,《衞報》於2014年推出了一份名為“#Open001”的紙質報紙,報紙內容幾乎完全由算法生成。機器人在對社交網絡上的熱門分享進行統計分析後,基於此進行內容篩選、編輯與排版。作為試驗性產品,#Open001 每月僅印刷 5000 份,而且只針對媒體機構和廣告機構發行。


2.紐約時報Blossomblot:找爆款

《紐時時報》數字部門的科學團隊研發機器人Blossomblot的初衷是為了解決一個問題:在《紐約時報》一天推送的300篇文章中,哪些真正適合推薦到社交媒體網站?Blossomblot通過對社交平台上推送的海量文章進行大數據分析,能夠預測哪些內容更具有社交推廣效應,並幫編輯挑選出適合推送的文章和內容,通過機器學習甚至可以獨立制定標題、摘要文案、配圖等。

虛擬編輯Blossomblot上線後,《紐約時報》內部統計數據顯示,經過Blossomblot篩選後自動推薦的文章的點擊量是普通文章的38倍。


3.紐約時報R&D Editor和路透OpenCalais:文章標籤自動化

2015年7月,紐約時報 R&D實驗室開發了一款用來自動標記文章的機器人,編輯寫稿時,機器人會自動彈出文章可以採用的標籤和關鍵詞,為新聞編輯部提供了一種創造性的收集內容的方式。

這與路透Calais系統的操作原理類似,Calais會從各類文本類型中找出元數據,通過連接內部的資料庫實現文本閲讀和分析。當記者或編輯在系統中鍵入內容時,每個詞都會被系統記錄和學習,並隨時與系統數據庫進行比對,篩選出關鍵詞和重點內容。當記者完成寫作時,機器人可對記者建議的註釋進行簡單地審查。


人工智能的觸角還伸向了哪裏?

除了寫作和編輯,新聞生產的過程還包括海量數據分析、新聞事實核查、新聞線索收集、和新聞交互使用。國外媒體已經開始在這些領域應用人工智能技術。

【海量數據分析】

1.Mashable:讓Velocity成為預言家

Mashable是美國的一家知名互聯網新聞博客,關注各大社交媒體和科技公司的新聞動態。今年2月,Mashable的執行董事Ben Maher在出席活動時稱,Mashable如今開始運用人工智能技術發現故事,“主頁”已死,媒體們應該努力去吸引現代用户。

為吸引用户,Mashable啟動了一個名為Velocity的數據分析工具平台,通過分析鏈接識別文章的傳播趨勢和可能存在的爆點,除此之外,Velocity還可以幫助編輯們發現“飽和點”,如果一個事件的分享率達到95%,編輯就不再投入關注,如果沒有,編輯們則可以考慮為其再添加“一把火”。


2.路透社+Graphiq:人工智能數據庫

今年8月30日,路透社宣佈與語義技術公司Graphiq合作,為有合作關係的新聞媒體及發行商提供Graphiq龐大的可視化數據庫,這一數據庫基於智能算法進行實時更新。
據Graphiq的副總裁Alex Rosenberg介紹,他們的解決方案是預先假設哪些事件將被報道,之後人工智能可在極短的時間內從數據庫中抓取數據,建立可視化圖像,然後打包這些圖像與所做的報道匹配。

舉例來説,如果你準備寫一條鱷魚攻擊人的新聞時,Graphiq的人工智能系統已經把該事件基於歷史數據的可視化內容生成完畢,在提升內容信息量的同時也為記者節省了大量時間。


【新聞事實核查】

刺蝟君在之前的文章《這是美國大選辯論最壞的時代,這是事實核查新聞最好的時代?》裏曾介紹了事實核查新聞的生產流程。以美國的PolitiFact網站為例,網站記者(研究員)和來自不同新聞機構的合作記者一起人工挑選內容進行核查,記者和編輯需要隨時關注、尋找、篩選核查的內容與對象。但有不少國外新聞機構開發出了應用於新聞核實的機器人。

《華盛頓郵報》2012年開發了一個叫“Truth Teller”的應用程序,用以自動對新聞內容進行即時核實。不過,這一技術之後的發展之路卻略顯坎坷。2013年9月,Truth Teller推出了測試版,但核實能力依舊非常有限:《郵報》團隊需要在實操過程中教Truth Teller假話的無數種説法,同時,Truth Teller的語音識別系統還會不時出現轉碼錯誤。此後,Truth Teller的熱度便慢慢退去。

不少人對新聞自動核查的可行性提出了疑問,但這沒有停住媒體機構為此進行嘗試的腳步。英國的一家事實檢查機構 Full Fact今年年初發布了一個測試版的監控系統,從幾十個英國新聞網站(BBC、衞報等)搜尋信息,自動分析英國議會記錄和其他一些內情,目標是捕捉每個謠言的生命週期,進而粉碎這些謠言。Full Fact下一步的計劃是以概念驗證的方式進行自動化地檢測和核實統計出來的報道,在確保數據機器可讀的情況下提高人工智能的情景分析能力。這裏“統計出來的報道”是指一些通常情況下可識別的報道,例如「X 認為」就是一種很常見的可統計的報道,計算機可以識別這些模式,然後檢查公共數據。

Full Fact 的主任 Will Moy對新聞自動核查表達了樂觀的態度。他認為事實核查的四個階段(在信息來源中監控媒體、確認關於事實的報道、檢驗真假和公佈核實結果),每個階段都可能實現自動化。

【新聞線索蒐集】

今年4月,Facebook Messenger面向所有開發者推出聊天機器人Chatbot,入駐的媒體均有開發權限。目前,大多數媒體開發的機器人主要用於新聞內容推薦,比如華爾街日報、衞報、CNN等,但一些媒體的聊天機器人也承擔起了收集新聞線索的任務。

《華盛頓郵報》開發了一個叫Feels的聊天機器人,在美國大選期間向用户收集選舉相關數據,以捕捉美國選民在選舉前3周的傾向。Feels每天還會提供5個emoji,讓用户選擇最符合自己傾向的表情。

同樣地,Buzzfeed也希望 Messenger 上的用户通過Chatbot給它提供新聞素材。

當用户打開與Chatbot的聊天界面時,它會告知用户它在為俄亥俄州的克利夫蘭市週一舉辦的美國共和黨代表大會蒐集新聞素材並開始詢問用户一系列問題:你關注這條新聞嗎?如果你住在克利夫蘭市,你會圍觀還是會抗議這次大會?你是否願意發些現場的圖片或視頻?這些問題都有三個預設的答案,用户只需選擇其中一個就好。最後,ChatBot 都會要求用户發一個 emoji 表情來描述對這次大會的感受。

BuzzFeed後方的新聞編輯部有一個專門運營ChatBot的團隊,編輯們通過與現場記者的溝通,實時更新消息形成良性的反饋循環。Buzzfeed 網站主編本·史密斯(Ben Smith)稱,Chatbot是新聞報道的補充,它能幫助Buzzfeed同時跟很多人溝通。

【新聞交互應用】

外媒的聊天機器人除了用來蒐集新聞線索之外,最常見的功能便是與用户進行交互。其中比較典型的代表便是Quartz自己研發的聊天機器人和CNN在Facebook messenger上開發的聊天機器人 。

1.聊新聞的Quartz

數字商業新聞網站Quartz在今年2月上線了以人機對話的方式推送新聞的客户端。與傳統的看新聞不同, Quartz界面是個單純的對話窗口,打開後Quartz會用聊天式的口吻向讀者推薦新聞。當讀者看到感興趣的話題時,可以點擊窗口下面的選項進行追問,了解更多細節。Quartz推送的所有內容經過人工編輯實現選擇和編輯,用户與Quartz的互動則是由機器算法完成。


Quartz副總裁兼執行主編扎克•西沃德(ZachSeward)在接受採訪時説,聊天式新聞大大提高了用户粘度,用户停留的時間變長了。不過這類新聞產品最大的挑戰是找到適合聊天的新聞類型。

2.CNN聊天機器人
作為Facebook Messenger聊天機器人的首批體驗者之一,CNN也對交互有不小的興趣。除了每天向用户推送頭條新聞外,CNN的聊天機器人還在界面下方設置了讀故事、了解梗概以及向機器人提問三個選項。


提升機器人與用户交互的流暢度需要增強機器人識別文本和語義的能力。CNN下一步的計劃是與Outbrain進行深度合作,讓機器人能夠熟練對相同的詞語在不同意境內進行意義的轉化。

科技公司搶鏡停不下來

人工智能技術在外媒新聞生產過程中的應用已經相當廣泛,不過同國內一樣,由於人工智能與計算機、互聯網等技術一脈相承,那些擁有強大技術基因的科技公司切入內容市場優勢十分明顯。比較典型的是Facebook和微軟。

作為全球最大社交媒體平台(擁有超9億用户)的Facebook自然不會錯過對機器算法的嘗試。今年8月,Facebook解散了“熱門話題(Trending)”團隊,將熱門話題的編輯、推薦和排名全部交給機器算法,篩選依據是該話題的相關文章和貼文數量。

但Facebook在機器算法上的嘗試可謂飽受爭議。2014年,外界出現了批評用户消息流中並未出現足夠多有關邁克爾·布朗槍擊案的報道,壓力下Facebook不再堅持純算法的新聞篩選方式。2015年5月,Facebook又面臨用户對編輯團隊存政治偏見的指責,之後決定調整人工編輯在審批熱門話題方面的作用。今年8月,Facebook熱門話題人工編輯的工作不再是提煉新聞要點或者選擇新聞話題,而在於訓練他們背後的這些算法。今年更是被爆出不斷推送假新聞的情況。


看得出來,雖然AI進入新聞編輯部勢不可擋,但內容完全算法化存在的風險也不小,最明顯的就是因算法識別不力而導致的假新聞氾濫。

另一邊,微軟在今年5月發佈的最新新聞應用——NewsPro 2.0加入了“新聞機器人”,功能也同大多數媒體的聊天機器人一樣,主打新聞推薦。它會根據用户指令每次推送三條相關新聞。比如輸入“Give me news”之後,NewsPro會給用户推送個性化頭條。


瑕不掩瑜,眾多的嘗試給出了極為珍貴的經驗

與國內相比,國外媒體的寫作機器人有三點不同:一是其覆蓋的新聞種類不只侷限於數據來源清晰的體育報道和企業財報,還包括報道社會熱點和突發新聞;二是數據來源更廣,國外新聞機構不僅擁有官方數據庫,還打通了各種各樣的企業數據,比如《華盛頓郵報》與體育數據公司Stats.com、美聯社與MLBAM合作等;三是外媒對AI技術的應用已經超越了模式化寫稿的1.0階段,他們正在探索如何提高機器人的自動化程度以及如何使人工智能擁有更接近人力記者的寫作水平。

此外,外媒的人工智能技術在新聞編輯、數據分析、線索收集、新聞核查與形式交互創新等方面的進展已經取得了不錯的成績,不過也暴露出不少問題,比如核查的不準確、交互的不流暢、算法識別不力導致的假新聞、算法按興趣自動推送帶來的觀點極化等等。

哥倫比亞新聞學院的數據專家、記者JonathanStray今年在《哥倫畢業新聞評論》上發表了一篇關於人工智能與新聞業的文章,標題是《賽博紀元:人工智能將協助人類徹底變革新聞業》。文中表示,人工智能的巨頭迄今都在忽視新聞業,Google正在開發自動駕駛汽車、圖像理解和健康應用程序;IBM 的 Watson 部門已投資 10 億美元在“認知計算”上,希望將軟件銷售給法律、醫學、營銷和智能方面的從業者。但新聞業不在他們的列表中,因為這一市場還不夠大。
但我們必須看到的是,AP、路透社等一些新聞機構如今每個月會發出上千篇計算機自動編寫的稿件,這無疑是一個巨大的進展。但今天的寫作機器人在語境理解和趨勢分析上仍未表現出令人驚豔的一面。一篇好新聞依舊需要人類記者的見解和分析。

以往,我們在談人工智能對新聞業的變革時,總是把“取代人類”幾個字掛在嘴邊,但在看完國外媒體的人工智能實踐後,一個顯而易見的事實是:現階段人工智能的所有新聞實踐背後都離不開人,無論是簡單的模板內容填充還是海量數據抓取、新聞自動化核查還是聊天機器人互動,其背後都需要人類設計智能系統和人工訓練機器人。在未來很長一段時間裏,人工智能與新聞業的結合更多地將是交互式的結合,完全自動化的新聞報道仍將面臨不小挑戰。

(金凱娜對本文亦有貢獻)

參考文章:

1、4 Examples of AI’s Rise in Journalism (AndWhat it Means for Journalists)

2、AI is already making inroads intojournalism but could it win a Pulitzer?


3、The age of the cyborg

4、BuzzFeed’s newest political reporter is a bot

5、1年時間,機器人如何席捲英美編輯室


6、美聯社黑科技:機器人寫稿,還要轉換成廣播



AI+News 系列報道(一):

在人工智能和新聞的結合上,國內媒體到底做得怎麼樣了?


資料來源:36Kr

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→