一直在討論的大數據,這次在美國大選中究竟幹了什麼?

36氪 於 15/11/2016 發表 收藏文章

本稿件由南七道整理翻譯,原文來自於Uvm、Befair等網站



特朗普入主白宮,美國大選落下帷幕。回首這場混戰,大數據技術在其中其實發揮了不小的作用,甚至佔據了至關重要的地位。

社交媒體上的大數據分析

從美國大選之初,各候選人各方面的數據統計就已經被統計在各家網站上。比如從這張數據來看,上圖表示的是各個候選人的推文提及率。而在同樣的時間序列中,特朗普在推文中的提及率佔有明顯的領先優勢,不過其他候選人在同一個座標軸中幾乎不可見。


圖中下方的圖標則是關於每位共和黨候選人的推文的幸福感指數進行的比較,特朗普相對於克魯茲和盧比奧有微弱的優勢,對於卡森有明顯的優勢。並且,特朗普的平均幸福指數比希拉里略高(5.79比5.70),但仍比桑德斯低(5.79比5.85)。雖説這些數據並不能夠直接決定最後的大選結果,但也間接的為特朗普獲勝起到了潤滑和推動作用。


除了這些幸福指數和提及率,大數據統計還對各個候選人的各個“標籤”進行了統計,而正是這些標籤決定了幸福指數等相關數據的分值高低。在下圖特朗普和希拉里的“標籤”對比中,詞語的顏色根據感情狀態表示——越藍越快樂,越紫越悲傷,而且詞語的大小由加權平均tf-idf值決定。
從圖中不難看出,希拉里的詞圖中,正面詞彙與負面詞彙相交織,其中比較重要的正面詞彙有“經驗”,“才能”,“女性”,“世界”;負面詞彙有“犯罪”,“調查”和“謊言”,這也許是與電子郵件服務器醜聞相關。而特朗普的詞圖中,最大的詞彙包括支持者形容的“前行”,以及現在的共和黨初選中的“勝利”;負面詞彙,或許來自於他的反對者,包括“羞辱”,“攻擊”,“種族主義”,“騙子”和“危險”。

除此之外,還有可供我們參考的是詞彙轉移圖,如圖所示:


希拉里的詞彙轉移圖與參照分佈比較相似(5.76比5.77)。負面詞彙包括電子郵件調查及“監獄”,“犯罪”,“囚犯”,“醜聞”等。此外,“票據”是以負面形式呈現的詞彙(被理解為支付票據),但是在希拉里這裏則是指比爾·希拉里。正面詞彙主要有“她”,“女性”,“感謝”,“健康”,而負面詞彙“憎恨”,“悲傷”,“失敗者”,“詐騙”,“種族主義”較少被提及。

而特朗普有最高的幸福水平(5.79),其正面詞彙有“偉大”,“愛”,“美國”,“更好”等,顯然,這與他的宣傳口號相關——使美國再次偉大。但是他的負面詞彙包括了更多。比如“憎恨”,“種族主義”,“死亡”,“失敗者”,“悲傷”,“禁止”,以及以褻瀆的方式,反映了他的反對者的觀點。

通過分析大眾趨勢,民眾可以通過數據了解到誰更符合國民的標準。而社交媒體運用大數據的統計和判斷使得民眾判斷方向發生了一定的偏差,引導了整個輿論的導向,甚至改變了很多人的原始初衷,心中的那桿秤在不知不覺中發生了一定的偏差。

個人數據團隊的關鍵性作用

當然,這個只是社交媒體和一些數據公司較為公正的數據統計,而對於特朗普和希拉里本人而言,個人背後的數據團隊比較看來,簡直就是一場大數據的盛宴。

傳言希拉里有一支堪比矽谷公司的大數據團隊——50名專業的程序員和開發者,大部分都是曾經供職於Facebook、Google、Twitter等大型的科技公司的高層人士。在他們的幫助下,如果想要想利用更多技術手段來幫助希拉里贏取更多選票和資金,簡直是輕而易舉的事情。比如,民主黨對於競選頁面進行細微的調整,就可以讓捐贈人儲存信用卡信息。這種手段常用於電商公司將窗口用户變為付費用户的手段上,但現在在政治上同樣適用,很多民眾在不知不覺中便已經成為了希拉里“忠實”的支持者。

除此之外,這些大數據團隊還能夠處理一些突發的技術問題。比如,2015年,聯邦競選委員會報告競選籌資截止日當天,外部郵箱系統突然崩潰。雖然當時場面一片混亂,但是希拉里的競選團隊竟在4個多小時內搭建了一個臨時郵箱系統Balloon,使得危及順利解決。

這樣看來,特朗普似乎只有Twitter這樣一個武器,實則不然,特朗普背後的數據團隊對於他商人出身的身份進行了量身打造,為這樣一位本該有着金錢光環的人打造了一副政客的鋼筋鐵甲,使得他的辯論能力突飛猛進。特朗普背後的大數據團隊着重於希拉里過去的演講,通過關鍵詞和數據分析來洞悉希拉里演講的漏洞和缺點,從而為特朗普提供有力的攻擊武器。

還記得曾經的辯論會嗎?希拉里發言26分鐘內便被特朗普打斷了25次,這難道不是大數據團隊支持的結果?

國內數據公司DataEye CEO汪祥斌認為,其實從上兩屆奧巴馬的總統大選開始,大數據在整個總統大選過程中的應用已經越來越深入,從大選籌資階段開始,精準的籌資郵件篩選到選情實時分析,選民人羣精準定位,結果預測各個環節都已經開始數據化,整個總統大選已經變成一個典型的數據驅動的業務決策過程。不難看出美國的政治已經全面進入了大數據時代。

大數據公司是大選的幕後英雄

如果説到專門為民主黨和共和黨提供數據分析和服務的要數TargetSmart和DeepRootAnalytics這兩大公司了。前者專門為民主黨派和州民主黨派以及他們的同盟提供大數據分析和服務;而後者則給共和黨及其從屬團隊提供數據分析。

TargetSmart和DeepRoot都是利用Alteryx的軟件來説明他們容納、淨化、混合以及分析來源不同的大規模資料。這種方法主要來分析選民的年齡結構,根據不同年齡段來分段並且打分,然後利用這些資訊來優化他們在媒體上的花銷,特別是在非常重要的電視廣告上,從而擴大宣傳效應,使得事情的效果事半功倍。

資料將會指示客户該將他們的競選廣告放到哪,從而使得廣告在目標人羣的曝光率大大提升,同時還會提示他們花銷的紀錄,透過讓客户在情景中能夠意識到這個問題,不僅提供他們所做的與目標人羣相關的理由,而且也會分析競爭對手或同盟所做的,對目標人羣的影響,這就允許他們能夠對正在進行的分配任務具有策略性,並對廣告投放更聰明——把廣告投放在最不顯眼而又最高效的地方,同時根據其他人或組織的移動來及時做出反應。

這一屆大選特朗普和希拉里總計為大選燒掉了將近1億美金,這些錢燒在哪些地方?無外乎宣傳公關,而這個其中的宣傳打廣告以及拉選票就佔據了多數,包括電視廣告,網絡廣告,直郵信件等等。在汪祥斌看來,如此高昂的廣告投入也為大數據的應用提供了廣闊的施展空間。不僅僅是籌資的多少,誰能更有效的進行精準的廣告投放某種意義上來説也直接決定宣傳戰的結果。

大選&賭盤相愛相殺

因2016年美國總統選舉勝負難料,激烈的選情也直接帶動了賭客下注的熱情,博彩公司因此收到創紀錄的賭金。在此之前英國互聯網博彩公司Betfair稱,其“下一任總統”賭盤可能超越英國脱歐公投賭盤,成為歷來投注金額最高的一個賭盤。目前該賭盤已經收到約1億3000萬美元的賭金。

而對於該公司而言,對於選舉下注早已經是見怪不怪的事了。在此之前,該公司網站共有70多個與美國總統選舉相關的賭盤,下注的賭盤從誰將贏得最多的支持票,到各黨將拿下多少個州都有。而“下一任總統”賭盤是下注額最高的一個。

英國另外一博彩公司Ladbrokes則透露表現,自從該公司在4年前為本屆美國總統選舉收注以來,至今的下注額已達500萬英鎊。不過絕大多數賭金是在美國以外的地區下注的。受到美法律王法公法律的限制,美國境內的政治賭博只侷限在與大學有聯繫的相對小的平台上,而且是供大學做學術研究用途的,不過這些數據統計結果一旦公佈,公民的選擇和態度就會發生相應的變化。

南七道:南七道新媒創始人,36氪專欄作者,互聯網明星創業公司臉萌、FaceU等品牌操盤手,關注互聯網和科技創業。微信公眾號:南七道。


資料來源:36Kr

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→