Airbnb是如何利用大數據幫助用户確定房租價格的?

雷鋒網 於 13/05/2016 發表 收藏文章

圖片來源,GoodLifeStudio/cloudcomputing news.net
Airbnb的數據科學團隊領導人Riley Newman在nerds.airbnb.com的日誌上寫道:“數據是一種行為或事件的記錄。通常情況下它可以代表出人們所做出的決定。如果你可以重現一個人做出決定的過程,你就可以從中學到很多東西;這是從人們那裏知道他們喜歡或不喜歡什麼的不直接的辦法——這個特性比那個更吸引我,我發現這個功能很好用但是那些……沒有那麼好用。這樣的反饋可以成為做出有關社區成長、產品開發或者資源優化的決定時非常有價值的信息來源。我們可以把來自客户的信息翻譯成一種更適合指引我們做出決定的語言。”

正是這種從用户反饋中獲得信息的洞察力讓Airbnb得以將他們的精力集中在發展高峰期時熱門旅遊景點的房主數量上。並且為價格制定出明確的結構標準以使得他們能最大化程度利用他們全球化屬性而收集來的海量數據。比如説,數據可以幫助Airbnb通過像位置、出租時所在的時間段、鋪位的類型、交通的發達程度等數種變量來決定一個房間或一間公寓的合適價格,Airbnb現在可以利用算法來幫助他們的客户做到這些。如果你考慮到這些房間都是真正的“家”,而不是旅館那種標準化的、可以輕易的用星級來評判好壞的房間,你就會發現要給出一個清晰的調價方式真的是件很有挑戰性的事。畢竟那些在城市公寓中比較會讓人滿意的條件(比如WiFi、便捷的交通)對於一間古典、精緻的小農舍可能就沒有那麼重要了(那裏的住客可能會更渴望平靜、浪漫的生活而不是WiFi覆蓋或者地鐵直達)。

為了幫助房主們定價,Airbnb開發了一套叫“Aerosolve”的機器學習平台。這個平台會自動將城市劃分成無數個由微型街區組成的小區域,並分析房主們拍攝的房間照片(展示一個温馨舒適的卧室會比展示一間時髦的客廳更加容易獲得青睞!)。Aerosolve還模仿酒店和航空公司的定價模式搭建了一套動態定價策略。

Airbnb還開源了一個叫“Airpal”的平台:這是一個用户友好型的數據分析平台,能允許公司的任何員工——而不是隻有那些受過專業訓練的員工獲得和分析公司的數據信息,並且使用Airpal提供的工具對其進行質詢。

大數據應用的結果怎麼樣?

就像Newman説的那樣:“頗為諷刺的是,衡量一個數據科學團隊給公司帶來的影響反而是很難的,但是有一個明顯的信號是:現在不管是技術人員還是非技術人員,都一致的希望能參考更多數據來作出決定。”這種現象在Airpal裏得到了表現和證明。2014年上線運行的Airpal系統至今已經被超過三分之一的員工用來進行查詢和質疑。這個讓人印象深刻的數字表明瞭數據已經成為了Airbnb內部決定流程中非常重要的一環。

而Airbnb的不斷成長也是另一個他們對數據的明智使用產生了回報的側面體現。

有哪些數據被用上了?

被分析的數據主要是由格式化的和無固定格式的消息混合起來的內部信息:屋主拍攝的房間照片、地理位置、居住條件(房間、床位的數量,WiFi,熱水浴缸等等),用户反饋和評分,事物處理數據之類。也有一些外部數據會被考慮進去。比如英國的愛丁堡有一個非常出名的節日“愛丁堡文化節(The Edinburgh Festival)”,在節日期間,同一條件的房間的定價會比一年中的其餘時段都要高一些。

可以説一些技術細節嗎?

Airbnb目前手握將近1500TB的數據,像蜂巢一樣由HDFS(Hadoop Distributed File System,一種用來管理大數據的文件系統)集羣組織起來,託管在亞馬遜的EC2(Elastic Compute Cloud)雲服務中。Airbnb曾經用亞馬遜的RedShift服務作為數據查詢工具,但後來換成了Facebook的Presto。因為Presto是開源的,所以他們能及早的修復發現的漏洞並且打上相應的補丁。

在未來,Airbnb希望將數據處理的方式由現在的批量處理升級為實時處理,這將能讓他們更好的發現和處理支付過程中出現的異常現象,並且提升房源匹配和個性化信息的準確度。

有什麼需要克服的困難嗎?

其實Airbnb的數據科學團隊面臨的一項巨大的挑戰反而是跟上公司夢幻般的發展速度。在2011年早些時候,這個團隊僅由三名數據學家組成,因為那時候公司還很小,所以儘管只有三人,他們也能有足夠的精力來處理每個員工遇到的數據問題。但在那一年的末尾,Airbnb就已經有了10個國際分公司,公司的人數有了巨大的增長,這也意味着數據團隊不可能再一對一的為公司的員工解決問題了。

就像Newman對此所説的那樣:“我們需要找到一個讓我們的工作變得更大眾、通俗的做法,不僅是侷限於一對一的指導和幫助,我們需要允許工作組、全公司甚至我們的整個社區都了解使用這些數據的辦法。”隨着更快速和可靠的技術的購入,這個想法成為了可能。他們還把搜索查詢基礎數據的工作也從科學家們手中交給了整個公司的團隊們,在項目控制面板和Airpal提供的工具的幫助下,這些數據讓Airbnb的團隊如虎添翼。並且由於數據科學家們從這些繁瑣的一對一工作中解脱了出來,他們可以將精力集中在一些更酷、更有用的項目上。教會公司的團隊如何使用這些工具是幫助他們獲得對數據的洞察力的關鍵。

我們能從中學到什麼?

Airbnb是一家對大數據的需求和應用隨着公司的擴張而成長的完美的例子。我想,他們隨着公司的成長而調整、轉換自己以適應新節奏的能力是他們賴以成功的關鍵和精髓。這點更突出了大數據的“非靜態”屬性,你的數據處理策略可能需要隨時變化來應對需求的改變。

而一個數據科學團隊能與公司內的所有團隊都配合的如此之好(即使他們不會再同每個員工面對面交流了)也是一件非常了不起的事。這不僅意味着數據團隊能保證一直對公司的商業目標保持最貼切的理解,也強調了公司保持基於數據的決定方式的重要性。畢竟如果沒有人會依據它們來行動的話,你有再多的數據也沒有用。

via cloudcomputing news.net


資料來源:雷鋒網
作者/編輯:黃鑫
標籤: Airbnb  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→