Google又崩了!連 Google Search 都不能用

雷鋒網 於 30/03/2020 發表 收藏文章
在疫情所導致的隔離之下,你很難不依賴互聯網帶來的溝通便利。

然而,誰能想象到,就在疫情快速在全球蔓延的境況之下,Google,這個世界級的互聯網科技巨頭,卻出現了服務崩潰的情況,甚至讓 Google Search 搜索引擎、Gmail 這樣最重要和常見的服務都不能正常使用。


這也真是關鍵時刻掉鏈子。

Google 是怎麼掉鏈子的?

Google 此次宕機,發生在美國東部時間 3 月 26 日。

當天上午 11 點,陸續有美國東部網友發現,包括 Gmail、YouTube、Hangouts 和 Google Docs 等在內,一系列的 Google 服務發生了不可用的情況。

這對於正處於疫情中的美國東部用户(尤其是美國疫情最為嚴重的紐約州)羣體來説,簡直是雪上加霜。

一開始,對於這次宕機,Google 並沒有在 Twitter 上説明具體原因。不過,在 3 月 26 日中午左右,Google G Suite Dashboard 進行了更新,其中顯示除了 Google Sites 和 Google Groups 之外,其他的 Google 服務都出現了問題。


雷鋒網(公眾號:雷鋒網)了解到,也有不少用户宣稱,整個 Google 服務都出現了問題,包括 Google Search 搜索引擎——這簡直是太要命了。

根據用户反饋,上述出現問題的服務偶爾可用,但多數情況下會出現 500 錯誤,也就是服務器內部錯誤。

有網友在 Twitter 上評論稱:Google 也會宕機,真是活久見了。

隨後,到了下午,Google Cloud 負責技術基礎設施的高級副總裁 Urs Hölzle 終於在 Twitter 上發佈關於此次宕機的聲明:

引用我們對此感到非常抱歉! 我們在亞特蘭大發生了路由器故障,這影響了通過該地區的流量。 現在情況應該恢復正常了。


為了消除用户對於疫情之下流量過載的擔憂,Urs Hölzle 還特意強調稱,這次宕機事故與網絡流量或任何類型的過載無關,而 Covid-19 並未對 Google Cloud 的網絡造成壓力。

言外之意,Google Cloud 方面並不認為這是其雲服務負載能力的問題。

Google 的迴應存在水分?

對於這次網絡故障,Google Cloud Status Dashboard 也發表了詳細聲明稱:

引用今天,由於太平洋時間上午 8:18 在亞特蘭大的一個數據中心中的路由器發生重大故障,導致網絡擁塞,我們的一些用户遇到了服務中斷。 結果,在該數據中心中運行的 Google 服務受到直接影響,直到我們的工程師重新路由流量並將這些服務移至備用設施後才可用。 由於網絡擁塞,美國東南部的用户在訪問更廣泛的 Google 服務時可能還會遇到暫時的困難。

當然,Google 方面也宣稱,自己正在解決問題,而且問題不會再次發生。


而 Urs Hölzle 也在後續聲明中解釋稱,這次的故障是由第三方供應商所提供的路由器導致的,具體來説,是因為一個軟件 Bug。他認為,這樣的錯誤非常罕見,但的確會對大量用户造成影響。

Urs Hölzle 也在 Twitter 上再次強調,預計問題不會再次出現。

不過,針對此次宕機問題,一家從事網絡檢測的企業 ThousandEyes 認為,Google 的解釋其實是存在一定水分的。

畢竟,美國東海岸的用户在大約 20 分鐘的時間裏無法訪問任何 Google 服務,這背後的原因可以理解為是亞達蘭大路由器故障——但事實上,這次宕機不僅僅影響到了美國東海岸用户,也影響到了其他地區的用户。

具體來説如下圖:


可以看到,在美國東海岸之外,此次宕機也影響到了美國中部和美國西海岸,甚至包括舊金山、洛杉磯和西雅圖等周邊區域。

對此,ThousandEyes 產品銷售總監認為,這些錯誤具備一致性,即無法訪問正確加載各種服務所需的後端系統;實際上,從 Google 的前端服務器到後端服務,所有經由受影響區域的流量都會受到影響。

這也可以解釋,為什麼美國西海岸用户也受到影響。

Google:COVID-19 不會損壞我

雷鋒網注意到,也許是為了再次撫慰用户,3 月 26 日當天,Google Cloud 負責技術基礎設施的高級副總裁 Urs Hölzle 再次發表博客,就宕機和 Google 的網絡系統進行了更加詳細的説明。

Urs Hölzle 上來就表示:

引用隨着冠狀病毒大流行的蔓延,越來越多的人轉向工作或在家學習,自然而然地想知道 Google 網絡是否可以處理這種負擔。簡短的回答:是。


雷鋒網截圖在 Google 官網

他還表示,Google 的網絡設計是基於需求旺盛時期運行的,而且以往 Google 就有處理高峰期流量的經歷,比如説世界盃決賽。而在本次疫情中,用户使用 Hangouts 來視頻的頻率在增加,但 Google 已經降低了 YouTube 的默認清晰度,以應對流量負載。

在基礎架構的構建層面,Urs Hölzle 表示:

引用Google 的網絡由高容量的光纜系統組成,該系統在陸地和海洋下環繞地球,將我們的數據中心相互連接並與您連接。流量通過了我們的專用網絡,並且就速度和可靠性進行了優化;然後我們才將其傳遞給 200 多個國家和地區的 3000 多家互聯網服務提供商(ISP),並覆蓋數百個接入點和世界各地成千上萬的邊緣位置。

Urs Hölzle 還表示,Google Cloud 在全球的網絡部署和運營團隊會根據需要隨時隨地增加容量,並且在出現中斷的情況下儘快恢復服務——在 Twitter 轉發語中,Urs Hölzle 還總結稱:

引用COVID-19 不會損壞 Google 網絡。

儘管言辭懇切,但 Google 這次掉鏈子還是引起了一些擔憂。

外媒 ZDNET 所認為:

引用當我們擔心互聯網會給我們許多人從家裏工作和視頻會議取代會議帶來多大的負擔時,這令人擔憂地提醒我們:互聯網並沒有我們想要的那麼穩定。 是的,這個特定的實例的確與冠狀病毒沒有任何關係。 但是,如果僅僅是因為一台路由器故障,就將數千萬用户拋棄於 Google 服務之外,那就太令人擔憂了。

更何況,Google 尚且如此,那其他的互聯網服務提供商又會如何呢?

本文參考鏈接:

https://twitter.com/uhoelzle

https://www.blog.google/inside-google/infrastructure/keeping-our-network-infrastructure-strong-amid-covid-19/

https://www.zdnet.com/article/is-google-down-users-reporting-sporadic-outages/

https://www.zdnet.com/article/it-wasnt-just-you-why-google-suffered-widespread-outages/

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知

資料來源:雷鋒網
作者/編輯:李帥飛

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→