機會,永遠只會留給有準備的伺服器
從本周三開始,Facebook及其旗下Instagram、WhatsApp、Messenger等App,在全球範圍內遭遇大規模宕機。根據專供用戶報告應用程序及站點問題的網站Downdetector數據顯示,關於這場宕機事故的日內最高報錯人數達到1.2萬。
更為尷尬的是,因為部分伺服器的故障時間長達10-24小時,用戶完全無法登陸,Facebook最終不得不在推特上發布公告,通知用戶宕機的實時調查結果。
這邊扎克伯格焦頭爛額,而另一邊,趁著Facebook伺服器配置變更導致宕機期間,其競爭對手Telegram的新用戶註冊量突然迎來激增。Telegram聯合創始人帕維爾·杜羅夫(Pavel Durov)表示,「在過去24小時中,我看到Telegram迎來了300萬新註冊用戶」。
Telegram「收化運發」的功夫不可謂玩得不漂亮,但實際上每次有高人氣網站出現宕機情況時,同類型網站人氣暴增也已經成為了慣例。而這對於後者來說,無疑是難得的吸粉好機會——但前提是這些網站的伺服器也要做好準備。
過去微博也曾因為新版本用戶協議引起大量用戶不滿,大量常駐畫師提議轉投另一家平台pawoo。結果沒有任何準備的pawoo在幾小時後伺服器就宕機,而讓人無語的是,根據pawoo的公告顯示,造成伺服器宕機的激增用戶數量,不過是3小時內湧入2700名新用戶而已。
所以說,機會,永遠只是留給有準備的伺服器。
所以有能力的公司,向來都極為重視伺服器架構方面的技術升級,並且大多數互聯網公司都有自己的伺服器容災系統,以防止平台宕機帶來使用體驗不便,或者對數據安全造成隱患。
就拿移動支付來說,如今不少年輕人交通出行刷乘車碼,購物消費刷二維碼,甚至儲蓄、理財也統統集中在手機電子錢包上。你能想像有一天,支付寶或者微信錢包突然宕機超10多個小時嗎?
不過大家可以放心,支付寶在相關技術上從來不含糊。去年在杭州舉辦的雲棲大會ATEC主論壇現場,螞蟻金服就展現了自家機房所採用的「三地五中心」的架構。簡單來說,就是在3座城市部署5個機房,擁有這樣一個架構,就算3座城市裡有一兩個機房發生故障導致斷網,支付寶的底層技術系統也可以將故障城市的流量全部切換到運行正常的機房,還能保證數據一致且零丟失。
為了驗證這一架構的安全性,支付寶還在當年那場活動中讓工程師當眾剪斷了自家機房的光纜(當然,只是特別技術演練)。僅僅20秒的「系統異常」之後,整個系統就恢復了正常。
其實,這種在相隔較遠的異地,建立兩套或多套功能相同系統,互相之間進行健康狀態監視和功能切換的伺服器容災系統,正逐漸成為很多互聯網公司的「標配」。
除此之外,有些常用的社交平台還需面對特殊時間段流量暴漲給伺服器帶來的壓力。比如大家日常使用的微博,在節假日往往會迎來流量的高峰,如果有明星毫無預警地在微博上宣布分手/交往/結婚/離婚,更是會讓流量如搭火箭一般一飛衝天。那麼在這裡,節假日的流量高峰還可以預估,娛樂圈的突發事件則是讓人猝不及防。
比如當初鹿晗關曉彤公布戀情時,正值微博搜索工程師丁振凱大婚之日,因為微博流量暴漲擠垮伺服器,工程師只能在結婚現場緊急加班。而據微博CEO@來去之間 透露,當天更是緊急租用增加了1000台阿里雲伺服器來應對流量高峰,才保證了後續平台的良好運行。
指望明星在曝出猛料之前和微博工程師先打聲招呼,顯然並不現實。為了應對突發流量高峰,微博最終開發了一套通用的智能彈性調度系統,能實時監測業務的冗餘度,並按需進行全自動化的擴縮容,無需人為干預。坊間曾有傳言,現在微博的自動擴容系統,已經可以同時容納8位明星並發出軌,所以也被稱為「八軌系統」(誤)。
自從微博用上這套自動擴容系統之後,不管是唐嫣羅晉宣布結婚、還是武俠小說泰斗金庸逝世,又或者是IG奪冠王思聰抽獎,都順利扛住了流量高峰給伺服器帶來的壓力。
儘管互聯網公司為了伺服器不宕機作出了這麼多努力,但是還是難保天有不測風雲。對於目前一些技術上還難以攻克的難關,程序員也只能用一項流傳了千年的古老秘法——求神拜佛(包括但不限於燒香、貼符、開光、跳大神等),藉助玄學的力量來解決宕機的問題了。
【本文圖片來自網路】


※變單車、變金幣?押金圈的「潛規則」有多少把戲
※戲說網事:「BAT,這可使不得!」
TAG:三易生活 |