運維人:「背鍋」非我所欲,運維恰如人生
專業的原創深度技術分享,值得收藏
當我們聊到運維的時候,很多人的第一反應都是「背鍋俠」,這或許就代表了一個很主流的對運維的定位。但是,當我們深入了解 Google 的 SRE 以及 Netflix 的 Core SRE 這些崗位時,又能感受到運維令人神往的魅力。那到底該如何來定義運維?美麗聯合集團技術服務經理趙成結合他自己的經歷談了對這個事情的看法,或許能夠帶給你一些啟發。本文節選自極客時間專欄《趙成的運維體系管理課》。
作者簡介
我是怎麼開始做運維工作的?
我當時是在華為電信軟體部門,大家熟知的簡訊、彩信、智能網、BOSS 計費系統以及運營商客服系統等都是這個部門的產品。我到公司沒多久就進入了一個新成立的項目組,為運營商開發一個閱讀類互聯網產品,因為是工作後參與的第一個正式項目,從需求討論、方案選型、代碼開發到上線這樣一路跟來下,幾乎傾注了我所有的熱情。當時完全是封閉式開發,除了吃飯睡覺,其它時間基本都用在這個項目上,周六日都是泡在公司的。
項目上線之後,基於運營商海量用戶的積累,業務量很快就增長上來了,按照慣例,各種系統問題、故障宕機也隨之而來了。當時我們團隊規模不大,大家也都是齊心協力,出現問題我們總是一群人一起衝上去解決問題。之所以有這樣的反應,主要是因為不忍心看到自己和團隊一手打造出來的系統出問題。在華為,軟體質量的榮譽感勝過一切。
因為我經驗尚淺,所以一開始都是跟在後面看著主管和老員工解決,後來對於一些疑難問題,我就會主動要求接過來研究一下,有時候一個問題要研究好幾天才會有些眉目,不過也是在這樣的一個過程中,隨著解決的問題越來越多,經驗也就越來越豐富,很快就成長了起來。再加上我一直是出現問題後,第一個做出響應和衝到最前面的那個人,主管和團隊也對我有了足夠的信任和認可,也正是因為獲得了這樣的信任和認可,後來我得到的成長機會就越來越多。
這裡就分享一點:
要敢於承擔責任,敢於表達自己的想法。特別是對於職場新人,只有承擔,且敢於承擔更多更重要的責任,才能夠快速成長起來。一些重要事項,主管肯定是優先安排最穩妥和靠譜的人去做,這個時候老員工的優勢會更明顯,作為新人或經驗尚淺的員工,如果沒有積極主動的態度和令人放心的表現,很多好機會往往就與你失之交臂了。
對這個階段做個總結,我更願意承擔一些非常具有挑戰性的工作,成長得就比較快。同時,在客戶層面,我又相對比較願意表達見解和意見。雖然那個時候沒有什麼溝通技巧,也沒什麼表達技巧,甚至有些時候是笨嘴拙舌的,但是,很多時候技巧是次要的,最關鍵的是要敢於表達,當團隊需要這樣一個角色時,是不是有人能夠站出來承擔起這個職責。慢慢地我在客戶層面也得到了一定的認可和信任,成為一個真心誠意、關鍵時刻能靠得住的一個人。通過這樣一個階段,我不但在技能深度上有了積累,在廣度上也體現出了明顯的優勢。
我為什麼會把運維當作職業發展的方向?
這個階段大約也就 1 年左右,我的主管就開始跟我溝通,由我來組建這個產品的運維團隊,把線上運維、穩定性和部分客戶溝通工作完全交給我。
可能有些人覺得做運維是很低級的事情,讓你做運維就是讓你去填坑,其實對於這樣的言論我是十分反對的。當然,更多的時候我也不是去解釋,而是靠做事情來證明。
說回到當時的事情上,當時主管在跟我溝通獨立帶一個運維團隊時,我的感受不僅僅是晉陞層面的喜悅,更多的是因為能夠做運維而感到非常自豪。
為什麼會非常自豪,這就不得不提到華為內部,在當時來講,就已經有非常完善和先進的運維體系和運作機制了,我們一起來看一下。
在華為內部,運維是非常受尊重而且非常關鍵的崗位。如果你在研發團隊中一直寫代碼,沒有做過運維工作,是很難晉陞高級別崗位的。所以華為的架構師、技術經理甚至是更高級別的研發主管,按照不成文的規定,都默認要在運維團隊輪崗過,然後再選拔出來。而且這裡面最最關鍵的是,運維這個崗位不是你想做就能做的,是有條件要求的。
下面我們就來看看有什麼樣的條件要求。我當時是在華為電信業務軟體部,華為的運維體系分為一、二、三線,我們分別來看。
一線維護
這個團隊是負責產品的交付服務和後續的客戶服務工作。從技能上,很像傳統運維,主要是對網路設備、硬體主機和操作系統層面要熟練。一方面要負責交付的項目管理;另一方面,也是非常重要的一點,要對一線客戶滿意度負責,也就是客戶反饋的所有問題,甚至是客戶工作中表現出來的喜怒哀樂都要關注。
一線維護,最重要的就是必須要有非常強的服務意識。
二線技術支持
因為一線維護面對的是單個具體的運營商,在遇到一些問題的時候,往往沒有經驗,但是二線因為要面對某個產品全球的局點問題,所以在經驗上更容易沉澱和積累。當某個一線團隊遇到沒有經驗的問題時,二線有可能就可以很快很好地幫忙解決,而不用直接透傳到三線。同時,二線還要做好統籌協調,因為一線過來的問題不僅僅是產品本身問題,也可能是網路設備、硬體、操作系統、存儲甚至資料庫等的問題,這就需要二線幫助一線協調專家資源進行處理,而不是一線再一個個找人,這時一線只管反饋問題即可。
二線技術支持,大多由產品研發或者一線維護經驗的人員抽調上來的,即使沒有這些經驗,也要下放到一線去鍛煉很長時間,兩三年都有可能,所以技術和經驗上都相對更加全面,同時能夠有較強的推進協調能力。
三線研發維優
到了三線就是研發團隊中的運維團隊了,這個團隊在華為叫做維優團隊。這個團隊就很牛了,一般都是從開發骨幹精挑細選出來的,一方面是為了鍛煉人,另一方面也是為了在出現問題時,能夠有最專業、能力最強的人響應處理。處理問題的過程中,還會不斷完善工具體系,提升日常維護和問題定位的效率。因為三線同樣要面對全球局點問題,所以 7*24 響應,而且常年無休,比我們現在互聯網運維的工作負荷要大得多,所以這個團隊成員一般做個 1~2 年就會轉崗晉陞,不然身體肯定是承受不住的。
三線研發維優,這個團隊的成員就像軍隊中的突擊隊或尖刀連一樣,總是沖在最前面,在高壓狀態下,解決最複雜、最棘手的問題,所以從選拔階段,就有非常高的要求。最終經過這個團隊磨練出來的人,技術能力、溝通協作能力以及全面解決問題的能力,都是非常突出的。自然地,在晉陞發展方面就會有更大競爭優勢。
上述這樣一個非常嚴密的一、二、三線運維機制和協作體系,各條線各司其職,發揮各自優勢作用,串聯起了客戶、產品和研發整個技術支持體系,基本上就支撐起了華為電信軟體在全球局點的技術支持和服務工作,這一點還是很強大的。也因為各自都有獨特的價值體現,所以運維崗位上人員的存在感和成就感就會比較強,當然就不會覺得做運維是很低級的事情。同時,因為人員非常優秀,能力突出,這個崗位得到尊重也是必然的,甚至是令人嚮往的。
其實,能夠得到尊重,還有非常重要的一點,就是來自華為對客戶和用戶的尊重,真正的把「客戶第一」融入到了整個公司的組織架構和運作機制中。
這裡我們不做過多發散,理解下來就是誰離客戶最近,誰對客戶負責,誰就能代表客戶,誰就有最大的話語權,甚至是指揮權和決策權。體現在上述我們所說的運維機制上,就是:一線的聲音,代表了客戶聲音;一線反饋到二線的問題,二線必須響應;二線傳遞到三線的問題,三線必須響應。
這套機制的根本目的,還是為了促進整個體系能夠以儘快解決問題、提升軟體質量為目標。整個團隊樹立起這樣的觀念,就自然會對質量和問題有敬畏感,研發維優那個時候大多都是遠程電話與一、二線溝通,潛意識裡就會把一、二線作為他們的客戶,同樣保持謙卑和尊重。
所以,無論是從對運維的定位上,還是整個公司文化以及運作機制上,都形成了對這個崗位的高度定位和尊重。
當時華為的三線研發維優,其實很像 Google 的 SRE 崗位,各方面能力要求很高,不僅僅是軟體開發這麼簡單,所以當時讓我去做運維,並且給到我足夠的授權去組建和帶團隊,就相當於讓我去做 SRE 這樣高端的崗位,我自然會覺得非常自豪。
再往後,在這個專業方向上做精做細,形成差異化的優勢,自然就會有更大的收穫。
給我們的一點啟發
這樣的一個發展過程並不是我刻意設計過的,機會也不是刻意爭取到的,就是平時多做一點,做得認真一點,確保最終能夠拿到結果,而且稍微努力一下,盡量拿到比預期好一些的結果。在這個過程中,隨著個人能力的提升和全面發展,後續各種機會也就隨之而來了。
總結起來確實就是這麼平淡無奇,但在運維崗位,我做到了從普通到優秀。
做運維如此,其他崗位亦如此。
《趙成的運維體系管理課》全年目錄
本文摘自趙成在極客時間 App 開設的付費專欄「趙成的運維體系管理課」,歡迎掃描下圖二維碼了解專欄詳情並閱讀試讀文章,在極客時間留言,一起參與討論。


※2018人工智慧怎麼玩?中科院專家山世光、360首席科學家顏水成等技術大咖來教你!
TAG:InfoQ |