運維的本質是什麼?
可以啦,讓我們繼續相互陪伴。
看到的一個微博,說運維的本質是「可視化」,這個觀點不知道出自哪裡,但是非常的可笑。
很多觀點都是出自沒有實際經驗的人,這是技術界的悲哀。作為一個從事多年一線運維的普通工程師,我常常給新來的同學講,什麼是運維最本質的東西?
很簡單,運維的本質是「可控」。運維是一門非常複雜的學問,不像學會兩三門語言,設計幾個網站應用就可以成為架構師那樣的工作。他除了技術之外,經驗積累、視野、大局觀、甚至是心胸都有可能決定成敗。優秀的開發者比比皆是,但是優秀的運維人員少之又少。
原因就是運維內容太複雜了!而我為什麼說運維的本質是「可控」,大概有以下幾個原因:
第一點:穩定性「可控」
運維不是維護一兩台機器,發布代碼就好,而是要做成千上萬,甚至十幾萬台的伺服器和各種網路設備、存儲設備等專有設備維護,這些伺服器包含webserver,DB,cache,cdn,computing多種類型,如何讓這些大量的伺服器穩定的跑在生產環境中,不因為硬體損壞、發布變更、系統升級而引發的業務系統故障。沒有東西是不會壞的,沒有系統是沒有bug的。硬體要壞,系統升級,發布變更,這些都沒有關係,但是最重要的,一旦發生這些之後,運維人員知道,這會業務影響多大!?需要多少時間和工作量恢復?
第二點:性能「可控」
我和DBA一起維護DB多年,DBA最痛苦的地方,不在於「慢」,而在於時快時慢。一個不穩定的性能,就無法預估承受業務壓力需要的系統規模,這樣對於DBA在維護是無異於自殺。很多雲計算廠商做設計的時候,往往也會忽略這一點,其實性能的問題,比最高性能,來的重要的多!非常漂亮的數字不能解決問題,但是一次性能的不足,可能就引發故障。
第三點:安全「可控」
有沒有絕對的安全呢?理論上沒有,所以,運維的同學,總要花很多精力在系統安全上,比如控制哪些用戶可以登錄系統環境?哪些用戶是可以進行變更?哪些用戶甚至可以拿到最高許可權?測試和開發隔離,公司內外隔離,都是因此而生。只要能夠控制許可權的面積,範圍,就能知道風險,這邊是所謂的安全「可控」。
重要如上所示,但是正如一開頭所說,運維的內容相當複雜,交付「可控」,變更內容「可控」,效率「可控」都是可以值得深究的東西,因此,無論是「可視化」,「大數據」,「運維自動化」等等,都是在為「運維可控」服務的。數據可視化,帶來的是規模可控;運維自動化,帶來的是效率可控,風險可控,如是而已。
每一個點的提升,都是運維的提升,希望所有從事運維的同學,都能感受到,做什麼可以讓「可控力」提升,不要再半夜的時候處理故障,不要和女朋友看電影的時候回公司處理故障,也許我們再次遇到這些問題的時候,可以拿起一杯茶,做一個優雅的運維。
作者 | qqeyes
轉自 | 運維幫
原文 | http://t.cn/EPKWTD1


※終於知道程序員為什麼沒女朋友了
※趣圖:開發人員如何處理別人的代碼
TAG:程序員之家 |