教你如何在CentOS 6.5下部署Open-Falcon監控系統
註:本次安裝為測試環境,使用CentOS 6.5的系統,所裝軟體均為直接yum,如果線上部署,請使用公司提供的軟體版本。
1、介紹
監控系統是整個運維環節,乃至整個產品生命周期中最重要的一環,事前及時預警發現故障,事後提供翔實的數據用於追查定位問題。監控系統作為一個成熟的運維產品,業界有很多開源的實現可供選擇。當公司剛剛起步,業務規模較小,運維團隊也剛剛建立的初期,選擇一款開源的監控系統,是一個省時省力,效率最高的方案。之後,隨著業務規模的持續快速增長,監控的對象也越來越多,越來越複雜,監控系統的使用對象也從最初少數的幾個SRE,擴大為更多的DEVS,SRE。這時候,監控系統的容量和用戶的「使用效率」成了最為突出的問題。
亮點和功能
強大靈活的數據採集:自動發現,支持falcon-agent、snmp、支持用戶主動push、用戶自定義插件支持、opentsdb data model like(timestamp、endpoint、metric、key-value tags)
水平擴展能力:支持每個周期上億次的數據採集、告警判定、歷史數據存儲和查詢
高效率的告警策略管理:高效的portal、支持策略模板、模板繼承和覆蓋、多種告警方式、支持callback調用
人性化的告警設置:最大告警次數、告警級別、告警恢復通知、告警暫停、不同時段不同閾值、支持維護周期
高效率的graph組件:單機支撐200萬metric的上報、歸檔、存儲(周期為1分鐘)
高效的歷史數據query組件:採用rrdtool的數據歸檔策略,秒級返回上百個metric一年的歷史數據
dashboard:多維度的數據展示,用戶自定義Screen
高可用:整個系統無核心單點,易運維,易部署,可水平擴展
開發語言: 整個系統的後端,全部golang編寫,portal和dashboard使用Python編寫
2、部署
Open-Falcon採用server-agent方式來實現監控。下面是具體的部署情況:
2.1、一體化部署後端
本次測試環境,進行單機部署,所有模塊都放在一台主機上,如果有需要分散式部署,請參考官方文檔https://book.open-falcon.org/zh_0_2/distributed_install/,分散式只需要將模塊遷移到其它伺服器,修改配置文件即可,十分簡單。
2.1.1、環境準備
open-falcon的後端組件都是使用Go語言編寫的,所以我們需要先安裝Go語言開發環境
安裝redis
安裝mysql並啟動
測試機是centos6的,其餘系統自行更改啟動命令
初始化MySQL表結構
2.1.2、安裝
創建工作目錄
下載編譯好的二進位包並解壓
2.1.3、配置文件
在啟動之前,需要修改各模塊的配置文件,保證資料庫的用戶名和密碼正確。下面是各個模塊的配置文件路徑。
2.1.4、啟動
2.2、部署前端
克隆前端組件代碼
安裝依賴包
安裝python依賴環境
修改dashboard配置文件,修改資料庫的用戶名和密碼,保證dashboard能連接資料庫。
啟動
訪問網站 http://IP:8081 ,剛登陸需要註冊用戶,註冊的第一個用戶名為root的帳號會被認為是超級管理員,超級管理員可以設置其他用戶為管理員。


※8年後重登王座 Python 再度成為TIOBE年度編程語言
※NVIDIA面目生成器再做突破
TAG:Linux資訊速推 |