運維工(gōng)程師必備利器|一招實現(xiàn)運維智能(néng)化
發布時(shí)間:2023-05-04 閱讀: 分享

簡介

現(xiàn)如今,随着日益增速的業務環境,運維在企業中的角色越來(lái)越重要。如何在錯綜複雜(zá)的IT系統架構中降低(dī)現(xiàn)場故障處理(lǐ)時(shí)間、提高(gāo)運維效率,是每個IT運維工(gōng)程師都必不可少的技能(néng)。

爲解決上(shàng)述運維人員困境,2021年12月30日,雲智慧AIOps社區(qū)邀請(qǐng)雲智慧開(kāi)發運維工(gōng)程師Larry Zhang在線分享了(le)開(kāi)源運維管理(lǐ)平台OMP的功能(néng)特性、使用(yòng)場景等關鍵内容,更是通過實踐操作(zuò)詳細地介紹了(le)如何通過OMP實現(xiàn)運維智能(néng)化。

什(shén)麽是OMP?

OMP是雲智慧自(zì)主設計(jì)研發,集輕量級、聚合型、智能(néng)運維爲一體的綜合運維管理(lǐ)平台,具備納管、部署、監控、巡檢、自(zì)愈、備份、恢複等功能(néng)。通過減輕交付難度,提升運維自(zì)動化、智能(néng)化,進而提升運維整體效率,保障業務運行的連續性和(hé)安全性。

OMP功能(néng)特性介紹

  • 主機納管

OMP支持頁面添加和(hé)批量添加兩種方式納管主機。添加過程中OMP會(huì)驗證主機SSH連接信息,驗證通過後即可創建主機。此外(wài),主機創建完成後OMP會(huì)自(zì)動安裝 Agent端,安裝完成後也(yě)會(huì)自(zì)動對(duì)主機進行監控。點擊監控按鈕可以查看(kàn)主機監控面闆,通過主機詳情頁面也(yě)可以查看(kàn)主機詳細信息及曆史記錄。


圖片


  • 服務發布

OMP支持頁面上(shàng)傳和(hé)後端掃描兩種方式發布服務包。使用(yòng)者可以根據實際情況選擇适合的方式發布服務包,OMP會(huì)對(duì)服務包進行驗證,驗證通過後,即可成功發布。服務包發布成功後,會(huì)在應用(yòng)商店(diàn)中展示所發布的服務列表,使用(yòng)者可以點擊查看(kàn)進入到(dào)服務詳情頁面,查看(kàn)服務詳細信息。


圖片


  • 服務管理(lǐ)

在應用(yòng)商店(diàn)點擊安裝,選擇服務版本後,進入安裝流程。涉及到(dào)依賴信息的服務,OMP會(huì)自(zì)動将依賴服務顯示出來(lái),保障服務安裝完後的可用(yòng)性。此外(wài),使用(yòng)者可根據選擇的服務數量,進行服務分布和(hé)服務配置修改。安裝過程中,OMP會(huì)優先安裝依賴服務,點擊“查看(kàn)詳細安裝信息”後 可查看(kàn)安裝腳本輸出内容。安裝完成後OMP會(huì)自(zì)動對(duì)服務監控,在服務列表中可以對(duì)服務進行停止、啓動、重啓、卸載等操作(zuò)。


圖片


  • 監控告警

異常清單中會(huì)展示正在處于告警狀态指标數據,幫助使用(yòng)者了(le)解當前異常主機、服務。通過點擊監控按鈕,可以查看(kàn)該服務的監控面闆。告警記錄可以幫助使用(yòng)者查看(kàn)曆史告警信息,通過點擊監控按鈕,可以查看(kàn)該服務的監控面闆。此外(wài),監控設置中使用(yòng)者可以根據實際情況,配置監控組件的地址信息,也(yě)可以開(kāi)啓郵件推送,選擇告警信息接受郵件。


圖片


  • 狀态巡檢

OMP中巡檢共分爲3個維度,分别是 深度分析、主機巡檢、組件巡檢,在巡檢記錄中選擇所需的巡檢内容即可。巡檢執行完成後,可以在線查看(kàn),或者導出巡檢報(bào)告,也(yě)可以通過郵件推送報(bào)告到(dào)指定郵箱。


圖片


  • 默認指标

使用(yòng)者可以在指标中心統一設置默認的告警指标,告警指标會(huì)對(duì)巡檢、監控同時(shí)生效,當主機或服務資源使用(yòng)超過阈值時(shí),觸發告警。


圖片


  • 系統設置

當納管主機或服務需要升級或維護時(shí),可以開(kāi)啓維護模式。維護模式下(xià),OMP會(huì)抑制所有告警通知(zhī)。通過郵件設置,可以設置發件郵箱信息。


圖片


OMP使用(yòng)場景分析

  • 多雲環境集成
  • 快(kuài)速部署環境
  • 主機批量管理(lǐ)
  • 自(zì)動監控告警
  • 資産信息記錄

OMP實操答(dá)疑解惑

  1. OMP中巡檢的目的是什(shén)麽?

巡檢的目的主要是對(duì)主機和(hé)服務時(shí)間做狀态快(kuài)照,以此可以查看(kàn)該時(shí)間段主機和(hé)服務的狀态。

  1. 巡檢和(hé)監控的區(qū)别是什(shén)麽?

巡檢的顆粒度更細一些(xiē),主要是對(duì)内核等信息進行監控;而監控隻會(huì)對(duì)主機CPU等級别信息的一個監控。

  1. OMP中監控是用(yòng)什(shén)麽技術實現(xiàn)的?

目前是通過prometheus操作(zuò)實現(xiàn)。

  1. OMP能(néng)采集到(dào)設備上(shàng)的日志嗎?

目前OMP采集的是服務日志,可在安裝包中指明(míng)服務日志路徑進行日志采集。

  1. OMP所有組件都開(kāi)源了(le)嗎?

是的,目前OMP所有的組件均已開(kāi)源。歡迎大(dà)家登陸Github或Gitee點贊支持~

OMP GitHub 地址: https://github.com/CloudWise-OpenSource/OMP

OMP 國内鏡像地址: https://gitee.com/CloudWise/OMP


13905190502 南京市玄武區(qū)洪武北路188号長發數碼大(dà)廈11樓E座
友情鏈接
百度 網絡安全和(hé)信息化委員會(huì) FreeBuf網絡安全行業門(mén)戶

分享:
Copyright © 2020-2022 南京明(míng)科網絡科技有限公司 版權所有  
技術支持:飛(fēi)酷網絡