從零到卓越:規(guī)劃構建高效告警平臺的實戰(zhàn)路徑
在現(xiàn)代社會中,告警系統(tǒng)的重要性日益凸顯,它通過實時監(jiān)控和及時通知,幫助各個領域預防風險和應對異常情況,確保安全和穩(wěn)定運行。
告警系統(tǒng)在現(xiàn)代社會中扮演著越來越重要的角色。
告警系統(tǒng)是一個復雜而關鍵的系統(tǒng),它主要用于監(jiān)控、發(fā)現(xiàn)和通告潛在的風險或異常情況,以便及時采取措施進行應對。
通過不斷優(yōu)化和提升告警系統(tǒng)的功能、性能、穩(wěn)定、精準性,可以更好地保障各個領域的安全和穩(wěn)定運行。
01 告警平臺價值
提高生產效率,降低維護成本
告警平臺能夠實時監(jiān)控生產設備的運行狀態(tài),包括溫度、壓力、振動、電流、電壓等關鍵參數(shù)。
一旦這些參數(shù)超出預設的安全范圍或達到故障閾值,系統(tǒng)能立即發(fā)出告警,通知相關人員及時處理,從而避免設備損壞或生產中斷,確保生產線的高效運行。
告警平臺能夠及時發(fā)現(xiàn)設備故障,從而減少因設備停機導致的生產延誤和損失。這有助于降低因停機造成的直接和間接成本。
提升安全管理水平,優(yōu)化資源配置
在涉及高溫、高壓、易燃易爆等危險因素的生產環(huán)境中,告警平臺對于保障人員和設備安全至關重要。通過實時監(jiān)控和及時告警,系統(tǒng)能迅速識別并處理潛在的安全隱患,防止事故的發(fā)生。
告警平臺能夠根據(jù)告警信息的緊急程度和重要性,智能調度維護人員,確保資源得到最優(yōu)配置。這有助于提高維護工作的效率和質量。
推動技術進步,帶動產業(yè)升級
告警平臺的建設和發(fā)展,促進了傳感器技術、物聯(lián)網(wǎng)技術、大數(shù)據(jù)分析、人工智能算法等技術的不斷創(chuàng)新和應用。這些技術的融合和應用,為預警系統(tǒng)的智能化、精準化提供了有力支持。
隨著預警系統(tǒng)在各個領域的廣泛應用,相關產業(yè)鏈也得到了快速發(fā)展。從傳感器制造、數(shù)據(jù)分析軟件開發(fā)到系統(tǒng)集成服務等領域,都迎來了新的發(fā)展機遇。
提升企業(yè)競爭力
通過實時監(jiān)控和數(shù)據(jù)分析,企業(yè)可以及時發(fā)現(xiàn)生產過程中的問題并進行改進,從而提高產品質量。
告警平臺能夠縮短故障處理時間,提高生產線的穩(wěn)定性和靈活性,使企業(yè)能夠更快地響應市場需求變化。
02 告警平臺產品設計
1、角色用例
▲ 用例圖
告警平臺要正常運轉,服務于實際業(yè)務,需要四類角色,設備管理員、系統(tǒng)管理員、告警處理員、領導。
設備管理員:負責設備接入,提供設備信息采集,獲取告警的數(shù)據(jù)源;
系統(tǒng)管理員:負責系統(tǒng)的配置,尤其是告警規(guī)則、通知規(guī)則等基礎數(shù)據(jù)的配置;
告警處理員:負責告警的全生命周期管理,包含處理、驗證、關閉;當部分告警不能直接處理是,需要上報領導知曉;
領導:負責升級告警管理,包含處理、驗證、關閉;同時,也需要肩負起監(jiān)督告警處理員對告警的及時處理;
角色用例的分析,是明白有哪些人員角色參與系統(tǒng)操作、業(yè)務執(zhí)行,為深度業(yè)務分析提供突破口。
2、用戶故事
▲ 用戶故事
講清楚用戶故事,可以串聯(lián)完完整的業(yè)務流程,梳理清楚所有的分支流程,也為后續(xù)測試時提供全部檢驗條件。
什么事物 在什么時間 在什么環(huán)境 下觸發(fā)了哪些告警條件,以怎樣的值來報警。
- 實驗室3樓 – 302實驗室 – 溫度超過37度 – 橙色告警 – 通知實驗室管理員
- 豬舍3棟 氨氣濃度超過36 / m3 且 二氧化碳濃度超過 83 /m3 – 紅色告警 – 通知養(yǎng)殖場廠長
- 2樓206小會議室 – 火警 – 紅色告警誤報
- 實驗室3樓 – 302實驗室 – 溫度超過43度 – 紅色告警 – 通知樓長【告警級別升級】
- 實驗室3樓 – 302實驗室 – 溫度超過43度 – 紅色告警 – 通知樓長【之前還未處理,又有告警,告警升級】
- 綜合樓4樓 – 過道 – 風速偏大 – 藍色告警 – 通知保安室 – 忽略告警
在告警用戶故事這一塊,用戶故事1和5,梳理清楚同一個規(guī)則生成告警,前告警已處理、未處理的兩個不同流程。當前告警還未處理時,再次生成更高級別的告警,就是告警的升級。
在實際處理時,高級別告警處理后,前置的告警將再無處理必要。
3、告警業(yè)務流程
▲ 業(yè)務流程
設備接入為前置性條件,設備數(shù)據(jù)采集為告警提供數(shù)據(jù)源。告警業(yè)務擴寬,需要支持統(tǒng)計數(shù)據(jù)等作為數(shù)據(jù)源。
告警平臺系統(tǒng)管理員進行告警配置,包含告警規(guī)則、通知規(guī)則配置。告警規(guī)則主要配置哪個設備的哪個屬性值,在什么情況下生成告警;通知規(guī)則主要配置告警生成后通過哪些途徑通知哪些人。
告警處理流程包含處理、驗證、關閉;處理是針對出現(xiàn)的這個情況,有什么解決方案,可以確定誤報、忽略;
驗證是確認該告警的處理方案實際落地,比如溫度過高報警,通過打開空調的方式處理,驗證空調已打開,且溫度設置23度,是有效的處理方式。然后可以關閉報警,當前事項處理完成。
告警處理需要考慮,當前告警處理員處理不了這個告警的情況,支持告警升級。
業(yè)務流程中,為了提升便捷度,特別增加當告警被處理時,直接修改對應消息的狀態(tài),減少信息干擾。
4、ER圖設計
▲ ER圖
基于以上業(yè)務流程分析,拆解出來:告警規(guī)則、告警、告警消息規(guī)則、告警消息信息實體,也是告警平臺的主要庫表。告警的處理、升級、驗證、關閉都作為告警子表來進行設計。
拆解到ER圖的層級,是為了很好的跟前后端開發(fā)溝通。也便于從數(shù)據(jù)的角度理解系統(tǒng)中數(shù)據(jù)的存儲、查詢、更新。同時也明確主要信息,產品心中做到有數(shù)。
5、狀態(tài)機管理
▲ 狀態(tài)機
基于ER圖拆解,告警、告警消息的狀態(tài)進行詳細的拆分。
狀態(tài)機明確了告警、告警信息有哪些狀態(tài),各狀態(tài)下可執(zhí)行哪些操作,各狀態(tài)對應通過哪些操作進行狀態(tài)切換。
其中,告警消息有一個“待下發(fā)”狀態(tài),這個在業(yè)務上實際是不需要,只是為便捷信息溯源,確保數(shù)據(jù)生成到數(shù)據(jù)消失,全部都在可控范圍內。
03 升級告警平臺
系統(tǒng)建設、方案設計、產品設計,都可以遵循:路走通,路好走,路擴寬。
大道至簡,但中間的路途并非一馬平川的。
▲ 大道至簡
功能完善優(yōu)化
基于以上,完成了告警平臺核心功能的梳理和搭建。要提高一個產品的易用性,擴展產品的影響面,在交互細節(jié)上還需要更細致、更強化,需要盡可能補全所有的業(yè)務流程。
也可以預留一部分運維功能(如強制修改狀態(tài),可以讓業(yè)務流重新流轉)。
在告警平臺上,優(yōu)先補充“支持多條件組合告警”,實現(xiàn)更復雜、更有效的、更符合業(yè)務現(xiàn)狀的配置條件。
其次是補充“人工告警”,支持異常情況的手動告警路徑,確保在數(shù)據(jù)同步、規(guī)則判斷出現(xiàn)異常時,能夠有快速業(yè)務執(zhí)行的通道。
消息系統(tǒng)是個很好的輔助,通過消息來告知用戶是否需要關注。但若是消息過多、準確性不高,消息系統(tǒng)就容易成為雞肋。
在實際執(zhí)行中,要支持設置消息的忽略與靜默,在不恰當、不關鍵的場景中,不提示消息。另外,當業(yè)務已經(jīng)處理,最好將相關的消息置為已讀,不再吸引用戶的注意力,從而減少用戶的處理,減少系統(tǒng)對用戶的干擾。
擴展告警業(yè)務范圍、擴展告警信息源
當庫存低于安全閾值時,預警平臺可以自動提醒庫管進行補貨;當應收賬款逾期時,可以提醒財務人員關注并跟進。
在安全領域,預警告警平臺可以實時監(jiān)控網(wǎng)絡流量、系統(tǒng)日志等關鍵信息,一旦發(fā)現(xiàn)異常行為或潛在威脅,立即發(fā)出警報,有助于企業(yè)迅速響應并采取措施,保障系統(tǒng)安全穩(wěn)定運行。
告警對象分級分組管理
將告警信息按照重要性、緊急程度或影響范圍進行分層分類。例如,將告警分為事故類(1級)、異常類(2級)、越限類(3級)、變位類(4級)和告知類(5級)等不同級別。
對于不同級別的告警,制定相應的管理要求和處理流程。高級別的告警需要由專門的團隊或人員立即處理,而低級別的告警則可以由相對寬松的團隊或人員在規(guī)定時間內處理。
根據(jù)響應人員的專業(yè)技能、經(jīng)驗和職責范圍,將其分為不同的響應小組。每個小組負責處理特定類型或級別的告警。
例如,設立專門的網(wǎng)絡安全小組負責處理網(wǎng)絡安全相關的告警,而數(shù)據(jù)中心運維小組則負責處理服務器和存儲設備的告警。
告警系統(tǒng)通過實時監(jiān)控與分析、智能化告警處理、合理的資源分配算法以及響應人員的分組分級等策略,可以優(yōu)化資源配置并提高響應效率。
這些措施有助于企業(yè)更好地應對各種潛在風險和挑戰(zhàn),保障業(yè)務的連續(xù)性和高效性。
AI告警
隨著大數(shù)據(jù)、區(qū)塊鏈、虛擬幣等新技術新業(yè)態(tài)的不斷發(fā)展,新型電信網(wǎng)絡詐騙案件日益增加,嚴重影響網(wǎng)絡空間穩(wěn)定和人民群眾財產安全?;ヂ?lián)網(wǎng)預警勸阻平臺通過精準識別詐騙信息并提示潛在受害人,有效遏制了詐騙行為的蔓延。
利用人工智能和機器學習算法,實現(xiàn)告警的智能化處理。例如,采用動態(tài)閾值(區(qū)間檢測功能),根據(jù)歷史數(shù)據(jù)預測指標上下邊界,自動調整閾值,從而避免資源在靜態(tài)閾值下的浪費或不足。
引入趨勢性預測功能,根據(jù)歷史數(shù)據(jù)預測未來告警數(shù)量,以便企業(yè)提前準備資源,應對可能的問題。
告警平臺對于提高生產效率、降低維護成本、優(yōu)化資源配置、提升安全管理水平和提升企業(yè)競爭力等方面都具有重要意義。
新技術不斷發(fā)展,新業(yè)務需求不斷擴展,告警平臺也將在實際應用中完善、優(yōu)化、升級、進化。
本文由人人都是產品經(jīng)理作者【壹叁零壹】,微信公眾號:【壹叁零壹】,原創(chuàng)/授權 發(fā)布于人人都是產品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!