重新發(fā)現(xiàn)遠(yuǎn)程管理和監(jiān)控的價值
By Calvin Nicholson, Legrand
COVID-19 封鎖迫使組織重新考慮他們開展業(yè)務(wù)和教育的方式,因為他們接受了遠(yuǎn)程工作工具。工作環(huán)境的這種近乎即時的轉(zhuǎn)變給 IT 和數(shù)據(jù)中心管理人員帶來了新的數(shù)據(jù)中心挑戰(zhàn),因為許多人無法親自動手進(jìn)行故障排除。
由于對物理 IT 基礎(chǔ)設(shè)施的訪問受限,網(wǎng)絡(luò)管理員比以往任何時候都更傾向于使用遠(yuǎn)程網(wǎng)絡(luò)管理和監(jiān)控工具來幫助重啟服務(wù)器和其他設(shè)備,關(guān)閉未使用的網(wǎng)點,這樣就不能在不知情的情況下安裝新設(shè)備,也不能收集一般數(shù)據(jù)。
盡管2020年數(shù)據(jù)中心的規(guī)模沒有增加太多,Gartner表示,2020年的支出下降了10%,但許多設(shè)施確實實現(xiàn)了指數(shù)級的服務(wù)需求,部分原因是大量遠(yuǎn)程工作者使用新應(yīng)用程序。這給IT管理帶來了很大的壓力,因為許多數(shù)據(jù)中心在 IT 人員減少和人力資源要求減少的情況下運行,從而限制了人員進(jìn)入設(shè)施。
國際正常運行時間協(xié)會(Uptime Institute)的一項調(diào)查強(qiáng)調(diào)了這一問題,他們詢問了全球200多家關(guān)鍵IT/設(shè)施基礎(chǔ)設(shè)施運營商,“在未來90天內(nèi),COVID-19對貴公司的關(guān)鍵IT基礎(chǔ)設(shè)施運營構(gòu)成的頭號風(fēng)險是什么?”多達(dá)32%的人選擇:減少IT基礎(chǔ)設(shè)施運營人員的級別。
遠(yuǎn)程管理的價值
雖然IT和數(shù)據(jù)中心管理人員在物理上距離其數(shù)據(jù)中心很遠(yuǎn),但他們也轉(zhuǎn)向了電源設(shè)備,如直接連接到網(wǎng)絡(luò)的Switched PDUs,因此他們可以遠(yuǎn)程管理設(shè)備。這些switch pdu提供的一些最有價值的功能是遠(yuǎn)程命令和控制電源負(fù)載的功能,例如:
- 遠(yuǎn)程重啟和啟動順序。重新啟動并不總是容易的——特別是對于多站點數(shù)據(jù)中心或托管設(shè)施。重新啟動可以從web界面遠(yuǎn)程執(zhí)行,無需部署服務(wù)技術(shù)人員。
- 電力負(fù)載調(diào)度。不可否認(rèn)的事實是,數(shù)據(jù)中心運行的服務(wù)器實際上什么都不做,這是在浪費能源。Switched PDU提供了在每個插座/設(shè)備基礎(chǔ)上遠(yuǎn)程管理電源計劃的能力。
- 鎖定可用的插座。有時機(jī)架沒電或相位需要重新平衡。使用Switched PDU提供了將插座從“斷電”模式切換到“通電”狀態(tài)的能力,這對于管理臨界負(fù)載和確保正常運行時間非常重要。
環(huán)境監(jiān)測的價值
不用說,如果您不了解其環(huán)境和相關(guān)元素,就很難遠(yuǎn)程管理數(shù)據(jù)中心。靜態(tài)且以孤島模式工作的可視化建模工具與其他關(guān)鍵工具(如數(shù)據(jù)中心基礎(chǔ)設(shè)施監(jiān)控 (DCIM))幾乎沒有集成。這通常迫使管理人員梳理 CAD 圖紙以查明故障設(shè)備。然而,在大流行期間,數(shù)據(jù)中心經(jīng)理開始更深入地研究設(shè)備和工具,這些設(shè)備和工具提供了大量的運營可見性。
在數(shù)據(jù)中心使用的設(shè)備中,環(huán)境監(jiān)測傳感器發(fā)揮著重要作用。就像眾所周知的礦工的金絲雀一樣,環(huán)境傳感器一直在幫助IT和數(shù)據(jù)中心專業(yè)人員監(jiān)控機(jī)柜周圍的健康狀況,并對可能危及IT資產(chǎn)性能和壽命的潛在問題發(fā)出警報。所有類型的數(shù)據(jù)中心(edge、core和colo)都依賴智能傳感器工具,提供對IT設(shè)備機(jī)架內(nèi)部和周圍環(huán)境健康狀況的準(zhǔn)確洞察。
如今,大部分 IT 設(shè)備都經(jīng)過優(yōu)化,可以檢測和報告不利的操作條件,因此管理人員可以在代價高昂的問題出現(xiàn)之前迅速采取行動——甚至是在家中遠(yuǎn)程管理。此外,智能傳感器還可以通過以下方式幫助 IT 和數(shù)據(jù)中心專業(yè)人員:
- 防止過冷、冷卻不足、靜電放電、腐蝕和短路。
- 降低運營成本、推遲資本支出、延長正常運行時間并提高未來增長的能力。
- 提供環(huán)境監(jiān)測并提醒管理人員注意潛在問題,例如存在水、煙霧和打開柜門。
- 基準(zhǔn)溫度(也稱為設(shè)定點)每向上變化度數(shù),最多可節(jié)省 4% 的能源成本。
- 幫助填充 AI、ML 和其他未來計劃。
- 為分布式數(shù)據(jù)中心運營的多維視圖提供有價值的信息。
真正重要的數(shù)據(jù)饋送儀表板
大多數(shù)數(shù)據(jù)中心使用某種類型的網(wǎng)絡(luò)運營中心 (NOC) 儀表板運行,該儀表板可聚合多個來源的信息,但這有時會導(dǎo)致不準(zhǔn)確。如果數(shù)據(jù)不可信,決策就會有缺陷,如果決策有缺陷——需要到機(jī)架上驗證信息。獲取準(zhǔn)確的信息不是火箭科學(xué),可以由設(shè)備級別的智能傳感器和智能 PDU 自動收集,以提供那些值得信賴的環(huán)境洞察力。
真正重要的數(shù)據(jù)將產(chǎn)生可靠的運營洞察力,如果以用戶友好的格式顯示,管理人員將參與其中。數(shù)據(jù)中心信息管理 (DCIM) 解決方案通過獲取豐富的實時測量數(shù)據(jù)并將其與詳細(xì)的資產(chǎn)管理(包括完整的電力鏈連接可配置性)相結(jié)合,提供了輕松的交互。無論是否因為疫情封鎖,使用 3D 儀表板,數(shù)據(jù)中心管理人員可以從遠(yuǎn)程位置查看其設(shè)施的環(huán)境條件——比實際在現(xiàn)場要好。
向DCIM儀表板中提供的聚合數(shù)據(jù)允許IT和數(shù)據(jù)中心管理人員查看服務(wù)器機(jī)架和通往機(jī)柜的路徑,并可以很容易地深入到單個機(jī)柜中,以獲得所有計算設(shè)備的視圖,包括名稱、型號和狀態(tài)。
但它并不僅僅停留在機(jī)架層面,它的可見性延伸到機(jī)柜之上,深入到分接箱關(guān)鍵電源監(jiān)控,可以用作軌道母線槽系統(tǒng)的一部分,也可以作為一個獨立的解決方案。在3D儀表板上簡單地雙擊一個關(guān)閉框,就會顯示出瓦、安培、伏特或千瓦的實時信息。所有這些詳細(xì)信息都保存在一個模型庫中,以消除冗余數(shù)據(jù)輸入,包括:哪些協(xié)議在新單元上啟用;DCIM集成信息和負(fù)載均衡數(shù)據(jù)。
從 PDU 獲取的遠(yuǎn)程監(jiān)控數(shù)據(jù)使 DCIM 儀表板能夠顯示電源資源的運行情況以及它們在機(jī)架級別的消耗情況。憑借這種洞察力,IT 和數(shù)據(jù)中心經(jīng)理可以更好地規(guī)劃容量變化。此外,通過 PDU 和傳感器的數(shù)據(jù)饋送,他們還可以接收到以下信息:
- 內(nèi)閣的溫度。
- 智能機(jī)架式pdu或母線槽分接箱電流異常。
- 濕度的波動。
一個好的經(jīng)驗法則是始終尋找能夠與所有 BMS、DCIM 或其他工具(如 Splunk 或 Tableau)集成的智能 PDU。
結(jié)論
如果說數(shù)據(jù)中心和IT經(jīng)理曾經(jīng)有過擁抱他們的遠(yuǎn)程管理和監(jiān)控工具的時候,那就是在大流行開始的時候。即使是現(xiàn)在,疫苗接種正在遏制COVID-19的傳播,很大比例的工作人員仍將留在或部分留在偏遠(yuǎn)地區(qū)。在Gartner最近的一項調(diào)查中,90%的人力資源主管表示,即使COVID-19疫苗廣泛可用,員工也將被允許遠(yuǎn)程工作,是的,這包括IT專業(yè)人士。
在可預(yù)見的未來,數(shù)據(jù)中心將繼續(xù)提供高需求的服務(wù)。但是,為了滿足需求,管理這些關(guān)鍵任務(wù)服務(wù)的人員還必須使用工具,使日益增長的遠(yuǎn)程工作人員能夠不斷監(jiān)控閾值、預(yù)測容量利用率、設(shè)置電壓陷阱,并平衡數(shù)據(jù)中心的環(huán)境條件。部署智能傳感器、傳感器管理、PDU、分接箱和DCIM解決方案來實現(xiàn)3D儀表盤,將使遠(yuǎn)程工作者能夠進(jìn)行他們的工作——通常比走在服務(wù)器島或電源路徑上進(jìn)行實際評估更快。