數(shù)據(jù)中心需要大量的專業(yè)和技術(shù)人員來保持穩(wěn)定的運(yùn)行。一般來說,負(fù)責(zé)重要業(yè)務(wù)的數(shù)據(jù)中心是一個(gè)24小時(shí)值班的數(shù)據(jù)中心。一般來說,沒有人值班的數(shù)據(jù)中心只能承擔(dān)不重要的業(yè)務(wù),幾乎沒有數(shù)據(jù)中心沒有完全的管理和維護(hù)。因此,數(shù)據(jù)中心的日常維護(hù)工作很繁瑣,但它非常重要。由于人們?cè)诠ぷ骱蜕钪型耆蕾嚁?shù)據(jù),運(yùn)行的數(shù)據(jù)中心在數(shù)據(jù)計(jì)算中發(fā)揮著越來越重要的作用,這突出了維護(hù)工作的重要性。
當(dāng)數(shù)據(jù)中心建立并投入運(yùn)行時(shí),維護(hù)將開始,直到數(shù)據(jù)中心的生命周期結(jié)束。一般來說,我們可以將數(shù)據(jù)中心的維護(hù)分為四類:第一類是日常檢查;第二類是應(yīng)用程序變更和部署;第三類是軟硬件升級(jí);第四,對(duì)于突發(fā)故障處理,讓我們?cè)敿?xì)討論這些維護(hù)工作,以便您了解維護(hù)工作。
日常檢查。
數(shù)千英里的堤壩在蟻巢中坍塌。任何故障都可能在發(fā)生之前出現(xiàn)。如果不消除小隱患,可能會(huì)導(dǎo)致重大故障。因此,數(shù)據(jù)中心的日常檢查很無聊,但及時(shí)發(fā)現(xiàn)一些隱患也很重要。根據(jù)數(shù)據(jù)中心業(yè)務(wù)重要性的不同,數(shù)據(jù)中心的所有操作設(shè)備都應(yīng)定期檢查。一些數(shù)據(jù)中心設(shè)備制造商提供檢查軟件,如網(wǎng)絡(luò)管理軟件、安全保護(hù)軟件等。您可以使用這些軟件檢查數(shù)據(jù)中心網(wǎng)絡(luò),查看日志是否有異常報(bào)警,網(wǎng)絡(luò)是否在短時(shí)間內(nèi)中斷,端口是否有up/down等。通過網(wǎng)絡(luò)檢測(cè)軟件檢查網(wǎng)絡(luò)質(zhì)量。檢查服務(wù)器應(yīng)用服務(wù)是否正常,CPU內(nèi)存和其他利用率是否正常。檢查應(yīng)用程序。例如,如果有搜索服務(wù),您可以通過服務(wù)器搜索單詞,看看它是否在正常搜索結(jié)果的范圍內(nèi)。如果有異常,應(yīng)及時(shí)處理和消除。如有必要,應(yīng)在備用環(huán)境中切換重要業(yè)務(wù),然后在排除后。
還應(yīng)檢查數(shù)據(jù)中心的機(jī)房環(huán)境,以及環(huán)境溫度、濕度和粉塵是否符合要求。空調(diào)和供電系統(tǒng)運(yùn)行良好,設(shè)備運(yùn)行是否過熱。地板、天窗、消防和監(jiān)控都是檢查部分。不合理的地方應(yīng)該及時(shí)糾正,不應(yīng)該懶惰。當(dāng)你經(jīng)常去一些數(shù)據(jù)中心時(shí),你會(huì)發(fā)現(xiàn)許多值班的維護(hù)人員正在瀏覽網(wǎng)頁(yè)和玩電腦游戲。我們甚至根本不檢查日常檢查。只要沒有故障,我們就會(huì)玩游戲,消耗時(shí)間。這樣,數(shù)據(jù)中心遲早會(huì)出現(xiàn)故障。一旦出現(xiàn)故障,我們就會(huì)粗心大意。我們甚至不知道哪個(gè)業(yè)務(wù)需要設(shè)備,哪個(gè)港口需要設(shè)備,哪個(gè)網(wǎng)絡(luò)電纜需要設(shè)備。起初,一個(gè)小故障可能會(huì)導(dǎo)致一個(gè)大故障,因?yàn)槲覀儾皇煜にR虼耍覀儾荒芴幚砣粘z查。雖然它需要重復(fù),但它非常重要。在連續(xù)檢查的過程中,我們將有越來越深的數(shù)據(jù)中心。通過這種方式,我們將在每次檢查中有一個(gè)新的發(fā)現(xiàn),并在檢查中進(jìn)行研究。
應(yīng)用變化。
數(shù)據(jù)中心所攜帶的業(yè)務(wù)將不會(huì)保持不變。隨著業(yè)務(wù)的多樣化,業(yè)務(wù)通常需要調(diào)整,包括服務(wù)器和網(wǎng)絡(luò)的設(shè)置。因此,為了熟悉服務(wù)器和網(wǎng)絡(luò)設(shè)備的操作,我們主要需要掌握Linux服務(wù)器命令和網(wǎng)絡(luò)協(xié)議。根據(jù)應(yīng)用程序的需要進(jìn)行更改。此時(shí),對(duì)維護(hù)人員提出了更高的要求。他們不僅應(yīng)該非常熟悉數(shù)據(jù)中心的原始業(yè)務(wù),而且還應(yīng)該正確地了解新的應(yīng)用程序業(yè)務(wù),以便在不影響原始業(yè)務(wù)的情況下進(jìn)行調(diào)整。這種應(yīng)用程序更改可能需要每月進(jìn)行幾次,這是數(shù)據(jù)中心維護(hù)人員的必要課程,突出了技術(shù)人員的基本技能水平。此時(shí),我們應(yīng)該熟悉設(shè)備的操作命令,并知道如何實(shí)現(xiàn)業(yè)務(wù)。我們應(yīng)該經(jīng)常與設(shè)備制造商的技術(shù)人員打交道,并通過溝通盡快掌握設(shè)備的操作方法。同時(shí),由于設(shè)備制造商缺乏應(yīng)用程序業(yè)務(wù),因此有必要在維護(hù)人員之間協(xié)調(diào)設(shè)備。
軟硬件升級(jí)。
數(shù)據(jù)中心設(shè)備的一般運(yùn)行周期為五年。有些設(shè)備需要逐步消除和更換。由于存在軟件缺陷,有些設(shè)備需要升級(jí)。因此,軟硬件升級(jí)也是維護(hù)工作的一部分。特別是當(dāng)軟硬件出現(xiàn)故障時(shí),必須進(jìn)行更換。有時(shí)候,設(shè)備制造商通常需要提供軟件補(bǔ)丁來解決這個(gè)問題,以免影響業(yè)務(wù)。數(shù)據(jù)中心設(shè)備數(shù)百,軟硬件故障的發(fā)生是正常的,因此需要不斷升級(jí)軟硬件。這類工作通常在早上之后進(jìn)行,業(yè)務(wù)量最少。維修人員熬夜是很常見的。維修人員應(yīng)具備良好的身體素質(zhì),否則將無法承受。在升級(jí)軟硬件時(shí),我們需要做好后退機(jī)制,防止升級(jí)問題無法恢復(fù),業(yè)務(wù)長(zhǎng)期無法恢復(fù)。當(dāng)你接管數(shù)據(jù)中心的維護(hù)時(shí),你會(huì)發(fā)現(xiàn)幾乎每個(gè)月都有這么多的升級(jí)。熬夜已經(jīng)成為維護(hù)人員的日常升級(jí)。
故障突然發(fā)生。
沒有數(shù)據(jù)中心沒有故障,這樣的問題會(huì)發(fā)生在數(shù)據(jù)中心中心的運(yùn)行過程中。此時(shí),顯示了維修人員的高技能水平。據(jù)統(tǒng)計(jì),80%的故障是人為故障,因此維修人員的水平往往決定了數(shù)據(jù)中心運(yùn)行的穩(wěn)定性。此外,對(duì)于突發(fā)故障,高級(jí)維修人員可以冷靜下來,冷靜分析故障觸發(fā)的原因,快速找到解決方案。如果他們?cè)诙虝r(shí)間內(nèi)找不到解決方案,他們也可以先恢復(fù)業(yè)務(wù),然后切換到備用設(shè)備進(jìn)行分析。此時(shí),數(shù)據(jù)中心擁有高水平的維護(hù)人員非常重要,可以在關(guān)鍵時(shí)刻使用。
雖然這些工作看起來很普通,但不要低估它們。事實(shí)上,數(shù)據(jù)中心的維護(hù)非常重要,這與整個(gè)數(shù)據(jù)中心業(yè)務(wù)的正常運(yùn)行有關(guān)。目前,這些專業(yè)人士在市場(chǎng)上非常受歡迎,尤其是那些深度排除故障的人。只有關(guān)注數(shù)據(jù)中心的維護(hù),我們才能給數(shù)據(jù)中心一個(gè)安全的機(jī)會(huì)。
掃一掃·免費(fèi)設(shè)計(jì)·咨詢
廣州氣宇消防設(shè)備有限公司 電話:020-31145279 傳真:020-31145279
網(wǎng)址:m.hkgd666.com 企業(yè)QQ:2951282212
辦公地址:廣州市番禺區(qū)南村萬達(dá)廣場(chǎng)B4棟2901-2902 / 2926-2967
工廠地址:廣州市番禺區(qū)化龍鎮(zhèn)草堂村農(nóng)業(yè)公司路13號(hào)(氣宇消防)
服務(wù)熱線:13710788484(周總)
全國(guó)免費(fèi)服務(wù)熱線
4001-8090-088
周一至周五9:00-18:00
技術(shù)支持:搜浪網(wǎng)絡(luò)