發(fā)布于:2021-01-29 13:46:53
0
123
0
多年來,隨著我們的基礎(chǔ)架構(gòu)遷移到云中,它變得更加抽象和可自我糾正。在這段時(shí)間里,很難忘記的是,當(dāng)出現(xiàn)嚴(yán)重錯(cuò)誤時(shí),仍然是系統(tǒng)另一端的人正在醒來修復(fù)它。
科技界“快速行動(dòng),打破常規(guī)”的口號(hào)已經(jīng)傳播到許多其他依靠IT基礎(chǔ)架構(gòu)為其產(chǎn)品和服務(wù)提供服務(wù)的行業(yè)和部門,但是這種工作方式可能會(huì)破壞他們最重要的資產(chǎn):員工的健康和士氣。
規(guī)模帶來了復(fù)雜性,而復(fù)雜性帶來了不可預(yù)測(cè)性:今天的待命IT工作者不知道什么時(shí)候可以在早上四點(diǎn)醒來解決事件,這是一個(gè)問題。錯(cuò)誤和延誤造成數(shù)百萬美元的損失,并且企業(yè)需要盡快解決嚴(yán)重的故障是可以理解的,那么我們?nèi)绾尾拍芾^續(xù)前進(jìn)并為工程師創(chuàng)造一個(gè)更具吸引力的健康環(huán)境?
善于擴(kuò)展DevOps
快速補(bǔ)丁發(fā)布和連續(xù)交付模型的期望給尋求改進(jìn)其產(chǎn)品的企業(yè)帶來了壓力??梢岳斫猓S多公司正在尋求DevOps的實(shí)踐,以減輕這種負(fù)擔(dān)并修改其團(tuán)隊(duì)結(jié)構(gòu),以便開發(fā)和運(yùn)營能夠以更高效,更敏捷的方式協(xié)同工作。
但是,該方法可以進(jìn)一步擴(kuò)展。盡管IT經(jīng)理現(xiàn)在已經(jīng)習(xí)慣于研究團(tuán)隊(duì)如何合作,但是從總體上來說,該行業(yè)很少善于考慮個(gè)人,他/她與工作的關(guān)系以及“永遠(yuǎn)在線”文化可能產(chǎn)生的不利影響。在IT工作者身上。
如果您在凌晨3點(diǎn)醒來進(jìn)行緊急修復(fù),那么第二天您的工作效率就不會(huì)很高。這聽起來似乎很明顯,但令人驚訝的企業(yè)數(shù)量卻沒有考慮到這一點(diǎn),考慮到一些研究表明睡眠中斷比睡眠不足更令人震驚。系統(tǒng)管理員和值班人員應(yīng)在白天或晚上的所有時(shí)間都可以使用,但他們不是“超級(jí)英雄”或“忍者”。這種期望及其造成的持續(xù)壓力可能對(duì)員工的健康非常不利。
工作滿意度低的工人很可能會(huì)提前離職:根據(jù)一些估計(jì),更換員工的成本可能高達(dá)該員工年薪的21%,因此從健康和福祉的角度考慮員工的應(yīng)對(duì)方式會(huì)嚴(yán)重影響業(yè)務(wù)。底線。最近,在GitLab的數(shù)據(jù)丟失事件中,我們還集中注意力缺乏注意力的災(zāi)難性后果。
我從經(jīng)驗(yàn)中知道這一點(diǎn):創(chuàng)辦我自己的公司的頭幾年,我一直在待命。我們的團(tuán)隊(duì)只有幾個(gè)人,所以我發(fā)現(xiàn)晚上經(jīng)常因?yàn)榕c朋友交往而被叫走。這促使我看到,作為一家公司,如何在處理IT警報(bào)時(shí)可以使通話變得更加輕松,還可以了解整個(gè)行業(yè)如何實(shí)現(xiàn)相同的目標(biāo)。
那該怎么辦呢?
對(duì)于基礎(chǔ)架構(gòu)監(jiān)視公司的創(chuàng)始人來說,談?wù)撨@一點(diǎn)似乎很奇怪:畢竟,服務(wù)器監(jiān)視包括發(fā)送警報(bào)和喚醒人們。我們意識(shí)到,我們有責(zé)任倡導(dǎo)IT團(tuán)隊(duì)采用更可持續(xù)的工作實(shí)踐,因此我們將這些實(shí)踐稱為HumanOps。
HumanOps有幾種核心原則,但是要記住的最重要的原則是人類健康會(huì)影響企業(yè)健康。正如理查德·布蘭森(Richard Branson)喜歡說的那樣:“如果您照顧好員工,您的客戶和底線也將得到回報(bào)”。如果企業(yè)優(yōu)先考慮員工的福利,那么系統(tǒng)性能,員工保留率和生產(chǎn)率都將得到改善。
這些是理論上的好主意,但是我們?nèi)绾沃贫▽?shí)用的政策來實(shí)施它們呢?開發(fā)人員可以從與他們的經(jīng)理一起開始,重新評(píng)估問題的升級(jí)方式,問題的升級(jí)人員以及監(jiān)督呼叫工作量的人員。建立內(nèi)部協(xié)議,以確保在您打電話給某人之前,所有替代方法都已用盡,并理想地確保重要知識(shí)不會(huì)僅存在于負(fù)責(zé)解決問題的一兩個(gè)人中。
實(shí)施諸如無罪的驗(yàn)尸之類的政策,以及提高人們對(duì)睡眠不足影響的普遍認(rèn)識(shí),對(duì)于將同情帶回到電話上的IT工作大有幫助。您甚至可以要求您的經(jīng)理加入呼叫輪換,親身體驗(yàn)中斷-許多公司都采用這種方法,因?yàn)闆]有什么比不斷地提醒他們提高修復(fù)優(yōu)先級(jí)的方法了!
軟件制造商有責(zé)任確保其產(chǎn)品按預(yù)期工作,這應(yīng)包括確保員工具備足夠的能力以健康和可持續(xù)的方式工作。諸如工時(shí)中斷成本,每位員工在呼叫上花費(fèi)的時(shí)間以及非工作時(shí)間觸發(fā)的警報(bào)數(shù)之類的指標(biāo)可以幫助管理人員了解其特定公司中優(yōu)先級(jí)最高的問題領(lǐng)域的概況。
DevOps以及這些實(shí)踐可以為企業(yè)帶來很多活力和熱情,但重要的是不要僅專注于技術(shù)實(shí)踐而忘記DevOps的人為因素?,F(xiàn)在是時(shí)候了,我們認(rèn)識(shí)到工程師是壓力很大,需要停機(jī)的人,并且有滿足這些需求的強(qiáng)大的商業(yè)和社會(huì)原因。俗話說,最重要的資產(chǎn)每天晚上回家,所以讓他們睡個(gè)覺。
作者介紹
熱門博客推薦