全自動發布引起服務事故始末

昨天有道云筆記的服務當機,官網以及服務都不能使用,我幸災樂禍的發了一個朋友圈,強調了一下容災的必要性,還調侃性的說不要省那點備份和容災的錢,其實公司容災和備份方案都是我定的,老板哪知道該做些什么才能讓產品穩定。

最近我們一直在切換服務器,在切換負載均衡,在切換域名以及存儲,最后也就是在今天,我把發布腳本也切換了。發布內容出錯導致了公司服務短時無法使用(10分鐘內,我的感覺是斷了這么久),斷當時還是有點慌的,還要決策是恢復還是繼續發布,后來相信自己的腳本,還是繼續找報錯,修了下去,還好結果還可以,影響不是很大。

起因

之前服務比較少,采用的是單機發布,也就是先登錄到服務器,再執行部署腳本進行發布,有多少服務就要登錄多少機器,一是慢,一是怕執行錯順序,好處就是心里不慌,掛掉就掛掉,有負載均衡撐著呢

這次服遷移,我們把原來的單服務進行了切分,要維護的服務器更多,服務也更多,所以也就打起了發布全自動化的主意。

過程

其實之前寫的腳本主流程還是可以用的,只是缺少很多檢測,比如tomcat殺不掉怎么辦,啟動后有沒有啟動起來,添加了相關的檢測后,我找了個我負責的另一個產品上做測試,經過一下午的時間總算是可以完美運行了。

今天就開始搞主服務,照著昨天的腳本改,為服務器做定制,寫好后,認認真真檢查了半個多小時。覺得沒問題后發布,一點,刷刷的日志滾滾而來,看到了報錯,可惜無法中止,等都執行結束,產品就不能訪問了。

這時心里還是有些慌的,回滾?還是繼續發?經過一番思想斗爭,決定還是繼續發下去,回滾也不是那么容易的,也要很多步驟的。這時客服就開始叫了,然后是公司其他部門的,產品經理就開始找我,群里各種消息接踵而至。沒辦法,我也急呀,拉到個產品經理,讓他替我回復。我就靜下心找到錯誤,修正,多機執行,經過一番折騰總算是恢復了。

總結

1. 經過這次事故,我覺得最好的方案是將發布由一次變為兩次甚至更多次,將服務器劃分為一些子網,每次都是先在一個子網中進行發布,無問題后再再其他子網中發布,如果出現問題,就將子網切斷隔離,進行修復。

2. 腳本也應該具有遇錯自動回滾功能,不過實際情況下報錯種類很多,也有一些是無害的,這種只能解決一小部分問題。

3. 能備份還是多備份吧

4. 腳本還是要多進行實際測試,別太自信,現在年紀大了,眼睛跟不上了,只能在思路上提意見。本以為是復制好的腳本,只改一些參數不會有問題,改好后,還認真看了半個小時都沒看出錯誤

5. 這種事情最好不要讓負責人去做,如果我當時交給運維同學去做,我去檢查,可能也不會出現腳本錯誤。負責人會有時會逾越一些必要流程以及些許的盲目自信。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,546評論 6 533
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,570評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,505評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,017評論 1 313
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,786評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,219評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,287評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,438評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,971評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,796評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,995評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,540評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,230評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,662評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,918評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,697評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,991評論 2 374

推薦閱讀更多精彩內容

  • Spring Cloud為開發人員提供了快速構建分布式系統中一些常見模式的工具(例如配置管理,服務發現,斷路器,智...
    卡卡羅2017閱讀 134,785評論 18 139
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,662評論 25 708
  • Ubuntu的發音 Ubuntu,源于非洲祖魯人和科薩人的語言,發作 oo-boon-too 的音。了解發音是有意...
    螢火蟲de夢閱讀 99,430評論 9 467
  • 作者/齊天 清晨 街角的販賣聲 喚醒了沉睡的太陽 陽光灑在走走停停的車窗上 刺了眼睛 迷了征途 傍晚 街燈搖曳 我...
    小圣齊天閱讀 399評論 12 11
  • 2000年高中一年級,一次調座位的機會我們變成同桌,我無視這個新同桌自顧自的沉浸在悲傷中,上著自習自己哭,他一臉詫...
    初悅S閱讀 314評論 0 2