最近領導讓研究nagios,作為一名小白,以前從來沒有接觸過nagios,也是云里霧里的就開搞,終于,三天研究下來,基本監控項可以配置,等著部署客戶端監控其他服務器了,但是服務器也有好幾十臺,一個個部署,有點太愚昧,所以,利用ansible批量執行本地腳本,自己在本地寫完編譯腳本,開始推送公鑰,一切準備就緒,執行命令ansible all -m script 'shell.sh',結果。。。。悲劇了,郵箱開始炸了。
接二連三的apache服務down掉了,mysql服務down掉了,立刻終止批量執行命令,查看報警服務器,發現mysql已經由原來的5.5.34更新為5.5.54,不過還好,沒有造成什么損失,產品沒有報障,但是,有一臺服務器,mysql沒有起來,登上去手動啟動,提示start job failed,這是為什么,查看error.log,里面并沒有任何的日志信息,空文件,百度說是因為socket文件丟失,但別忘了,mysql不啟動,socket文件肯定沒有,接著查看各個文件權限,運行用戶都是mysql,權限正常。
查找了大概半個小時,還是沒有確定原因,決定替換一下配置文件試試,找了一臺啟動正常的mysql服務器,down下來他的配置文件,使用rz上傳配置文件到有問題這臺,但沒有裝這個命令,然后執行apt-get install lrzsz安裝,執行過程中,奇跡發生了,顯示mysql有一部分并沒有更新完成,在裝rz的過程中自動修復了未完成的一部分,查看mysql狀態,啟動正常了,誤打誤撞解決了無法啟動問題。(出問題的這臺服務器上面的數據庫沒有業務使用,調用的redis,所以并沒有影響業務)
所以,這也是低級錯誤,也是自身技術欠缺,分享出來,希望大家在生產環境中,慎用apt-get update ,apt-get upgrade,yum update這些命令,同時批量執行腳本時,先在本地測試一下,然后找臺線上的測試一下,確定沒有問題,再批量執行,否則,一旦出問題,真的很難快速解決。
最后,希望各位大神看完別噴,因為我畢竟是小白一名,只是希望后面跟我一樣的小白別犯這樣的錯誤。
一次apt-get update引起的風波
最后編輯于 :
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
- 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
- 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
- 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
推薦閱讀更多精彩內容
- 【蝴蝶效應】 蝴蝶效應:上個世紀70年代,美國一個名叫洛倫茲的氣象學家在解釋空氣系統理論時說,亞馬遜雨林一只蝴蝶...
- apt-get是某些linux發行版使用的一個“包管理器”(還有別的發行版使用yum等,以及brew等其他平臺上的...
- Problem & Solution: Problem_0 以下 ID 的密鑰沒有可用的公鑰: 1397BC536...