日常工作總結:
0.規范:軟件安裝/備份目錄/腳本存放/日志格式等進行統一規劃。
1.硬件:Openstack、Docker、Kvm統一測試。
2.系統:使用centos6.x系列服務器統一管理。
3.應用:Nginx,PHP、MySQL統一版本及安裝目錄。
4.配置:Saltstack自動化安裝環境、配置、分發不同環境。
5.監控:zabbix3.x進行監控,分析、展示、報警。
6.日志:使用elk,對各個節點進行收集,分析,展示,報警。
7.代碼:使用gitlab管理代碼,腳本+git實現自動部署,秒級回退。
8.集群:整個集群通過saltstack批量部署,配置,管理。
9.備份:每天定時備份重要至其他計算節點,后期恢復測試。
一、網絡故障分為硬件\軟件故障
網卡損壞
鏈路故障
網卡驅動不兼容
網絡排查思路
1.ping本地回環口, 確定本機TCP/IP協議棧是否正常
2.ping本機IP地址, 確定本地設備以及驅動是否正常
3.ping同網段主機, 確定二層網絡是否正常工作
4.ping網關地址, 確定本地與網絡是否正常
5.ping公網地址, 確定本地路由是否正常
6.ping公網域名, 確定DNS客戶端是否正常
二、進程無法刪除問題
在Linux或Unix系統中,通過rm或文件管理器刪除文件將會從文件系統的文件夾結構上解除鏈接,然而假設這個文件是被打開了的,也就是說有一個進程正在使用,那么進程仍然能夠讀取該文件,磁盤空間也會被一直占用。
1.kill掉相應的進程。
2.停掉使用這個文件的應用,讓OS主動回收磁盤空間。
3.如果環境中有很多進程都在使用這個文件,那么直接停掉進程可能會帶來一定的風險。最好選擇合適的時間停掉相應的進程,讓OS主動回收磁盤空間。
例如:nginx一直在往access.log寫文件,那么這個時候你去刪除日志,其實只是把文件名刪除了,并沒有把扇區上的數據釋放掉,因為這個acces.log這個文件被nginx進程占用,所以不會釋放,這個時候你只需要重啟一下nginx 這個文件的block就會被徹底清理掉,這個時候空間才算真的釋放了。
三、配置https后發生報錯(ERR_SSL_PROTOCOL_ERROR)。
影響范圍
公司官網無法訪問。
處理流程
1.查看日志,無報錯信息。
2.查看Nginx配置文件發現少加了ssl模塊。