今天 brtfs 崩潰了。。。。原因是 APT 鎖住了,我強制重啟,然后文件系統就崩了(進入 initramfs 模式)。于是嘗試修復文件系統。
分以下幾個部份說明:
一、開機出現 grub rescue 指令模式
二、開機出現grub指令模式
三、可見到grub menu,但無法開機
四、開機進入initramfs模式
五、處理grub的異常狀況
第5是前面四種錯誤處理完后,進入系統該接著處理的事情。不然下次開機仍會發生一樣的問題。
解決方法一般是3步:
啟動盤開機,chroot 到硬盤系統,執行 update-grub.
一、開機出現 grub rescue 指令模式
假如看到grub rescue,表示mbr (master boot record)的資料,完全對應不上磁盤的狀況,所以無法辨別系統的所有分區,更不用說連grub menu都無法讀入。所以,處理的方法就是幫他找到grub的設置。
grub rescue>ls
(hd0), (hd0,msdos3), (hd0,msdos2), (hd0,msdos1)
ls可以列出所有的硬碟與分區,(hd0)是第一個硬碟,(hd0,msdos1)是第一顆硬碟的第一個分區。以此類推。輸入指令時,可以簡寫成(hd0,1)表示。若是GPT分割,出現的會是(hd0,gpt0)的格式。
接下來我們必須了解各分區,到底是什麼分區?所以我們可以用ls列出文件列表判斷,格式如下:
grub recue> ls (hd0,1)/
grub recue> ls (hd0,2)/
grub recue> ls (hd0,3)/
確定各個分區那個是 / ,哪個是/boot,哪個是swap后,就可以開始繼續處理。現在假設 / 是(hd0,3),/boot 是(hd0,2)。
額外說明一下,(hd0,2)/grub下的i386-pc或者x86_64-efi目錄,是放置grub模組所在:前者出現在以mbr開機的系統,后者出現在efi開機的系統 。你可以嘗試 ls 看看,會發現列出一堆.mod檔,這是開機所需要的文件,稍候我們也會需要其中一個模組。
接下來是正式設置,其實只有四行指令:
grub rescue> set root=(hd0,3)
grub rescue> set prefix=(hd0,2)/grub
grub rescue> insmod normal
grub rescue> normal
第一行指令:設置根目錄所在的分區
第二行指令:設置grub目錄。這樣他才知道哪里去找模組。此行設置錯誤,第三行指令執行時,就無法載入模組。假如你的 /boot 沒有額外分割,那這行就要寫成 set prefix=(hd0,3)/boot/grub
第三行指令:載入normal模組
第四行指令:執行normal模組
normal模組作用是什麼?他會把一些指令,文件系統模組,及其他需要的模組自動呼叫進來。
假如你的grub.cfg沒有問題,應該就可以看見grub菜單了。提醒一點,這模式下,指令只要打錯,只能開機重來,無法重打一次覆蓋之前的命令。
進入系統后,記得 處理grub的異常狀況
附注:我利用fdisk的expert mode重新變更分區的順序,產生這樣的問題。
二、開機出現grub指令模式
這類問題通常發生在,mbr可以找到對應的磁盤與各分區,卻無法找到可用有效的grub.cfg。
這時候,相關的模組已經載入,所以比grub rescue好處理,打錯可以重打一次覆蓋之前的命令,也可以用上下鍵重復之前的命令。
同樣用 ls 找出相關的分區,并檢查哪個分區是根目錄,哪個分區是 /boot ,方法與之前的grub rescue相同。現在假設 / 是(hd0,3),/boot 是(hd0,2)
命令有四行:
grub> set root=(hd0,3)
grub> linux (hd0,2)/vmlinuz-3.11.0-18-generic root=/dev/sda3
grub> initrd (hd0,2)/initrd.img-3.11.0-18-generic
grub> boot
第一行:設置根目錄所在的分區
第二行:設置核心所在,并設置根目錄所在分區
第三行:設置虛擬系統啟動核心所在。
第四行:開機
我怎麼知道核心的完整名稱為何?用ls去查一下就可以了。
假如你的 /boot 沒有額外分割,第二行要改成 (hd0,3)/boot/vmlinuz-3.11.0-18-generic,且后面指定root=/dev/sda3可以省略;第三行要改成(hd0,3)/boot/initrd.img-3.11.0-18-generic。
假如你系統的其他部份沒有問題,應該就會進入系統了。不會見到grub菜單。
進入系統后,記得 處理grub的異常狀況
注:我刪除grub.cfg來重現這種錯誤。
三、可見到grub menu,但無法開機
系統可以找到grub.cfg,但是上頭的資料有問題,無法找到核心。常發生在變更分割表后,因grub無法辨識uuid或者label造成.
在grub menu可選擇'e',對menuentry進行修改
修改前,大約會如下:
setparams 'Ubuntu'
recordfail
load_video
insmod gzio
insmod part_msdos
insmod ext2
set root='hd1,msdos2'
if [ x$feature_platform_search_hint = xy ]; then
search --no-floppy --fs-uuid --set=root --hint-bios=hd1,msdos2 --hint-baremetal=ahci1,msdos2 1ad522f5-2d6f-4a74-b827-245e168e8b35
else
search --no-floppy --fs-uuid --set=root 1ad522f5-2d6f-4a74-b827-245e168e8b35
fi
echo'Loading Linux 3.11.0-18 ...'
linux/boot/vmlinuz-3.11.0-18-generic root=UUID=1ad522f5-2d6f-4a74-b827-245e168e8b35 ro quiet splash $vt_handoff
echo'Loading initial ramdisk ...'
initrd/boot/initrd.img-3.11.0-18-generic
可以把他修改成最基本的樣式:
setparams 'Ubuntu'
set root=(hd0,3)
linux (hd0,2)/vmlinuz-3.11.0-18-generic root=/dev/sda3
initrd (hd0,2)/initrd.img-3.11.0-18-generic
輸入完成后,按Ctrl-x或者F10開機。
是不是很像 開機出現grub指令模式 的處理方法?因為兩者都是grub.cfg的異常所造成,所以必須告訴grub核心在哪里。
還有一個小技巧,其實兩者的處理方式可以一模一樣:按下Ctrl-c或者F2,就會進入指令模式,與 開機出現grub指令模式 的處理方法 完全相同。若是你搞不清楚哪個分區是/boot?哪個是根目錄?指令模式會比較好用。
進入系統后,記得 處理grub的異常狀況。
注:我修改grub.cfg來造成這樣的問題。
四、開機進入initramfs模式
假如開機過程,一直到載入核心都沒問題,但是其他的文件系統卻無法正常掛載,導致開機失敗,就會進入initramfs模式。
什麼是initramfs?就是initrd.img,他其實就是一個核心的內存版,開機過程中,直接放上內存,形成一個虛擬的系統,然后再把其他的文件系統掛載進來,換成真正的核心來控制。
所以你可以 ls 看一下,就會發現就是一個類似linux系統的文件結構。
但他真的很簡陋,你可以到bin與sbin下看看,就知道這個系統有多簡陋。所以我們必須把原有磁盤中的文件系統掛載進來。其實這個過程,就跟真的開機過程類似。小心,initramfs下不會顯示所在的目錄,小心「迷路」。
blkid可以檢視有哪些磁盤與分區(沒有fdisk可用...),我們可以利用mount掛載進來看。我們假設你已經確認:/ 在/dev/sda3,/boot在/dev/sda2
mkdir mnt
mount /dev/sda3 /mnt
mount /dev/sda2 /mnt/boot
這兩個順序不要顛倒,因為/boot是在根目錄之下的
接著需要把一些必要設備檔、系統檔、與內存掛載到真實的根目錄去,以提供真實的根目錄使用。
mount --bind /dev /mnt/dev
mount --bind /sys /mnt/sys
mount -t proc proc /mnt/porc
假如你還有其他分區,也要一并掛載到相對應的目錄。
再來就要把根目錄切換到真實的根目錄去了:
chroot /mnt
好了,現在你應該看到每行最前面的initramfs已經變成root@(none),你已經開始使用真實的根目錄,很多工具也回來了。如果你對系統夠了解,加載模組,連上網路都是可行的。
稍微解釋一下chroot。這個指令會把你的根目錄切換到你指定的地方,切換過去后,你會從這里開始你的root身份,在這里你擁有所有的權限。這個技巧很重要,不僅用在修復系統。到目前為止,你所作的事,就跟真實的開機流程類似。有興趣的人,不妨多了解一點。
不過現在首要的事情,是 處理grub的異常狀況(請看第五段),因為你已經進入系統了,雖然功能不全,但已經足以讓你處理問題了。
這里額外提供一個技巧,blkid可以查看磁盤分區的uuid,比對 /etc/fstab 后,可能你會需要修改 /etc/fstab 里的數據。為了方便修改,你可以先把查詢的結果放在 /etc/fstab 的后面:
blkid >> /etc/fstab
上下比對修改應該不會太難。最后記得把舊的設置,前面加上'#',這樣才不會沖突。存檔。鍵入sync。重新開機。(因為很多模組沒有掛上,你無法reboot或shutdown,只能直接電源鍵關機。)
假如都正常了,應該就會進入系統。大多數的狀況下,不需要額外的處理。因為你已經處理完了。
注:我利用tune2fs修改分區的uuid,來造成這樣的問題。
五、處理grub的異常狀況
會出現grub異常狀況,幾乎都與掛載設置,grub設置,或磁盤開機區有關,所以請處理以下三件事:
檢查并修改 /etc/fstab :
/etc/fstab 是系統掛載分區的必要文件。請確認里面的uuid是否與實際狀況相符?實際的uuid可以藉由sudo blkid取得。若有不符的狀況,請修改。現在ubuntu已經默認使用uuid來辨識分區,這種辨識方式,可以避免系統的混淆。當然他仍支持以往用設備名稱辨識的方法。更新 /boot/grub/grub.cfg :
sudo update-grub
- 重新安裝grub到磁盤開頭的開機區
sudo grub-install /dev/sda
若有問題,可能需要強制安裝
sudo grub-install /dev/sda --force
若不是/dev/sda,請自行修改。
以下三個參數要注意,必要時要特別加入
--boot-directory=[path]
--efi-directory=[path]
--uefi-secure-boot
詳情請man grub-install