k8s使用nfs持久存儲mysql數(shù)據(jù)的一次踩坑

準(zhǔn)備

首先確保nfs服務(wù)端搭建成功。由于資源限制，我們的nfs服務(wù)器和k8s集群不在同一局域網(wǎng)內(nèi)，所以k8s中pv使用公網(wǎng)ip連接nfs，且nfs服務(wù)器的帶寬為10M。

創(chuàng)建nfs pv

apiVersion: v1
kind: PersistentVolume
metadata:
  name: mysql-nfs
spec:
  capacity:
    storage: 10Gi
  accessModes:
    - ReadWriteOnce
  persistentVolumeReclaimPolicy: Recycle
  nfs:
    path: /mysql-data
    server: 39.105.232.177

創(chuàng)建pvc

kind: PersistentVolumeClaim
apiVersion: v1
metadata:
  name: mysql-pvc
  namespace: laravel
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 10Gi

查看pv和pvc的狀態(tài)

pv屬于bound狀態(tài)

NAME        CAPACITY   ACCESS MODES   RECLAIM POLICY   STATUS   CLAIM               STORAGECLASS   REASON   AGE
mysql-nfs   10Gi       RWO            Recycle          Bound    laravel/mysql-pvc                           16d

pvc也屬于bound狀態(tài)

NAME        STATUS   VOLUME      CAPACITY   ACCESS MODES   STORAGECLASS   AGE
mysql-pvc   Bound    mysql-nfs   10Gi       RWO                           16d

如果沒有使用storageclass,pv和pvc通過相同的storage存儲大小和accessModes訪問策略倆個元素來實現(xiàn)自動綁定。可以看到圖中pv和pvc已經(jīng)自動綁定。

創(chuàng)建mysql的deployment
使用的 harbor.maigengduo.com/laravel/mysql5.7鏡像是基于docker官方的mysql:5.7鏡像build的，mysql的data目錄為/var/lib/mysql。

kind: Deployment
apiVersion: extensions/v1beta1
metadata:
  name: mysql
  namespace: laravel
  labels:
    name: mysql
  annotations:
    reloader.stakater.com/auto: "true"
spec:
  replicas: 1
  selector:
    matchLabels:
      name: mysql
  template:
    metadata:
      labels:
        name: mysql
    spec:
      containers:
        - name: mysql
          image: harbor.maigengduo.com/laravel/mysql5.7:202007071543
          ports:
            - name: mysql-port
              containerPort: 3306
              protocol: TCP
          imagePullPolicy: Always
          env:
          - name: MYSQL_ROOT_PASSWORD
            value: root
          volumeMounts:
            - name: mysql-pvc
              mountPath: "/var/lib/mysql"
      restartPolicy: Always
      volumes:
        - name: mysql-pvc
          persistentVolumeClaim:
            claimName: mysql-pvc

部署完之后我開始認(rèn)為，容器內(nèi)的/var/lib/mysql目錄下的數(shù)據(jù)會‘直接同步’到nfs服務(wù)端的/mysql-data目錄下,注意:這里是我認(rèn)為的，后面會驗證我還是年輕啊，哈哈。

但是發(fā)現(xiàn)，容器內(nèi)的數(shù)據(jù)文件并沒有同步到nfs服務(wù)端，nfs服務(wù)端的共享目錄只看到倆個文件，分別為ibdata1和ib_logfile0，而且導(dǎo)致mysql服務(wù)不可用，最嚴(yán)重的時候直接導(dǎo)致了整個k8s的pod都處于pendding狀態(tài)了。

為了確定問題，我將容器內(nèi)別的目錄（目錄大小比較小）重新掛載到nfs上，發(fā)現(xiàn)是可以正常同步的，證明是/var/lib/mysql目錄特殊，特殊點有倆個，第一個該目錄的用戶和所屬組都是mysql,第二點是該目錄比較大。

root@mysql-85bc98b4d9-gg4q2:/var/lib# ls -l
total 32
drwxr-xr-x 1 root  root  4096 Aug 14  2019 apt
drwxr-xr-x 1 root  root  4096 Aug 14  2019 dpkg
drwxr-xr-x 2 root  root  4096 Mar 28  2019 misc
drwxr-xr-x 6 mysql mysql 4096 Jul 24 01:10 mysql
drwxrwx--- 2 mysql mysql 4096 Aug 14  2019 mysql-files
drwxr-x--- 2 mysql mysql 4096 Aug 14  2019 mysql-keyring
drwxr-xr-x 2 root  root  4096 Aug 12  2019 pam
drwxr-xr-x 1 root  root  4096 Aug 12  2019 systemd

root@mysql-85bc98b4d9-gg4q2:/var/lib/mysql# du -sh
422M    .
.

于是這里提出有幾個問題

nfs服務(wù)端為什么只同步過倆個文件？

為什么mysql服務(wù)會不可用？為什么嚴(yán)重時整個k8s中的pod都處于pendding狀態(tài)了呢？

帶著上面的倆個問題，多次實驗首先發(fā)現(xiàn)了下面這個問題

nfs服務(wù)端共享文件夾權(quán)限問題

現(xiàn)象：nfs服務(wù)端的共享目錄/mysql-data原本的用戶和所屬組都是root,如下

[root@iZ2zebwwgp62jma838rfc4Z /]# ls -l
drwxr-xr-x   6 root root  4096 Jul 24 09:10 mysql-data

但是當(dāng)部署deployment后，也就是客戶端掛載后，服務(wù)端的共享目錄/mysql-data的用戶變?yōu)榱藀olkitd，用戶組變成了input，如下

[root@iZ2zebwwgp62jma838rfc4Z /]# ls -l
drwxr-xr-x   6 polkitd input  4096 Jul 24 09:10 mysql-data

為什么呢？感覺有點不正常。

首先查看容器內(nèi)的/var/lib/mysql目錄的權(quán)限，看到該目錄所屬用戶和用戶組都為mysql

root@mysql-85bc98b4d9-gg4q2:/var/lib# ls -l
total 32
drwxr-xr-x 1 root  root  4096 Aug 14  2019 apt
drwxr-xr-x 1 root  root  4096 Aug 14  2019 dpkg
drwxr-xr-x 2 root  root  4096 Mar 28  2019 misc
drwxr-xr-x 6 mysql mysql 4096 Jul 24 01:10 mysql

然后查看用戶為mysql的相關(guān)信息，發(fā)現(xiàn)用戶myql所屬id為999，所屬組id也為999

root@mysql-85bc98b4d9-gg4q2:/var/lib# cat /etc/passwd | grep mysql
mysql:x:999:999::/home/mysql:

查看宿主機上用戶id為999的信息,發(fā)現(xiàn)用戶id為999的用戶為polkitd。

[root@iZ2zebwwgp62jma838rfc4Z /]# cat /etc/passwd | grep 999
polkitd:x:999:998:User for polkitd:/:/sbin/nologin

繼續(xù)查看用戶組id為999的組名，發(fā)現(xiàn)用戶組id為999的組名為input。

[root@iZ2zebwwgp62jma838rfc4Z /]# cat /etc/group | grep 999
input:x:999:

到這里你肯定明白了宿主機上共享目錄的權(quán)限怎么變成用戶為polkitd，用戶組變成了input。

總結(jié)

宿主機使用volume映射到容器內(nèi)時，宿主機和容器內(nèi)的文件或文件夾的權(quán)限是相同的，準(zhǔn)備的說是用戶id和用戶組id是相同的。

解決

似乎上面那個現(xiàn)象對我們上面提的倆問題并沒有什么幫助，但是上面那個現(xiàn)象是真實存在的，我們必須搞清楚。接下來進入正題。。。

nfs服務(wù)端為什么只同步過倆個文件？

剛開始時這個問題真的很棘手，后來靜下來想想，這個目錄大小將近500M,是不是目錄太大的問題，同步需要時間呢？所以并不是只同步過來倆個文件，而是正在同步中，接下來驗證這個猜想。

首先在宿主機的共享目錄下查看文件夾大小，發(fā)現(xiàn)為100M

[root@iZ2zebwwgp62jma838rfc4Z mysql-data]# du -sh
100M    .

在過2秒查看一遍，發(fā)現(xiàn)大小變?yōu)?01M

[root@iZ2zebwwgp62jma838rfc4Z mysql-data]# du -sh
101M    .

此時真的驗證了我們的猜想，nfs服務(wù)端的數(shù)據(jù)是正在同步中，只是nfs的寫速度真的很慢，讓我們以為就同步過來倆個文件，被表象所迷惑。
同步速度慢主要有幾個原因，首先io同步就是耗時的，其次nfs服務(wù)器和k8s不在一個局域網(wǎng)內(nèi)，然后nfs服務(wù)器的帶寬也很低，最主要的還是nfs服務(wù)寫速度真的很慢。

為什么mysql服務(wù)會不可用？為什么嚴(yán)重時整個k8s中的pod都處于pendding狀態(tài)了呢？

寫io是很耗cpu的，更何況這種大量復(fù)制。既然服務(wù)不可用了，我們使用top命令查看下k8s worker節(jié)點機器的各項性能，如下圖。發(fā)現(xiàn)nfs在同步過程有一個nginx的command的進程cpu竟然達到了99%，us的cpu達到了23.5%，sy的cpu達到了48.6%，很顯然，io同步時消耗了大量的cpu,導(dǎo)致mysql服務(wù)不可用了，而k8s的pod都會占用宿主機的cpu的資源的，如果宿主機的cpu資源不夠pod所申明的cpu,pod將會重新構(gòu)建，進而進入pod的生命周期中的pendding狀態(tài)，所有pod都在爭搶宿主機cpu的資源。

image.png

總結(jié)：寫io是很耗cpu資源，為了k8s集群服務(wù)的可用性，我們需要將k8s的node節(jié)點的cpu調(diào)大點。

如果你了解k8s resource，你就會知道，只有當(dāng)節(jié)點擁有足夠滿足 Pod 內(nèi)存請求的內(nèi)存和cpu請求的cpu時，才會將 Pod 調(diào)度至節(jié)點上運行，顯然上面這種情況消耗了大量的cpu，導(dǎo)致pod都調(diào)度不到節(jié)點上，以至于處于pendding狀態(tài)。

可以看到我們上面的mysql deployment中并沒有設(shè)置resource相關(guān)cpu和memory配置，pod默認(rèn)limit為節(jié)點的所有cpu個memory。當(dāng)nfs數(shù)據(jù)復(fù)制時，將大量消耗pod內(nèi)的cpu,以至于node節(jié)點的cpu被消耗完，這是出現(xiàn)這個問題的根本原因，體現(xiàn)了pod設(shè)置resource資源的重要性，不然某個pod類似我們的這種情況將會消耗光節(jié)點的所有資源。

上面?zhèn)z個問題解決后，等到mysql的數(shù)據(jù)文件全部同步到nfs上時，理應(yīng)mysql服務(wù)和其他服務(wù)都能正常訪問了，但是并沒有預(yù)期的那么好，又出現(xiàn)了下面這個問題。。

mysql connection is not allowed

在集群外連接mysql時報以下錯誤。

rHost '172-17-208-115.calico-typha.kube-system.svc.cluster.local' is 
not allowed to connect to this MySQL serverConnection closed by foreign host.

解決

這個原因是因為索要鏈接的mysql數(shù)據(jù)庫只允許其所在的服務(wù)器連接，需要在mysql服務(wù)器上設(shè)置一下允許的ip權(quán)限

grant all privileges on *.* to 'root'@'%' identified by 'root';
flush privileges;

最后編輯于：2020.12.04 09:06:48

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,786評論 6贊 534
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,656評論 3贊 419
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 176,697評論 0贊 379
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,098評論 1贊 314
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點故事閱讀 71,855評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,254評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,322評論 3贊 442
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,473評論 0贊 289
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 49,014評論 1贊 335
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 40,833評論 3贊 355
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,016評論 1贊 371
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,568評論 5贊 362
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 44,273評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,680評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,946評論 1贊 288
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,730評論 3贊 393
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 48,006評論 2贊 374

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

k8s使用nfs持久存儲mysql數(shù)據(jù)的一次踩坑

k8s使用nfs持久存儲mysql數(shù)據(jù)的一次踩坑

準(zhǔn)備

nfs服務(wù)端共享文件夾權(quán)限問題

解決

mysql connection is not allowed

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

k8s使用nfs持久存儲mysql數(shù)據(jù)的一次踩坑

準(zhǔn)備

nfs服務(wù)端共享文件夾權(quán)限問題

解決

mysql connection is not allowed

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频