我們來解決一下 matplotlib 的中文顯示問題

用 matplotlib 繪制圖表,默認設置下,是無法在圖中正確顯示中文的。原因無非兩種,一種是字符編碼不正確,一種是字體不支持中文。前一種情況總是發生在 Python 2 用戶身上,解決方法是把字符轉成 UTF-8。而 Python 3 統一使用 Unicode,不存在這個問題。

本文主要解決的是第二種問題:字體不支持中文。

背景知識

想快速解決問題可直接跳到步驟一,有不明白的地方再來閱讀背景知識。

matplotlib 從配置文件 matplotlibrc 中讀取配置,字體相關內容也在其中。matplotlib 依次在以下四個位置尋找配置文件:

  1. 當前工作目錄下的 matplotlibrc
  2. $MATPLOTLIBRC/matplotlibrc
  3. 用戶家目錄下的 matplotlibrc。 如 Linux 一般在 ~/.config/matplotlib/matplotlibrc, macOS 在 ~/.matplotlib/matplotlibrc
  4. INSTALL/matplotlib/mpl-data/matplotlibrc,其中 INSTALL 指具體的安裝目錄。

詳見官方文檔。查詢當前使用的 matplotlibrc 所在目錄,可以用 get_configdir() 函數:

import matplotlib
matplotlib.get_configdir()

這里有一份配置文件示例可供下載。

閱讀配置文件可以發現,matplotlib 默認使用的 font.familysans-serif,即無襯線字體,而無襯線字體又是從這幾種字體中依次選用:

font.sans-serif : Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif

全是西文字體,沒一個支持中文的。而且 matplotlib 對字體文件的格式也很挑剔,除了 .ttf 其他一概不認。比如 macOS Sierra 中的 Lucida Grande 是 .ttc 格式,即便按照順位輪到它了,仍然會被跳過。

查詢當前的 font.family

matplotlib.font_manager.FontProperties().get_family()

查詢當前使用字體:

from matplotlib.font_manager import findfont, FontProperties
findfont(FontProperties(family=FontProperties().get_family()))

鋪墊結束,我們利用上面的知識解決問題。


步驟一

Python 2 用戶請先確認字符編碼為 UTF-8。Python 3 用戶直接跳過此步驟。

步驟二

尋找支持中文并且安裝為 .ttf 格式的字體。

Windows 用戶應該總能找到 SimHei.ttf。*nix 用戶可以通過 fc-list 命令或者圖形工具在當前系統內查詢。如果不幸真沒找到符合條件的,你就得自己去下載一個或者進行格式轉換了。SimHei.ttf 應該很容易找到,然而其實是未獲授權的。文泉驛微米黑是一種自由字體,推薦使用。

.ttc 轉換為 .ttf,網上有不少在線或線下工具,可以自行搜索。

友情提示一句,請選擇各種黑體作為圖表中的字體,宋體放在圖表中,丑死了。

步驟三

新安裝的字體 matplotlib 一時不能找到,需要更新字體列表緩存。

如果你建立了 ~/.matplotlib/ 目錄的話,應該會在其中找到 fontList.py3k.cache。在其中找到 Vera.ttf 的安裝目錄,把新安裝的字體復制到該目錄下。

刪除 fontList.py3k.cache。matplotlib 下次啟動時會重建緩存,新字體隨之被添加。

步驟四

現在就要在程序中使用中文字體了。

首先,你得知道字體的英文名稱,比如 SimHei.ttf 就叫 SimHei,文泉驛微米黑叫 WenQuanYi Micro Hei。

然后,你有兩種方法告訴 matplotlib 使用這些字體:

  1. matplotlibrc 中,添加像這樣的一行:
font.sans-serif : WenQuanYi Micro Hei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif

把中文字體作為第一順序選用的字體。

  1. 在程序文件開頭,指定字體:
import matplotlib
matplotlib.rcParams['font.sans-serif'] = 'WenQuanYi Micro Hei'

第2種方法很靈活,可以針對每個文件單獨設置。如果使用第1種方法,建議把 matplotlibrc 放在當前工作目錄下,不要作為全局配置。


好了,配置完成,效果如圖:

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容