Python的默認(rèn)編碼
Python在安裝時,默認(rèn)的編碼是ascii,當(dāng)程序中出現(xiàn)非ascii編碼時,Python的處理常常會報這樣的錯:
UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),
Python沒辦法處理費ascii編碼的,此時需要自己設(shè)置將Python的默認(rèn)編碼,一般設(shè)置為utf-8的編碼格式。
查詢系統(tǒng)默認(rèn)編碼可以在解釋器中輸入以下命令:
>>> import sys
>>> sys.getdefaultencoding()
'ascii'
臨時更改編碼
設(shè)置默認(rèn)編碼時使用:
>>> sys.setdefaultencoding('utf8')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'module' object has no attribute 'setdefaultencoding'
發(fā)現(xiàn)報錯。
需要先執(zhí)行reload(sys),再執(zhí)行以上命令就可以順利通過了:
>>> reload(sys)
<module 'sys' (built-in)>
>>> sys.setdefaultencoding('utf8')
>>> sys.getdefaultencoding()
'utf8'
此時在執(zhí)行sys.getdefaultencoding()就會發(fā)現(xiàn)編碼已經(jīng)被設(shè)置為utf8的了,但是在解釋器里修改的編碼只能保證當(dāng)次有效,在重啟解釋器后,會發(fā)現(xiàn),編碼又被重置為默認(rèn)的ascii了,那么有沒有辦法一次性修改程序或系統(tǒng)的默認(rèn)編碼呢?
兩種方法設(shè)置Python的默認(rèn)編碼
1、在程序中加入以下代碼:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
2、在python的Lib\site-packages文件夾下新建一個sitecustomize.py,內(nèi)容為:
# encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
重啟python解釋器,執(zhí)行sys.getdefaultencoding(),發(fā)現(xiàn)編碼已經(jīng)被設(shè)置為utf8的了,多次重啟之后,效果相同,這是因為系統(tǒng)在python啟動的時候,自行調(diào)用該文件,設(shè)置系統(tǒng)的默認(rèn)編碼,而不需要每次都手動的加上解決代碼,屬于一勞永逸的解決方法。
還有一種解決方案是在程序中所有涉及到編碼的地方,強制編碼為utf8,即添加代碼encode("utf8"),這種方法并不推薦使用,因為一旦少寫一個地方,將會導(dǎo)致大量的錯誤報告.
ps:方法2中,如何找到python的Lib\site-packages文件夾?方法如下:
>>> import sys
>>> import pprint
>>> pprint.pprint(sys.path)
['',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python27.zip',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/plat-darwin',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/plat-mac',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/plat-mac/lib-scriptpackages',
'/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/lib-tk',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/lib-old',
'/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/lib-dynload',
'/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/PyObjC',
'/Library/Python/2.7/site-packages']
可以看到,最后一個即為我們要尋找的文件夾路徑。