新聞中心
這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
創(chuàng)新互聯(lián)Python教程:python如何查看編碼
python中可以使用chardet模塊檢測(cè)字符串/文件編碼。

創(chuàng)新互聯(lián)建站于2013年開始,先為多倫等服務(wù)建站,多倫等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為多倫企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
1、chardet下載與安裝
下載地址:http://pypi.python.org/pypi/chardet
下載chardet后,解壓chardet壓縮包,直接將chardet文件夾放在應(yīng)用程序目錄下,就可以使用import chardet開始使用chardet了,也可以將chardet拷貝到Python系統(tǒng)目錄下,這樣你所有的python程序只要用import chardet就可以了。
python setup.py install
使用中,chardet.detect()返回字典,其中confidence是檢測(cè)精確度,encoding是編碼形式。
示例:
網(wǎng)頁編碼判斷:
>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}文件編碼判斷
import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#這里試著換成read(5)也可以,但是換成readlines()后報(bào)錯(cuò)
enc=chardet.detect(ff)
print enc['encoding']
tt.close() 當(dāng)前文章:創(chuàng)新互聯(lián)Python教程:python如何查看編碼
網(wǎng)頁地址:http://m.fisionsoft.com.cn/article/cdhioio.html


咨詢
建站咨詢
