新聞中心
python 有str object 和 unicode object 兩種字符串, 都可以存放字符的字節(jié)編碼,但是他們是不同的type,這一點(diǎn)很重要,也是為什么會有encode 和decode。

創(chuàng)新互聯(lián)成立與2013年,先為馬尾等服務(wù)建站,馬尾等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為馬尾企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
encode 和 decode在pyhton 中的意義可表示為
encode將
unicode-----> str
decode
unicode <-------str
幾種常用法:
str_string.decode('codec') 是把str_string轉(zhuǎn)換為unicode_string, codec是源str_string的編碼方式
unicode_string.encode('codec') 是把unicode_string 轉(zhuǎn)換為str_string,codec是目標(biāo)str_string的編碼方式
str_string.decode('from_codec').encode('to_codec') 可實(shí)現(xiàn)不同編碼的str_string之間的轉(zhuǎn)換
比如:
>>> t='長城'
>>> t
'\xb3\xa4\xb3\xc7'
>>> t.decode('gb2312').encode('utf-8')
'\xe9\x95\xbf\xe5\x9f\x8e'str_string.encode('codec') 是先調(diào)用系統(tǒng)的缺省codec去把str_string轉(zhuǎn)換為unicode_string,然后用encode的參數(shù)codec去轉(zhuǎn)換為最終的str_string. 相當(dāng)于str_string.decode('sys_codec').encode('codec')。
unicode_string.decode('codec') 基本沒有意義,unicode 在python里只用一種unicode編碼,UTF16或者UTF32(編譯python時就已經(jīng)確定),沒有編碼轉(zhuǎn)換的需要。
注:缺省codec在site-packages下的sitecustomize.py文件中指定,比如
import sys
sys.setdefaultencoding('utf-8')
網(wǎng)站題目:創(chuàng)新互聯(lián)Python教程:怎么處理Python字符編碼轉(zhuǎn)換?
分享URL:http://m.fisionsoft.com.cn/article/djcgoge.html


咨詢
建站咨詢
