新聞中心
python 字符編碼簡(jiǎn)記

創(chuàng)新互聯(lián)主要從事網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)丹陽,十年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):18980820575
可以簡(jiǎn)單的理解為:
1.為了處理英文字符,產(chǎn)生了ASCII碼。
2.為了處理中文字符,產(chǎn)生了GB2312。
3.為了處理各國(guó)字符,產(chǎn)生了Unicode。
4.為了提高Unicode存儲(chǔ)和傳輸性能,產(chǎn)生了UTF-8,它是Unicode的一種實(shí)現(xiàn)形式。
注意:
Python2.x 默認(rèn)編碼是 ASCII
Python3.x 默認(rèn)編碼是 unicode,所以 Python3.x 直接支持中文不需要進(jìn)行二次處理。
相關(guān)推薦:《Python視頻教程》
GBK轉(zhuǎn)換成 UTF-8 的流程:
1.通過解碼 (decode) 轉(zhuǎn)換成 Unicode
2.通過編碼 (encode) 轉(zhuǎn)成成 GBK
亂碼是因?yàn)橄到y(tǒng)編碼與所提供字符的編碼不一致所導(dǎo)致的。所以當(dāng)我們需要操作系統(tǒng)正確的輸出一個(gè)字符時(shí),除了要知道該字符的字符編碼,也要知道自己系統(tǒng)所使用的字符編碼。
Linux 系統(tǒng)大部分使用的是 UTF-8 編碼,Windoors 系統(tǒng)使用的編碼是 GB2312。
可以通過 chardet 來判斷字符的編碼
安裝步驟:
1. 下載 chardet-3.0.4.tar.gz 地址:https://pypi.python.org/pypi/chardet/3.0.4#downloads 2. 解壓至安裝目錄 我的電腦為 D:\software\Python2.7\Lib\site-packages\chardet-3.0.4 3. 打開 Windows 命令行窗口進(jìn)行安裝
進(jìn)入源碼目錄
使用 python setup.py install 安裝
測(cè)試
# -*- encoding:utf-8 -*- import chardet name = '你好' print(chardet.detect(name))
運(yùn)行結(jié)果:
在py2中
#-*- coding: UTF-8 -*-
聲明這句話就是告訴 python2.7 解釋器 (默認(rèn)ACSII編碼方式)解釋的 .py 文件聲明下面的內(nèi)容按 utf8 編碼,就是編碼(編碼成字節(jié)串最后轉(zhuǎn)成0101的形式讓機(jī)器去執(zhí)行)
當(dāng)前題目:創(chuàng)新互聯(lián)Python教程:Python之字符編碼相關(guān)介紹
路徑分享:http://m.fisionsoft.com.cn/article/dpdipgh.html


咨詢
建站咨詢
