新聞中心
這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python3如何中文轉換編碼?
相信平時各位小伙伴都是習慣用中文的人,就算英文水平不錯,畢竟還是中文用起來更順手一點。不過在計算機編程中,還是以英文為主,會給我們的實際操作帶來一些困擾。有時候中文也不能被計算機語言所識別,就會導致報錯的出現(xiàn)。今天就python3中文轉換url編碼的相關問題,小編為大家?guī)硪粋€示例的講解。

處理百度貼吧的東西。想要做一個關鍵詞的list,每次需要時,直接添加
到list里面就可以了。但是添加到list里面是中文的情況(比如‘麗江'),url的地址編碼卻是'%E4%B8%BD%E6%B1%9F',因此需
要做一個轉換。這里我們就用到了模塊urllib。
>>> import urllib >>> data = '麗江' >>> print data 麗江 >>> data '\xe4\xb8\xbd\xe6\xb1\x9f' >>> urllib.quote(data) '%E4%B8%BD%E6%B1%9F'
那我們想轉回去呢?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')
'\xe4\xb8\xbd\xe6\xb1\x9f'
>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')
麗江細心的同學會發(fā)現(xiàn)貼吧url中出現(xiàn)的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其實是編碼問題。百度的是gbk,其他的一般網(wǎng)站比如google就是utf8的。所以可以用下列語句實現(xiàn)。
>>> import sys,urllib
>>> s = '麗江'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))
'%C0%F6%BD%AD'
>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))
'%E4%B8%BD%E6%B1%9F'
>>>以上就是python3中文轉換url編碼的方法,是不是很實用呢~畢竟中文在編程里面想轉換不是一件容易的事情。學會了的小伙伴趕緊保存起來,不然下次又要重新找解決的辦法啦。
分享名稱:創(chuàng)新互聯(lián)Python教程:python3如何中文轉換編碼?
當前URL:http://m.fisionsoft.com.cn/article/djddcps.html


咨詢
建站咨詢
