The palest ink is better than the best memory.
python 有str object 和 unicode object 兩種字符串, 都可以存放字符的字節編碼,但是他們是不同的type,這一點很重要,也是為什么會有encode 和decode。 encode 和 decode在pyhton 中的意義可表示為 encode unicode -------------------------> str unicode <--------------------------str decode 幾種常用法: str_string.decode('codec') 是把str_string轉換為unicode_string, codec是源str_string的編碼方式 unicode_string.encode('codec') 是把unicode_string 轉換為str_string,codec是目標str_string的編碼方式 str_string.decode('from_codec').encode('to_codec') 可實現不同編碼的str_string之間的轉換 比如:
str_string.encode('codec') 是先調用系統的缺省codec去把str_string轉換為unicode_string,然后用encode的參數codec去轉換為最終的str_string. 相當于str_string.decode('sys_codec').encode('codec')。 unicode_string.decode('codec') 基本沒有意義,unicode 在python里只用一種unicode編碼,UTF16或者UTF32(編譯python時就已經確定),沒有編碼轉換的需要。 注:缺省codec在site-packages下的sitecustomize.py文件中指定,比如
Copyright @ 漢辰 Powered by: .Text and ASP.NET Theme by: .NET Monster