摘要:前陣子想爬點東西,結(jié)果一直提示錯誤,在網(wǎng)上一查,發(fā)現(xiàn)是的控制臺的問題。控制臺的編碼是,是,造成了沖突。下面給出三種解決方法第一種方法直接替換出錯的內(nèi)容第二種方法再解碼先用編碼,加個丟棄錯誤的字符,然后再解碼。
前陣子想爬點東西,結(jié)果一直提示錯誤UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘xa0’ in position,在網(wǎng)上一查,發(fā)現(xiàn)是 Windows 的控制臺的問題。控制臺的編碼是 GBK,Python 是 UTF-8,造成了沖突。下面給出三種解決方法:
第一種方法:直接替換出錯的內(nèi)容import requests url = "https://segmentfault.com/a/1190000015617318" print(requests.get(url).text.replace("xa0", " "))第二種方法:再解碼
先用 GBK 編碼,加個 ignore 丟棄錯誤的字符,然后再解碼。
import requests url = "https://segmentfault.com/a/1190000015617318" print(requests.get(url).text.encode("gbk", "ignore").decode("gbk")第三種方法:修改控制臺編碼
新建一個 cmd.reg, 輸入代碼:
Windows Registry Editor Version 5.00 [HKEY_CURRENT_USERConsole\%SystemRoot%_system32_cmd.exe] "CodePage"=dword:0000fde9 "FontFamily"=dword:00000036 "FontWeight"=dword:00000190 "FaceName"="Consolas" "ScreenBufferSize"=dword:232900d2 "WindowSize"=dword:002b00d2
保存后運行。如果 Ctrl+B 無效,用 python.exe 打開.py程序后再試一次。
如果還有問題的話,可以在我的知乎和SF留言。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41979.html
摘要:如果統(tǒng)一規(guī)定每個字符用個或者個字節(jié)來存儲,那么每個英文字符都必然需要額外到個,這對存儲是很大的浪費。因此對于英語字母,編碼和碼是相同的。中文中文輸出這里同樣可以知道,中存放的是文件保存的編碼的碼。 unicode 與 utf-8 的關(guān)系 unicode 是 character set character set 是把每個字符對應(yīng)成數(shù)字的集合,比如unicode中 A對應(yīng)0041,漢字...
摘要:根據(jù)有效范圍作用域分為全局變量和局部變量。類型以開頭標(biāo)識類型以開頭標(biāo)識類型以進制的字節(jié)碼表示,實際上是一個字節(jié)串,回應(yīng)了它的另一個名字。 < 返回索引頁 基本語法 Hello World 代碼注釋 關(guān)鍵字 數(shù)據(jù)類型 變量、常量 變量 變量賦值 變量命名 變量的作用域 常量 字符串與編碼 字符轉(zhuǎn)義 字符編碼 字符串操作 運算符與表達式 運算符 表達式 ...
摘要:中國人民看到這樣很不錯,于是就把這種漢字方案叫做。結(jié)果擴展之后的編碼方案被稱為標(biāo)準(zhǔn),包括了的所有內(nèi)容,同時又增加了近個新的漢字包括繁體字和符號。 聲明:文章借鑒自【徹底搞懂 python 中文亂碼問題】 一. 各種編碼的由來 1.1 ASCII編碼 很久很久以前,有一群人,他們決定用8個可以開合的晶體管來組合成不同的狀態(tài),以表示世界上的萬物。他們看到8個開關(guān)狀態(tài)是好的,于是他們把這稱為...
摘要:常見的字符編碼有編碼,編碼,編碼等。碼只規(guī)定了個字符的編碼,這在美國是夠用的。小結(jié)是一種針對的可變長度字符編碼,它是的實現(xiàn)方式之一。 字符編碼是計算機編程中不可回避的問題,不管你用 Python2 還是 Python3,亦或是 C++, Java 等,我都覺得非常有必要厘清計算機中的字符編碼概念。本文主要分以下幾個部分介紹: 基本概念 常見字符編碼簡介 Python 的默認(rèn)編碼 Py...
摘要:關(guān)于中文為了處理漢字,程序員設(shè)計了用于簡體中文的和用于繁體中文的。年一共收錄了個字符,包括個漢字和個其它符號。年的是取代的正式國家標(biāo)準(zhǔn)。區(qū)分中文編碼的方法是高字節(jié)的最高位不為。 Python 2和 Python3的區(qū)別 3.0有Unicode support ,這代表著可以直接默認(rèn)寫中文,2是不行的 有一些庫改名了,但表面上變化不大,都是些大寫變小寫,下劃線沒了之類的 Twisted...
閱讀 1250·2021-11-15 11:37
閱讀 2260·2021-09-30 09:55
閱讀 4539·2021-09-22 15:51
閱讀 3760·2021-09-22 15:46
閱讀 2781·2019-08-30 15:52
閱讀 438·2019-08-29 16:20
閱讀 2903·2019-08-29 15:12
閱讀 1163·2019-08-26 18:27