国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

前后端交互過程中的編碼

explorer_ddf / 632人閱讀

摘要:前后端交互過程中涉及的編碼首先,瀏覽器的設置里有設置編碼格式,一般設置為。按照設置的順序檢查檢測文件的編碼。

起因

最近在寫PHP,本身對PHP不太熟練。然后遇到編碼這個問題,困擾了大半天,索性,系統探索解決一番。

前后端交互過程中涉及的編碼

Browser cilent: 首先,瀏覽器的設置里有設置編碼格式,一般設置為UTF-8。

AJAX request: AJAX異步請求的過程中可以設置編碼,contentType:"application/x-www-form-urlencoded; charset=utf-8"

PHP cilent: PHP通過$_POST這個全局變量接收前端POST過來的數據,編碼格式為AJAX在請求頭中設置的charset=utf-8,PHP操作的過程中可以通過iconv函數庫自行轉碼,例如iconv("UTF-8","GB2312//IGNORE",$data)

connection: 在PHP與數據庫連接的過程中可以設置connection過程中使用的編碼格式,例如CodeIgniter框架可以在數據庫配置文件database.php中,設置"char_set" => "latin1"

databases: 數據會先把數據從php客戶端的編碼轉為轉為connection中設置的編碼,再以字節流的形式傳輸并插入數據庫。

字符編碼

常用的編碼分為

UTF-8 萬國碼,就是它是一種變長的編碼方式

latin1 又稱“西歐語言”,是mysql數據庫默認設置。為單字節編碼

gb2312 一共收錄了7445個字符,包括6763個漢字和682個其它符號。

GBK 漢字內碼擴展規范,支持繁體與簡體和許多符號

UTF-8

走上國際化就靠它了。現在推薦使用UTF-8,這樣外國人打開我們的網站的時候不需要轉碼,直接就能使用。
不多說了,大家都認識。

看一下他的編碼特質
UTF-8的設計有以下的多字符組序列的特質

單字節字符的最高有效比特永遠為0。

多字節序列中的首個字符組的幾個最高有效比特決定了序列的長度。最高有效位為110的是2字節序列,而1110的是三字節序列,如此類推。

多字節序列中其余的字節中的首兩個最高有效比特為10。

UTF-8的這些特質,保證了一個字符的字節序列不會包含在另一個字符的字節序列中。這確保了以字節為基礎的部分字符串比對(sub-string match)
方法可以適用于在文字中搜索字或詞。有些比較舊的可變長度8位編碼(如Shift JIS)沒有這個特質,故字符串比對的算法變得相當復雜。雖然這增加了UTF-8
編碼的字符串的信息冗余,但是利多于弊。另外,數據壓縮并非Unicode的目的,所以不可混為一談。即使在發送過程中有部分字節因錯誤或干擾而完全丟失,
還是有可能在下一個字符的起點重新同步,令受損范圍受到限制。

另一方面,由于其字節序列設計,如果一個疑似為字符串的序列被驗證為UTF-8編碼,那么我們可以有把握地說它是UTF-8字符串。一段兩字節隨機序列碰巧為合法的UTF-8而非ASCII的概率為32分1。對于三字節序列的概率為256分1,對更長的序列的概率就更低了。

latin1

latin1編碼是單字節編碼,向下兼容ASCII,其編碼范圍是0x00-0xFF,0x00-0x7F之間完全和ASCII一致,0x80-0x9F之間是控制字符,0xA0-0xFF之間是文字符號。

因為latin1編碼范圍使用了單字節內的所有空間,在支持latin1的系統中傳輸和存儲其他任何編碼的字節流都不會被拋棄。換言之,把其他任何編碼的字節流當作latin1編碼看待都沒有問題。
這是個很重要的特性,MySQL數據庫默認編碼是Latin1就是利用了這個特性,latin1編碼是一個8位的容器。

把一個gbk編碼的串寫入latin1的表,不會有任何問題,保存的是原封不動的字節流,從表中讀取已寫入的串也不會有任何問題,且讀出的字節流就和當初寫入的完全一致。

讀取出來以后,如果在終端下,就會理解成locale類型(如果locale系gbk,當時寫入的gbk中文串可正常回顯)讀取出來以后,如果要寫入文件,則文件編碼方式即當時寫入的字節流編碼,如gbk寫入的,讀出存入文件后,文件編碼也是gbk!
但是如果混著寫(utf-8 + gbk),那編輯器就犯蒙了,就可能會顯示會有亂碼。

當然,基于可維護的角度,還是統一為UTF-8編碼格式,以免出現亂碼。

GBK與gb2312

因為歷史原因,很多網頁和數據庫依然使用這個編碼格式
應該逐步升級為UTF-8。

文件編碼

每個文件都設置了其編碼的格式,大部分推薦使用UTF-8。

VIM文件編碼示例

一個文本文件,vim打開的時候按某種編碼A打開,轉換成某種編碼B,然后保存的時候轉換成另一種編碼C,其他文本編輯器類似,可能沒有vim這么可以設置和自動完成。
編碼B:對于整個文件沒有影響,只是事關顯示的,就是vim與操作系統交互時候使用的編碼。

編碼A:使用 set fileencodings=ucs-bom,utf-8,gbk,cp936,latin-1設置。vim 按照設置的順序檢查檢測文件的編碼。因為某些編碼里不存在某些二進制序列的組合,所以如果檢測到就認為不是這種編碼,檢查下一種編碼,否則就認為是這一種。因為latin-1可以出現任何二進制序列的組合,所以如果放到第一個,那么將永遠以latin-1顯示。

在一般的二進制文件里是不存在字符編碼的標記的。但是Unicode里面有個特殊叫做零寬度空格(FEFF)而FFFE是不存在的編碼,所以在Unicode的標準里可以人為的在開始加入這個字符(這個字符在任何字體下都是沒有寬度的,在中文字符里面沒有任何的效果跟沒有一樣,是為了照顧東南亞某些語言的顯示而設置的)。這樣就便于文本編輯器檢查字符和字節順序,但是在代碼里include這種文件經常會出問題(這可是個大坑,編譯器會認為這是一個非法字符,可是你又看不到)。

編碼B:set fileencoding=utf-8,保存時候使用的編碼,保存的時候自動轉換為另一種編碼。但是如果一開始打開的時候就識別錯了編碼,再轉換的時候一個不存在的字符也是不會完轉換的。

參考資料

mysql的latin1 支持中文

UTF-8維基百科

VIM 文件編碼識別與亂碼處理

WilsonLiu"s blog首發地址:http://blog.wilsonliu.cn

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/21804.html

相關文章

  • 前后交互過程中的編碼

    摘要:前后端交互過程中涉及的編碼首先,瀏覽器的設置里有設置編碼格式,一般設置為。按照設置的順序檢查檢測文件的編碼。 起因 最近在寫PHP,本身對PHP不太熟練。然后遇到編碼這個問題,困擾了大半天,索性,系統探索解決一番。 前后端交互過程中涉及的編碼 Browser cilent: 首先,瀏覽器的設置里有設置編碼格式,一般設置為UTF-8。 AJAX request: AJAX異步請求的過程...

    William_Sang 評論0 收藏0
  • JavaScript中幾個重要的知識點(3) ---- Ajax

    摘要:與響應不同的是,身份驗證并不能提供任何幫助,而且這個請求也不應該被重復提交。 JavaScript中幾個最重要的大知識點 面向對象 DOM事件 異步交互ajax AJAX AJAX是異步的javascript和xml(Asynchronous Javascript And XML)的縮寫,用于網頁局部刷新,提升用戶瀏覽體驗 通常前端程序員關于AJAX的掌握僅僅停留在會用AJAX發送...

    starsfun 評論0 收藏0
  • 觸屏版開發總結

    摘要:概述前段時間剛剛完成公司觸屏版項目,我覺得很有必要寫一篇文章總結下自己的心得和踩過的坑。小結個人覺得整個開發流程就是一體的,沒有絕對的前后端分離。細數下開發過程中遇到的坑。最近在看模板,貌似很吊的樣子總結學習就是不斷踩坑的過程啊 概述 前段時間剛剛完成公司觸屏版項目,我覺得很有必要寫一篇文章總結下自己的心得和踩過的坑。每次回頭看看自己寫的代碼,都有不一樣的體會,不過大致感覺都是驚人的...

    張利勇 評論0 收藏0

發表評論

0條評論

explorer_ddf

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<