當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  編程技術(shù) >  正文

網(wǎng)頁(yè)編碼為什么不用gbk或者gb2312而用utf-8

 2020-10-30 14:43  來(lái)源: 腳本之家   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

GBK的文字編碼是雙字節(jié)來(lái)表示的,至于UTF-8編碼則是用以解決國(guó)際上字符的一種多字節(jié)編碼,正如標(biāo)題所言,下面為大家詳細(xì)介紹下到底是為什么呢。

能選擇的話還是應(yīng)該用UTF-8

事實(shí)上Windows系統(tǒng)自己的程序已經(jīng)全面轉(zhuǎn)向Unicode,而GBK只是為了應(yīng)付中國(guó)標(biāo)準(zhǔn)的權(quán)宜之計(jì)。

GBK的文字編碼是雙字節(jié)來(lái)表示的,即不論中、英文字符均使用雙字節(jié)來(lái)表示,只不過(guò)為區(qū)分中文,將其最高位都定成1。

至于UTF-8編碼則是用以解決國(guó)際上字符的一種多字節(jié)編碼,它對(duì)英文使用8位(即一個(gè)字節(jié)),中文使用24位(三個(gè)字節(jié))來(lái)編碼。對(duì)于英文字符較多的論壇則用UTF-8節(jié)省空間。

GBK包含全部中文字符,

UTF-8則包含全世界所有國(guó)家需要用到的字符。

GBK是在國(guó)家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)(好像還不是國(guó)家標(biāo)準(zhǔn))

UTF-8編碼的文字可以在各國(guó)各種支持UTF8字符集的瀏覽器上顯示。

比如,如果是UTF8編碼,則在外國(guó)人的英文IE上也能顯示中文,而無(wú)需他們下載IE的中文語(yǔ)言支持包。

所以,對(duì)于英文比較多的論壇 ,使用GBK則每個(gè)字符占用2個(gè)字節(jié),而使用UTF-8英文卻只占一個(gè)字節(jié)。

請(qǐng)注意:UTF-8版本雖然具有良好的國(guó)際兼容性,但中文需要比GBK/BIG5版本多占用50%的數(shù)據(jù)庫(kù)存儲(chǔ)空間,因此并非推薦使用,僅供對(duì)國(guó)際兼容性有特殊要求的用戶使用。

簡(jiǎn)單地說(shuō):

對(duì)于中文較多的論壇,適宜用GBK編碼節(jié)省數(shù)據(jù)庫(kù)空間。

對(duì)于英文較多的論壇,適宜用UTF-8節(jié)省數(shù)據(jù)庫(kù)空間。

gbk和gb2312的區(qū)別有哪些

首先大家要了解什么是gbk?什么是gb2312?我們要知道他們都是一種字符編碼,當(dāng)然字符編碼還有很多種。

而字符編碼我們可以這樣理解:

在計(jì)算機(jī)中存放的都是0和1的二進(jìn)制值。

8個(gè)位對(duì)應(yīng)一個(gè)字節(jié),常用16進(jìn)制來(lái)表示。

那么我們?nèi)绻胍谟?jì)算機(jī)上看到我們想要的字符顯示,而不是各種0和1的數(shù)字該怎么實(shí)現(xiàn)呢?

這里我們就需要使計(jì)算機(jī)把其所存儲(chǔ)的對(duì)應(yīng)的16進(jìn)制的數(shù)值,轉(zhuǎn)化為對(duì)應(yīng)的字符,包括英文和中文等其他語(yǔ)言的字符,然后輸出到屏幕上。

所以編碼也就是,定義了一套規(guī)則,去指定哪些數(shù)值,對(duì)應(yīng)著哪些字符。

那么字符編碼,就是定義了一套規(guī)則,指定了計(jì)算機(jī)中存放的這么多值中的哪個(gè)值,對(duì)應(yīng)了電腦屏幕顯示出來(lái)的哪個(gè)字母。

綜上所述,大家應(yīng)該都能理解GBK和GB2312是一種字符編碼了吧。

下面我們?cè)倬唧w說(shuō)說(shuō)他們的區(qū)別與相同點(diǎn):

相同點(diǎn):

1、GBK和GB2312 都是16位的!

2、它們通常用在網(wǎng)頁(yè)的meta標(biāo)簽內(nèi)。

不同點(diǎn):

1、GBK字符編碼支持簡(jiǎn)體中文和繁體中文!

GBK全稱《漢字內(nèi)碼擴(kuò)展規(guī)范》(GBK即“國(guó)標(biāo)”、“擴(kuò)展”漢語(yǔ)拼音的第一個(gè)字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國(guó)全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)1995年12月1日制訂,國(guó)家技術(shù)監(jiān)督局標(biāo)準(zhǔn)化司、電子工業(yè)部科技與質(zhì)量監(jiān)督司1995年12月15日聯(lián)合以技監(jiān)標(biāo)函1995 229號(hào)文件的形式,將它確定為技術(shù)規(guī)范指導(dǎo)性文件。

2、GB2312只支持簡(jiǎn)體中文!

《信息交換用漢字編碼字符集》是由中國(guó)國(guó)家標(biāo)準(zhǔn)總局1980年發(fā)布,1981年5月1日開始實(shí)施的一套國(guó)家標(biāo)準(zhǔn),標(biāo)準(zhǔn)號(hào)是GB 2312—1980。

GB 2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè);同時(shí),GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語(yǔ)西里爾字母在內(nèi)的682個(gè)全角字符。

如果你的網(wǎng)頁(yè)主要面對(duì)使用漢語(yǔ)的中國(guó)人的話,使用 GB2312和GBK非常好,文字儲(chǔ)存體積要小,有一些優(yōu)點(diǎn)。如果你的網(wǎng)頁(yè)要面向世界的話,你再用GB2312和GBK作為網(wǎng)頁(yè)編碼的話,有些電腦上的瀏覽器沒有這種編碼,你的網(wǎng)頁(yè)漢字內(nèi)容就會(huì)變成無(wú)法識(shí)別的亂碼。

文章轉(zhuǎn)自腳本之家,原文鏈接:https://www.jb51.net/web/93434.html

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門排行

信息推薦