HTML的語(yǔ)言編碼有哪一些
發(fā)表時(shí)間:2023-12-25 來(lái)源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]在HTML里,編碼可導(dǎo)致瀏覽者通過(guò)IE時(shí)候網(wǎng)頁(yè)亂碼,也可以導(dǎo)致div+css的兼容性Hack,編碼非常的重要,一般編碼的位置放在HTML網(wǎng)頁(yè)中的<head>和</head>中間。今天我們就介紹一下關(guān)于編碼的知識(shí)。一般這段網(wǎng)頁(yè)編碼放在html網(wǎng)頁(yè)中的<head>和...
在HTML里,編碼可導(dǎo)致瀏覽者通過(guò)IE時(shí)候網(wǎng)頁(yè)亂碼,也可以導(dǎo)致div+css的兼容性Hack,編碼非常的重要,一般編碼的位置放在HTML網(wǎng)頁(yè)中的<
head>和</head>中間。今天我們就介紹一下關(guān)于編碼的知識(shí)。
一般這段網(wǎng)頁(yè)編碼放在html網(wǎng)頁(yè)中的<head>和</head>中間。
html編碼樣式
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
通過(guò)改變charset=utf-8中的utf-8就可以改變網(wǎng)頁(yè)的編碼。
一般我們?cè)趯慍SS文件時(shí)候也需要在CSS文件頂部使用@charset "utf-8";來(lái)定義此CSS文件編碼類型。一般html源代碼和css文件編碼要統(tǒng)一,如果不統(tǒng)一會(huì)導(dǎo)致CSS hack,頁(yè)面亂碼網(wǎng)頁(yè)頁(yè)面排版亂等兼容問(wèn)題。
常用html編碼種類
國(guó)內(nèi)常用的流行的有utf-8、gb2312這兩種。一般這兩種類型就能滿足國(guó)內(nèi)網(wǎng)頁(yè)編碼需求。當(dāng)然程序和數(shù)據(jù)庫(kù)中也會(huì)用到這兩種編碼類型來(lái)處理網(wǎng)頁(yè)和存儲(chǔ)數(shù)據(jù)類型。
UTF-8 有一下特性
UCS 字符 U+0000 到 U+007F (ASCII) 被編碼為字節(jié) 0x00 到 0x7F (ASCII 兼容). 這意味著只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 兩種編碼方式下是一樣的.
所有 >U+007F 的 UCS 字符被編碼為一個(gè)多個(gè)字節(jié)的串, 每個(gè)字節(jié)都有標(biāo)記位集. 因此, ASCII 字節(jié) (0x00-0x7F) 不可能作為任何其他字符的一部分.
表示非 ASCII 字符的多字節(jié)串的第一個(gè)字節(jié)總是在 0xC0 到 0xFD 的范圍里, 并指出這個(gè)字符包含多少個(gè)字節(jié). 多字節(jié)串的其余字節(jié)都在 0x80 到 0xBF 范圍里. 這使得重新同步非常容易, 并使編碼無(wú)國(guó)界, 且很少受丟失字節(jié)的影響.
可以編入所有可能的 231個(gè) UCS 代碼
UTF-8 編碼字符理論上可以最多到 6 個(gè)字節(jié)長(zhǎng), 然而 16 位 BMP 字符最多只用到 3 字節(jié)長(zhǎng).
Bigendian UCS-4 字節(jié)串的排列順序是預(yù)定的.
字節(jié) 0xFE 和 0xFF 在 UTF-8 編碼中從未用到.
GB2312 有以下特性
GB2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字,其中一級(jí)漢字3755個(gè),二級(jí)漢字3008個(gè);同時(shí),GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄羅斯語(yǔ)西里爾字母在內(nèi)的682個(gè)全形字符。
GB2312的出現(xiàn),基本滿足了漢字的計(jì)算機(jī)處理需要,它所收錄的漢字已經(jīng)覆蓋99.75%的使用頻率。GB2312中對(duì)所收漢字進(jìn)行了“分區(qū)”處理,每區(qū)含有94個(gè)漢字/符號(hào)。這種表示方式也稱為區(qū)位碼。
01-09區(qū)為特殊符號(hào)。
16-55區(qū)為一級(jí)漢字,按拼音排序。
56-87區(qū)為二級(jí)漢字,按部首/筆畫排序。
10-15區(qū)及88-94區(qū)則未有編碼。
舉例來(lái)說(shuō),“啊”字是GB2312之中的第一個(gè)漢字,它的區(qū)位碼就是1601。字節(jié)結(jié)構(gòu)在使用GB2312的程序中,通常采用EUC儲(chǔ)存方法,以便兼容于ASCII。每個(gè)漢字及符號(hào)以兩個(gè)字節(jié)來(lái)表示。第一個(gè)字節(jié)稱為“高位字節(jié)”,第二個(gè)字節(jié)稱為“低位字節(jié)”。 “高位字節(jié)”使用了0xA1-0xF7(把01-87區(qū)的區(qū)號(hào)加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多數(shù)程序中,會(huì)以0xB0A1儲(chǔ)存。(與區(qū)位碼對(duì)比:0xB0=0xA0+16,0xA1=0xA0+1)。
所以GB2312編碼中漢字區(qū)碼的十進(jìn)制是從176到247,位碼是從161到255.之所以存儲(chǔ)了6763小于82*94=6768,是因?yàn)樵趨^(qū)碼為215,位碼為250-254之間共五個(gè)編碼沒(méi)有漢字編碼,所以6768-5=6763個(gè)。
GB2312編碼可以通俗理解為國(guó)內(nèi)通用的語(yǔ)言。
推薦charset使用編碼
UTF-8可以通俗理解簡(jiǎn)體繁體可用此編碼如臺(tái)灣和內(nèi)地使用此編碼。
因編碼導(dǎo)致網(wǎng)頁(yè)兼容錯(cuò)誤問(wèn)題
如果編碼混排將使網(wǎng)頁(yè)亂碼也叫不兼容,特別是在CSS注釋中使用了編碼混排將導(dǎo)致css hack。
希望以后在制作網(wǎng)頁(yè)的時(shí)候千萬(wàn)不要忘記對(duì)網(wǎng)頁(yè)編碼的聲明。
以上就是HTML語(yǔ)言編碼的知識(shí),更多精彩請(qǐng)關(guān)注php中文網(wǎng)其它相關(guān)文章!
相關(guān)內(nèi)容:
怎么知道DIV設(shè)置什么CSS屬性樣式?
為什么要對(duì)DIV設(shè)置CSS樣式?
html 的<header>標(biāo)簽需要怎么使用
以上就是HTML的語(yǔ)言編碼有哪些的詳細(xì)內(nèi)容,更多請(qǐng)關(guān)注php中文網(wǎng)其它相關(guān)文章!
網(wǎng)站建設(shè)是一個(gè)廣義的術(shù)語(yǔ),涵蓋了許多不同的技能和學(xué)科中所使用的生產(chǎn)和維護(hù)的網(wǎng)站。