找回密碼
 立即注冊(cè)

QQ登錄

只需一步,快速開始

搜索
查看: 2701|回復(fù): 0
打印 上一主題 下一主題
收起左側(cè)

各種編碼格式

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
ID:74985 發(fā)表于 2015-3-21 03:07 | 只看該作者 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
從ASCII、GB2312、GBK到GB18030,這些編碼方法是向下兼容的,即同一個(gè)字符在這些方案中總是有相同的編碼,后面的標(biāo)準(zhǔn)支持更多的字符。而Unicode只與ASCII兼容(更準(zhǔn)確地說(shuō),是與ISO-8859-1兼容),與GB碼不兼容。例如“漢”字的Unicode編碼是6C49,而GB碼是BABA。
因此如果一個(gè)系統(tǒng)支持GB碼,而另一個(gè)系統(tǒng)支持UNICODE碼,這兩個(gè)系統(tǒng)如果想進(jìn)行“說(shuō)話”的話。二者必須進(jìn)行轉(zhuǎn)碼。


但是不同的編碼對(duì)應(yīng)的機(jī)內(nèi)碼也是不一樣的,比如漢字“啊”,采用GB2312的方式存到內(nèi)存的數(shù)可能是BABA,但是UNICODE碼存到內(nèi)存中的數(shù)為1234。



在計(jì)算機(jī)中字符通常并不是保存為圖像,每個(gè)字符都是使用一個(gè)編碼來(lái)表示的,而每個(gè)字符究竟使用哪個(gè)編碼代表,要取決于使用哪個(gè)字符集(charset)。
“中國(guó)北京香蕉是個(gè)大笨蛋”這是我定義的aka字符集;各字符對(duì)應(yīng)代碼點(diǎn)為:

北 00000001
京 00000010
香 10000001
蕉 10000010
是 10000100
個(gè) 10001000
大 10010000
笨 10100000
蛋 11000000
中 00000100
國(guó) 00001000
下面是我定義的 zixia 編碼方案(8位),可以看到它的編碼中表示了aka字符集的所有字符對(duì)應(yīng)的 代碼單元;
北 10000001
京 10000010
香 00000001
蕉 00000010
是 00000100
個(gè) 00001000
大 00010000
笨 00100000
蛋 01000000
中 10000100
國(guó) 10001000
所謂文本文件 就是我們按一定編碼方式將二進(jìn)制數(shù)據(jù)表示為對(duì)應(yīng)的文本如00000001000000100000010000001000000100000010000001000000這樣的文件。我用一個(gè)支持zixia編碼和aka字符集的記事本打開,它就按照編碼方案顯示為  “香蕉是個(gè)大笨蛋 ”
如果我把這些字符按照GBK另存一個(gè)文件,那么則肯定不是這個(gè),而是
1100111111100011 1011110110110110 1100101011000111 1011100011110110 1011010011110011 1011000110111111 1011010110110000 110100001010

分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏 分享淘帖 頂 踩
回復(fù)

使用道具 舉報(bào)

本版積分規(guī)則

小黑屋|51黑電子論壇 |51黑電子論壇6群 QQ 管理員QQ:125739409;技術(shù)交流QQ群281945664

Powered by 單片機(jī)教程網(wǎng)

快速回復(fù) 返回頂部 返回列表