校驗(yàn),是在數(shù)據(jù)傳送過(guò)程中為了檢查數(shù)據(jù)完整性的一種手段。通常的做法是發(fā)送方在數(shù)據(jù)幀之中或者之后附帶一段校驗(yàn)碼,接收方通過(guò)特定的方式對(duì)接收到的所有數(shù)據(jù)做某種操作,操作的結(jié)果與預(yù)定的不符,說(shuō)明傳送中發(fā)生了錯(cuò)誤,而有些校驗(yàn)碼還附帶糾錯(cuò)功能,即檢查出錯(cuò)誤后還可以恢復(fù)原數(shù)據(jù),不過(guò)這種恢復(fù)是建立在一些假設(shè)基礎(chǔ)上的,因此在實(shí)際大量數(shù)據(jù)傳輸中并不經(jīng)常使用。 首先介紹distance的概念,distance就是兩個(gè)N位碼之間不同的位的個(gè)數(shù)。例如0110100與0111010,他們有3個(gè)位不同,distance就為3。 所有校驗(yàn)碼的原理都是一樣的:即從選取一個(gè)集合,這個(gè)集合中任意2個(gè)碼的distance要大于m。只用這個(gè)集合中的元素傳輸數(shù)據(jù),如果接收方接受到的數(shù)據(jù)不屬于此集合,說(shuō)明有錯(cuò)誤在傳輸中發(fā)生。上面說(shuō)的校驗(yàn)碼就是為了達(dá)到這個(gè)目的。 如大家最熟悉最簡(jiǎn)單的奇偶校驗(yàn),通過(guò)添加一個(gè)校驗(yàn)位,合法碼集合的任意2個(gè)碼的distance大于2,即1個(gè)合法碼至少要改變2個(gè)位才能得到另一個(gè)合法碼。 一個(gè)最小distance為m的集合,可以檢測(cè)最多m-1位錯(cuò)誤的傳輸,若有m位錯(cuò)誤,就會(huì)被當(dāng)作合法碼而校驗(yàn)成功,還拿奇偶校驗(yàn)做例子,如果發(fā)生了2個(gè)位都因錯(cuò)誤改變了(如1011變?yōu)?000),奇偶校驗(yàn)后還是合法的。 再說(shuō)一個(gè)奇偶校驗(yàn)的衍生,就是累加和校驗(yàn)。奇偶校驗(yàn)的算法可以描述為:我們對(duì)一個(gè)數(shù)據(jù)幀按位相加,所得的結(jié)果作為校驗(yàn)位。類似的,我們講數(shù)據(jù)1byte1byte的相加,無(wú)視溢出,就得到累加和校驗(yàn)byte。當(dāng)然,并不一定必須要1byte1byte相加,這取決于處理器的位數(shù),用16位機(jī)你也可以用2byte做累加和。
海明校驗(yàn):distance=3,即可以校驗(yàn)2位錯(cuò)誤 海明校驗(yàn)的基本思想是把數(shù)據(jù)分組,分別對(duì)每個(gè)組做奇偶校驗(yàn)。通過(guò)一系列規(guī)則的確定檢查并且改正錯(cuò)誤 分組規(guī)則:海明校驗(yàn)用bit1,bit2,bit4,bit8,bit16,bit32.......做為校驗(yàn)位,插到數(shù)據(jù)幀里面。這里的bit1,bit2指的是將校驗(yàn)位插入后,從低位到高位進(jìn)行編號(hào),從1開(kāi)始編。例如發(fā)送01010010111(高位在前),則其中最末位1(bit1),次末位1(bit2),以及0(bit4),1(bit8),就是校驗(yàn)位。
由于校驗(yàn)位是2的倍數(shù),因此校驗(yàn)位的編碼都只含有1個(gè)1,如bit1=bit0001,bit2=bit0010,bit4=bit0100,bit8=bit1000.......那么,我們把所有與之對(duì)應(yīng)位是1的分在一組,如bit3=bit0011,bit5=bit0101,bit7=bit0111,bit9=bit1001,bit11=bit1011,bit13=bit1101,bit15=bit1111這些最低位都為1,因此與bit1校驗(yàn)位分在同一組。對(duì)這組做奇校驗(yàn)或者偶校驗(yàn),決定bit1的值。
bit7 bit6 bit5 bit3 bit4 bit2 bit1 1 0 1 0 1 0 0 1 1 1 0 0 這是一個(gè)7位數(shù)據(jù)的例子,bit7,6,5與bit4分為一組;bit7,6,3與bit2分為一組;bit7,5,3與bit1分為一組;對(duì)每行做偶校驗(yàn),即可決定bit4,bit2,bit1的值 下面看下海明校驗(yàn)怎樣糾錯(cuò),在實(shí)際傳輸中,兩位都發(fā)生錯(cuò)誤的幾率比一位發(fā)生錯(cuò)誤的幾率高很多,我們假設(shè)只有1位發(fā)生錯(cuò)誤,如: bit7 bit6 bit5 bit3 bit4 bit2 bit1 1 0 1 1 1 0 0 0 1 1 0 0 可以看出,第一行與第二行不滿足偶校驗(yàn)規(guī)則,而能夠引起這一結(jié)果的只有可能是bit6在傳輸中發(fā)生了錯(cuò)誤,因?yàn)橹挥衎it6對(duì)且僅對(duì)這兩行產(chǎn)生效果。我們將bit6取反 就可得到未出錯(cuò)的數(shù)據(jù)
CRC校驗(yàn),cyclic redundancy check 循環(huán)冗余碼校驗(yàn) 。這種校驗(yàn)被廣泛用于數(shù)據(jù)傳輸之中,因?yàn)樗募m錯(cuò)率很高,你的硬盤(pán)上,每512個(gè)字節(jié)后就會(huì)有一個(gè)CRC校驗(yàn)碼,但是大部分人可能都不知道CRC校驗(yàn)的原理,這是我研究好久才得出的結(jié)論,網(wǎng)上絕對(duì)找不到的。 CRC校驗(yàn)的原理很簡(jiǎn)單:任何一個(gè)數(shù)位異或它本身,就得到全0。下面我們看一下CRC是如何產(chǎn)生校驗(yàn)碼的。先介紹一下生成多項(xiàng)式的概念,一個(gè)多項(xiàng)式可以由一段二進(jìn)制代碼表示,如x3+x2+1可以用1101來(lái)表示,即1*x3+1*x2+0*x1+1*x0(次方我打不出來(lái)。。。)數(shù)據(jù)傳送中,接受方和發(fā)送方先約定一個(gè)生成多項(xiàng)式(你可以在各種通信協(xié)議中找到,例如CRC-ITU,CRC-16,CRC-12等等),用數(shù)據(jù)幀左移N位后所代表的多項(xiàng)式除以NN+1位的生成多項(xiàng)式,就可得到N位的余式,這個(gè)余式代表的二進(jìn)制序列就作為CRC校驗(yàn)碼。這里的多項(xiàng)式除法和我們一般的除法有一些不同,大家不要深究,但是有除法的概念會(huì)對(duì)以后查表算法的理解有很到的幫助,所以在這里介紹一下。 那么怎么進(jìn)行這種除法呢?比如數(shù)據(jù)幀為1011,生成多項(xiàng)式為11011,以生成4位CRC,首先把數(shù)據(jù)幀左移4位成10110000,寫(xiě)在被除數(shù)的位置,然后和11011首位對(duì)齊,做位異或: 10110000 11011 01101000(結(jié)果) 將11011右移直到上一步結(jié)果的左數(shù)第一個(gè)1與11011首位對(duì)齊,繼續(xù)做位異或,直到結(jié)果為4位或以下 01101000 011011 00000100 則4位CRC就為0100 將來(lái)我們發(fā)送的數(shù)據(jù)就是10110100,將CRC附在數(shù)據(jù)幀后面。 很奇妙的是:把這個(gè)發(fā)送數(shù)據(jù)按上述規(guī)律再做同樣的位異或操作,得到必定是全0,(原理會(huì)在以后講到)大家可以筆算一下。這就是CRC檢查錯(cuò)誤的方法,CRC也有糾錯(cuò)功能,如果得到結(jié)果不是全0,則還按上述規(guī)則繼續(xù)位異或,我們會(huì)發(fā)現(xiàn)余數(shù)是按某個(gè)規(guī)律循環(huán)的,這也是循環(huán)冗余碼校驗(yàn)之所以得名的原因,直到出現(xiàn)某個(gè)特殊的余數(shù)時(shí),可以證明出錯(cuò)位此時(shí)對(duì)應(yīng)的就是出錯(cuò)位。但在實(shí)際中大量數(shù)據(jù)傳輸這種糾錯(cuò)能力很少應(yīng)用,這里就不詳細(xì)介紹了。
上次我們已經(jīng)得到計(jì)算CRC的方法,在這里重復(fù)下:求N位CRC 先初始化一個(gè)N位的移位寄存器為全0,每次將寄存器里數(shù)據(jù)左移一位,左移后,取數(shù)據(jù)幀1位輸入(從高位到低位順序取),輸入位^溢出位=1,整個(gè)寄存器需要異或上生成多項(xiàng)式除去最高位.輸入位^溢出位=0,不做任何操作,繼續(xù)左移求下一位的CRC。 按這個(gè)算法,很容易寫(xiě)出軟件計(jì)算的程序 /*------產(chǎn)生1bitCRC校驗(yàn)------*/ void Bit_gen(bit in) {bit temp=in^(CRC&0x80);//溢出位與入位異或,決定CRC是否與生成多項(xiàng)式按位異或 CRC<<=1;//右移 if(temp) CRC^=CRCgen;//CRCgen為CRC生成多項(xiàng)式對(duì)應(yīng)的序列 }
現(xiàn)在就可以解釋為什么CRC校驗(yàn)之后是全0了,收到數(shù)據(jù)幀+CRC校驗(yàn)碼后,繼續(xù)用以上算法,如果傳輸無(wú)誤將數(shù)據(jù)幀輸入后,得到的一定是和收到的CRC校驗(yàn)碼相同的碼,那么每次輸入和溢出位必定都相等,所以異或之后一定為0,即不需要再異或生成多項(xiàng)式去最高位,這樣左移N位后,得到的就是N個(gè)0。
實(shí)際上,寄存器的初始化不需要是全0(但收發(fā)雙方初始化要相同),也不需要是高位先入(收發(fā)雙方入的順序要一樣),只要算法一樣,執(zhí)行CRC校驗(yàn)都可以校驗(yàn)出誤碼來(lái)。
顯然,如要計(jì)算一個(gè)龐大的數(shù)據(jù)幀,這種按位輸入的方法顯然是太慢了,512KB的數(shù)據(jù)就要移位512*1024*1024次,這在有些情況中是不能容忍的,為此,引入byte型算法,即每次計(jì)算一個(gè)byte的CRC
byte型算法:對(duì)于給定的一個(gè)生成多項(xiàng)式,1byte數(shù)據(jù)的CRC有256個(gè)不同的可能值,即每1個(gè)8位數(shù)據(jù)都對(duì)應(yīng)了一個(gè)CRC碼,byte型算法就是把這個(gè)碼表存到程序儲(chǔ)存器里,通過(guò)查表就可得到任1byte的CRC。 比如unsigned int code CRClist[256]= {0x0000, 0x1021, 0x2042, 0x3063, 0x4084, 0x50a5, 0x60c6, 0x70e7, 0x8108, 0x9129, 0xa14a, 0xb16b, 0xc18c, 0xd1ad, 0xe1ce, 0xf1ef, 0x1231, 0x0210, 0x3273, 0x2252, 0x52b5, 0x4294, 0x72f7, 0x62d6, 0x9339, 0x8318, 0xb37b, 0xa35a, 0xd3bd, 0xc39c, 0xf3ff, 0xe3de, 0x2462, 0x3443, 0x0420, 0x1401, 0x64e6, 0x74c7, 0x44a4, 0x5485, 0xa56a, 0xb54b, 0x8528, 0x9509, 0xe5ee, 0xf5cf, 0xc5ac, 0xd58d, 0x3653, 0x2672, 0x1611, 0x0630, 0x76d7, 0x66f6, 0x5695, 0x46b4, 0xb75b, 0xa77a, 0x9719, 0x8738, 0xf7df, 0xe7fe, 0xd79d, 0xc7bc, 0x48c4, 0x58e5, 0x6886, 0x78a7, 0x0840, 0x1861, 0x2802, 0x3823, 0xc9cc, 0xd9ed, 0xe98e, 0xf9af, 0x8948, 0x9969, 0xa90a, 0xb92b, 0x5af5, 0x4ad4, 0x7ab7, 0x6a96, 0x1a71, 0x0a50, 0x3a33, 0x2a12, 0xdbfd, 0xcbdc, 0xfbbf, 0xeb9e, 0x9b79, 0x8b58, 0xbb3b, 0xab1a, 0x6ca6, 0x7c87, 0x4ce4, 0x5cc5, 0x2c22, 0x3c03, 0x0c60, 0x1c41, 0xedae, 0xfd8f, 0xcdec, 0xddcd, 0xad2a, 0xbd0b, 0x8d68, 0x9d49, 0x7e97, 0x6eb6, 0x5ed5, 0x4ef4, 0x3e13, 0x2e32, 0x1e51, 0x0e70, 0xff9f, 0xefbe, 0xdfdd, 0xcffc, 0xbf1b, 0xaf3a, 0x9f59, 0x8f78, 0x9188, 0x81a9, 0xb1ca, 0xa1eb, 0xd10c, 0xc12d, 0xf14e, 0xe16f, 0x1080, 0x00a1, 0x30c2, 0x20e3, 0x5004, 0x4025, 0x7046, 0x6067, 0x83b9, 0x9398, 0xa3fb, 0xb3da, 0xc33d, 0xd31c, 0xe37f, 0xf35e, 0x02b1, 0x1290, 0x22f3, 0x32d2, 0x4235, 0x5214, 0x6277, 0x7256, 0xb5ea, 0xa5cb, 0x95a8, 0x8589, 0xf56e, 0xe54f, 0xd52c, 0xc50d, 0x34e2, 0x24c3, 0x14a0, 0x0481, 0x7466, 0x6447, 0x5424, 0x4405, 0xa7db, 0xb7fa, 0x8799, 0x97b8, 0xe75f, 0xf77e, 0xc71d, 0xd73c, 0x26d3, 0x36f2, 0x0691, 0x16b0, 0x6657, 0x7676, 0x4615, 0x5634, 0xd94c, 0xc96d, 0xf90e, 0xe92f, 0x99c8, 0x89e9, 0xb98a, 0xa9ab, 0x5844, 0x4865, 0x7806, 0x6827, 0x18c0, 0x08e1, 0x3882, 0x28a3, 0xcb7d, 0xdb5c, 0xeb3f, 0xfb1e, 0x8bf9, 0x9bd8, 0xabbb, 0xbb9a, 0x4a75, 0x5a54, 0x6a37, 0x7a16, 0x0af1, 0x1ad0, 0x2ab3, 0x3a92, 0xfd2e, 0xed0f, 0xdd6c, 0xcd4d, 0xbdaa, 0xad8b, 0x9de8, 0x8dc9, 0x7c26, 0x6c07, 0x5c64, 0x4c45, 0x3ca2, 0x2c83, 0x1ce0, 0x0cc1, 0xef1f, 0xff3e, 0xcf5d, 0xdf7c, 0xaf9b, 0xbfba, 0x8fd9, 0x9ff8, 0x6e17, 0x7e36, 0x4e55, 0x5e74, 0x2e93, 0x3eb2, 0x0ed1, 0x1ef0 }; 這是CRC-16通信協(xié)議規(guī)定的CRC碼表,它的生成多項(xiàng)式是0x1021,是初始化全0得到的碼表。值得一提的是,對(duì)于一個(gè)生成多項(xiàng)式,初始化不同,得到的碼表也不同,應(yīng)此余式表可以是多種多樣的,所以大家見(jiàn)到和這個(gè)表不一樣的表也不要驚訝~~ 這個(gè)表在儲(chǔ)存器里以一維數(shù)組的形式儲(chǔ)存,對(duì)應(yīng)第i 個(gè)元素就是i 的CRC碼。如00000000的CRC就是第一個(gè)0x0000. 那么怎么算多byte的CRC呢?其實(shí)算法和按位求的算法很類似:以CRC-16為例 先初始化一個(gè)16位的移位寄存器,每次將寄存器里數(shù)據(jù)左移一byte,左移后,取數(shù)據(jù)幀1byte輸入,輸入byte按位異或溢出byte,(這是一個(gè)1byte的數(shù)據(jù))得到在表中的位置,查表得CRC(這是16位的數(shù)據(jù))再加上寄存器里的值,就是此byte輸入后的CRC。 程序如下: void CRC_gen(uchar byte) {uchar temp=(uchar)(CRC>>8);//取高字節(jié)CRC CRC<<=8;//CRC左移1byte CRC^=CRClist[byte^temp];//此字節(jié)的CRC=(上字節(jié)的CRC左移1byte)^(上字節(jié)CRC高字節(jié)+此字節(jié)查表后得到的CRC) } |