校驗技術(shù)

ID:3719 · 發(fā)表于 2008-7-27 10:28

校驗，是在數(shù)據(jù)傳送過程中為了檢查數(shù)據(jù)完整性的一種手段。通常的做法是發(fā)送方在數(shù)據(jù)幀之中或者之后附帶一段校驗碼，接收方通過特定的方式對接收到的所有數(shù)據(jù)做某種操作，操作的結(jié)果與預(yù)定的不符，說明傳送中發(fā)生了錯誤，而有些校驗碼還附帶糾錯功能，即檢查出錯誤后還可以恢復(fù)原數(shù)據(jù)，不過這種恢復(fù)是建立在一些假設(shè)基礎(chǔ)上的，因此在實際大量數(shù)據(jù)傳輸中并不經(jīng)常使用。
首先介紹distance的概念，distance就是兩個N位碼之間不同的位的個數(shù)。例如0110100與0111010，他們有3個位不同，distance就為3。
所有校驗碼的原理都是一樣的：即從選取一個集合，這個集合中任意2個碼的distance要大于m。只用這個集合中的元素傳輸數(shù)據(jù)，如果接收方接受到的數(shù)據(jù)不屬于此集合，說明有錯誤在傳輸中發(fā)生。上面說的校驗碼就是為了達(dá)到這個目的。
如大家最熟悉最簡單的奇偶校驗，通過添加一個校驗位，合法碼集合的任意2個碼的distance大于2，即1個合法碼至少要改變2個位才能得到另一個合法碼。
一個最小distance為m的集合，可以檢測最多m-1位錯誤的傳輸，若有m位錯誤，就會被當(dāng)作合法碼而校驗成功，還拿奇偶校驗做例子，如果發(fā)生了2個位都因錯誤改變了（如1011變?yōu)?000），奇偶校驗后還是合法的。
再說一個奇偶校驗的衍生，就是累加和校驗。奇偶校驗的算法可以描述為：我們對一個數(shù)據(jù)幀按位相加，所得的結(jié)果作為校驗位。類似的，我們講數(shù)據(jù)1byte1byte的相加，無視溢出，就得到累加和校驗byte。當(dāng)然，并不一定必須要1byte1byte相加，這取決于處理器的位數(shù)，用16位機(jī)你也可以用2byte做累加和。

海明校驗：distance=3,即可以校驗2位錯誤
海明校驗的基本思想是把數(shù)據(jù)分組，分別對每個組做奇偶校驗。通過一系列規(guī)則的確定檢查并且改正錯誤
分組規(guī)則：海明校驗用bit1,bit2,bit4,bit8,bit16,bit32.......做為校驗位，插到數(shù)據(jù)幀里面。這里的bit1,bit2指的是將校驗位插入后，從低位到高位進(jìn)行編號，從1開始編。例如發(fā)送01010010111（高位在前），則其中最末位1（bit1）,次末位1（bit2）,以及0(bit4),1(bit8),就是校驗位。

由于校驗位是2的倍數(shù)，因此校驗位的編碼都只含有1個1，如bit1=bit0001,bit2=bit0010,bit4=bit0100,bit8=bit1000.......那么，我們把所有與之對應(yīng)位是1的分在一組，如bit3=bit0011,bit5=bit0101,bit7=bit0111,bit9=bit1001,bit11=bit1011,bit13=bit1101,bit15=bit1111這些最低位都為1，因此與bit1校驗位分在同一組。對這組做奇校驗或者偶校驗，決定bit1的值。

bit7       bit6       bit5       bit3       bit4       bit2       bit1
1          0          1                         0
1          0                         0                      1
1          1                         0                                        0
這是一個7位數(shù)據(jù)的例子，bit7,6,5與bit4分為一組；bit7,6,3與bit2分為一組；bit7,5,3與bit1分為一組;對每行做偶校驗，即可決定bit4,bit2,bit1的值
下面看下海明校驗怎樣糾錯，在實際傳輸中，兩位都發(fā)生錯誤的幾率比一位發(fā)生錯誤的幾率高很多，我們假設(shè)只有1位發(fā)生錯誤，如：
bit7       bit6       bit5       bit3       bit4       bit2       bit1
1          0          1                         1
1          0                         0                      0
1          1                         0                                     0
可以看出，第一行與第二行不滿足偶校驗規(guī)則，而能夠引起這一結(jié)果的只有可能是bit6在傳輸中發(fā)生了錯誤，因為只有bit6對且僅對這兩行產(chǎn)生效果。我們將bit6取反就可得到未出錯的數(shù)據(jù)

CRC校驗，cyclic redundancy check 循環(huán)冗余碼校驗。這種校驗被廣泛用于數(shù)據(jù)傳輸之中，因為它的糾錯率很高，你的硬盤上，每512個字節(jié)后就會有一個CRC校驗碼，但是大部分人可能都不知道CRC校驗的原理，這是我研究好久才得出的結(jié)論，網(wǎng)上絕對找不到的。
CRC校驗的原理很簡單：任何一個數(shù)位異或它本身，就得到全0。下面我們看一下CRC是如何產(chǎn)生校驗碼的。先介紹一下生成多項式的概念，一個多項式可以由一段二進(jìn)制代碼表示，如x3+x2+1可以用1101來表示，即1*x3+1*x2+0*x1+1*x0(次方我打不出來。。。)數(shù)據(jù)傳送中，接受方和發(fā)送方先約定一個生成多項式（你可以在各種通信協(xié)議中找到，例如CRC-ITU,CRC-16，CRC-12等等），用數(shù)據(jù)幀左移N位后所代表的多項式除以NN+1位的生成多項式，就可得到N位的余式，這個余式代表的二進(jìn)制序列就作為CRC校驗碼。這里的多項式除法和我們一般的除法有一些不同，大家不要深究，但是有除法的概念會對以后查表算法的理解有很到的幫助，所以在這里介紹一下。
那么怎么進(jìn)行這種除法呢？比如數(shù)據(jù)幀為1011，生成多項式為11011，以生成4位CRC，首先把數(shù)據(jù)幀左移4位成10110000，寫在被除數(shù)的位置，然后和11011首位對齊，做位異或：
10110000
11011
01101000（結(jié)果）
將11011右移直到上一步結(jié)果的左數(shù)第一個1與11011首位對齊，繼續(xù)做位異或，直到結(jié)果為4位或以下
01101000
011011
00000100
則4位CRC就為0100
將來我們發(fā)送的數(shù)據(jù)就是10110100，將CRC附在數(shù)據(jù)幀后面。
很奇妙的是：把這個發(fā)送數(shù)據(jù)按上述規(guī)律再做同樣的位異或操作，得到必定是全0，（原理會在以后講到）大家可以筆算一下。這就是CRC檢查錯誤的方法，CRC也有糾錯功能，如果得到結(jié)果不是全0，則還按上述規(guī)則繼續(xù)位異或，我們會發(fā)現(xiàn)余數(shù)是按某個規(guī)律循環(huán)的，這也是循環(huán)冗余碼校驗之所以得名的原因，直到出現(xiàn)某個特殊的余數(shù)時，可以證明出錯位此時對應(yīng)的就是出錯位。但在實際中大量數(shù)據(jù)傳輸這種糾錯能力很少應(yīng)用，這里就不詳細(xì)介紹了。

上次我們已經(jīng)得到計算CRC的方法，在這里重復(fù)下：求N位CRC
先初始化一個N位的移位寄存器為全0，每次將寄存器里數(shù)據(jù)左移一位，左移后，取數(shù)據(jù)幀1位輸入（從高位到低位順序�。斎胛籢溢出位=1，整個寄存器需要異或上生成多項式除去最高位.輸入位^溢出位=0，不做任何操作，繼續(xù)左移求下一位的CRC。
按這個算法，很容易寫出軟件計算的程序
/*------產(chǎn)生1bitCRC校驗------*/
void Bit_gen(bit in)
{bit temp=in^(CRC&0x80);//溢出位與入位異或,決定CRC是否與生成多項式按位異或
CRC<<=1;//右移
if(temp) CRC^=CRCgen;//CRCgen為CRC生成多項式對應(yīng)的序列
}

現(xiàn)在就可以解釋為什么CRC校驗之后是全0了，收到數(shù)據(jù)幀+CRC校驗碼后，繼續(xù)用以上算法，如果傳輸無誤將數(shù)據(jù)幀輸入后，得到的一定是和收到的CRC校驗碼相同的碼，那么每次輸入和溢出位必定都相等，所以異或之后一定為0，即不需要再異或生成多項式去最高位，這樣左移N位后，得到的就是N個0。

實際上，寄存器的初始化不需要是全0（但收發(fā)雙方初始化要相同），也不需要是高位先入（收發(fā)雙方入的順序要一樣），只要算法一樣，執(zhí)行CRC校驗都可以校驗出誤碼來。

顯然，如要計算一個龐大的數(shù)據(jù)幀，這種按位輸入的方法顯然是太慢了，512KB的數(shù)據(jù)就要移位512*1024*1024次，這在有些情況中是不能容忍的，為此，引入byte型算法，即每次計算一個byte的CRC

byte型算法：對于給定的一個生成多項式，1byte數(shù)據(jù)的CRC有256個不同的可能值，即每1個8位數(shù)據(jù)都對應(yīng)了一個CRC碼，byte型算法就是把這個碼表存到程序儲存器里，通過查表就可得到任1byte的CRC。
比如unsigned int code CRClist[256]=
{0x0000, 0x1021, 0x2042, 0x3063, 0x4084, 0x50a5, 0x60c6, 0x70e7,
0x8108, 0x9129, 0xa14a, 0xb16b, 0xc18c, 0xd1ad, 0xe1ce, 0xf1ef,
0x1231, 0x0210, 0x3273, 0x2252, 0x52b5, 0x4294, 0x72f7, 0x62d6,
0x9339, 0x8318, 0xb37b, 0xa35a, 0xd3bd, 0xc39c, 0xf3ff, 0xe3de,
0x2462, 0x3443, 0x0420, 0x1401, 0x64e6, 0x74c7, 0x44a4, 0x5485,
0xa56a, 0xb54b, 0x8528, 0x9509, 0xe5ee, 0xf5cf, 0xc5ac, 0xd58d,
0x3653, 0x2672, 0x1611, 0x0630, 0x76d7, 0x66f6, 0x5695, 0x46b4,
0xb75b, 0xa77a, 0x9719, 0x8738, 0xf7df, 0xe7fe, 0xd79d, 0xc7bc,
0x48c4, 0x58e5, 0x6886, 0x78a7, 0x0840, 0x1861, 0x2802, 0x3823,
0xc9cc, 0xd9ed, 0xe98e, 0xf9af, 0x8948, 0x9969, 0xa90a, 0xb92b,
0x5af5, 0x4ad4, 0x7ab7, 0x6a96, 0x1a71, 0x0a50, 0x3a33, 0x2a12,
0xdbfd, 0xcbdc, 0xfbbf, 0xeb9e, 0x9b79, 0x8b58, 0xbb3b, 0xab1a,
0x6ca6, 0x7c87, 0x4ce4, 0x5cc5, 0x2c22, 0x3c03, 0x0c60, 0x1c41,
0xedae, 0xfd8f, 0xcdec, 0xddcd, 0xad2a, 0xbd0b, 0x8d68, 0x9d49,
0x7e97, 0x6eb6, 0x5ed5, 0x4ef4, 0x3e13, 0x2e32, 0x1e51, 0x0e70,
0xff9f, 0xefbe, 0xdfdd, 0xcffc, 0xbf1b, 0xaf3a, 0x9f59, 0x8f78,
0x9188, 0x81a9, 0xb1ca, 0xa1eb, 0xd10c, 0xc12d, 0xf14e, 0xe16f,
0x1080, 0x00a1, 0x30c2, 0x20e3, 0x5004, 0x4025, 0x7046, 0x6067,
0x83b9, 0x9398, 0xa3fb, 0xb3da, 0xc33d, 0xd31c, 0xe37f, 0xf35e,
0x02b1, 0x1290, 0x22f3, 0x32d2, 0x4235, 0x5214, 0x6277, 0x7256,
0xb5ea, 0xa5cb, 0x95a8, 0x8589, 0xf56e, 0xe54f, 0xd52c, 0xc50d,
0x34e2, 0x24c3, 0x14a0, 0x0481, 0x7466, 0x6447, 0x5424, 0x4405,
0xa7db, 0xb7fa, 0x8799, 0x97b8, 0xe75f, 0xf77e, 0xc71d, 0xd73c,
0x26d3, 0x36f2, 0x0691, 0x16b0, 0x6657, 0x7676, 0x4615, 0x5634,
0xd94c, 0xc96d, 0xf90e, 0xe92f, 0x99c8, 0x89e9, 0xb98a, 0xa9ab,
0x5844, 0x4865, 0x7806, 0x6827, 0x18c0, 0x08e1, 0x3882, 0x28a3,
0xcb7d, 0xdb5c, 0xeb3f, 0xfb1e, 0x8bf9, 0x9bd8, 0xabbb, 0xbb9a,
0x4a75, 0x5a54, 0x6a37, 0x7a16, 0x0af1, 0x1ad0, 0x2ab3, 0x3a92,
0xfd2e, 0xed0f, 0xdd6c, 0xcd4d, 0xbdaa, 0xad8b, 0x9de8, 0x8dc9,
0x7c26, 0x6c07, 0x5c64, 0x4c45, 0x3ca2, 0x2c83, 0x1ce0, 0x0cc1,
0xef1f, 0xff3e, 0xcf5d, 0xdf7c, 0xaf9b, 0xbfba, 0x8fd9, 0x9ff8,
0x6e17, 0x7e36, 0x4e55, 0x5e74, 0x2e93, 0x3eb2, 0x0ed1, 0x1ef0
};
這是CRC-16通信協(xié)議規(guī)定的CRC碼表，它的生成多項式是0x1021，是初始化全0得到的碼表。值得一提的是，對于一個生成多項式，初始化不同，得到的碼表也不同，應(yīng)此余式表可以是多種多樣的，所以大家見到和這個表不一樣的表也不要驚訝~~
這個表在儲存器里以一維數(shù)組的形式儲存，對應(yīng)第i 個元素就是i 的CRC碼。如00000000的CRC就是第一個0x0000.
那么怎么算多byte的CRC呢？其實算法和按位求的算法很類似：以CRC-16為例
先初始化一個16位的移位寄存器，每次將寄存器里數(shù)據(jù)左移一byte，左移后，取數(shù)據(jù)幀1byte輸入，輸入byte按位異或溢出byte，（這是一個1byte的數(shù)據(jù)）得到在表中的位置，查表得CRC（這是16位的數(shù)據(jù)）再加上寄存器里的值，就是此byte輸入后的CRC。
程序如下：
void CRC_gen(uchar byte)
{uchar temp=(uchar)(CRC>>8);//取高字節(jié)CRC
CRC<<=8;//CRC左移1byte
CRC^=CRClist[byte^temp];//此字節(jié)的CRC=(上字節(jié)的CRC左移1byte)^(上字節(jié)CRC高字節(jié)+此字節(jié)查表后得到的CRC)
}

帳號		自動登錄	找回密碼
密碼			立即注冊