為那些苦苦尋覓DSP資料的人,提供一些幫助...... 一 DSP定點算數(shù)運算 1 數(shù)的定標(biāo) 在定點DSP芯片中,采用定點數(shù)進(jìn)行數(shù)值運算,其操作數(shù)一般采用整型數(shù)來表示。一個整型數(shù)的最大表示范圍取決于DSP芯片所給定的字長,一般為16位或24位。顯然,字長越長,所能表示的數(shù)的范圍越大,精度也越高。如無特別說明,本書均以16位字長為例。 DSP芯片的數(shù)以2的補碼形式表示。每個16位數(shù)用一個符號位來表示數(shù)的正負(fù),0表示數(shù)值為正,l則表示數(shù)值為負(fù)。其余15位表示數(shù)值的大小。因此, 二進(jìn)制數(shù)0010000000000011b=8195 二進(jìn)制數(shù)1111111111111100b= -4 對DSP芯片而言,參與數(shù)值運算的數(shù)就是16位的整型數(shù)。但在許多情況下,數(shù)學(xué)運算過程中的數(shù)不一定都是整數(shù)。那么,DSP芯片是如何處理小數(shù)的呢?應(yīng)該說,DSP芯片本身無能為力。那么是不是說DSP芯片就不能處理各種小數(shù)呢?當(dāng)然不是。這其中的關(guān)鍵就是由程序員來確定一個數(shù)的小數(shù)點處于16位中的哪一位。這就是數(shù)的定標(biāo)。 通過設(shè)定小數(shù)點在16位數(shù)中的不同位置,就可以表示不同大小和不同精度的小數(shù)了。數(shù)的定標(biāo)有Q表示法和S表示法兩種。表1.1列出了一個16位數(shù)的16種Q表示、S表示及它們所能表示的十進(jìn)制數(shù)值范圍。 從表1.1可以看出,同樣一個16位數(shù),若小數(shù)點設(shè)定的位置不同,它所表示的數(shù)也就不同。例如, 16進(jìn)制數(shù)2000H=8192,用Q0表示 16進(jìn)制數(shù)2000H=0.25,用Q15表示 但對于DSP芯片來說,處理方法是完全相同的。 從表1.1還可以看出,不同的Q所表示的數(shù)不僅范圍不同,而且精度也不相同。Q越大,數(shù)值范圍越小,但精度越高;相反,Q越小,數(shù)值范圍越大,但精度就越低。例如,Q0 的數(shù)值范圍是一32768到+32767,其精度為1,而Q15的數(shù)值范圍為-1到0.9999695,精度為1/32768=0.00003051。因此,對定點數(shù)而言,數(shù)值范圍與精度是一對矛盾,一個變量要想能夠表示比較大的數(shù)值范圍,必須以犧牲精度為代價;而想精度提高,則數(shù)的表示范圍就相應(yīng)地減小。在實際的定點算法中,為了達(dá)到最佳的性能,必須充分考慮到這一點。 浮點數(shù)與定點數(shù)的轉(zhuǎn)換關(guān)系可表示為: 浮點數(shù)(x)轉(zhuǎn)換為定點數(shù)(xq):xq=(int)x* 2Q 定點數(shù)(xq)轉(zhuǎn)換為浮點數(shù)(x):x=(float)xq*2-Q 例如,浮點數(shù)x=0.5,定標(biāo)Q=15,則定點數(shù)xq=L0.5*32768J=16384,式中LJ表示下取整。反之,一個用Q=15表示的定點數(shù)16384,其浮點數(shù)為163幼*2-15=16384/32768=0.5。浮點數(shù)轉(zhuǎn)換為定點數(shù)時,為了降低截尾誤差,在取整前可以先加上0.5。 表1.1 Q表示、S表示及數(shù)值范圍 Q表示 S表示 十進(jìn)制數(shù)表示范圍 Q15 S0.15 -1≤x≤0.9999695 Q14 S1.14 -2≤x≤1.9999390 Q13 S2.13 -4≤x≤3.9998779 Q12 S3.12 -8≤x≤7.9997559 Q11 S4.11 -16≤x≤15.9995117 Q10 S5.10 -32≤x≤31.9990234 Q9 S6.9 -64≤x≤63.9980469 Q8 S7.8 -128≤x≤127.9960938 Q7 S8.7 -256≤x≤255.9921875 Q6 S9.6 -512≤x≤511.9804375 Q5 S10.5 -1024≤x≤1023.96875 Q4 S11.4 -2048≤x≤2047.9375 Q3 S12.3 -4096≤x≤4095.875 Q2 S13.2 -8192≤x≤8191.75 Q1 S14.1 -16384≤x≤16383.5 Q0 S15.0 -32768≤x≤32767 2 高級語言:從浮點到定點 我們在編寫DSP模擬算法時,為了方便,一般都是采用高級語言(如C語言)來編寫模擬程序。程序中所用的變量一般既有整型數(shù),又有浮點數(shù)。如例1.1程序中的變量i是整型數(shù),而pi是浮點數(shù),hamwindow則是浮點數(shù)組。 例1.1 256點漢明窗計算 int i;+ float pi=3.14l59; float hamwindow[256]; for(i=0;i<256;i++) hamwindow=0.54-0.46*cos(2.0*pi*i/255); 如果我們要將上述程序用某種足點DSP芯片來實現(xiàn),則需將上述程序改寫為DSP芯片的匯編語言程序。為了DSP程序調(diào)試的方便及模擬定點DSP實現(xiàn)時的算法性能,在編寫DSP匯編程序之前一般需將高級語言浮點算法改寫為高級語言定點算法。下面我們討論基本算術(shù)運算的定點實現(xiàn)方法。 2.1 加法/減法運算的C語言定點摸擬 設(shè)浮點加法運算的表達(dá)式為: float x,y,z; z=x+y; 將浮點加法/減法轉(zhuǎn)化為定點加法/減法時最重要的一點就是必須保證兩個操作數(shù)的定標(biāo) temp=x+temp; z=temp>>(Qx-Qz),若Qx>=Qz z=temp<<(Qz-Qx),若Qx<=Qz 例1.4結(jié)果超過16位的定點加法 設(shè)x=l5000,y=20000,則浮點運算值為z=x+y=35000,顯然z>32767,因此 Qx=1,Qy=0,Qz=0,則定點加法為: x=30000;y=20000; temp=20000<<1=40000; temp=temp+x=40000+30000=70000; z=70000L>>1=35000; 因為z的Q值為0,所以定點值z=35000就是浮點值,這里z是一個長整型數(shù)。當(dāng)加法或加法的結(jié)果超過16位表示范圍時,如果程序員事先能夠了解到這種情況,并且需要保持運算精度時,則必須保持32位結(jié)果。如果程序中是按照16位數(shù)進(jìn)行運算的,則超過16位實際上就是出現(xiàn)了溢出。如果不采取適當(dāng)?shù)拇胧,則數(shù)據(jù)溢出會導(dǎo)致運算精度的嚴(yán)重惡化。一般的定點DSP芯片都沒有溢出保護(hù)功能,當(dāng)溢出保護(hù)功能有效時,一旦出現(xiàn)溢出,則累加器ACC的結(jié)果為最大的飽和值(上溢為7FFFH,下溢為8001H),從而達(dá)到防止溢出引起精度嚴(yán)重惡化的目的。 2.2乘法運算的C語言定點模擬 設(shè)浮點乘法運算的表達(dá)式為: float x,y,z; z=xy; 假設(shè)經(jīng)過統(tǒng)計后x的定標(biāo)值為Qx,y的定標(biāo)值為Qy,乘積z的定標(biāo)值為Qz,則 z=xy zq*2-Qx=xq*yq*2-(Qx+Qy) zq=(xqyq)2Qz-(Qx+Qy) 所以定點表示的乘法為: int x,y,z; long temp; temp=(long)x; z=(temp*y)>>(Qx+Qy-Qz); 例1.5定點乘法。 設(shè)x=18.4,y=36.8,則浮點運算值為=18.4*36.8=677.12; 根據(jù)上節(jié),得Qx=10,Qy=9,Qz=5,所以 x=18841;y=18841; temp=18841L; z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666; 因為z的定標(biāo)值為5,故定點z=21666,即為浮點的z=21666/32=677.08。 2.3除法運算的C語言定點摸擬 設(shè)浮點除法運算的表達(dá)式為: float x,y,z; z=x/y; 假設(shè)經(jīng)過統(tǒng)計后被除數(shù)x的定標(biāo)值為Qx,除數(shù)y的定標(biāo)值為Qy,商z的定標(biāo)值為Qz,則 z=x/y zq*2-Qz=(xq*2-Qx)/(yq*2-Qy) zq=(xq*2(Qz-Qx+Qy))/yq 所以定點表示的除法為: int x,y,z; long temp; temp=(long)x; z=(temp<<(Qz-Qx+Qy))/y; 例1.6定點除法。 設(shè)x=18.4,y=36.8,浮點運算值為z=x/y=18.4/36.8=0.5; 根據(jù)上節(jié),得Qx=10,Qy=9,Qz=15;所以有 z=18841,y=18841; temp=(long)18841; z=(18841L<<(15-10+9)/18841=3O8690944L/18841=16384; 因為商z的定標(biāo)值為15,所以定點z=16384,即為浮點z=16384/215=0.5。 2.4程序變量的Q值確定 在前面幾節(jié)介紹的例子中,由于x,y,z的值都是已知的,因此從浮點變?yōu)槎c時Q值很好確定。在實際的DSP應(yīng)用中,程序中參與運算的都是變量,那么如何確定浮點程序中變量的Q值呢?從前面的分析可以知道,確定變量的Q值實際上就是確定變量的動態(tài)范圍,動態(tài)范圍確定了,則Q值也就確定了。 設(shè)變量的絕對值的最大值為|max|,注意|max|必須小于或等于32767。取一個整數(shù)n,使?jié)M足 2n-1<|max|<2n 則有 2-Q=2-15*2n=2-(15-n) Q=15-n 例如,某變量的值在-1至+1之間,即|max|<1,因此n=0,Q=15-n=15。 既然確定了變量的|max|就可以確定其Q值,那么變量的|max|又是如何確定的呢?一般來說,確定變量的|max|有兩種方法。一種是理論分析法,另一種是統(tǒng)計分析法。 1. 理論分析法 有些變量的動態(tài)范圍通過理論分析是可以確定的。例如: (1)三角函數(shù)。y=sin(x)或y=cos(x),由三角函數(shù)知識可知,|y|<=1。 (2)漢明窗。y(n)=0.54一0.46cos[nπn/(N-1)],0<=n<=N-1。因為-1<=cos[2πn/(N-1)]<=1,所以0.08<=y(n)<=1.0。 (3)FIR卷積。y(n)=∑h(k)x(n-k),設(shè)∑|h(k)|=1.0,且x(n)是模擬信號12位量化值,即有|x(n)|<=211,則|y(n)|<=211。 (4)理論已經(jīng)證明,在自相關(guān)線性預(yù)測編碼(LPC)的程序設(shè)計中,反射系數(shù)ki滿足下列不等式:|ki|<1.0,i=1,2,...,p,p為LPC的階數(shù)。 2. 統(tǒng)計分析法 對于理論上無法確定范圍的變量,一般采用統(tǒng)計分析的方法來確定其動態(tài)范圍。所謂統(tǒng)計分析,就是用足夠多的輸入信號樣值來確定程序中變量的動態(tài)范圍,這里輸入信號一方面要有一定的數(shù)量,另一方面必須盡可能地涉及各種情況。例如,在語音信號分析中,統(tǒng)計分析時就必須來集足夠多的語音信號樣值,并且在所采集的語音樣值中,應(yīng)盡可能地包含各種情況。如音量的大小,聲音的種類(男聲、女聲等)。只有這樣,統(tǒng)計出來的結(jié)果才能具有典型性。 當(dāng)然,統(tǒng)計分析畢竟不可能涉及所有可能發(fā)生的情況,因此,對統(tǒng)計得出的結(jié)果在程序設(shè)計時可采取一些保護(hù)措施,如適當(dāng)犧牲一些精度,Q值取比統(tǒng)計值稍大些,使用DSP芯片提供的溢出保護(hù)功能等。 2.5浮點至定點變換的C程序舉例 本節(jié)我們通過一個例子來說明C程序從浮點變換至定點的方法。這是一個對語音信號(0.3~3.4kHz)進(jìn)行低通濾波的C語言程序,低通濾波的截止頻率為800Hz,濾波器采用19點的有限沖擊響應(yīng)FIR濾波。語音信號的采樣頻率為8kHz,每個語音樣值按16位整型數(shù)存放在insp.dat文件中。 例1.7語音信號800Hz 19點FIR低通濾波C語言浮點程序。 #i nclude <stdio.h> const int length=180/*語音幀長為180點=22.5ms@8kHz采樣*/ void filter(int xin[],int xout[],int n,float h[]);/*濾波子程序說明*/ /*19點濾波器系數(shù)*/ static float h[19]= {0.01218354,-0.009012882,-0.02881839,-0.04743239,-0.04584568, -0.008692503,0.06446265,0.1544655,0.2289794,0.257883, 0.2289794,0.1544655,0.06446265,-0.008692503,-0.04584568, -0.04743239,-0.02881839,-0.009012882,O.01218354}; static int xl[length+20]; /*低通濾波浮點子程序*/ void filter(int xin[],int xout[],int n,float h[]) { int i,j; float sum; for(i=0;i<length;i++)x1[n+i-1]=xin; for(i=0;i<length;i++) { sum=0.0; for(j=0;j<n;j++)sum+=h[j]*x1[i-j+n-1]; xout=(int)sum; for(i=0;i<(n-l);i++)x1[n-i-2]=xin[length-1-i]; } /*主程序*/ void main() FILE *fp1,*fp2; int frame,indata[length],outdata[length]; fp1=fopen(insp.dat,"rb");/* 輸入語音文件*/ fp2=fopen(Outsp.dat,"wb");/* 濾波后語音文件*/ frame=0; while(feof(fp1) ==0) { frame++; printf(“frame=%d\n”,frame); for(i=0;i<length;i++)indata=getw(fp1); /*取一幀語音數(shù)據(jù)*/ filter(indata,outdata,19,h);/*調(diào)用低通濾波子程序*/ for(i=0;i<length;i++)putw(outdata,fp2);/*將濾波后的樣值寫入文件*/ } fcloseall();/*關(guān)閉文件*/ return(0); } 例1.8語音信號800Hz l9點FIR低通濾波C語言定點程序。 #i nclude <stdio.h> const int length=180; void filter (int xin[],int xout[],int n,int h[]); static int h[19]={399,-296,-945,-1555,-1503,-285,2112,5061,7503,8450, 7503,5061,2112,-285,-1503,-1555,-945,-296,399};/*Q15*/ static int x1[length+20]; /*低通濾波定點子程序*/ void filter(int xin[],int xout[],int n,int h[]) int i,j; long sum; for(i=0;i<length;i++)x1[n+i-111=xin]; for(i=0;i<1ength;i++) sum=0; for(j=0;j<n;j++)sum+=(long)h[j]*x1[i-j+n-1]; xout=sum>>15; for(i=0;i<(n-1);i++)x1[n-i-2]=xin[length-i-1]; } 主程序與浮點的完全一樣! 3 DSP定點算術(shù)運算 定點DSP芯片的數(shù)值表示基于2的補碼表示形式。每個16位數(shù)用l個符號位、i個整數(shù)位和15-i個小數(shù)位來表示。因此: 00000010.10100000 表示的值為: 21+2-1+2-3=2.625 這個數(shù)可用Q8格式(8個小數(shù)位)來表示,其表示的數(shù)值范圍為-128至+l27.996,一個Q8定點數(shù)的小數(shù)精度為1/256=0.004。 雖然特殊情況(如動態(tài)范圍和精度要求)必須使用混合表示法。但是,更通常的是全部以Q15格式表示的小數(shù)或以Q0格式表示的整數(shù)來工作。這一點對于主要是乘法和累加的信號處理算法特別現(xiàn)實,小數(shù)乘以小數(shù)得小數(shù),整數(shù)乘以整數(shù)得整數(shù)。當(dāng)然,乘積累加時可能會出現(xiàn)溢出現(xiàn)象,在這種情況下,程序員應(yīng)當(dāng)了解數(shù)學(xué)里面的物理過程以注意可能的溢出情況。下面我們來討論乘法、加法和除法的DSP定點運算,匯編程序以TMS320C25為例。 3.1定點乘法 兩個定點數(shù)相乘時可以分為下列三種情況: 1. 小數(shù)乘小數(shù) 例1.9 Q15*Q15=Q30 0.5*0.5=0.25 0.100000000000000;Q15 * 0.100000000000000;Q15 -------------------------------------------- 00.010000000000000000000000000000=0.25;Q30 兩個Q15的小數(shù)相乘后得到一個Q30的小數(shù),即有兩個符號位。一般情況下相乘后得到的滿精度數(shù)不必全部保留,而只需保留16位單精度數(shù)。由于相乘后得到的高16位不滿15位的小數(shù)據(jù)度,為了達(dá)到15位精度,可將乘積左移一位,下面是上述乘法的TMS320C25程序: LT OP1;OP1=4000H(0.5/Q15) MPY OP2;oP2=4000H(0.5/Ql5) PAC SACH ANS,1;ANS=2000H(0.25/Q15) 2. 整數(shù)乘整數(shù) 例1.10 Q0*Q0=Q0 17*(-5)=-85 0000000000010001=l7 *1111111111111011=-5 ------------------------------------------- 11111111111111111111111110101011=-85 3. 混合表示法 許多情況下,運算過程中為了既滿足數(shù)值的動態(tài)范圍又保證一定的精度,就必須采用Q0與Q15之間的表示法。比如,數(shù)值1.2345,顯然Q15無法表示,而若用Q0表示,則最接近的數(shù)是1,精度無法保證。因此,數(shù)1.2345最佳的表示法是Q14。 例1.11 1.5*0.75= 1.125 01.10000000000000=1.5;Q14 *00.11000000000000=0.75;Q14 --------------------------------------- 0001.0010000000000000000000000000=1.125 Q28 Q14的最大值不大于2,因此,兩個Q14數(shù)相乘得到的乘積不大于4。 一般地,若一個數(shù)的整數(shù)位為i位,小數(shù)位為j位,另一個數(shù)的整數(shù)位為m位,小數(shù)位為n位,則這兩個數(shù)的乘積為(i+m)位整數(shù)位和(j+n)位小數(shù)位。這個乘積的最高16位可能的精度為(i+m)整數(shù)位和(15- i- m)小數(shù)位。 但是,若事先了解數(shù)的動態(tài)范圍,就可以增加數(shù)的精度。例如,程序員了解到上述乘積不會大于1.8,就可以用Q14數(shù)表示乘積,而不是理論上的最佳情況Q13。例3.11的TMS320C25程序如下: LT OP1;OP1 = 6000H(1.5/Ql4) MPY OP2;OP2 = 3000H(0.75/Q14) PAC SACH ANS,1;ANS=2400H(1.125/Q13) 上述方法,為了精度均對乘的結(jié)果舍位,結(jié)果所產(chǎn)生的誤差相當(dāng)于減去一個LSB(最低位)。采用下面簡單的舍人方法,可使誤差減少二分之一。 LT OP1 MPY OP2 PAC ADD ONE,14(上舍入) SACH ANS,1 上述程序說明,不管ANS為正或負(fù),所產(chǎn)生的誤差是l/2 LSB,其中存儲單元ONE的值為1。 3.2定點加法 乘的過程中,程序員可不考慮溢出而只需調(diào)整運算中的小數(shù)點。而加法則是一個更加復(fù)雜的過程。首先,加法運算必須用相同的Q點表示,其次,程序員或者允許其結(jié)果有足夠的高位以適應(yīng)位的增長,或者必須準(zhǔn)備解決溢出問題。如果操作數(shù)僅為16位長,其結(jié)果可用雙精度數(shù)表示。下面舉例說明16位數(shù)相加的兩種途徑。 1.保留32位結(jié)果 LAC OP1;(Q15) ADD OP2;(Ql5) SACH ANSHI ;(高16位結(jié)果) SACL ANSLO :(低16位結(jié)果) 2.調(diào)整小數(shù)點保留16位結(jié)果 LAC OP1,15;(Q14數(shù)用ACCH表示) ADD OP2,15;(Q14數(shù)用ACCH表示) SACH ANS;(Q14) 加法運算最可能出現(xiàn)的問題是運算結(jié)果溢出。TMS320提供了檢查溢出的專用指令BV,此外,使用溢出保護(hù)功能可使累加結(jié)果溢出時累加器飽和為最大的整數(shù)或負(fù)數(shù)。當(dāng)然,即使如此,運算精度還是大大降低。因此,最好的方法是完全理解基本的物理過程并注意選擇數(shù)的表達(dá)方式。 3.3定點除法 在通用DSP芯片中,一般不提供單周期的除法指令,為此必須采用除法子程序來實現(xiàn)。二進(jìn)制除法是乘法的逆運算。乘法包括一系列的移位和加法,而除法可分解為一系列的減法和移位。下面我們來說明除法的實現(xiàn)過程。 設(shè)累加器為8位,且除法運算為10除以3。除的過程包括與被除法有關(guān)的除數(shù)逐步移位,在每一步進(jìn)行減法運算,如果能減則將位插入商中。 (1)除數(shù)的最低有效位對齊被除數(shù)的最高有效位。 0000l0l0 - 00011000 -------------------------------------- 11110010 (2)由于減法結(jié)果為負(fù),放棄減法結(jié)果,將被除數(shù)左移一位,再減。 00010100 - 00011000 ---------------------------------------- 11111000 (3)結(jié)果仍為負(fù),放棄減法結(jié)果,被除數(shù)左移一位,再減。 00101000 - 00011000 ------------------------------------------ 00010000 (4)結(jié)果為正,將減法結(jié)果左移一位后加1,作最后一次減。 00100001 - 00011000 ---------------------------------------- 00001001 (5)結(jié)果為正,將結(jié)果左移一位加1 得最后結(jié)果。高4位代表余數(shù),低4位表示商。 00010011 即,商為0011= 3.余數(shù)為0001= 1。 TMS320沒有專門的除法指令,但使用條件減指令SUBC可以完成有效靈活的除法功能。使用這一指令的唯一限制是兩個操作數(shù)必須為正。程序員必須事先了解其可能的運算數(shù)的特性,如其商是否可以用小數(shù)表示及商的精度是否可被計算出來。這里每一種考慮可影響如何使用SUBC指令的問題。下面我們給出兩種不同情況下的TMS320C25除法程序。 (1)分子小于分母 DIV_A: LT NUMERA MPY DENOM PAC SACH TEMSGN;取商的符號 LAC DENOM ABS SACL DENOM;使分母為正 ZALH NUMERA; 分子為正 ABS RPTK 14 SUBC DENOM;除循環(huán)15次 SACL QUOT LAC TEMSGN BGEZ A1;若符號為正,則完成 ZAC SUB QUOT SACL QUOT;若為負(fù),則商為負(fù) A1: RET 這個程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN為暫存單元。 (2)規(guī)定商的精度 DIV_B: LT NUMERA MPY DENOM PAC SACH TEMSGN;取商的符號 LAC DENOM ABS SACL DENOM; 使分母為正 LACK 15 ADD FRAC SACL FRAC;計算循環(huán)計數(shù)器 LAC NUMERA ABS ; 使分子為正 RPT FRAC SUBC DENOM; 除循環(huán)16+FRAC次 SACL QUOT LAC TEMSGN BGEZ B1;若符號為正,則完成 ZAC SUB QUOT SACL QUOT;若為負(fù),則商為負(fù) B1: RET 與DIV_A相同,這個程序中,分子在NUMERA中,分母在DENOM中,商存在QUOT中,TEMSGN為暫存單元。FRAC中規(guī)定商的精度,如商的精度為Q13,則調(diào)用程序前FRAC單元中的值應(yīng)為13。 4 非線性運算的定點快速實現(xiàn) 在數(shù)值運算中,除基本的加減乘除運算外,還有其它許多非線性運算,如,對數(shù)運算,開方運算,指數(shù)運算,三角函數(shù)運算等,實現(xiàn)這些非線性運算的方法一般有:(1)調(diào)用DSP編譯系統(tǒng)的庫函數(shù);(2)查表法;(3)混合法。下面我們分別介紹這三種方法。 1.調(diào)用DSP編譯系統(tǒng)的庫函數(shù) TMS320C2X/C5X的C編譯器提供了比較豐富的運行支持庫函數(shù)。在這些庫函數(shù)中,包含了諸如對數(shù)、開方、三角函數(shù)、指數(shù)等常用的非線性函數(shù)。在C程序中(也可在匯編程序中)只要采用與庫函數(shù)相同的變量定義,就可以直接調(diào)用。例如,在庫函數(shù)中,定義了以10為底的常用對數(shù)log10(): #i nclude<math.h> double,log10(double x); 在C程序中按如下方式調(diào)用: float x,y; X=10.0; y=log10(x); 從上例可以看出,庫函數(shù)中的常用對數(shù)log10()要求的輸入值為浮點數(shù),返回值也為浮點數(shù),運算的精度完全可以保證。直接調(diào)用庫函數(shù)非常方便,但由于運算量大,很難在實時DSP中得到應(yīng)用。 2.查表法 在實時DSP應(yīng)用中實現(xiàn)非線性運算,一般都采取適當(dāng)降低運算精度來提高程序的運算速度。查表法是快速實現(xiàn)非線性運算最常用的方法。采用這種方法必須根據(jù)自變量的范圍和精度要求制作一張表格。顯然輸人的范圍越大,精度要求越高,則所需的表格就越大,即存儲量也越大。查表法求值所需的計算就是根據(jù)輸入值確定表的地址,根據(jù)地址就可得到相應(yīng)的值,因而運算量較小。查表法比較適合于非線性函數(shù)是周期函數(shù)或已知非線性函數(shù)輸入值范圍這兩種情況、例1.12和例1. 13分別說明這兩種情況。 例1.12 已知正弦函數(shù)y=cos(x),制作一個512點表格,并說明查表方法。由于正弦函數(shù)是周期函數(shù),函數(shù)值在-1至+1之間,用查表法比較合適。由于Q15的表示范圍為1-至32767/32768之間,原則上講-1至+1的范圍必須用Q14表示。但一般從方便和總體精度考慮,類似情況仍用Q15表示,此時+1用32767來表示。 (1)產(chǎn)生5l2點值的C語言程序如下所示。 #define N 512 #define pi 3.14l59 int sin_tab[5l2]; void main() { int i; for(i=0;i<N;i++)sin_tab=(int)(32767*sin(2*pi*i/N)); (2)查表 查表實際上就是根據(jù)輸人值確定表的地址。設(shè)輸入x在0~2π之間,則x對應(yīng)于512點表的地址為:index=(int)(512*x/2π),則y=sin(x)=sin_tab[index]如果x用Q12定點數(shù)表示,將512/2π用Q8表示為20861,則計算正弦表的地址的公式為。 index=(x*20861L)>>20; 例1.12用查表法求以2為底的對數(shù),已知自變量值范圍為0.5-1,要求將自變量范圍均勻劃分為10等分。試制作這個表格并說明查表方法。 (1)作表: y=log2(x),由于x在0.5到1之間,因此y在-1到0之間,x和y均可用Q15表示。由于對x均勻劃分為10段,因此,10段對應(yīng)于輸入x的范圍如表3.2所示。若每一段的對數(shù)值都取第一點的對數(shù)值,則表中第一段的對數(shù)值為y0(Q15)=(int)(log(O.5)*32768),第二段的對數(shù)值為y1(Q15)=(int)(log2(0.55)*32768),依次類推,如表3.2所示。 (2)查表: 查表時,先根據(jù)輸人值計算表的地址,計算方法為: index=((x-16384)*20)>>15; 式中, index就是查表用的地址。例如,已知輸人x=26869,則index=6,因此,y= -10549。 表1.2 logtab0 10點對數(shù)表 地址 輸入值 對數(shù)值(Q15) 0 0.50-0.55 -32768 1 0.55-0.60 -28262 2 0.60-0.65 -24149 3 0.65-0.70 -20365 4 0.70-0.75 -16862 5 0.75-0.80 -13600 6 0.80-0.85 -10549 7 0.85-0.90 -7683 8 0.90-0.95 -4981 9 0.95-1.00 -2425 3.混合法 (1)提高查表法的精度 上述方法查表所得結(jié)果的精度隨表的大小而變化,表越大,則精度越高,但存儲量也越大。當(dāng)系統(tǒng)的存儲量有限而精度要求也較高時,查表法就不太適合。那么能否在適當(dāng)增加運算量的情況下提高非線性運算的精度呢?下面介紹一種查表結(jié)合少量運算來計算非線性函數(shù)的混合法,這種方法適用于在輸入變量的范圍內(nèi)函數(shù)呈單調(diào)變化的情形。混合法是在查表的基礎(chǔ)上來用計算的方法以提高當(dāng)輸入值處于表格兩點之間時的精度。提高精度的一個簡便方法是采用折線近似法,如圖1.1所示。 圖1.1提高精度的折線近似法” 仍以求以2為底的對數(shù)為例(例1.12)。設(shè)輸入值為x,則精確的對數(shù)值為y,在表格值的兩點之間作一直線,用y'作為y的近似值,則有: y'=y0+△y 其中y0由查表求得,F(xiàn)在只需在查表求得y0的基礎(chǔ)上增加△y既可!鱵的計算方法如下: △y=(△x/△x0)△y=△x(△y0/△x0) 其中△y0/△x0對每一段來說是一個恒定值,可作一個表格直接查得。此外計算此時需用到每段橫坐標(biāo)的起始值,這個值也可作一個表格。這佯共有三個大小均為10的表格,分別為存儲每段起點對數(shù)值的表logtab0、存儲每段△y0/△x0值的表logtab1和存儲每段輸入起始值x0的表logtab2,表logtab1和表logtab2可用下列兩個數(shù)組表示。 int logtab1[10]={22529,20567,18920,17517,16308, 15255,14330,13511,12780,12124};/*△y0/△x0:Q13*/ int logtab2[10]={16384,18022,19660,21299,22938, 24576,26214,27853,29491,31130};/*x0:Q15*/ 綜上所述,采用混合法計算對數(shù)值的方法可歸納為: (1)根據(jù)輸人值,計算查表地址:index=((x-16384)*20)>>15; (2)查表得y0=logtab0[index]; (3)計算△x=x-logtab2[index]; (4)計算△y=(△x*logtab1[index])>>13; (5)計算得結(jié)果y=y0+△y。 例1.13已知x=0.54,求log2(x)。 0.54的精確對數(shù)值為y=log2(0.54)=-0.889。 混合法求對數(shù)值的過程為: (1)定標(biāo)Q15,定標(biāo)值x=0.54*32768=17694; (2)表地址index=((x-16384)*20)>>15=0; (3)查表得y0=logtab0[0]=-32768; (4)計算△x=x-logtab2[0]=17694-16384=1310; (5)計算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602 (6)計算結(jié)果y=y0+△y=-32768+3602=-29166。 結(jié)果y為Q15定標(biāo),析算成浮點數(shù)為-29166/32768=-0.89,可見精度較高。 (2)擴大自變量范圍 如上所述,查表法比較適用于周期函數(shù)或自變量的動態(tài)范圍不是太大的情形。對于像對數(shù)這樣的非線性函數(shù),輸入值和函數(shù)值的變化范圍都很大。如果輸入值的變化范圍很大,則作表就比較困難。那么能否比較好地解決這個問題,即不便表格太大,又能得到比較高的精度呢?下面我們來討論一種切實可行的方法。 設(shè)x是一個大于0.5的數(shù),則x可以表示為下列形式: x=m*2e 式中,0.5<=m<=1.0,e為整數(shù)。則求x的對數(shù)可以表示為: log2(x)=log2(m*2e)=log2(m)+log2(2e)=e+log2(m) 也就是說,求x的對數(shù)實際上只要求m的對數(shù)就可以了,而由于m的數(shù)值在0.5和1.0之間,用上面介紹的方法是完全可以實現(xiàn)的。例如: log2(10000)=log2(0.61035*214)=log2(0.61035)+14 =13.2877 可見,如果一個數(shù)可以用比較簡便的方法表示為上面的形式,則求任意大小數(shù)的對數(shù)也比較方便的。TMS320C2X/C5X指令集提供了一條用于對ACC中的數(shù)進(jìn)行規(guī)格化的指令NORM,該指令的作用就是使累加器中的數(shù)左移,直至數(shù)的最高位被移至累加器的第30位。例如,對數(shù)值10000進(jìn)行規(guī)格化的TMS320C25程序為。 LAC #10000 SACL TEMP ZALH TEMP LAR AR1,#0FH RPT 14 NORM * - 上述程序執(zhí)行后,AR1=#0eH,ACCH=2000(10進(jìn)制)。對一個16位整數(shù)x進(jìn)行上述程序處理實際上就是作這樣一個等效變換: x=[(x*2e)/32768]*215-Q 其中,寄存器AR1包含的值為15-Q累加器ACC高16位包含的值為x.2Q,其數(shù)值在16384至32768之間。 例1.14實現(xiàn)以2為底的對數(shù)的C定點模擬程序。 int logtab0[10]={-32768,-28262,-24149,-20365,-16862, -13600),-1O549,-7683,-4981,-2425};/*Q15*/ int logtab1[10]={122529,20567,18920,175l7,16308, 15255,14330,13511,12780,12124};/*Q13*/ int logtab2[10]={16384,l8022,19660,21299,22938, 24576,26214,27853,29491,31130};/*Q15*/ int log2_fast(int Am) { int point,point1; int index,x0,dx,dy,y; point=0; while(Am<16384){point++;Am=Am<<1;}/*對Am進(jìn)行規(guī)格化*/ point1=(15-point-4)*512;/*輸入為Q4,輸出為Q9*/ index=((Am-16384)*20L)>>15;/*求查表地址*/ dx=Am-logtab2[index]; dy=((long)dx*logtab1[index])>>13; y=(dy+longtab0[index])>>6;/*Q9*/ y=point1+y; return(y); } 上述程序中,輸入值A(chǔ)m采用Q4表示,輸出采用Q9表示,如果輸入輸出的Q值與上面程序中的不同,則應(yīng)作相應(yīng)的修改。 以上討論了DSP芯片進(jìn)行定點運算所涉及的一些基本問題,這些問題包括:數(shù)的定標(biāo),DSP程序的定點模擬,DSP芯片的足點運算以及定點實現(xiàn)非線性函數(shù)的快速實現(xiàn)方法等。充分理解這些問題對于用定點芯片實現(xiàn)DSP算法具有非常重要的作用。 |
歡迎光臨 (http://www.torrancerestoration.com/bbs/) | Powered by Discuz! X3.1 |