DSP定浮點(diǎn)問題淺議

ID:128229 · 發(fā)表于 2016-6-27 19:39

為那些苦苦尋覓DSP資料的人,提供一些幫助......

一  ＤＳＰ定點(diǎn)算數(shù)運(yùn)算
1  數(shù)的定標(biāo)
在定點(diǎn)DSP芯片中，采用定點(diǎn)數(shù)進(jìn)行數(shù)值運(yùn)算，其操作數(shù)一般采用整型數(shù)來表示。一個(gè)整型數(shù)的最大表示范圍取決于DSP芯片所給定的字長(zhǎng)，一般為16位或24位。顯然，字長(zhǎng)越長(zhǎng)，所能表示的數(shù)的范圍越大，精度也越高。如無特別說明，本書均以16位字長(zhǎng)為例。
DSP芯片的數(shù)以2的補(bǔ)碼形式表示。每個(gè)16位數(shù)用一個(gè)符號(hào)位來表示數(shù)的正負(fù)，0表示數(shù)值為正，l則表示數(shù)值為負(fù)。其余15位表示數(shù)值的大小。因此，
   二進(jìn)制數(shù)0010000000000011b=8195
   二進(jìn)制數(shù)1111111111111100b= -4
對(duì)DSP芯片而言，參與數(shù)值運(yùn)算的數(shù)就是16位的整型數(shù)。但在許多情況下，數(shù)學(xué)運(yùn)算過程中的數(shù)不一定都是整數(shù)。那么，DSP芯片是如何處理小數(shù)的呢？應(yīng)該說，DSP芯片本身無能為力。那么是不是說DSP芯片就不能處理各種小數(shù)呢？當(dāng)然不是。這其中的關(guān)鍵就是由程序員來確定一個(gè)數(shù)的小數(shù)點(diǎn)處于16位中的哪一位。這就是數(shù)的定標(biāo)。
通過設(shè)定小數(shù)點(diǎn)在16位數(shù)中的不同位置，就可以表示不同大小和不同精度的小數(shù)了。數(shù)的定標(biāo)有Q表示法和S表示法兩種。表1.1列出了一個(gè)16位數(shù)的16種Q表示、S表示及它們所能表示的十進(jìn)制數(shù)值范圍。
從表1.1可以看出，同樣一個(gè)16位數(shù)，若小數(shù)點(diǎn)設(shè)定的位置不同，它所表示的數(shù)也就不同。例如，
      16進(jìn)制數(shù)2000H=8192，用Q0表示
      16進(jìn)制數(shù)2000H=0.25，用Q15表示
但對(duì)于DSP芯片來說，處理方法是完全相同的。
從表1.1還可以看出，不同的Q所表示的數(shù)不僅范圍不同，而且精度也不相同。Q越大，數(shù)值范圍越小，但精度越高；相反，Q越小，數(shù)值范圍越大，但精度就越低。例如，Q0 的數(shù)值范圍是一32768到+32767，其精度為1，而Q15的數(shù)值范圍為-1到0.9999695，精度為1/32768=0.00003051。因此，對(duì)定點(diǎn)數(shù)而言，數(shù)值范圍與精度是一對(duì)矛盾，一個(gè)變量要想能夠表示比較大的數(shù)值范圍，必須以犧牲精度為代價(jià)；而想精度提高，則數(shù)的表示范圍就相應(yīng)地減小。在實(shí)際的定點(diǎn)算法中，為了達(dá)到最佳的性能，必須充分考慮到這一點(diǎn)。
浮點(diǎn)數(shù)與定點(diǎn)數(shù)的轉(zhuǎn)換關(guān)系可表示為：
      浮點(diǎn)數(shù)(x)轉(zhuǎn)換為定點(diǎn)數(shù)(xq)：xq=(int)x* 2Q
      定點(diǎn)數(shù)(xq)轉(zhuǎn)換為浮點(diǎn)數(shù)(x)：x=(float)xq*2-Q
例如，浮點(diǎn)數(shù)x=0.5，定標(biāo)Q=15，則定點(diǎn)數(shù)xq=L0.5*32768J=16384，式中LJ表示下取整。反之，一個(gè)用Q=15表示的定點(diǎn)數(shù)16384，其浮點(diǎn)數(shù)為163幼*2-15=16384/32768=0.5。浮點(diǎn)數(shù)轉(zhuǎn)換為定點(diǎn)數(shù)時(shí)，為了降低截尾誤差，在取整前可以先加上0.5。

表1.1 Q表示、S表示及數(shù)值范圍
Q表示 S表示十進(jìn)制數(shù)表示范圍
Q15 S0.15 -1≤x≤0.9999695
Q14 S1.14 -2≤x≤1.9999390
Q13 S2.13 -4≤x≤3.9998779
Q12 S3.12 -8≤x≤7.9997559
Q11 S4.11 -16≤x≤15.9995117
Q10 S5.10 -32≤x≤31.9990234
Q9 S6.9 -64≤x≤63.9980469
Q8 S7.8 -128≤x≤127.9960938
Q7 S8.7 -256≤x≤255.9921875
Q6 S9.6 -512≤x≤511.9804375
Q5 S10.5 -1024≤x≤1023.96875
Q4 S11.4 -2048≤x≤2047.9375
Q3 S12.3 -4096≤x≤4095.875
Q2 S13.2 -8192≤x≤8191.75
Q1 S14.1 -16384≤x≤16383.5
Q0 S15.0 -32768≤x≤32767
2  高級(jí)語(yǔ)言：從浮點(diǎn)到定點(diǎn)
我們?cè)诰帉慏SP模擬算法時(shí)，為了方便，一般都是采用高級(jí)語(yǔ)言(如C語(yǔ)言)來編寫模擬程序。程序中所用的變量一般既有整型數(shù)，又有浮點(diǎn)數(shù)。如例1.1程序中的變量i是整型數(shù)，而pi是浮點(diǎn)數(shù)，hamwindow則是浮點(diǎn)數(shù)組。
例1.1  256點(diǎn)漢明窗計(jì)算
int i；+
float pi=3.14l59；
float hamwindow[256]；
for(i=0；i<256；i++)  hamwindow=0.54-0.46*cos(2.0*pi*i/255)；
如果我們要將上述程序用某種足點(diǎn)DSP芯片來實(shí)現(xiàn)，則需將上述程序改寫為DSP芯片的匯編語(yǔ)言程序。為了DSP程序調(diào)試的方便及模擬定點(diǎn)DSP實(shí)現(xiàn)時(shí)的算法性能，在編寫DSP匯編程序之前一般需將高級(jí)語(yǔ)言浮點(diǎn)算法改寫為高級(jí)語(yǔ)言定點(diǎn)算法。下面我們討論基本算術(shù)運(yùn)算的定點(diǎn)實(shí)現(xiàn)方法。
2.1  加法/減法運(yùn)算的C語(yǔ)言定點(diǎn)摸擬
設(shè)浮點(diǎn)加法運(yùn)算的表達(dá)式為：
float x，y，z；
z=x+y；
將浮點(diǎn)加法/減法轉(zhuǎn)化為定點(diǎn)加法/減法時(shí)最重要的一點(diǎn)就是必須保證兩個(gè)操作數(shù)的定標(biāo)
temp=x+temp；
z=temp>>(Qx-Qz)，若Qx>=Qz
z=temp<<(Qz-Qx)，若Qx<=Qz
例1.4結(jié)果超過16位的定點(diǎn)加法
設(shè)x=l5000，y=20000，則浮點(diǎn)運(yùn)算值為z=x+y=35000，顯然z>32767，因此
Qx=1，Qy=0，Qz=0，則定點(diǎn)加法為：
x=30000；y=20000；
temp=20000<<1=40000；
temp=temp+x=40000+30000=70000；
z=70000L>>1=35000；
因?yàn)閦的Q值為0，所以定點(diǎn)值z(mì)=35000就是浮點(diǎn)值，這里z是一個(gè)長(zhǎng)整型數(shù)。當(dāng)加法或加法的結(jié)果超過16位表示范圍時(shí)，如果程序員事先能夠了解到這種情況，并且需要保持運(yùn)算精度時(shí)，則必須保持32位結(jié)果。如果程序中是按照16位數(shù)進(jìn)行運(yùn)算的，則超過16位實(shí)際上就是出現(xiàn)了溢出。如果不采取適當(dāng)?shù)拇胧�，則數(shù)據(jù)溢出會(huì)導(dǎo)致運(yùn)算精度的嚴(yán)重惡化。一般的定點(diǎn)DSP芯片都沒有溢出保護(hù)功能，當(dāng)溢出保護(hù)功能有效時(shí)，一旦出現(xiàn)溢出，則累加器ACC的結(jié)果為最大的飽和值(上溢為7FFFH，下溢為8001H)，從而達(dá)到防止溢出引起精度嚴(yán)重惡化的目的。
2.2乘法運(yùn)算的C語(yǔ)言定點(diǎn)模擬
設(shè)浮點(diǎn)乘法運(yùn)算的表達(dá)式為：
float x，y，z；
z=xy；
假設(shè)經(jīng)過統(tǒng)計(jì)后x的定標(biāo)值為Qx，y的定標(biāo)值為Qy，乘積z的定標(biāo)值為Qz，則
z=xy
zq*2-Qx=xq*yq*2-(Qx+Qy)
zq=(xqyq)2Qz-(Qx+Qy)
所以定點(diǎn)表示的乘法為：
int  x，y，z；
long temp；
temp=(long)x；
z=(temp*y)>>(Qx+Qy-Qz)；
例1.5定點(diǎn)乘法。
設(shè)x=18.4，y=36.8，則浮點(diǎn)運(yùn)算值為=18.4*36.8=677.12；
根據(jù)上節(jié)，得Qx=10，Qy=9，Qz=5，所以
x=18841；y=18841；
temp=18841L；
z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666；
因?yàn)閦的定標(biāo)值為5，故定點(diǎn)z=21666，即為浮點(diǎn)的z=21666/32=677.08。
2.3除法運(yùn)算的C語(yǔ)言定點(diǎn)摸擬
設(shè)浮點(diǎn)除法運(yùn)算的表達(dá)式為：
float x，y，z；
z=x/y；
假設(shè)經(jīng)過統(tǒng)計(jì)后被除數(shù)x的定標(biāo)值為Qx，除數(shù)y的定標(biāo)值為Qy，商z的定標(biāo)值為Qz，則
z=x/y
zq*2-Qz=(xq*2-Qx)/(yq*2-Qy)
zq=(xq*2(Qz-Qx+Qy))/yq
所以定點(diǎn)表示的除法為：
int x，y，z；
long temp；
temp=(long)x；
z=(temp<<(Qz-Qx+Qy))/y；
例1.6定點(diǎn)除法。
設(shè)x=18.4，y=36.8，浮點(diǎn)運(yùn)算值為z=x/y=18.4/36.8=0.5；
根據(jù)上節(jié)，得Qx=10，Qy=9，Qz=15；所以有
z=18841，y=18841；
temp=(long)18841；
z=(18841L<<(15-10+9)/18841=3O8690944L/18841=16384；
因?yàn)樯蘻的定標(biāo)值為15，所以定點(diǎn)z=16384，即為浮點(diǎn)z=16384/215=0.5。
2.4程序變量的Q值確定
在前面幾節(jié)介紹的例子中，由于x，y，z的值都是已知的，因此從浮點(diǎn)變?yōu)槎c(diǎn)時(shí)Q值很好確定。在實(shí)際的DSP應(yīng)用中，程序中參與運(yùn)算的都是變量，那么如何確定浮點(diǎn)程序中變量的Q值呢？從前面的分析可以知道，確定變量的Q值實(shí)際上就是確定變量的動(dòng)態(tài)范圍，動(dòng)態(tài)范圍確定了，則Q值也就確定了。
設(shè)變量的絕對(duì)值的最大值為|max|，注意|max|必須小于或等于32767。取一個(gè)整數(shù)n，使?jié)M足
2n-1<|max|<2n
則有
2-Q=2-15*2n=2-(15-n)
Q=15-n
例如，某變量的值在-1至+1之間，即|max|<1，因此n=0，Q=15-n=15。
既然確定了變量的|max|就可以確定其Q值，那么變量的|max|又是如何確定的呢？一般來說，確定變量的|max|有兩種方法。一種是理論分析法，另一種是統(tǒng)計(jì)分析法。
  1.  理論分析法
有些變量的動(dòng)態(tài)范圍通過理論分析是可以確定的。例如：
(1)三角函數(shù)。y=sin(x)或y=cos(x)，由三角函數(shù)知識(shí)可知，|y|<=1。
(2)漢明窗。y(n)=0.54一0.46cos[nπn/(N-1)]，0<=n<=N-1。因?yàn)?1<=cos[2πn/(N-1)]<=1，所以0.08<=y(n)<=1.0。
(3)FIR卷積。y(n)=∑h(k)x(n-k)，設(shè)∑|h(k)|=1.0，且x(n)是模擬信號(hào)12位量化值，即有|x(n)|<=211，則|y(n)|<=211。
(4)理論已經(jīng)證明，在自相關(guān)線性預(yù)測(cè)編碼(LPC)的程序設(shè)計(jì)中，反射系數(shù)ki滿足下列不等式：|ki|<1.0，i=1，2，...，p，p為L(zhǎng)PC的階數(shù)。
  2.  統(tǒng)計(jì)分析法
對(duì)于理論上無法確定范圍的變量，一般采用統(tǒng)計(jì)分析的方法來確定其動(dòng)態(tài)范圍。所謂統(tǒng)計(jì)分析，就是用足夠多的輸入信號(hào)樣值來確定程序中變量的動(dòng)態(tài)范圍，這里輸入信號(hào)一方面要有一定的數(shù)量，另一方面必須盡可能地涉及各種情況。例如，在語(yǔ)音信號(hào)分析中，統(tǒng)計(jì)分析時(shí)就必須來集足夠多的語(yǔ)音信號(hào)樣值，并且在所采集的語(yǔ)音樣值中，應(yīng)盡可能地包含各種情況。如音量的大小，聲音的種類(男聲、女聲等)。只有這樣，統(tǒng)計(jì)出來的結(jié)果才能具有典型性。
當(dāng)然，統(tǒng)計(jì)分析畢竟不可能涉及所有可能發(fā)生的情況，因此，對(duì)統(tǒng)計(jì)得出的結(jié)果在程序設(shè)計(jì)時(shí)可采取一些保護(hù)措施，如適當(dāng)犧牲一些精度，Q值取比統(tǒng)計(jì)值稍大些，使用DSP芯片提供的溢出保護(hù)功能等。
2.5浮點(diǎn)至定點(diǎn)變換的C程序舉例
本節(jié)我們通過一個(gè)例子來說明C程序從浮點(diǎn)變換至定點(diǎn)的方法。這是一個(gè)對(duì)語(yǔ)音信號(hào)(0.3~3.4kHz)進(jìn)行低通濾波的C語(yǔ)言程序，低通濾波的截止頻率為800Hz，濾波器采用19點(diǎn)的有限沖擊響應(yīng)FIR濾波。語(yǔ)音信號(hào)的采樣頻率為8kHz，每個(gè)語(yǔ)音樣值按16位整型數(shù)存放在insp.dat文件中。
例1.7語(yǔ)音信號(hào)800Hz 19點(diǎn)FIR低通濾波C語(yǔ)言浮點(diǎn)程序。
＃i nclude  <stdio.h>
const int length=180/*語(yǔ)音幀長(zhǎng)為180點(diǎn)=22.5ms＠8kHz采樣*/
void filter(int xin[]，int xout[]，int n，float h[])；/*濾波子程序說明*/
/*19點(diǎn)濾波器系數(shù)*/
static float h[19]=
{0.01218354，-0.009012882，-0.02881839，-0.04743239，-0.04584568，
-0.008692503，0.06446265，0.1544655，0.2289794，0.257883，
0.2289794，0.1544655，0.06446265，-0.008692503，-0.04584568，
-0.04743239，-0.02881839，-0.009012882，O.01218354}；
static int xl[length+20]；
/*低通濾波浮點(diǎn)子程序*/
void filter(int xin[]，int xout[]，int n，float h[])
{
int i，j；
float sum；
for(i=0；i<length；i++)x1[n+i-1]=xin；
for(i=0；i＜length；i++)
{
sum=0.0；
for(j=0；j＜n；j++)sum+=h[j]*x1[i-j+n-1]；
xout=(int)sum；
for(i=0；i＜(n-l)；i++)x1[n-i-2]=xin[length-1-i]；
}
/*主程序*/
void main()
FILE *fp1，*fp2；
int frame，indata[length]，outdata[length]；
fp1=fopen(insp.dat，"rb")；/* 輸入語(yǔ)音文件*/
fp2=fopen(Outsp.dat，"wb")；/* 濾波后語(yǔ)音文件*/
frame=0；
while(feof(fp1) ==0)
{
frame++；
printf(“frame=％d＼n”，frame)；
for(i=0；i＜length；i++)indata=getw(fp1)；  /*取一幀語(yǔ)音數(shù)據(jù)*/
filter(indata，outdata，19，h)；/*調(diào)用低通濾波子程序*/
for(i=0；i＜length；i++)putw(outdata，fp2)；/*將濾波后的樣值寫入文件*/
}
fcloseall()；/*關(guān)閉文件*/
return(0)；
}
例1.8語(yǔ)音信號(hào)800Hz l9點(diǎn)FIR低通濾波C語(yǔ)言定點(diǎn)程序。
＃i nclude <stdio.h>
const int length=180；
void  filter (int xin[]，int xout[]，int n，int h[])；
static int h[19]={399，-296，-945，-1555，-1503，-285，2112，5061，7503，8450，
7503，5061，2112，-285，-1503，-1555，-945，-296，399}；/*Q15*/
static int x1[length+20]；
/*低通濾波定點(diǎn)子程序*/
void filter(int xin[]，int xout[]，int n，int h[])
int i，j；
long sum；
for(i=0；i＜length；i++)x1[n＋i-111=xin]；
for(i=0；i＜1ength；i++)
sum=0；
for(j=0；j＜n；j++)sum+=(long)h[j]*x1[i-j＋n-1]；
xout=sum>>15；
for(i=0；i＜(n-1)；i＋＋)x1[n-i-2]=xin[length-i-1]；
}
主程序與浮點(diǎn)的完全一樣�！�
3  DSP定點(diǎn)算術(shù)運(yùn)算
定點(diǎn)DSP芯片的數(shù)值表示基于2的補(bǔ)碼表示形式。每個(gè)16位數(shù)用l個(gè)符號(hào)位、i個(gè)整數(shù)位和15-i個(gè)小數(shù)位來表示。因此：
00000010.10100000
表示的值為：
21＋2-1＋2-3=2.625
   這個(gè)數(shù)可用Q8格式(8個(gè)小數(shù)位)來表示，其表示的數(shù)值范圍為-128至＋l27.996，一個(gè)Q8定點(diǎn)數(shù)的小數(shù)精度為1/256=0.004。
雖然特殊情況(如動(dòng)態(tài)范圍和精度要求)必須使用混合表示法。但是，更通常的是全部以Q15格式表示的小數(shù)或以Q0格式表示的整數(shù)來工作。這一點(diǎn)對(duì)于主要是乘法和累加的信號(hào)處理算法特別現(xiàn)實(shí)，小數(shù)乘以小數(shù)得小數(shù)，整數(shù)乘以整數(shù)得整數(shù)。當(dāng)然，乘積累加時(shí)可能會(huì)出現(xiàn)溢出現(xiàn)象，在這種情況下，程序員應(yīng)當(dāng)了解數(shù)學(xué)里面的物理過程以注意可能的溢出情況。下面我們來討論乘法、加法和除法的DSP定點(diǎn)運(yùn)算，匯編程序以TMS320C25為例。
3.1定點(diǎn)乘法
兩個(gè)定點(diǎn)數(shù)相乘時(shí)可以分為下列三種情況：
1.  小數(shù)乘小數(shù)
例1.9  Q15*Q15=Q30
0.5*0.5=0.25
0.100000000000000；Q15
  *  0.100000000000000；Q15
--------------------------------------------
00.010000000000000000000000000000=0.25；Q30
兩個(gè)Q15的小數(shù)相乘后得到一個(gè)Q30的小數(shù)，即有兩個(gè)符號(hào)位。一般情況下相乘后得到的滿精度數(shù)不必全部保留，而只需保留16位單精度數(shù)。由于相乘后得到的高16位不滿15位的小數(shù)據(jù)度，為了達(dá)到15位精度，可將乘積左移一位，下面是上述乘法的TMS320C25程序：
LT  OP1；OP1=4000H(0.5/Q15)
MPY OP2；oP2=4000H(0.5/Ql5)
PAC
SACH  ANS，1；ANS=2000H(0.25/Q15)
2.  整數(shù)乘整數(shù)
例1.10 Q0*Q0=Q0
17*(-5)=-85
0000000000010001=l7
*1111111111111011=-5
-------------------------------------------
11111111111111111111111110101011=-85
3.  混合表示法
許多情況下，運(yùn)算過程中為了既滿足數(shù)值的動(dòng)態(tài)范圍又保證一定的精度，就必須采用Q0與Q15之間的表示法。比如，數(shù)值1.2345，顯然Q15無法表示，而若用Q0表示，則最接近的數(shù)是1，精度無法保證。因此，數(shù)1.2345最佳的表示法是Q14。
例1.11  1.5*0.75= 1.125
01.10000000000000=1.5；Q14
*00.11000000000000=0.75；Q14
---------------------------------------
0001.0010000000000000000000000000=1.125  Q28
Q14的最大值不大于2，因此，兩個(gè)Q14數(shù)相乘得到的乘積不大于4。
一般地，若一個(gè)數(shù)的整數(shù)位為i位，小數(shù)位為j位，另一個(gè)數(shù)的整數(shù)位為m位，小數(shù)位為n位，則這兩個(gè)數(shù)的乘積為(i+m)位整數(shù)位和(j+n)位小數(shù)位。這個(gè)乘積的最高16位可能的精度為(i＋m)整數(shù)位和(15- i- m)小數(shù)位。
但是，若事先了解數(shù)的動(dòng)態(tài)范圍，就可以增加數(shù)的精度。例如，程序員了解到上述乘積不會(huì)大于1.8，就可以用Q14數(shù)表示乘積，而不是理論上的最佳情況Q13。例3.11的TMS320C25程序如下：
LT  OP1；OP1  = 6000H(1.5/Ql4)
MPY  OP2；OP2  =  3000H(0.75/Q14)
PAC
SACH ANS，1；ANS=2400H(1.125/Q13)
上述方法，為了精度均對(duì)乘的結(jié)果舍位，結(jié)果所產(chǎn)生的誤差相當(dāng)于減去一個(gè)LSB(最低位)。采用下面簡(jiǎn)單的舍人方法，可使誤差減少二分之一。
LT  OP1
MPY OP2
PAC
ADD  ONE，14(上舍入)
SACH  ANS，1
上述程序說明，不管ANS為正或負(fù)，所產(chǎn)生的誤差是l/2  LSB，其中存儲(chǔ)單元ONE的值為1。
3.2定點(diǎn)加法
乘的過程中，程序員可不考慮溢出而只需調(diào)整運(yùn)算中的小數(shù)點(diǎn)。而加法則是一個(gè)更加復(fù)雜的過程。首先，加法運(yùn)算必須用相同的Q點(diǎn)表示，其次，程序員或者允許其結(jié)果有足夠的高位以適應(yīng)位的增長(zhǎng)，或者必須準(zhǔn)備解決溢出問題。如果操作數(shù)僅為16位長(zhǎng)，其結(jié)果可用雙精度數(shù)表示。下面舉例說明16位數(shù)相加的兩種途徑。
1.保留32位結(jié)果
LAC  OP1；(Q15)
ADD  OP2；(Ql5)
SACH  ANSHI  ；(高16位結(jié)果)
SACL  ANSLO  ：(低16位結(jié)果)
2.調(diào)整小數(shù)點(diǎn)保留16位結(jié)果
LAC  OP1，15；(Q14數(shù)用ACCH表示)
ADD  OP2，15；(Q14數(shù)用ACCH表示)
SACH  ANS；(Q14)
加法運(yùn)算最可能出現(xiàn)的問題是運(yùn)算結(jié)果溢出。TMS320提供了檢查溢出的專用指令BV，此外，使用溢出保護(hù)功能可使累加結(jié)果溢出時(shí)累加器飽和為最大的整數(shù)或負(fù)數(shù)。當(dāng)然，即使如此，運(yùn)算精度還是大大降低。因此，最好的方法是完全理解基本的物理過程并注意選擇數(shù)的表達(dá)方式。
3.3定點(diǎn)除法
在通用DSP芯片中，一般不提供單周期的除法指令，為此必須采用除法子程序來實(shí)現(xiàn)。二進(jìn)制除法是乘法的逆運(yùn)算。乘法包括一系列的移位和加法，而除法可分解為一系列的減法和移位。下面我們來說明除法的實(shí)現(xiàn)過程。
設(shè)累加器為8位，且除法運(yùn)算為10除以3。除的過程包括與被除法有關(guān)的除數(shù)逐步移位，在每一步進(jìn)行減法運(yùn)算，如果能減則將位插入商中。
(1)除數(shù)的最低有效位對(duì)齊被除數(shù)的最高有效位。
0000l0l0
-  00011000
--------------------------------------
11110010
(2)由于減法結(jié)果為負(fù)，放棄減法結(jié)果，將被除數(shù)左移一位，再減。
00010100
-  00011000
----------------------------------------
11111000
(3)結(jié)果仍為負(fù)，放棄減法結(jié)果，被除數(shù)左移一位，再減。
00101000
- 00011000
------------------------------------------
00010000
(4)結(jié)果為正，將減法結(jié)果左移一位后加1，作最后一次減。
00100001
- 00011000
----------------------------------------
00001001
(5)結(jié)果為正，將結(jié)果左移一位加1 得最后結(jié)果。高4位代表余數(shù)，低4位表示商。
00010011
即，商為0011= 3.余數(shù)為0001= 1。
TMS320沒有專門的除法指令，但使用條件減指令SUBC可以完成有效靈活的除法功能。使用這一指令的唯一限制是兩個(gè)操作數(shù)必須為正。程序員必須事先了解其可能的運(yùn)算數(shù)的特性，如其商是否可以用小數(shù)表示及商的精度是否可被計(jì)算出來。這里每一種考慮可影響如何使用SUBC指令的問題。下面我們給出兩種不同情況下的TMS320C25除法程序。
(1)分子小于分母
DIV_A：
LT  NUMERA
MPY  DENOM
PAC
SACH  TEMSGN；取商的符號(hào)
LAC  DENOM
ABS
SACL  DENOM；使分母為正
ZALH  NUMERA；分子為正
ABS
RPTK 14
SUBC  DENOM；除循環(huán)15次
SACL  QUOT
LAC  TEMSGN
BGEZ  A1；若符號(hào)為正，則完成
ZAC
SUB  QUOT
SACL QUOT；若為負(fù)，則商為負(fù)
A1：  RET
這個(gè)程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN為暫存單元。
(2)規(guī)定商的精度
DIV_B:
LT  NUMERA
MPY  DENOM
PAC
SACH TEMSGN；取商的符號(hào)
LAC  DENOM
ABS
SACL DENOM; 使分母為正
LACK 15
ADD  FRAC
SACL FRAC；計(jì)算循環(huán)計(jì)數(shù)器
LAC  NUMERA
ABS  ; 使分子為正
RPT  FRAC
SUBC DENOM; 除循環(huán)16＋FRAC次
SACL QUOT
LAC  TEMSGN
BGEZ B1;若符號(hào)為正，則完成
ZAC
SUB  QUOT
SACL QUOT；若為負(fù)，則商為負(fù)
B1：  RET
與DIV_A相同，這個(gè)程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN為暫存單元。FRAC中規(guī)定商的精度，如商的精度為Q13，則調(diào)用程序前FRAC單元中的值應(yīng)為13。
4  非線性運(yùn)算的定點(diǎn)快速實(shí)現(xiàn)
在數(shù)值運(yùn)算中，除基本的加減乘除運(yùn)算外，還有其它許多非線性運(yùn)算，如，對(duì)數(shù)運(yùn)算，開方運(yùn)算，指數(shù)運(yùn)算，三角函數(shù)運(yùn)算等，實(shí)現(xiàn)這些非線性運(yùn)算的方法一般有：(1)調(diào)用DSP編譯系統(tǒng)的庫(kù)函數(shù)；(2)查表法；(3)混合法。下面我們分別介紹這三種方法。
1.調(diào)用DSP編譯系統(tǒng)的庫(kù)函數(shù)
TMS320C2X/C5X的C編譯器提供了比較豐富的運(yùn)行支持庫(kù)函數(shù)。在這些庫(kù)函數(shù)中，包含了諸如對(duì)數(shù)、開方、三角函數(shù)、指數(shù)等常用的非線性函數(shù)。在C程序中(也可在匯編程序中)只要采用與庫(kù)函數(shù)相同的變量定義，就可以直接調(diào)用。例如，在庫(kù)函數(shù)中，定義了以10為底的常用對(duì)數(shù)log10()：
＃i nclude＜math.h＞
double，log10(double x)；
在C程序中按如下方式調(diào)用：
float x，y;
X=10.0;
y=log10(x)；
從上例可以看出，庫(kù)函數(shù)中的常用對(duì)數(shù)log10()要求的輸入值為浮點(diǎn)數(shù)，返回值也為浮點(diǎn)數(shù)，運(yùn)算的精度完全可以保證。直接調(diào)用庫(kù)函數(shù)非常方便，但由于運(yùn)算量大，很難在實(shí)時(shí)DSP中得到應(yīng)用。
2.查表法
在實(shí)時(shí)DSP應(yīng)用中實(shí)現(xiàn)非線性運(yùn)算，一般都采取適當(dāng)降低運(yùn)算精度來提高程序的運(yùn)算速度。查表法是快速實(shí)現(xiàn)非線性運(yùn)算最常用的方法。采用這種方法必須根據(jù)自變量的范圍和精度要求制作一張表格。顯然輸人的范圍越大，精度要求越高，則所需的表格就越大，即存儲(chǔ)量也越大。查表法求值所需的計(jì)算就是根據(jù)輸入值確定表的地址，根據(jù)地址就可得到相應(yīng)的值，因而運(yùn)算量較小。查表法比較適合于非線性函數(shù)是周期函數(shù)或已知非線性函數(shù)輸入值范圍這兩種情況、例1.12和例1. 13分別說明這兩種情況。
例1.12  已知正弦函數(shù)y=cos(x)，制作一個(gè)512點(diǎn)表格，并說明查表方法。由于正弦函數(shù)是周期函數(shù)，函數(shù)值在-1至+1之間，用查表法比較合適。由于Q15的表示范圍為1-至32767/32768之間，原則上講-1至＋1的范圍必須用Q14表示。但一般從方便和總體精度考慮，類似情況仍用Q15表示，此時(shí)+1用32767來表示。
(1)產(chǎn)生5l2點(diǎn)值的C語(yǔ)言程序如下所示。
#define N 512
#define pi 3.14l59
int sin_tab[5l2]；
void  main()
{
int i;
for(i=0；i＜N；i++)sin_tab=(int)(32767*sin(2*pi*i/N))；
(2)查表
查表實(shí)際上就是根據(jù)輸人值確定表的地址。設(shè)輸入x在0~2π之間，則x對(duì)應(yīng)于512點(diǎn)表的地址為：index=(int)(512*x/2π)，則y=sin(x)=sin_tab[index]如果x用Q12定點(diǎn)數(shù)表示，將512/2π用Q8表示為20861，則計(jì)算正弦表的地址的公式為。
index=(x*20861L)>>20；
例1.12用查表法求以2為底的對(duì)數(shù)，已知自變量值范圍為0.5-1，要求將自變量范圍均勻劃分為10等分。試制作這個(gè)表格并說明查表方法。
(1)作表：
y=log2(x)，由于x在0.5到1之間，因此y在-1到0之間，x和y均可用Q15表示。由于對(duì)x均勻劃分為10段，因此，10段對(duì)應(yīng)于輸入x的范圍如表3.2所示。若每一段的對(duì)數(shù)值都取第一點(diǎn)的對(duì)數(shù)值，則表中第一段的對(duì)數(shù)值為y0(Q15)=(int)(log(O.5)*32768)，第二段的對(duì)數(shù)值為y1(Q15)=(int)(log2(0.55)*32768)，依次類推，如表3.2所示。
(2)查表：
查表時(shí)，先根據(jù)輸人值計(jì)算表的地址，計(jì)算方法為：
index=((x-16384)*20)>>15；
式中， index就是查表用的地址。例如，已知輸人x=26869，則index=6，因此，y= -10549。
表1.2  logtab0 10點(diǎn)對(duì)數(shù)表
地址輸入值對(duì)數(shù)值(Q15)
0 0.50-0.55 -32768
1 0.55-0.60 -28262
2 0.60-0.65 -24149
3 0.65-0.70 -20365
4 0.70-0.75 -16862
5 0.75-0.80 -13600
6 0.80-0.85 -10549
7 0.85-0.90 -7683
8 0.90-0.95 -4981
9 0.95-1.00 -2425
3.混合法
(1)提高查表法的精度
上述方法查表所得結(jié)果的精度隨表的大小而變化，表越大，則精度越高，但存儲(chǔ)量也越大。當(dāng)系統(tǒng)的存儲(chǔ)量有限而精度要求也較高時(shí)，查表法就不太適合。那么能否在適當(dāng)增加運(yùn)算量的情況下提高非線性運(yùn)算的精度呢？下面介紹一種查表結(jié)合少量運(yùn)算來計(jì)算非線性函數(shù)的混合法，這種方法適用于在輸入變量的范圍內(nèi)函數(shù)呈單調(diào)變化的情形�；旌戏ㄊ窃诓楸淼幕A(chǔ)上來用計(jì)算的方法以提高當(dāng)輸入值處于表格兩點(diǎn)之間時(shí)的精度。提高精度的一個(gè)簡(jiǎn)便方法是采用折線近似法，如圖1.1所示。
圖1.1提高精度的折線近似法”
仍以求以2為底的對(duì)數(shù)為例(例1.12)。設(shè)輸入值為x，則精確的對(duì)數(shù)值為y，在表格值的兩點(diǎn)之間作一直線，用y'作為y的近似值，則有：
   y'=y0＋△y
其中y0由查表求得�，F(xiàn)在只需在查表求得y0的基礎(chǔ)上增加△y既可�！鱵的計(jì)算方法如下：                △y=(△x/△x0)△y=△x(△y0/△x0)
其中△y0/△x0對(duì)每一段來說是一個(gè)恒定值，可作一個(gè)表格直接查得。此外計(jì)算此時(shí)需用到每段橫坐標(biāo)的起始值，這個(gè)值也可作一個(gè)表格。這佯共有三個(gè)大小均為10的表格，分別為存儲(chǔ)每段起點(diǎn)對(duì)數(shù)值的表logtab0、存儲(chǔ)每段△y0/△x0值的表logtab1和存儲(chǔ)每段輸入起始值x0的表logtab2，表logtab1和表logtab2可用下列兩個(gè)數(shù)組表示。
int  logtab1[10]={22529，20567，18920，17517，16308，
15255，14330，13511，12780，12124}；/*△y0/△x0：Q13*/
int  logtab2[10]={16384，18022，19660，21299，22938，
24576，26214，27853，29491，31130}；/*x0：Q15*/
綜上所述，采用混合法計(jì)算對(duì)數(shù)值的方法可歸納為：
(1)根據(jù)輸人值，計(jì)算查表地址：index=((x-16384)*20)>>15；
(2)查表得y0=logtab0[index]；
(3)計(jì)算△x=x-logtab2[index]；
(4)計(jì)算△y=(△x*logtab1[index])>>13；
(5)計(jì)算得結(jié)果y=y0＋△y。
例1.13已知x=0.54，求log2(x)。
0.54的精確對(duì)數(shù)值為y=log2(0.54)=-0.889。
混合法求對(duì)數(shù)值的過程為：
(1)定標(biāo)Q15，定標(biāo)值x=0.54*32768=17694；
(2)表地址index=((x-16384)*20)>>15=0；
(3)查表得y0=logtab0[0]=-32768；
(4)計(jì)算△x=x-logtab2[0]=17694-16384=1310；
(5)計(jì)算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602
(6)計(jì)算結(jié)果y=y0＋△y=-32768＋3602=-29166。
結(jié)果y為Q15定標(biāo)，析算成浮點(diǎn)數(shù)為-29166/32768=-0.89，可見精度較高。
(2)擴(kuò)大自變量范圍
如上所述，查表法比較適用于周期函數(shù)或自變量的動(dòng)態(tài)范圍不是太大的情形。對(duì)于像對(duì)數(shù)這樣的非線性函數(shù)，輸入值和函數(shù)值的變化范圍都很大。如果輸入值的變化范圍很大，則作表就比較困難。那么能否比較好地解決這個(gè)問題，即不便表格太大，又能得到比較高的精度呢？下面我們來討論一種切實(shí)可行的方法。
設(shè)x是一個(gè)大于0.5的數(shù)，則x可以表示為下列形式：
x=m*2e
式中，0.5<=m<=1.0，e為整數(shù)。則求x的對(duì)數(shù)可以表示為：
log2(x)=log2(m*2e)=log2(m)＋log2(2e)=e＋log2(m)
也就是說，求x的對(duì)數(shù)實(shí)際上只要求m的對(duì)數(shù)就可以了，而由于m的數(shù)值在0.5和1.0之間，用上面介紹的方法是完全可以實(shí)現(xiàn)的。例如：
log2(10000)=log2(0.61035*214)=log2(0.61035)+14 =13.2877
可見，如果一個(gè)數(shù)可以用比較簡(jiǎn)便的方法表示為上面的形式，則求任意大小數(shù)的對(duì)數(shù)也比較方便的。TMS320C2X/C5X指令集提供了一條用于對(duì)ACC中的數(shù)進(jìn)行規(guī)格化的指令NORM，該指令的作用就是使累加器中的數(shù)左移，直至數(shù)的最高位被移至累加器的第30位。例如，對(duì)數(shù)值10000進(jìn)行規(guī)格化的TMS320C25程序?yàn)椤?br /> LAC #10000
SACL TEMP
ZALH TEMP
LAR AR1，#0FH
RPT 14
NORM * -
上述程序執(zhí)行后，AR1=#0eH，ACCH=2000(10進(jìn)制)。對(duì)一個(gè)16位整數(shù)x進(jìn)行上述程序處理實(shí)際上就是作這樣一個(gè)等效變換：
x=[(x*2e)/32768]*215-Q
其中，寄存器AR1包含的值為15-Q累加器ACC高16位包含的值為x.2Q，其數(shù)值在16384至32768之間。
例1.14實(shí)現(xiàn)以2為底的對(duì)數(shù)的C定點(diǎn)模擬程序。
int logtab0[10]={-32768，-28262，-24149，-20365，-16862，
-13600)，-1O549，-7683，-4981，-2425};/*Q15*/
int logtab1[10]={122529，20567，18920，175l7，16308，
15255，14330，13511，12780，12124};/*Q13*/
int logtab2[10]={16384，l8022，19660，21299，22938，
24576，26214，27853，29491，31130};/*Q15*/
int log2_fast(int Am)
{
int point，point1；
int index，x0，dx，dy，y;
point=0；
while(Am＜16384){point＋＋；Am=Am＜＜1；}/*對(duì)Am進(jìn)行規(guī)格化*/
point1=(15-point-4)*512；/*輸入為Q4，輸出為Q9*/
index=((Am-16384)*20L)＞＞15；/*求查表地址*/
dx=Am-logtab2[index]；
dy=((long)dx*logtab1[index])＞＞13；
y=(dy＋longtab0[index])＞＞6；/*Q9*/
y=point1＋y;
return(y)；
}
上述程序中，輸入值A(chǔ)m采用Q4表示，輸出采用Q9表示，如果輸入輸出的Q值與上面程序中的不同，則應(yīng)作相應(yīng)的修改。
以上討論了DSP芯片進(jìn)行定點(diǎn)運(yùn)算所涉及的一些基本問題，這些問題包括：數(shù)的定標(biāo)，DSP程序的定點(diǎn)模擬，DSP芯片的足點(diǎn)運(yùn)算以及定點(diǎn)實(shí)現(xiàn)非線性函數(shù)的快速實(shí)現(xiàn)方法等。充分理解這些問題對(duì)于用定點(diǎn)芯片實(shí)現(xiàn)DSP算法具有非常重要的作用。

帳號(hào)		自動(dòng)登錄	找回密碼
密碼			立即注冊(cè)

DSP定浮點(diǎn)問題淺議

相關(guān)帖子