每日av作品更新在线观看,久久精品人妻中文系列,欧美同性猛男gay69

標(biāo)題: DSP定浮點問題淺議 [打印本頁]

作者: 電子黑 時間: 2016-6-27 19:39
標(biāo)題: DSP定浮點問題淺議

為那些苦苦尋覓DSP資料的人,提供一些幫助......

一  ＤＳＰ定點算數(shù)運算
1  數(shù)的定標(biāo)
在定點DSP芯片中，采用定點數(shù)進(jìn)行數(shù)值運算，其操作數(shù)一般采用整型數(shù)來表示。一個整型數(shù)的最大表示范圍取決于DSP芯片所給定的字長，一般為16位或24位。顯然，字長越長，所能表示的數(shù)的范圍越大，精度也越高。如無特別說明，本書均以16位字長為例。
DSP芯片的數(shù)以2的補碼形式表示。每個16位數(shù)用一個符號位來表示數(shù)的正負(fù)，0表示數(shù)值為正，l則表示數(shù)值為負(fù)。其余15位表示數(shù)值的大小。因此，
   二進(jìn)制數(shù)0010000000000011b=8195
   二進(jìn)制數(shù)1111111111111100b= -4
對DSP芯片而言，參與數(shù)值運算的數(shù)就是16位的整型數(shù)。但在許多情況下，數(shù)學(xué)運算過程中的數(shù)不一定都是整數(shù)。那么，DSP芯片是如何處理小數(shù)的呢？應(yīng)該說，DSP芯片本身無能為力。那么是不是說DSP芯片就不能處理各種小數(shù)呢？當(dāng)然不是。這其中的關(guān)鍵就是由程序員來確定一個數(shù)的小數(shù)點處于16位中的哪一位。這就是數(shù)的定標(biāo)。
通過設(shè)定小數(shù)點在16位數(shù)中的不同位置，就可以表示不同大小和不同精度的小數(shù)了。數(shù)的定標(biāo)有Q表示法和S表示法兩種。表1.1列出了一個16位數(shù)的16種Q表示、S表示及它們所能表示的十進(jìn)制數(shù)值范圍。
從表1.1可以看出，同樣一個16位數(shù)，若小數(shù)點設(shè)定的位置不同，它所表示的數(shù)也就不同。例如，
      16進(jìn)制數(shù)2000H=8192，用Q0表示
      16進(jìn)制數(shù)2000H=0.25，用Q15表示
但對于DSP芯片來說，處理方法是完全相同的。
從表1.1還可以看出，不同的Q所表示的數(shù)不僅范圍不同，而且精度也不相同。Q越大，數(shù)值范圍越小，但精度越高；相反，Q越小，數(shù)值范圍越大，但精度就越低。例如，Q0 的數(shù)值范圍是一32768到+32767，其精度為1，而Q15的數(shù)值范圍為-1到0.9999695，精度為1/32768=0.00003051。因此，對定點數(shù)而言，數(shù)值范圍與精度是一對矛盾，一個變量要想能夠表示比較大的數(shù)值范圍，必須以犧牲精度為代價；而想精度提高，則數(shù)的表示范圍就相應(yīng)地減小。在實際的定點算法中，為了達(dá)到最佳的性能，必須充分考慮到這一點。
浮點數(shù)與定點數(shù)的轉(zhuǎn)換關(guān)系可表示為：
      浮點數(shù)(x)轉(zhuǎn)換為定點數(shù)(xq)：xq=(int)x* 2Q
      定點數(shù)(xq)轉(zhuǎn)換為浮點數(shù)(x)：x=(float)xq*2-Q
例如，浮點數(shù)x=0.5，定標(biāo)Q=15，則定點數(shù)xq=L0.5*32768J=16384，式中LJ表示下取整。反之，一個用Q=15表示的定點數(shù)16384，其浮點數(shù)為163幼*2-15=16384/32768=0.5。浮點數(shù)轉(zhuǎn)換為定點數(shù)時，為了降低截尾誤差，在取整前可以先加上0.5。

表1.1 Q表示、S表示及數(shù)值范圍
Q表示 S表示十進(jìn)制數(shù)表示范圍
Q15 S0.15 -1≤x≤0.9999695
Q14 S1.14 -2≤x≤1.9999390
Q13 S2.13 -4≤x≤3.9998779
Q12 S3.12 -8≤x≤7.9997559
Q11 S4.11 -16≤x≤15.9995117
Q10 S5.10 -32≤x≤31.9990234
Q9 S6.9 -64≤x≤63.9980469
Q8 S7.8 -128≤x≤127.9960938
Q7 S8.7 -256≤x≤255.9921875
Q6 S9.6 -512≤x≤511.9804375
Q5 S10.5 -1024≤x≤1023.96875
Q4 S11.4 -2048≤x≤2047.9375
Q3 S12.3 -4096≤x≤4095.875
Q2 S13.2 -8192≤x≤8191.75
Q1 S14.1 -16384≤x≤16383.5
Q0 S15.0 -32768≤x≤32767
2  高級語言：從浮點到定點
我們在編寫DSP模擬算法時，為了方便，一般都是采用高級語言(如C語言)來編寫模擬程序。程序中所用的變量一般既有整型數(shù)，又有浮點數(shù)。如例1.1程序中的變量i是整型數(shù)，而pi是浮點數(shù)，hamwindow則是浮點數(shù)組。
例1.1  256點漢明窗計算
int i；+
float pi=3.14l59；
float hamwindow[256]；
for(i=0；i<256；i++)  hamwindow=0.54-0.46*cos(2.0*pi*i/255)；
如果我們要將上述程序用某種足點DSP芯片來實現(xiàn)，則需將上述程序改寫為DSP芯片的匯編語言程序。為了DSP程序調(diào)試的方便及模擬定點DSP實現(xiàn)時的算法性能，在編寫DSP匯編程序之前一般需將高級語言浮點算法改寫為高級語言定點算法。下面我們討論基本算術(shù)運算的定點實現(xiàn)方法。
2.1  加法/減法運算的C語言定點摸擬
設(shè)浮點加法運算的表達(dá)式為：
float x，y，z；
z=x+y；
將浮點加法/減法轉(zhuǎn)化為定點加法/減法時最重要的一點就是必須保證兩個操作數(shù)的定標(biāo)
temp=x+temp；
z=temp>>(Qx-Qz)，若Qx>=Qz
z=temp<<(Qz-Qx)，若Qx<=Qz
例1.4結(jié)果超過16位的定點加法
設(shè)x=l5000，y=20000，則浮點運算值為z=x+y=35000，顯然z>32767，因此
Qx=1，Qy=0，Qz=0，則定點加法為：
x=30000；y=20000；
temp=20000<<1=40000；
temp=temp+x=40000+30000=70000；
z=70000L>>1=35000；
因為z的Q值為0，所以定點值z=35000就是浮點值，這里z是一個長整型數(shù)。當(dāng)加法或加法的結(jié)果超過16位表示范圍時，如果程序員事先能夠了解到這種情況，并且需要保持運算精度時，則必須保持32位結(jié)果。如果程序中是按照16位數(shù)進(jìn)行運算的，則超過16位實際上就是出現(xiàn)了溢出。如果不采取適當(dāng)?shù)拇胧�，則數(shù)據(jù)溢出會導(dǎo)致運算精度的嚴(yán)重惡化。一般的定點DSP芯片都沒有溢出保護(hù)功能，當(dāng)溢出保護(hù)功能有效時，一旦出現(xiàn)溢出，則累加器ACC的結(jié)果為最大的飽和值(上溢為7FFFH，下溢為8001H)，從而達(dá)到防止溢出引起精度嚴(yán)重惡化的目的。
2.2乘法運算的C語言定點模擬
設(shè)浮點乘法運算的表達(dá)式為：
float x，y，z；
z=xy；
假設(shè)經(jīng)過統(tǒng)計后x的定標(biāo)值為Qx，y的定標(biāo)值為Qy，乘積z的定標(biāo)值為Qz，則
z=xy
zq*2-Qx=xq*yq*2-(Qx+Qy)
zq=(xqyq)2Qz-(Qx+Qy)
所以定點表示的乘法為：
int  x，y，z；
long temp；
temp=(long)x；
z=(temp*y)>>(Qx+Qy-Qz)；
例1.5定點乘法。
設(shè)x=18.4，y=36.8，則浮點運算值為=18.4*36.8=677.12；
根據(jù)上節(jié)，得Qx=10，Qy=9，Qz=5，所以
x=18841；y=18841；
temp=18841L；
z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666；
因為z的定標(biāo)值為5，故定點z=21666，即為浮點的z=21666/32=677.08。
2.3除法運算的C語言定點摸擬
設(shè)浮點除法運算的表達(dá)式為：
float x，y，z；
z=x/y；
假設(shè)經(jīng)過統(tǒng)計后被除數(shù)x的定標(biāo)值為Qx，除數(shù)y的定標(biāo)值為Qy，商z的定標(biāo)值為Qz，則
z=x/y
zq*2-Qz=(xq*2-Qx)/(yq*2-Qy)
zq=(xq*2(Qz-Qx+Qy))/yq
所以定點表示的除法為：
int x，y，z；
long temp；
temp=(long)x；
z=(temp<<(Qz-Qx+Qy))/y；
例1.6定點除法。
設(shè)x=18.4，y=36.8，浮點運算值為z=x/y=18.4/36.8=0.5；
根據(jù)上節(jié)，得Qx=10，Qy=9，Qz=15；所以有
z=18841，y=18841；
temp=(long)18841；
z=(18841L<<(15-10+9)/18841=3O8690944L/18841=16384；
因為商z的定標(biāo)值為15，所以定點z=16384，即為浮點z=16384/215=0.5。
2.4程序變量的Q值確定
在前面幾節(jié)介紹的例子中，由于x，y，z的值都是已知的，因此從浮點變?yōu)槎c時Q值很好確定。在實際的DSP應(yīng)用中，程序中參與運算的都是變量，那么如何確定浮點程序中變量的Q值呢？從前面的分析可以知道，確定變量的Q值實際上就是確定變量的動態(tài)范圍，動態(tài)范圍確定了，則Q值也就確定了。
設(shè)變量的絕對值的最大值為|max|，注意|max|必須小于或等于32767。取一個整數(shù)n，使?jié)M足
2n-1<|max|<2n
則有
2-Q=2-15*2n=2-(15-n)
Q=15-n
例如，某變量的值在-1至+1之間，即|max|<1，因此n=0，Q=15-n=15。
既然確定了變量的|max|就可以確定其Q值，那么變量的|max|又是如何確定的呢？一般來說，確定變量的|max|有兩種方法。一種是理論分析法，另一種是統(tǒng)計分析法。
  1.  理論分析法
有些變量的動態(tài)范圍通過理論分析是可以確定的。例如：
(1)三角函數(shù)。y=sin(x)或y=cos(x)，由三角函數(shù)知識可知，|y|<=1。
(2)漢明窗。y(n)=0.54一0.46cos[nπn/(N-1)]，0<=n<=N-1。因為-1<=cos[2πn/(N-1)]<=1，所以0.08<=y(n)<=1.0。
(3)FIR卷積。y(n)=∑h(k)x(n-k)，設(shè)∑|h(k)|=1.0，且x(n)是模擬信號12位量化值，即有|x(n)|<=211，則|y(n)|<=211。
(4)理論已經(jīng)證明，在自相關(guān)線性預(yù)測編碼(LPC)的程序設(shè)計中，反射系數(shù)ki滿足下列不等式：|ki|<1.0，i=1，2，...，p，p為LPC的階數(shù)。
  2.  統(tǒng)計分析法
對于理論上無法確定范圍的變量，一般采用統(tǒng)計分析的方法來確定其動態(tài)范圍。所謂統(tǒng)計分析，就是用足夠多的輸入信號樣值來確定程序中變量的動態(tài)范圍，這里輸入信號一方面要有一定的數(shù)量，另一方面必須盡可能地涉及各種情況。例如，在語音信號分析中，統(tǒng)計分析時就必須來集足夠多的語音信號樣值，并且在所采集的語音樣值中，應(yīng)盡可能地包含各種情況。如音量的大小，聲音的種類(男聲、女聲等)。只有這樣，統(tǒng)計出來的結(jié)果才能具有典型性。
當(dāng)然，統(tǒng)計分析畢竟不可能涉及所有可能發(fā)生的情況，因此，對統(tǒng)計得出的結(jié)果在程序設(shè)計時可采取一些保護(hù)措施，如適當(dāng)犧牲一些精度，Q值取比統(tǒng)計值稍大些，使用DSP芯片提供的溢出保護(hù)功能等。
2.5浮點至定點變換的C程序舉例
本節(jié)我們通過一個例子來說明C程序從浮點變換至定點的方法。這是一個對語音信號(0.3~3.4kHz)進(jìn)行低通濾波的C語言程序，低通濾波的截止頻率為800Hz，濾波器采用19點的有限沖擊響應(yīng)FIR濾波。語音信號的采樣頻率為8kHz，每個語音樣值按16位整型數(shù)存放在insp.dat文件中。
例1.7語音信號800Hz 19點FIR低通濾波C語言浮點程序。
＃i nclude  <stdio.h>
const int length=180/*語音幀長為180點=22.5ms＠8kHz采樣*/
void filter(int xin[]，int xout[]，int n，float h[])；/*濾波子程序說明*/
/*19點濾波器系數(shù)*/
static float h[19]=
{0.01218354，-0.009012882，-0.02881839，-0.04743239，-0.04584568，
-0.008692503，0.06446265，0.1544655，0.2289794，0.257883，
0.2289794，0.1544655，0.06446265，-0.008692503，-0.04584568，
-0.04743239，-0.02881839，-0.009012882，O.01218354}；
static int xl[length+20]；
/*低通濾波浮點子程序*/
void filter(int xin[]，int xout[]，int n，float h[])
{
int i，j；
float sum；
for(i=0；i<length；i++)x1[n+i-1]=xin；
for(i=0；i＜length；i++)
{
sum=0.0；
for(j=0；j＜n；j++)sum+=h[j]*x1[i-j+n-1]；
xout=(int)sum；
for(i=0；i＜(n-l)；i++)x1[n-i-2]=xin[length-1-i]；
}
/*主程序*/
void main()
FILE *fp1，*fp2；
int frame，indata[length]，outdata[length]；
fp1=fopen(insp.dat，"rb")；/* 輸入語音文件*/
fp2=fopen(Outsp.dat，"wb")；/* 濾波后語音文件*/
frame=0；
while(feof(fp1) ==0)
{
frame++；
printf(“frame=％d＼n”，frame)；
for(i=0；i＜length；i++)indata=getw(fp1)；  /*取一幀語音數(shù)據(jù)*/
filter(indata，outdata，19，h)；/*調(diào)用低通濾波子程序*/
for(i=0；i＜length；i++)putw(outdata，fp2)；/*將濾波后的樣值寫入文件*/
}
fcloseall()；/*關(guān)閉文件*/
return(0)；
}
例1.8語音信號800Hz l9點FIR低通濾波C語言定點程序。
＃i nclude <stdio.h>
const int length=180；
void  filter (int xin[]，int xout[]，int n，int h[])；
static int h[19]={399，-296，-945，-1555，-1503，-285，2112，5061，7503，8450，
7503，5061，2112，-285，-1503，-1555，-945，-296，399}；/*Q15*/
static int x1[length+20]；
/*低通濾波定點子程序*/
void filter(int xin[]，int xout[]，int n，int h[])
int i，j；
long sum；
for(i=0；i＜length；i++)x1[n＋i-111=xin]；
for(i=0；i＜1ength；i++)
sum=0；
for(j=0；j＜n；j++)sum+=(long)h[j]*x1[i-j＋n-1]；
xout=sum>>15；
for(i=0；i＜(n-1)；i＋＋)x1[n-i-2]=xin[length-i-1]；
}
主程序與浮點的完全一樣�！�
3  DSP定點算術(shù)運算
定點DSP芯片的數(shù)值表示基于2的補碼表示形式。每個16位數(shù)用l個符號位、i個整數(shù)位和15-i個小數(shù)位來表示。因此：
00000010.10100000
表示的值為：
21＋2-1＋2-3=2.625
   這個數(shù)可用Q8格式(8個小數(shù)位)來表示，其表示的數(shù)值范圍為-128至＋l27.996，一個Q8定點數(shù)的小數(shù)精度為1/256=0.004。
雖然特殊情況(如動態(tài)范圍和精度要求)必須使用混合表示法。但是，更通常的是全部以Q15格式表示的小數(shù)或以Q0格式表示的整數(shù)來工作。這一點對于主要是乘法和累加的信號處理算法特別現(xiàn)實，小數(shù)乘以小數(shù)得小數(shù)，整數(shù)乘以整數(shù)得整數(shù)。當(dāng)然，乘積累加時可能會出現(xiàn)溢出現(xiàn)象，在這種情況下，程序員應(yīng)當(dāng)了解數(shù)學(xué)里面的物理過程以注意可能的溢出情況。下面我們來討論乘法、加法和除法的DSP定點運算，匯編程序以TMS320C25為例。
3.1定點乘法
兩個定點數(shù)相乘時可以分為下列三種情況：
1.  小數(shù)乘小數(shù)
例1.9  Q15*Q15=Q30
0.5*0.5=0.25
0.100000000000000；Q15
  *  0.100000000000000；Q15
--------------------------------------------
00.010000000000000000000000000000=0.25；Q30
兩個Q15的小數(shù)相乘后得到一個Q30的小數(shù)，即有兩個符號位。一般情況下相乘后得到的滿精度數(shù)不必全部保留，而只需保留16位單精度數(shù)。由于相乘后得到的高16位不滿15位的小數(shù)據(jù)度，為了達(dá)到15位精度，可將乘積左移一位，下面是上述乘法的TMS320C25程序：
LT  OP1；OP1=4000H(0.5/Q15)
MPY OP2；oP2=4000H(0.5/Ql5)
PAC
SACH  ANS，1；ANS=2000H(0.25/Q15)
2.  整數(shù)乘整數(shù)
例1.10 Q0*Q0=Q0
17*(-5)=-85
0000000000010001=l7
*1111111111111011=-5
-------------------------------------------
11111111111111111111111110101011=-85
3.  混合表示法
許多情況下，運算過程中為了既滿足數(shù)值的動態(tài)范圍又保證一定的精度，就必須采用Q0與Q15之間的表示法。比如，數(shù)值1.2345，顯然Q15無法表示，而若用Q0表示，則最接近的數(shù)是1，精度無法保證。因此，數(shù)1.2345最佳的表示法是Q14。
例1.11  1.5*0.75= 1.125
01.10000000000000=1.5；Q14
*00.11000000000000=0.75；Q14
---------------------------------------
0001.0010000000000000000000000000=1.125  Q28
Q14的最大值不大于2，因此，兩個Q14數(shù)相乘得到的乘積不大于4。
一般地，若一個數(shù)的整數(shù)位為i位，小數(shù)位為j位，另一個數(shù)的整數(shù)位為m位，小數(shù)位為n位，則這兩個數(shù)的乘積為(i+m)位整數(shù)位和(j+n)位小數(shù)位。這個乘積的最高16位可能的精度為(i＋m)整數(shù)位和(15- i- m)小數(shù)位。
但是，若事先了解數(shù)的動態(tài)范圍，就可以增加數(shù)的精度。例如，程序員了解到上述乘積不會大于1.8，就可以用Q14數(shù)表示乘積，而不是理論上的最佳情況Q13。例3.11的TMS320C25程序如下：
LT  OP1；OP1  = 6000H(1.5/Ql4)
MPY  OP2；OP2  =  3000H(0.75/Q14)
PAC
SACH ANS，1；ANS=2400H(1.125/Q13)
上述方法，為了精度均對乘的結(jié)果舍位，結(jié)果所產(chǎn)生的誤差相當(dāng)于減去一個LSB(最低位)。采用下面簡單的舍人方法，可使誤差減少二分之一。
LT  OP1
MPY OP2
PAC
ADD  ONE，14(上舍入)
SACH  ANS，1
上述程序說明，不管ANS為正或負(fù)，所產(chǎn)生的誤差是l/2  LSB，其中存儲單元ONE的值為1。
3.2定點加法
乘的過程中，程序員可不考慮溢出而只需調(diào)整運算中的小數(shù)點。而加法則是一個更加復(fù)雜的過程。首先，加法運算必須用相同的Q點表示，其次，程序員或者允許其結(jié)果有足夠的高位以適應(yīng)位的增長，或者必須準(zhǔn)備解決溢出問題。如果操作數(shù)僅為16位長，其結(jié)果可用雙精度數(shù)表示。下面舉例說明16位數(shù)相加的兩種途徑。
1.保留32位結(jié)果
LAC  OP1；(Q15)
ADD  OP2；(Ql5)
SACH  ANSHI  ；(高16位結(jié)果)
SACL  ANSLO  ：(低16位結(jié)果)
2.調(diào)整小數(shù)點保留16位結(jié)果
LAC  OP1，15；(Q14數(shù)用ACCH表示)
ADD  OP2，15；(Q14數(shù)用ACCH表示)
SACH  ANS；(Q14)
加法運算最可能出現(xiàn)的問題是運算結(jié)果溢出。TMS320提供了檢查溢出的專用指令BV，此外，使用溢出保護(hù)功能可使累加結(jié)果溢出時累加器飽和為最大的整數(shù)或負(fù)數(shù)。當(dāng)然，即使如此，運算精度還是大大降低。因此，最好的方法是完全理解基本的物理過程并注意選擇數(shù)的表達(dá)方式。
3.3定點除法
在通用DSP芯片中，一般不提供單周期的除法指令，為此必須采用除法子程序來實現(xiàn)。二進(jìn)制除法是乘法的逆運算。乘法包括一系列的移位和加法，而除法可分解為一系列的減法和移位。下面我們來說明除法的實現(xiàn)過程。
設(shè)累加器為8位，且除法運算為10除以3。除的過程包括與被除法有關(guān)的除數(shù)逐步移位，在每一步進(jìn)行減法運算，如果能減則將位插入商中。
(1)除數(shù)的最低有效位對齊被除數(shù)的最高有效位。
0000l0l0
-  00011000
--------------------------------------
11110010
(2)由于減法結(jié)果為負(fù)，放棄減法結(jié)果，將被除數(shù)左移一位，再減。
00010100
-  00011000
----------------------------------------
11111000
(3)結(jié)果仍為負(fù)，放棄減法結(jié)果，被除數(shù)左移一位，再減。
00101000
- 00011000
------------------------------------------
00010000
(4)結(jié)果為正，將減法結(jié)果左移一位后加1，作最后一次減。
00100001
- 00011000
----------------------------------------
00001001
(5)結(jié)果為正，將結(jié)果左移一位加1 得最后結(jié)果。高4位代表余數(shù)，低4位表示商。
00010011
即，商為0011= 3.余數(shù)為0001= 1。
TMS320沒有專門的除法指令，但使用條件減指令SUBC可以完成有效靈活的除法功能。使用這一指令的唯一限制是兩個操作數(shù)必須為正。程序員必須事先了解其可能的運算數(shù)的特性，如其商是否可以用小數(shù)表示及商的精度是否可被計算出來。這里每一種考慮可影響如何使用SUBC指令的問題。下面我們給出兩種不同情況下的TMS320C25除法程序。
(1)分子小于分母
DIV_A：
LT  NUMERA
MPY  DENOM
PAC
SACH  TEMSGN；取商的符號
LAC  DENOM
ABS
SACL  DENOM；使分母為正
ZALH  NUMERA；分子為正
ABS
RPTK 14
SUBC  DENOM；除循環(huán)15次
SACL  QUOT
LAC  TEMSGN
BGEZ  A1；若符號為正，則完成
ZAC
SUB  QUOT
SACL QUOT；若為負(fù)，則商為負(fù)
A1：  RET
這個程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN為暫存單元。
(2)規(guī)定商的精度
DIV_B:
LT  NUMERA
MPY  DENOM
PAC
SACH TEMSGN；取商的符號
LAC  DENOM
ABS
SACL DENOM; 使分母為正
LACK 15
ADD  FRAC
SACL FRAC；計算循環(huán)計數(shù)器
LAC  NUMERA
ABS  ; 使分子為正
RPT  FRAC
SUBC DENOM; 除循環(huán)16＋FRAC次
SACL QUOT
LAC  TEMSGN
BGEZ B1;若符號為正，則完成
ZAC
SUB  QUOT
SACL QUOT；若為負(fù)，則商為負(fù)
B1：  RET
與DIV_A相同，這個程序中，分子在NUMERA中，分母在DENOM中，商存在QUOT中，TEMSGN為暫存單元。FRAC中規(guī)定商的精度，如商的精度為Q13，則調(diào)用程序前FRAC單元中的值應(yīng)為13。
4  非線性運算的定點快速實現(xiàn)
在數(shù)值運算中，除基本的加減乘除運算外，還有其它許多非線性運算，如，對數(shù)運算，開方運算，指數(shù)運算，三角函數(shù)運算等，實現(xiàn)這些非線性運算的方法一般有：(1)調(diào)用DSP編譯系統(tǒng)的庫函數(shù)；(2)查表法；(3)混合法。下面我們分別介紹這三種方法。
1.調(diào)用DSP編譯系統(tǒng)的庫函數(shù)
TMS320C2X/C5X的C編譯器提供了比較豐富的運行支持庫函數(shù)。在這些庫函數(shù)中，包含了諸如對數(shù)、開方、三角函數(shù)、指數(shù)等常用的非線性函數(shù)。在C程序中(也可在匯編程序中)只要采用與庫函數(shù)相同的變量定義，就可以直接調(diào)用。例如，在庫函數(shù)中，定義了以10為底的常用對數(shù)log10()：
＃i nclude＜math.h＞
double，log10(double x)；
在C程序中按如下方式調(diào)用：
float x，y;
X=10.0;
y=log10(x)；
從上例可以看出，庫函數(shù)中的常用對數(shù)log10()要求的輸入值為浮點數(shù)，返回值也為浮點數(shù)，運算的精度完全可以保證。直接調(diào)用庫函數(shù)非常方便，但由于運算量大，很難在實時DSP中得到應(yīng)用。
2.查表法
在實時DSP應(yīng)用中實現(xiàn)非線性運算，一般都采取適當(dāng)降低運算精度來提高程序的運算速度。查表法是快速實現(xiàn)非線性運算最常用的方法。采用這種方法必須根據(jù)自變量的范圍和精度要求制作一張表格。顯然輸人的范圍越大，精度要求越高，則所需的表格就越大，即存儲量也越大。查表法求值所需的計算就是根據(jù)輸入值確定表的地址，根據(jù)地址就可得到相應(yīng)的值，因而運算量較小。查表法比較適合于非線性函數(shù)是周期函數(shù)或已知非線性函數(shù)輸入值范圍這兩種情況、例1.12和例1. 13分別說明這兩種情況。
例1.12  已知正弦函數(shù)y=cos(x)，制作一個512點表格，并說明查表方法。由于正弦函數(shù)是周期函數(shù)，函數(shù)值在-1至+1之間，用查表法比較合適。由于Q15的表示范圍為1-至32767/32768之間，原則上講-1至＋1的范圍必須用Q14表示。但一般從方便和總體精度考慮，類似情況仍用Q15表示，此時+1用32767來表示。
(1)產(chǎn)生5l2點值的C語言程序如下所示。
#define N 512
#define pi 3.14l59
int sin_tab[5l2]；
void  main()
{
int i;
for(i=0；i＜N；i++)sin_tab=(int)(32767*sin(2*pi*i/N))；
(2)查表
查表實際上就是根據(jù)輸人值確定表的地址。設(shè)輸入x在0~2π之間，則x對應(yīng)于512點表的地址為：index=(int)(512*x/2π)，則y=sin(x)=sin_tab[index]如果x用Q12定點數(shù)表示，將512/2π用Q8表示為20861，則計算正弦表的地址的公式為。
index=(x*20861L)>>20；
例1.12用查表法求以2為底的對數(shù)，已知自變量值范圍為0.5-1，要求將自變量范圍均勻劃分為10等分。試制作這個表格并說明查表方法。
(1)作表：
y=log2(x)，由于x在0.5到1之間，因此y在-1到0之間，x和y均可用Q15表示。由于對x均勻劃分為10段，因此，10段對應(yīng)于輸入x的范圍如表3.2所示。若每一段的對數(shù)值都取第一點的對數(shù)值，則表中第一段的對數(shù)值為y0(Q15)=(int)(log(O.5)*32768)，第二段的對數(shù)值為y1(Q15)=(int)(log2(0.55)*32768)，依次類推，如表3.2所示。
(2)查表：
查表時，先根據(jù)輸人值計算表的地址，計算方法為：
index=((x-16384)*20)>>15；
式中， index就是查表用的地址。例如，已知輸人x=26869，則index=6，因此，y= -10549。
表1.2  logtab0 10點對數(shù)表
地址輸入值對數(shù)值(Q15)
0 0.50-0.55 -32768
1 0.55-0.60 -28262
2 0.60-0.65 -24149
3 0.65-0.70 -20365
4 0.70-0.75 -16862
5 0.75-0.80 -13600
6 0.80-0.85 -10549
7 0.85-0.90 -7683
8 0.90-0.95 -4981
9 0.95-1.00 -2425
3.混合法
(1)提高查表法的精度
上述方法查表所得結(jié)果的精度隨表的大小而變化，表越大，則精度越高，但存儲量也越大。當(dāng)系統(tǒng)的存儲量有限而精度要求也較高時，查表法就不太適合。那么能否在適當(dāng)增加運算量的情況下提高非線性運算的精度呢？下面介紹一種查表結(jié)合少量運算來計算非線性函數(shù)的混合法，這種方法適用于在輸入變量的范圍內(nèi)函數(shù)呈單調(diào)變化的情形。混合法是在查表的基礎(chǔ)上來用計算的方法以提高當(dāng)輸入值處于表格兩點之間時的精度。提高精度的一個簡便方法是采用折線近似法，如圖1.1所示。
圖1.1提高精度的折線近似法”
仍以求以2為底的對數(shù)為例(例1.12)。設(shè)輸入值為x，則精確的對數(shù)值為y，在表格值的兩點之間作一直線，用y'作為y的近似值，則有：
   y'=y0＋△y
其中y0由查表求得�，F(xiàn)在只需在查表求得y0的基礎(chǔ)上增加△y既可�！鱵的計算方法如下：                △y=(△x/△x0)△y=△x(△y0/△x0)
其中△y0/△x0對每一段來說是一個恒定值，可作一個表格直接查得。此外計算此時需用到每段橫坐標(biāo)的起始值，這個值也可作一個表格。這佯共有三個大小均為10的表格，分別為存儲每段起點對數(shù)值的表logtab0、存儲每段△y0/△x0值的表logtab1和存儲每段輸入起始值x0的表logtab2，表logtab1和表logtab2可用下列兩個數(shù)組表示。
int  logtab1[10]={22529，20567，18920，17517，16308，
15255，14330，13511，12780，12124}；/*△y0/△x0：Q13*/
int  logtab2[10]={16384，18022，19660，21299，22938，
24576，26214，27853，29491，31130}；/*x0：Q15*/
綜上所述，采用混合法計算對數(shù)值的方法可歸納為：
(1)根據(jù)輸人值，計算查表地址：index=((x-16384)*20)>>15；
(2)查表得y0=logtab0[index]；
(3)計算△x=x-logtab2[index]；
(4)計算△y=(△x*logtab1[index])>>13；
(5)計算得結(jié)果y=y0＋△y。
例1.13已知x=0.54，求log2(x)。
0.54的精確對數(shù)值為y=log2(0.54)=-0.889。
混合法求對數(shù)值的過程為：
(1)定標(biāo)Q15，定標(biāo)值x=0.54*32768=17694；
(2)表地址index=((x-16384)*20)>>15=0；
(3)查表得y0=logtab0[0]=-32768；
(4)計算△x=x-logtab2[0]=17694-16384=1310；
(5)計算△y=(△xlogtab1[0]>>13=(13l0*22529L)>>13=3602
(6)計算結(jié)果y=y0＋△y=-32768＋3602=-29166。
結(jié)果y為Q15定標(biāo)，析算成浮點數(shù)為-29166/32768=-0.89，可見精度較高。
(2)擴大自變量范圍
如上所述，查表法比較適用于周期函數(shù)或自變量的動態(tài)范圍不是太大的情形。對于像對數(shù)這樣的非線性函數(shù)，輸入值和函數(shù)值的變化范圍都很大。如果輸入值的變化范圍很大，則作表就比較困難。那么能否比較好地解決這個問題，即不便表格太大，又能得到比較高的精度呢？下面我們來討論一種切實可行的方法。
設(shè)x是一個大于0.5的數(shù)，則x可以表示為下列形式：
x=m*2e
式中，0.5<=m<=1.0，e為整數(shù)。則求x的對數(shù)可以表示為：
log2(x)=log2(m*2e)=log2(m)＋log2(2e)=e＋log2(m)
也就是說，求x的對數(shù)實際上只要求m的對數(shù)就可以了，而由于m的數(shù)值在0.5和1.0之間，用上面介紹的方法是完全可以實現(xiàn)的。例如：
log2(10000)=log2(0.61035*214)=log2(0.61035)+14 =13.2877
可見，如果一個數(shù)可以用比較簡便的方法表示為上面的形式，則求任意大小數(shù)的對數(shù)也比較方便的。TMS320C2X/C5X指令集提供了一條用于對ACC中的數(shù)進(jìn)行規(guī)格化的指令NORM，該指令的作用就是使累加器中的數(shù)左移，直至數(shù)的最高位被移至累加器的第30位。例如，對數(shù)值10000進(jìn)行規(guī)格化的TMS320C25程序為。
LAC #10000
SACL TEMP
ZALH TEMP
LAR AR1，#0FH
RPT 14
NORM * -
上述程序執(zhí)行后，AR1=#0eH，ACCH=2000(10進(jìn)制)。對一個16位整數(shù)x進(jìn)行上述程序處理實際上就是作這樣一個等效變換：
x=[(x*2e)/32768]*215-Q
其中，寄存器AR1包含的值為15-Q累加器ACC高16位包含的值為x.2Q，其數(shù)值在16384至32768之間。
例1.14實現(xiàn)以2為底的對數(shù)的C定點模擬程序。
int logtab0[10]={-32768，-28262，-24149，-20365，-16862，
-13600)，-1O549，-7683，-4981，-2425};/*Q15*/
int logtab1[10]={122529，20567，18920，175l7，16308，
15255，14330，13511，12780，12124};/*Q13*/
int logtab2[10]={16384，l8022，19660，21299，22938，
24576，26214，27853，29491，31130};/*Q15*/
int log2_fast(int Am)
{
int point，point1；
int index，x0，dx，dy，y;
point=0；
while(Am＜16384){point＋＋；Am=Am＜＜1；}/*對Am進(jìn)行規(guī)格化*/
point1=(15-point-4)*512；/*輸入為Q4，輸出為Q9*/
index=((Am-16384)*20L)＞＞15；/*求查表地址*/
dx=Am-logtab2[index]；
dy=((long)dx*logtab1[index])＞＞13；
y=(dy＋longtab0[index])＞＞6；/*Q9*/
y=point1＋y;
return(y)；
}
上述程序中，輸入值A(chǔ)m采用Q4表示，輸出采用Q9表示，如果輸入輸出的Q值與上面程序中的不同，則應(yīng)作相應(yīng)的修改。
以上討論了DSP芯片進(jìn)行定點運算所涉及的一些基本問題，這些問題包括：數(shù)的定標(biāo)，DSP程序的定點模擬，DSP芯片的足點運算以及定點實現(xiàn)非線性函數(shù)的快速實現(xiàn)方法等。充分理解這些問題對于用定點芯片實現(xiàn)DSP算法具有非常重要的作用。

歡迎光臨 (http://www.torrancerestoration.com/bbs/)