找回密碼
 立即注冊(cè)

QQ登錄

只需一步,快速開(kāi)始

搜索
查看: 5355|回復(fù): 0
打印 上一主題 下一主題
收起左側(cè)

STM32L476 FPU 執(zhí)行效率之比較淺析

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
ID:98618 發(fā)表于 2016-10-10 23:46 | 只看該作者 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
1.前言
本應(yīng)用筆記基于STM32L476平臺(tái),通過(guò)實(shí)際測(cè)量來(lái)評(píng)定使能FPU時(shí)浮點(diǎn)運(yùn)算效率的情況。
2.測(cè)試工具
STM32L476 Nucleo,示波器
3.測(cè)試方法
MCU 運(yùn)行頻率設(shè)置為16MHz,根據(jù)下面公式1 做N 次浮點(diǎn)運(yùn)算,分使能FPU和禁止FPU兩種情況,測(cè)試完成相同運(yùn)算所需要的時(shí)間。在例程中通過(guò)翻轉(zhuǎn)IO PB13 來(lái)標(biāo)定完成運(yùn)算所需要的時(shí)間。
3.1 測(cè)試代碼
根據(jù)公式1,分別定義A、B、C 三個(gè)常量,如下:
/* Private constants---------------------------------------------------------*/
#define A_CONSTANT(0.285f)
#define B_CONSTANT(0.443f)
#define C_CONSTANT(0.698f)
根據(jù)公式做對(duì)應(yīng)的運(yùn)算并通過(guò)GPIOC Pin0 輸出,測(cè)定對(duì)應(yīng)消耗時(shí)間:
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_SET);
temp = A_CONSTANT*x*x +B_CONSTANT*x + C_CONSTANT;
HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_RESET);
3.2 代碼分析
根據(jù)測(cè)試用的一元二次方程,經(jīng)過(guò)IAR 編譯后,匯編結(jié)果如下:
3.2.1 FPU 使能
從匯編代碼可以看出,使能FPU 的情況下,完成一元二次方程的運(yùn)算只需要7 條單周期指令,總共耗時(shí)為7 個(gè)Clock 周期。通過(guò)IAR 的方針模式運(yùn)行,需要的CPU cycles 為7.

3.2.2 FPU 禁止
從匯編代碼可以看出,未使能FPU 的情況下,完成該一元二次方程的運(yùn)算需要執(zhí)行14 條指令,其中包括3 條兩周期指令,6 條單周期指令,5 條程序跳轉(zhuǎn)指令。通過(guò)IAR 的方針模式運(yùn)行,需要的CPU cycles 為207.
4.測(cè)試數(shù)據(jù)及結(jié)論
IO完成兩次翻轉(zhuǎn)耗時(shí)6.48 uS;
使能FPU 時(shí),除去IO 翻轉(zhuǎn)耗時(shí),完成一次運(yùn)算時(shí)間為6.52 uS(13 uS -6.48 uS),
如下圖示:


禁止FPU 時(shí),除去IO 翻轉(zhuǎn)耗時(shí),完成一次運(yùn)算時(shí)間為87.4 uS(93.88 uS -6.48 uS),如下圖示:

小結(jié)下,根據(jù)上面相關(guān)測(cè)試數(shù)據(jù)大致可得出如下結(jié)論:

? 完成同樣的一元二次方程運(yùn)算,禁止FPU時(shí)所消耗的時(shí)間約為使能FPU時(shí)消耗時(shí)間的13.4 倍左右。

**********The End **********

分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏 分享淘帖 頂 踩
回復(fù)

使用道具 舉報(bào)

本版積分規(guī)則

手機(jī)版|小黑屋|51黑電子論壇 |51黑電子論壇6群 QQ 管理員QQ:125739409;技術(shù)交流QQ群281945664

Powered by 單片機(jī)教程網(wǎng)

快速回復(fù) 返回頂部 返回列表