標(biāo)題: stm32 HardFault_Handler調(diào)試及問題查找方法 [打印本頁]
作者: piaolin 時(shí)間: 2015-10-29 17:16
標(biāo)題: stm32 HardFault_Handler調(diào)試及問題查找方法
本帖最后由 piaolin 于 2015-10-29 17:20 編輯
STM32出現(xiàn)HardFault_Handler故障的原因主要有兩個(gè)方面:
1、內(nèi)存溢出或者訪問越界。這個(gè)需要自己寫程序的時(shí)候規(guī)范代碼,遇到了需要慢慢排查。
2、堆棧溢出。增加堆棧的大小。
出現(xiàn)問題時(shí)排查的方法:
發(fā)生異常之后可首先查看LR寄存器中的值,確定當(dāng)前使用堆棧為MSP或PSP,然后找到相應(yīng)堆棧的指針,并在內(nèi)存中查看相應(yīng)堆棧里的內(nèi)容。由于異常發(fā)生時(shí),內(nèi)核將R0~R3、R12、Returnaddress、PSR、LR寄存器依次入棧,其中Return address即為發(fā)生異常前PC將要執(zhí)行的下一條指令地址。
注意:寄存器均是32位,且STM32是小端模式。(參考Cortex-M3權(quán)威)

編寫問題代碼如下:
- void StackFlow(void)
- {
- int a[3],i;
- for(i=0; i<10000; i++)
- {
- a[i]=1;
- }
- }
- void SystemInit(void)
- {
-
-
- RCC->CR |= (uint32_t)0x00000001;
-
- RCC->CFGR = 0x00000000;
-
- RCC->CR &= (uint32_t)0xFEF6FFFF;
-
- RCC->PLLCFGR = 0x24003010;
- StackFlow();
-
- RCC->CR &= (uint32_t)0xFFFBFFFF;
- 。。。。。。。。。。。。。。
- }
復(fù)制代碼
DEBUG如下圖
SP值為0x20008560,查看堆棧里面的值依次為R0~R3、R12、Return address、PSR、LR, 例如R0(1027 00 00), 顯然堆棧后第21個(gè)字節(jié)到24字節(jié)即為Returnaddress,該地址0x08001FFD即為異常前PC將要執(zhí)行的下一條指令地址(即StackFlow()后面的語句處RCC->CR &= (uint32_t)0xFFFBFFFF)

另一種方法:
默認(rèn)的HardFault_Handler處理方法不是B .這樣的死循環(huán)么?樓主將它改成BXLR直接返回的形式。然后在這條語句打個(gè)斷點(diǎn),一旦在斷點(diǎn)中停下來,說明出錯(cuò)了,然后再返回,就可以返回到出錯(cuò)的位置的下一條語句那兒
Cortex-M3/4的Fault異常是由于非法的存儲(chǔ)器訪問(比如訪問0地址、寫只讀存儲(chǔ)位置等)和非法的程序行為(比如除以0等)等造成的。常見的4種異常及產(chǎn)生異常的情況如下:
BusFault:在fetch指令、數(shù)據(jù)讀寫、fetch中斷向量或中斷時(shí)存儲(chǔ)恢復(fù)寄存器棧情況下,檢測(cè)到內(nèi)存訪問錯(cuò)誤則產(chǎn)生BusFault。
Memory ManagementFault:訪問了內(nèi)存管理單元(MPU)定義的不合法的內(nèi)存區(qū)域,比如向只讀區(qū)域?qū)懭霐?shù)據(jù)。
UsageFault:檢測(cè)到未定義指令或在存取內(nèi)存時(shí)有未對(duì)齊。還可以通過軟件配置是否檢測(cè)到除0和其它未對(duì)齊內(nèi)存訪問也產(chǎn)生該異常,默認(rèn)關(guān)閉,需要在工程初始化時(shí)配置:
[cpp] viewplaincopyprint?
- SCB->CCR |= 0x18; // enable div-by-0 and unaligned fault
HardFault:在調(diào)試程序過程中,這種異常最常見。上面三種異常發(fā)生任何一種異常都會(huì)引起HardFault,在上面的三種異常未使能的情況下,默認(rèn)發(fā)生異常時(shí)進(jìn)入HardFault中斷服務(wù)程序。使能前三種異常也要在初始化時(shí)配置:
[cpp] viewplaincopyprint?
- SCB->SHCSR |= 0x00007000; // enable Usage Fault, Bus Fault, and MMU Fault
在默認(rèn)復(fù)位初始化時(shí),HardFault使能,其它三者不使能,因此當(dāng)程序中出現(xiàn)不合法內(nèi)存訪問(一般是指針錯(cuò)誤引起)或非法的程序行為(一般就是數(shù)學(xué)里面常見的除0)時(shí)都將產(chǎn)生HardFault中斷。
[url=]2 HardFault調(diào)試方法[/url]假設(shè)IDE環(huán)境為Keil,芯片為STM32F103。
在stm32f10x_it.c中,添加軟件斷點(diǎn),一旦調(diào)試時(shí)出現(xiàn)Hard Fault則會(huì)在停在__breakpoint(0)處。
-
- void HardFault_Handler(void)
- {
-
- if (CoreDebug->DHCSR & 1) { //check C_DEBUGEN == 1 -> Debugger Connected
- __breakpoint(0); // halt program execution here
- }
- while (1)
- {
- }
- }
當(dāng)進(jìn)入HardFault斷點(diǎn)后,菜單欄Peripherals >Core Peripherals >FaultReports打開異常發(fā)生的報(bào)告,查看發(fā)生異常的原因。

上面的報(bào)告發(fā)生了BUS FAULT,并將Fault的中斷服務(wù)轉(zhuǎn)向Hard Fault。
相對(duì)于檢測(cè)發(fā)生了什么異常,定位異常發(fā)生位置顯得更重要。
(1)打開Call Stack窗口(如下圖左側(cè),斷點(diǎn)停在Hard Fault服務(wù)程序中)

(2)在Call Stack的HardFault_Handler上右鍵Show CallerCode(有的Keil版本也可以直接雙擊)

這時(shí)將跳轉(zhuǎn)到發(fā)生異常的源代碼位置(如上圖),異常發(fā)生在p->hour=0這一行。這里錯(cuò)誤很明顯:指針p尚未為成員變量分配內(nèi)存空間,直接訪問未分配的內(nèi)粗空間肯定出錯(cuò)。
再說明2點(diǎn):
[1] 在復(fù)雜的情況下,即使定位了異常發(fā)生位置也很難容易的改正錯(cuò)誤,要學(xué)會(huì)使用Watch窗口對(duì)發(fā)生錯(cuò)誤的指針變量進(jìn)行跟蹤;
[2]在問題不明晰的情況下,嘗試分析反匯編代碼,就自己遇到的,部分情況下的異常發(fā)生在BL等跳轉(zhuǎn)指令處,BL跳轉(zhuǎn)到了不合法的內(nèi)存地址產(chǎn)生異常
Refrences:
[1] Application Note209. Using Cortex-M3 and Cortex-M4 FaultExceptions.
[2] Cortex-M3權(quán)威指南
作者: piaolin 時(shí)間: 2015-10-29 17:21
看到有朋友遇到Hard Fault 異常錯(cuò)誤,特地找到一篇飛思卡爾工程師寫的一片經(jīng)驗(yàn)帖,定位Hard Fault 異常。
Kinetis MCU 采用 Cortex-M4 的內(nèi)核,該內(nèi)核的 Fault 異常可以捕獲非法的內(nèi)存訪問和非法的編程行為。Fault異常能夠檢測(cè)到以下幾類非法行為:· 總線 Fault: 在取址、數(shù)據(jù)讀/寫、取中斷變量、進(jìn)入/退出中斷時(shí)寄存器堆棧操作(入棧/出棧)時(shí)檢測(cè)到內(nèi)存訪問錯(cuò)誤。
· 存儲(chǔ)器管理 Fault: 檢測(cè)到內(nèi)存訪問違反了內(nèi)存保護(hù)單元(MPU, MemoryProtection Unit)定義的區(qū)域。
· 用法 Fault: 檢測(cè)到未定義的指令異常,未對(duì)其的多重加載/存儲(chǔ)內(nèi)存訪問。如果使能相應(yīng)控制位,還可以檢測(cè)出除數(shù)為零以及其他未對(duì)齊的內(nèi)存訪問。
· 硬 Fault: 如果上述的總線 Fault、存儲(chǔ)器管理 Fault、用法 Fault 的處理程序不能被執(zhí)行(例如禁能了總線 Fault、存儲(chǔ)器管理Fault、用法Fault 的異;蛘咴谶@些異常處理程序中又出現(xiàn)了新的Fault)則觸發(fā)硬Fault。
在 MQX 操作系統(tǒng)啟動(dòng)的時(shí)候會(huì)安裝上默認(rèn)的異常中斷處理函數(shù),當(dāng)系統(tǒng)異常時(shí)會(huì)產(chǎn)生一個(gè)“unexpected”中斷,內(nèi)核就會(huì)自動(dòng)調(diào)用異常處理函數(shù),同時(shí)也將運(yùn)行用戶自定義的處理函數(shù),來實(shí)現(xiàn)特殊故障的定位方法。
默認(rèn)情況下,MQX把出現(xiàn)異常的任務(wù)掛起,避免故障進(jìn)一步擴(kuò)大。通過TAD 任務(wù)感知調(diào)試插件的Task summary 功能,我們可以觀察到出現(xiàn)異常的任務(wù)情況。
220231ka89dmda9a9la2ad.png.thumb.jpg (273.83 KB, 下載次數(shù): 207)
下載附件
2015-10-29 17:22 上傳
開發(fā)人員在調(diào)試期間,需要弄清楚系統(tǒng)異常觸發(fā)了哪類Fault,由什么原因觸發(fā)了Fault 以及定位觸發(fā)Fault 的代碼。在這種情況下,可以利用自定義的Fault 中斷處理程序來分析
Fault 出錯(cuò)原因。
為了解釋所述的 Fault 中斷處理程序的原理,這里重述一下當(dāng)系統(tǒng)產(chǎn)生異常時(shí) MCU 的處理過程:
· 有一個(gè)壓棧的過程,若產(chǎn)生異常時(shí)使用 PSP(進(jìn)程棧指針),就壓入到 PSP 中,若產(chǎn)生異常時(shí)使用MSP(主棧指針),就壓入MSP 中。
· 會(huì)根據(jù)處理器的模式和使用的堆棧,設(shè)置 LR 的值(當(dāng)然設(shè)置完的LR 的值再壓棧)。
· 異常保存,硬件自動(dòng)把 8 個(gè)寄存器的值壓入堆棧(8 個(gè)寄存器依次為 xPSR、PC、LR、R12以及 R3~R0)。如果異常發(fā)生時(shí),當(dāng)前的代碼正在使用PSP,則上面8 個(gè)寄存器壓入PSP; 否則就壓入MSP。
當(dāng)系統(tǒng)產(chǎn)生異常時(shí),我們需要兩個(gè)關(guān)鍵寄存器值,一個(gè)是 PC ,一個(gè)是 LR (鏈接寄存器),通過 LR找到相應(yīng)的堆棧,再通過堆棧找到觸發(fā)異常的PC 值。將產(chǎn)生異常時(shí)壓入棧的 PC 值取出,并與反匯編的代碼對(duì)比就能得到哪條指令產(chǎn)生了異常。
這里解釋一下關(guān)于 LR 寄存器的工作原理。如上所述,當(dāng) Cortex-M4 處理器接受了一個(gè)異常后,寄存器組中的一些寄存器值會(huì)被自動(dòng)壓入當(dāng)前?臻g里,這其中就包括鏈接寄存器(LR )。這時(shí)的 LR 會(huì)被更新為異常返回時(shí)需要使用的特殊值(EXC_RETURN)。關(guān)于
EXC_RETURN 的定義如下,其為 32 位數(shù)值,高 28 位置 1,第 0 位到第三位則提供了異常返回機(jī)制所需的信息,如下表所示?梢娖渲械 2 位標(biāo)示著進(jìn)入異常前使用的棧是 MSP還是PSP。在異常處理過程結(jié)束時(shí),MCU 需要根據(jù)該值來分配 SP 的值。這也是本方法中用來判斷所使用堆棧的原理,其實(shí)現(xiàn)方法可以從后面_init_hardfault_isr 中看到。
220232v9gw5v22awlaabza.jpg.thumb.jpg (14.05 KB, 下載次數(shù): 203)
下載附件
2015-10-29 17:22 上傳
另外,我們可以利用 MQX 的控制臺(tái)串口輸出Fault 異常信息來幫助調(diào)試。編寫Fault 處理程序時(shí),將啟動(dòng)代碼中默認(rèn)的Fault 處理程序跟換成自己需要的Fault 處理程序。需要注意的是,由于是在中斷中進(jìn)行打印輸出,MQX的控制臺(tái)串口只能使用POLL 輪詢模式的驅(qū)動(dòng),不能使用中斷模式的驅(qū)動(dòng)。
用戶可以編寫自定義的硬 Fault 處理程序_int_hardfault_isr,修改 MQX 的中斷向量定義vector.c,把里面的DEFAULT_VECTOR 代碼段換成下面的代碼。當(dāng)系統(tǒng)出現(xiàn)硬Fault 異常時(shí),將會(huì)調(diào)用自定義的Fault 處理_int_hardfault_isr函數(shù)。在這個(gè)函數(shù),我們可以通過StackTrace-back 回溯出現(xiàn)問題的代碼。
220232ixlrzbjt8fhlllxy.png.thumb.jpg (230.03 KB, 下載次數(shù): 187)
下載附件
2015-10-29 17:22 上傳
我們可以在_int_hardfault_isr 函數(shù)里將出現(xiàn)異常時(shí)的寄存器、堆棧、狀態(tài)寄存器等信息打印出來。如果系統(tǒng)出現(xiàn)異常時(shí),一般情況都會(huì)通過串口控制臺(tái)打印出LR,PC的值。然后根據(jù)編譯器生成的map 文件,找到出現(xiàn)問題的具體函數(shù)。
220233nz2l2eiixxelvbcb.png.thumb.jpg (168.56 KB, 下載次數(shù): 211)
下載附件
2015-10-29 17:22 上傳
從上圖的串口輸出我們可以看到 PC 和 LR 寄存器值,PC 的值為 0x56c6,我們根據(jù)匯編代碼可以找到出現(xiàn)問題的指令。從而大大縮小了查找出現(xiàn)問題的范圍,可以幫助開發(fā)人員快速定位問題的根本原因。
附錄Fault異常中斷處理代碼:
- // hard fault handler in C,
- // with stack frame location as input parameter
- void hard_fault_handler_c (unsigned int * hardfault_args)
- {
- unsigned int stacked_r0;
- unsigned int stacked_r1;
- unsigned int stacked_r2;
- unsigned int stacked_r3;
- unsigned int stacked_r12;
- unsigned int stacked_lr;
- unsigned int stacked_pc;
- unsigned int stacked_psr;
- stacked_r0 = ((unsigned long)hardfault_args[0]);
- stacked_r1 = ((unsigned long)hardfault_args[1]);
- stacked_r2 = ((unsigned long)hardfault_args[2]);
- stacked_r3 = ((unsigned long)hardfault_args[3]);
- stacked_r12 = ((unsigned long)hardfault_args[4]);
- stacked_lr = ((unsigned long)hardfault_args[5]);
- stacked_pc = ((unsigned long)hardfault_args[6]);
- stacked_psr = ((unsigned long) hardfault_args[7]);
- printf ("\n\n[Hard faulthandler - all numbers in hex]\n");
- printf ("R0 = %x\n",stacked_r0);
- printf ("R1 = %x\n",stacked_r1);
- printf ("R2 = %x\n",stacked_r2);
- printf ("R3 = %x\n",stacked_r3);
- printf ("R12 = %x\n",stacked_r12);
- printf ("LR [R14] = %x subroutine call return address\n",stacked_lr);
- printf ("PC [R15] = %x program counter\n", stacked_pc);
- printf ("PSR = %x\n",stacked_psr);
- /******************* Add yourdebug trace here ***********************/
- _int_kernel_isr();
- }
- /* hard fault interrupt handler */
- void _int_hardfault_isr( )
- {
- __asm("TST LR, #4");
- __asm("ITE EQ");
- __asm("MRSEQ R0,MSP");
- __asm("MRSNE R0,PSP");
- __asm("Bhard_fault_handler_c");
- }
復(fù)制代碼
-
-
fault_isr.c.zip
2015-10-29 17:24 上傳
點(diǎn)擊文件名下載附件
下載積分: 黑幣 -5
1.42 KB, 下載次數(shù): 51, 下載積分: 黑幣 -5
-
-
vectors.c.zip
2015-10-29 17:24 上傳
點(diǎn)擊文件名下載附件
下載積分: 黑幣 -5
3.43 KB, 下載次數(shù): 41, 下載積分: 黑幣 -5
-
-
如何定位Kinetis MCU Hard Fault異常.pdf
2015-10-29 17:24 上傳
點(diǎn)擊文件名下載附件
下載積分: 黑幣 -5
362.58 KB, 下載次數(shù): 101, 下載積分: 黑幣 -5
作者: kailinux 時(shí)間: 2016-7-13 21:51
正在調(diào)試STM32F205,OS操作系統(tǒng)調(diào)度USB功能,樓主的方法正中,非常感謝!
作者: DZKJXHxcz 時(shí)間: 2016-8-3 16:57
謝謝樓主分享
作者: ycsjtzam 時(shí)間: 2017-2-3 12:18
我剛好需要,謝謝!
作者: lanfe 時(shí)間: 2017-2-24 14:15
謝謝樓主,正需要
作者: fgq411421 時(shí)間: 2017-4-20 09:19
非常好,正好遇到同樣的問題
作者: wendell.li 時(shí)間: 2017-7-24 00:12
需要,感謝 !。。。。。。!
作者: wendell.li 時(shí)間: 2017-7-24 10:39
測(cè)試 ,需要下載
作者: insect2006 時(shí)間: 2017-11-17 15:02
謝謝樓主分享
作者: crystaldoor 時(shí)間: 2018-12-25 10:31
謝謝樓主分享
作者: 培風(fēng) 時(shí)間: 2019-5-31 14:37
感謝分享 很有用
作者: chenc 時(shí)間: 2019-8-24 10:16
如果運(yùn)行幾個(gè)小時(shí)后才出現(xiàn)硬件錯(cuò)誤,而且查看代碼定位到HAL_SPI_TransmitReceive應(yīng)該查什么
作者: cliang223 時(shí)間: 2020-12-20 17:29
感謝分享 很有用
作者: pfg20999 時(shí)間: 2023-7-4 17:15
謝謝樓主,正需要
歡迎光臨 (http://www.torrancerestoration.com/bbs/) |
Powered by Discuz! X3.1 |