專注電子技術學習與研究
當前位置:單片機教程網(wǎng) >> MCU設計實例 >> 瀏覽文章

FAT文件系統(tǒng)原理

作者:佚名   來源:本站原創(chuàng)   點擊數(shù):  更新時間:2014年08月18日   【字體:

   主板BIOS程序運行,完成一系列的檢測和配置后,將執(zhí)行權力交予硬盤,跳到硬盤的第一個(主引導512字節(jié))扇區(qū)上執(zhí)行MBR,其中MBR的后64個字節(jié)為DPT(硬盤分區(qū)表,這里最多4個分區(qū),以55 AA結束),DPT上表明了分區(qū)是否為活動分區(qū)、分區(qū)的起始/結束磁頭、起始/結束柱面、起始/結束扇區(qū)等信息,(從這里看出硬盤內(nèi)部就是以扇區(qū)為單元管理磁盤),接下來CPU找到活動分區(qū),跳到活動分區(qū)去引導系統(tǒng)。

   我們已經(jīng)了解了MBR,就可以知道磁盤的分區(qū)等信息,那么我們接下來再看看具體的分區(qū)中的結構;通過DPT找到一個分區(qū),MBR將跳到活動分區(qū),將執(zhí)行權交給該分區(qū)的引導扇區(qū)(DBR,相當扇區(qū)編號為0),
每個分區(qū)的結構都是一樣的,最開始的是引導扇區(qū),然后是數(shù)據(jù)。
   DBR區(qū)(DOS BOOT RECORD)即操作系統(tǒng)引導記錄區(qū)的意思,通常占用分區(qū)的第0扇區(qū)共512個字節(jié)(特殊情況也要占用其它保留扇區(qū),我們先說第0扇)。在這512個字節(jié)中,第一部分是跳轉(zhuǎn)指令,接下來是廠商標志和操作系統(tǒng)版本號,BPB(BIOS Parameter Block),擴展BPB,os引導程序,結束標志幾部分組成。
   MBR將CPU執(zhí)行轉(zhuǎn)移給引導扇區(qū),因此,引導扇區(qū)的前三個字節(jié)必須是合法的可執(zhí)行的基于x86的CPU指令。這通常是一條跳轉(zhuǎn)指令,該指令負責跳過接下來的幾個不可執(zhí)行的字節(jié)(BPB和擴展BPB),跳到操作系統(tǒng)引導代碼部分。
   BPB(相對偏移字節(jié)0X0B),它包含了磁盤容量和幾何結構變量等信息:硬件扇區(qū)大。ㄗ止(jié)數(shù))、每鏃扇區(qū)數(shù)、文件系統(tǒng)版本等信息。
   擴展BPB也包含與文件系統(tǒng)等的相關各種信息。
   不論是硬盤還是各種flash,存儲設備要通過文件系統(tǒng)管理存儲,存儲設備的粗線條存儲規(guī)劃都是這樣的,使用不同的文件系統(tǒng)或不同的分區(qū),也就是相關的描述信息不一樣,數(shù)據(jù)區(qū)的存儲格式不一樣,但是粗線條的存儲規(guī)劃是一致的(如MBR,DBR,數(shù)據(jù)區(qū),只是其中包含的信息不一樣)。
   擴展分區(qū)可以被分區(qū)多個邏輯分區(qū)(邏輯驅(qū)動器),每個邏輯分區(qū)的結構是與主分區(qū)結構類似,但有區(qū)別,每個邏輯驅(qū)動器包含擴展引導記錄(擴展分區(qū)表與結束符)、引導扇區(qū)、數(shù)據(jù)區(qū)。
   邏輯驅(qū)動器的擴展引導記錄的第一項指向本驅(qū)動器的“引導扇區(qū)+數(shù)據(jù)區(qū)”,第二項指向下一個邏輯驅(qū)動器的擴展引導記錄;然而每個引導扇區(qū)與主分區(qū)的引導扇區(qū)類似也有區(qū)別,具體在看文檔。
   FAT16DBR之后沒有留有任何保留扇區(qū),其后緊隨的便是FAT表。FAT表是FAT16用來記錄磁盤數(shù)據(jù)區(qū)簇鏈結構的,FAT表以"F8 FF FF FF" 開頭,FAT表記錄了磁盤數(shù)據(jù)文件的存儲鏈表,對于數(shù)據(jù)的讀取而言是極其重要的,以至于Microsoft為其開發(fā)的FAT文件系統(tǒng)中的FAT表創(chuàng)建了一份備份,就是我們看到的FAT2。


1:硬盤的物理結構

   硬盤存儲數(shù)據(jù)是根據(jù)電、磁轉(zhuǎn)換原理實現(xiàn)的。硬盤由一個或幾個表面鍍有磁性物質(zhì)的金屬或玻璃等物質(zhì)盤片以及盤片兩面所安裝的磁頭和相應的控制電路組成(1),其中盤片和磁頭密封在無塵的金屬殼中。
    硬盤工作時,盤片以設計轉(zhuǎn)速高速旋轉(zhuǎn),設置在盤片表面的磁頭則在電路控制下徑向移動到指定位置然后將數(shù)據(jù)存儲或讀取出來。當系統(tǒng)向硬盤寫入數(shù)據(jù)時,磁頭中寫數(shù)據(jù)電流產(chǎn)生磁場使盤片表面磁性物質(zhì)狀態(tài)發(fā)生改變,并在寫電流磁場消失后仍能保持,這樣數(shù)據(jù)就存儲下來了;當系統(tǒng)從硬盤中讀數(shù)據(jù)時,磁頭經(jīng)過盤片指定區(qū)域,盤片表面磁場使磁頭產(chǎn)生感應電流或線圈阻抗產(chǎn)生變化,經(jīng)相關電路處理后還原成數(shù)據(jù)。因此只要能將盤片表面處理得更平滑、磁頭設計得更精密以及盡量提高盤片旋轉(zhuǎn)速度,就能造出容量更大、讀寫數(shù)據(jù)速度更快的硬盤。這是因為盤片表面處理越平、轉(zhuǎn)速越快就能越使磁頭離盤片表面越近,提高讀、寫靈敏度和速度;磁頭設計越小越精密就能使磁頭在盤片上占用空間越小,使磁頭在一張盤片上建立更多的磁道以存儲更多的數(shù)據(jù)。   
2:硬盤的邏輯結構

    硬盤由很多盤片(platter)組成,每個盤片的每個面都有一個讀寫磁頭。如果有N個盤片。就有2N個面,對應2N個磁頭(Heads),從0、1、2開始編號。每個盤片被劃分成若干個同心圓磁道(邏輯上的,是不可見的。)每個盤片的劃分規(guī)則通常是一樣的。這樣每個盤片的半徑均為固定值R的同心圓再邏輯上形成了一個以電機主軸為軸的柱面(Cylinders),從外至里編號為012……每個盤片上的每個磁道又被劃分為幾十個扇區(qū)(Sector),通常的容量是512byte,并按照一定規(guī)則編號為1、2、3……形成Cylinders×Heads×Sector個扇區(qū)。這三個參數(shù)即是硬盤的物理參數(shù)。我們下面的很多實踐需要深刻理解這三個參數(shù)的意義。


3:磁盤引導原理
MBR(master boot record)扇區(qū)  
   計算機在按下power鍵以后,開始執(zhí)行主板bios程序。進行完一系列檢測和配置以后。開始按bios中設定的系統(tǒng)引導順序引導系統(tǒng)。假定現(xiàn)在是硬盤。Bios執(zhí)行完自己的程序后如何把執(zhí)行權交給硬盤呢。交給硬盤后又執(zhí)行存儲在哪里的程序呢。其實,稱為mbr的一段代碼起著舉足輕重的作用。MBR(master boot record),即主引導記錄,有時也稱主引導扇區(qū)。位于整個硬盤的0柱面0磁頭1扇區(qū)(可以看作是硬盤的第一個扇區(qū))bios在執(zhí)行自己固有的程序以后就會jumpmbr中的第一條指令。將系統(tǒng)的控制權交由mbr來執(zhí)行。在總共512byte的主引導記錄中,MBR的引導程序占了其中的前446個字節(jié)(偏移0H~偏移1BDH),隨后的64個字節(jié)(偏移1BEH~偏移1FDH)DPT(Disk PartitionTable,硬盤分區(qū)表),最后的兩個字節(jié)“55 AA”(偏移1FEH~偏移1FFH)是分區(qū)有效結束標志。

    MBR不隨操作系統(tǒng)的不同而不同,意即不同的操作系統(tǒng)可能會存在相同的MBR,即使不同,MBR也不會夾帶操作系統(tǒng)的性質(zhì)。具有公共引導的特性。我們來分析一段mbr。下面是用winhex查看的一塊希捷120GB硬盤的mbr。

    我們看DPT部分。操作系統(tǒng)為了便于用戶對磁盤的管理。加入了磁盤分區(qū)的概念。即將一塊磁盤邏輯劃分為幾塊。磁盤分區(qū)數(shù)目的多少 只受限于CZ的英文字母的數(shù)目;
    在上圖DPT的64個字節(jié)中,如何表示多個分區(qū)的屬性呢? microsoft通過鏈接的方法【見下圖】解決了這個問題。在DPT64個字節(jié)中,以16個字節(jié)為分區(qū)表項單位描述一個分區(qū)的屬性。也就是說,第一個分區(qū)表項描述一個分區(qū)的屬性,一般為基本分區(qū)。第二個分區(qū)表項描述除基本分區(qū)外的其余空間,一般而言,就是我們所說的擴展分區(qū)。這部分的大體說明見表1【也就是64個字節(jié),每16個字節(jié)用來描述一個分區(qū),所以64個字節(jié)做多描述4個分區(qū),所以硬盤格式化分區(qū)的時候,主分區(qū)+擴展分區(qū)最多就4個:3+1,1+1,4+0,擴展分區(qū)可以用來劃分邏輯分區(qū)】,下圖就是一個16字節(jié)的分區(qū)描述字段。

說明: 每個分區(qū)表項占用16個字節(jié),假定偏移地址從0開始。如圖3的分區(qū)表項3。分區(qū)表項4同分區(qū)表項3
    1
、0H偏移為活動分區(qū)是否標志,只能選00H80H80H為活動,00H為非活動。其余值對microsoft而言為非法值。
    2
、重新說明一下(這個非常重要):大于1個字節(jié)的數(shù)被以低字節(jié)在前的存儲格式格式(little endian format)或稱反字節(jié)順序保存下來。低字節(jié)在前的格式是一種保存數(shù)的方法,這樣,最低位的字節(jié)最先出現(xiàn)在十六進制數(shù)符號中。例如,相對扇區(qū)數(shù)字段的值0x3F000000的低字節(jié)在前表示為0x0000003F。這個低字節(jié)在前的格式數(shù)的十進制數(shù)為63。
    3
、系統(tǒng)在分區(qū)時,各分區(qū)都不允許跨柱面,即均以柱面為單位,這就是通常所說的分區(qū)粒度。有時候我們分區(qū)是輸入分區(qū)的大小為7000M,分出來卻是6997M,就是這個原因。 偏移2H和偏移6H的扇區(qū)和柱面參數(shù)中,扇區(qū)占6(bit),柱面占10(bit),以偏移6H為例,其低6位用作扇區(qū)數(shù)的二進制表示。其高兩位做柱面數(shù)10位中的高兩位,偏移7H組成的8位做柱面數(shù)10位中的低8位。由此可知,實際上用這種方式表示的分區(qū)容量是有限的,柱面和磁頭從0開始編號,扇區(qū)從1開始編號,所以最多只能表示1024個柱面×63個扇區(qū)×256個磁頭×512byte=8455716864byte。即通常的8.4GB(實際上應該是7.8GB左右)限制。實際上磁頭數(shù)通常只用到255(由匯編語言的尋址寄存器決定),即使把這3個字節(jié)按線性尋址,依然力不從心。 在后來的操作系統(tǒng)中,超過8.4GB的分區(qū)其實已經(jīng)不通過C/H/S的方式尋址了。而是通過偏移CH~偏移FH4個字節(jié)32位線性扇區(qū)地址來表示分區(qū)所占用的扇區(qū)總數(shù)?芍ㄟ^4個字節(jié)可以表示2^32個扇區(qū),即2TB=2048GB,目前對于大多數(shù)計算機而言,這已經(jīng)是個天文數(shù)字了。在未超過8.4GB的分區(qū)上,C/H/S的表示方法和線性扇區(qū)的表示方法所表示的分區(qū)大小是一致的。也就是說,兩種表示方法是協(xié)調(diào)的。即使不協(xié)調(diào),也以線性尋址為準。(可能在某些系統(tǒng)中會提示出錯)。超過8.4GB的分區(qū)結束C/H/S一般填充為FEH FFH FFH。即C/H/S所能表示的最大值。有時候也會用柱面對1024的模來填充。不過這幾個字節(jié)是什么其實都無關緊要了。
   
雖然現(xiàn)在的系統(tǒng)均采用線性尋址的方式來處理分區(qū)的大小。但不可跨柱面的原則依然沒變。本分區(qū)的扇區(qū)總數(shù)加上與前一分區(qū)之間的保留扇區(qū)數(shù)目依然必須是柱面容量的整數(shù)倍。(保留扇區(qū)中的第一個扇區(qū)就是存放分區(qū)表的MBR或虛擬MBR的扇區(qū),分區(qū)的扇區(qū)總數(shù)在線性表示方式上是不計入保留扇區(qū)的。如果是第一個分區(qū),保留扇區(qū)是本分區(qū)前的所有扇區(qū)。
  

擴展分區(qū)

    擴展分區(qū)中的每個邏輯驅(qū)動器都存在一個類似于MBR的擴展引導記錄( Extended Boot Record, EBR),也有人稱之為虛擬mbr或擴展mbr,意思是一樣的。擴展引導記錄包括一個擴展分區(qū)表和該扇區(qū)的標簽。擴展引導記錄將記錄只包含擴展分區(qū)中每個邏輯驅(qū)動器的第一個柱面的第一面的信息。一個邏輯驅(qū)動器中的引導扇區(qū)一般位于相對扇區(qū)3263。但是,如果磁盤上沒有擴展分區(qū),那么就不會有擴展引導記錄和邏輯驅(qū)動器。第一個邏輯驅(qū)動器的擴展分區(qū)表中的第一項指向它自身的引導扇區(qū)。第二項指向下一個邏輯驅(qū)動器的EBR。如果不存在進一步的邏輯驅(qū)動器,第二項就不會使用,而且被記錄成一系列零。如果有附加的邏輯驅(qū)動器,那么第二個邏輯驅(qū)動器的擴展分區(qū)表的第一項會指向它本身的引導扇區(qū)。第二個邏輯驅(qū)動器的擴展分區(qū)表的第二項指向下一個邏輯驅(qū)動器的EBR。擴展分區(qū)表的第三項和第四項永遠都不會被使用。

    除了擴展分區(qū)上最后一個邏輯驅(qū)動器外,表2中所描述的擴展分區(qū)表的格式在每個邏輯驅(qū)動器中都是重復的:第一個項標識了邏輯驅(qū)動器本身的引導扇區(qū),第二個項標識了下一個邏輯驅(qū)動器的EBR。最后一個邏輯驅(qū)動器的擴展分區(qū)表只會列出它本身的分區(qū)項。最后一個擴展分區(qū)表的第二個項到第四個項被使用。 
    擴展分區(qū)表項中的相對扇區(qū)數(shù)字段所顯示的是從擴展分區(qū)開始到邏輯驅(qū)動器中第一個扇區(qū)的位移的字節(jié)數(shù)?偵葏^(qū)數(shù)字段中的數(shù)是指組成該邏輯驅(qū)動器的扇區(qū)數(shù)目。總扇區(qū)數(shù)字段的值等于從擴展分區(qū)表項所定義的引導扇區(qū)到邏輯驅(qū)動器末尾的扇區(qū)數(shù)。
    有時候在磁盤的末尾會有剩余空間,剩余空間是什么呢?我們前面說到,分區(qū)是以1柱面的容量為分區(qū)粒度的,那么如果磁盤總空間不是整數(shù)個柱面的話,不夠一個柱面的剩下的空間就是剩余空間了,這部分空間并不參與分區(qū),所以一般無法利用。照道理說,磁盤的物理模式?jīng)Q定了磁盤的總?cè)萘烤蛻撌钦麛?shù)個柱面的容量,為什么會有不夠一個柱面的空間呢。在我的理解看來,本來現(xiàn)在的磁盤為了更大的利用空間,一般在物理上并不是按照外圍的扇區(qū)大于里圈的扇區(qū)這種管理方式,只是為了與操作系統(tǒng)兼容而抽象出來CHS?赡芷鋵嶋H空間容量不一定正好為整數(shù)個柱面的容量吧。

FAT分區(qū)原理

    現(xiàn)在我們著重研究FAT格式分區(qū)內(nèi)數(shù)據(jù)是如何存儲的。FAT分區(qū)格式是MICROSOFT最早支持的分區(qū)格式,依據(jù)FAT表中每個簇鏈的所占位數(shù)(有關概念,后面會講到)分為fat12fat16、fat32三種格式"變種",但其基本存儲方式是相似的。
   
仔細研究圖7中的fat16fat32分區(qū)的組成結構。下面依次解釋DBRFAT1、FAT2、根目錄、數(shù)據(jù)區(qū)、剩余扇區(qū)的概念。提到的地址如無特別提示均為分區(qū)內(nèi)部偏移。

DBR
   DBR區(qū)(DOS BOOT RECORD)即操作系統(tǒng)引導記錄區(qū)的意思,通常占用分區(qū)的第0扇區(qū)共512個字節(jié)(特殊情況也要占用其它保留扇區(qū),我們先說第0)。在這512個字節(jié)中,其實又是由跳轉(zhuǎn)指令,廠商標志和操作系統(tǒng)版本號,BPB(BIOS Parameter Block),擴展BPB,os引導程序,結束標志幾部分組成。 以用的最多的FAT32為例說明分區(qū)DBR各字節(jié)的含義。見圖8

    MBRCPU執(zhí)行轉(zhuǎn)移給引導扇區(qū),因此,引導扇區(qū)的前三個字節(jié)必須是合法的可執(zhí)行的基于x86CPU指令。這通常是一條跳轉(zhuǎn)指令,該指令負責跳過接下來的幾個不可執(zhí)行的字節(jié)(BPB和擴展BPB),跳到操作系統(tǒng)引導代碼部分。
   
跳轉(zhuǎn)指令之后是8字節(jié)長的OEM ID,它是一個字符串, OEM ID標識了格式化該分區(qū)的操作系統(tǒng)的名稱和版本號。為了保留與MS-DOS的兼容性,通常Windows 2000格式化該盤是在FAT16FAT32磁盤上的該字段中記錄了“MSDOS 5.0”,在NTFS磁盤上(關于ntfs,另述),Windows 2000記錄的是“NTFS”。通常在被Windows 95格式化的磁盤上OEM ID字段出現(xiàn)“MSWIN4.0”,在被Windows 95 OSR2Windows 98格式化的磁盤上OEM ID字段出現(xiàn)“MSWIN4.1”。
   
接下來的從偏移0x0B開始的是一段描述能夠使可執(zhí)行引導代碼找到相關參數(shù)的信息。通常稱之為BPB(BIOS Parameter Block)BPB一般開始于相同的位移量,因此,標準的參數(shù)都處于一個已知的位置。磁盤容量和幾何結構變量都被封在BPB之中。由于引導扇區(qū)的第一部分是一個x86跳轉(zhuǎn)指令。因此,將來通過在BPB末端附加新的信息,可以對BPB進行擴展。只需要對該跳轉(zhuǎn)指令作一個小的調(diào)整就可以適應BPB的變化。圖9已經(jīng)列出了項目的名稱和取值,為了系統(tǒng)的研究,針對圖8,將FAT32分區(qū)格式的BPB含義和擴展BPB含義釋義為表格,見表4和表5。


FAT表和數(shù)據(jù)的存儲原則
    FAT(File Allocation Table 文件分配表),是MicrosoftFAT文件系統(tǒng)中用于磁盤數(shù)據(jù)(文件)索引和定位引進的一種鏈式結構。假如把磁盤比作一本書,FAT表可以認為相當于書中的目錄,而文件就是各個章節(jié)的內(nèi)容。但FAT表的表示方法卻與目錄有很大的不同。
   
FAT文件系統(tǒng)中,文件的存儲依照FAT表制定的簇鏈式數(shù)據(jù)結構來進行。同時,FAT文件系統(tǒng)將組織數(shù)據(jù)時使用的目錄也抽象為文件,以簡化對數(shù)據(jù)的管理。
關閉窗口