標(biāo)題:
教你如何從C/C++編程生成執(zhí)行文件
[打印本頁]
作者:
edu118gct
時(shí)間:
2014-12-11 10:53
標(biāo)題:
教你如何從C/C++編程生成執(zhí)行文件
篇二
C/C++程序編譯步驟詳解
C/C++程序編譯步驟詳解
C/C++語言很多人都比較熟悉,這基本上是每位大學(xué)生必學(xué)的一門編程語言,通常還都是作為程序設(shè)計(jì)入門語言學(xué)的,并且課程大多安排在大一。剛上大學(xué),孩子們還都很乖,學(xué)習(xí)也比較認(rèn)真,用心。所以,C/C++語言掌握地也都不錯(cuò),不用說編譯程序,就是寫個(gè)上幾百行的程序都不在話下,但是他們真的知道C/C++程序編譯的步驟么?
我想很多人都不甚清楚,如果他接下來學(xué)過“編譯原理”,也許能說個(gè)大概。VC的“舒適”開發(fā)環(huán)境屏蔽了很多編譯的細(xì)節(jié),這無疑降低了初學(xué)者的入門門檻,但是也“剝奪”了他們“知其所以然”的權(quán)利,致使很多東西只能死記硬背,遇到相關(guān)問題就“丈二”。實(shí)際上,我也是在學(xué)習(xí)Linux環(huán)境下編程的過程中才逐漸弄清楚C/C++源代碼是如何一步步變成可執(zhí)行文件的。
總體來說,C/C++源代碼要經(jīng)過:預(yù)處理、編譯、匯編和連接四步才能變成相應(yīng)平臺(tái)下的可執(zhí)行文件。大多數(shù)時(shí)候,程序員通過一個(gè)命令就能完成上述四個(gè)步驟。比如下面這段C的“Hello world!”代碼:
File: hw.c
#include stdio.h>
int main(int argc, char *argv[])
{
printf("Hello World!\n");
return 0;
}
如果用gcc編譯,只需要一個(gè)命令就可以生成可執(zhí)行文件hw:
xiaosuo@gentux hw $ gcc -o hw hw.c
xiaosuo@gentux hw $ ./hw Hello World!
我們可以用-v參數(shù)來看看gcc到底在背后都做了些什么動(dòng)作:
Reading specs from /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/specs
Configured with: /var/tmp/portage/sys-devel/gcc-3.4.6-r2/work/gcc-3.4.6/configure --prefix=/usr --bindir=/usr/i686-pc-linux-gnu/gcc-bin/3.4.6 --includedir=/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/include --datadir=/usr/share/gcc-data/i686-pc-linux-gnu/3.4.6 --mandir=/usr/share/gcc-data/i686-pc-linux-gnu/3.4.6/man --infodir=/usr/share/gcc-data/i686-pc-linux-gnu/3.4.6/info --with-gxx-include-dir=/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/include/g++-v3 --host=i686-pc-linux-gnu --build=i686-pc-linux-gnu --disable-altivec --enable-nls --without-included-gettext --with-system-zlib --disable-checking --disable-werror --enable-secureplt --disable-libunwind-exceptions --disable-multilib --disable-libgcj --enable-languages=c,c++,f77 --enable-shared --enable-threads=posix --enable-__cxa_atexit --enable-clocale=gnu
Thread model: posix
gcc version 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.10)
/usr/libexec/gcc/i686-pc-linux-gnu/3.4.6/cc1 -quiet -v hw.c -quiet -dumpbase hw.c -mtune=pentiumpro -auxbase hw -version -o /tmp/ccYB6UwR.s
ignoring nonexistent directory "/usr/local/include"
ignoring nonexistent directory "/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../../i686-pc-linux-gnu/include"
#include "..." search starts here:
#include ...> search starts here:
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/include
/usr/include
End of search list.
GNU C version 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.10) (i686-pc-linux-gnu)
compiled by GNU C version 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.9).
GGC heuristics: --param ggc-min-expand=81 --param ggc-min-heapsize=97004
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../../i686-pc-linux-gnu/bin/as -V -Qy -o /tmp/ccq8uGED.o /tmp/ccYB6UwR.s
GNU assembler version 2.17 (i686-pc-linux-gnu) using BFD version 2.17
/usr/libexec/gcc/i686-pc-linux-gnu/3.4.6/collect2 --eh-frame-hdr -m elf_i386 -dynamic-linker /lib/ld-linux.so.2 -o hw /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crt1.o /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crti.o /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtbegin.o -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6 -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6 -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../../i686-pc-linux-gnu/lib -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../.. /tmp/ccq8uGED.o -lgcc --as-needed -lgcc_s --no-as-needed -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtend.o /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crtn.o
稍微整理一下,去掉一些冗余信息后,如下:
cc1 hw.c -o /tmp/ccYB6UwR.s
as -o /tmp/ccq8uGED.o /tmp/ccYB6UwR.s
ld -o hw /tmp/ccq8uGED.o
以上三個(gè)命令分別對(duì)應(yīng)于編譯步驟中的預(yù)處理+編譯、匯編和連接。預(yù)處理和編譯還是放在了一個(gè)命令(cc1)中進(jìn)行的,可以把它再次拆分為以下兩步:
cpp -o hw.i hw.c
cc1 hw.i -o /tmp/ccYB6UwR.s
一個(gè)精簡(jiǎn)過的能編譯以上hw.c文件的Makefile如下:
.PHONY: clean
all: hw
hw: hw.o
ld -dynamic-linker /lib/ld-linux.so.2 -o hw /usr/lib/crt1.o \
/usr/lib/crti.o \
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtbegin.o \
hw.o -lc \
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtend.o \
/usr/lib/crtn.o
hw.o: hw.s
as -o hw.o hw.s
hw.s: hw.i
/usr/libexec/gcc/i686-pc-linux-gnu/3.4.6/cc1 -o hw.s hw.c
hw.i: hw.c
cpp -o hw.i hw.c
clean:
rm -rf hw.i hw.s hw.o
當(dāng)然,上面Makefile中的一些路徑是我系統(tǒng)上的具體情況,你的可能與我的不同。
接下來我們按照編譯順序看看編譯器每一步都做了什么。
首先是預(yù)處理,預(yù)處理后的文件hw.i:
# 1 "hw.c"
# 1 ""
# 1 ""
...
__extension__ typedef __quad_t __off64_t;
__extension__ typedef int __pid_t;
__extension__ typedef struct { int __val[2]; } __fsid_t;
...
extern int remove (__const char *__filename) __attribute__ ((__nothrow__));
extern int rename (__const char *__old, __const char *__new) __attribute__ ((__nothrow__));
...
int main(int argc, char *argv[])
{
printf("Hello World!\n");
return 0;
}
注:由于文件比較大,所以只留下了少部分具有代表性的內(nèi)容。
可以看見預(yù)處理器把所有要包含(include)的文件(包括遞歸包含的文件)的內(nèi)容都添加到了原始的C源文件中,然后把其輸出到輸出文件,除此之外,它還展開了所有的宏定義,所以在預(yù)處理器的輸出文件中你將找不到任何宏。這也提供了一個(gè)查看宏展開結(jié)果的簡(jiǎn)便方法。
第二步“編譯”,就是把C/C++代碼“翻譯”成匯編代碼:
.file "hw.c"
.section .rodata
.LC0:
.string "Hello World!\n"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $8, %esp
andl $-16, %esp
movl $0, %eax
addl $15, %eax
addl $15, %eax
shrl $4, %eax
sall $4, %eax
subl %eax, %esp
subl $12, %esp
pushl $.LC0
call printf
addl $16, %esp
movl $0, %eax
leave
ret
.size main, .-main
.section .note.GNU-stack,"",@progbits
.ident "GCC: (GNU) 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.10)"
這個(gè)匯編文件比預(yù)處理后的C/C++文件小了很多,去除了很多不必要的東西,比如說沒用到的類型聲明和函數(shù)聲明等。
第三步“匯編”,將第二步輸出的匯編代碼翻譯成符合一定格式的機(jī)器代碼,在Linux上一般表現(xiàn)為ELF目標(biāo)文件。 深圳專業(yè)嵌入式ARM、Linux、單片機(jī)技術(shù)實(shí)訓(xùn)提升,詳情咨詢郭老師,QQ754634522
xiaosuo@gentux hw $ file hw.o
hw.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped
最后一步“連接”,將上步生成的目標(biāo)文件和系統(tǒng)庫的目標(biāo)文件和庫文件連接起來,最終生成了可以在特定平臺(tái)運(yùn)行的可執(zhí)行文件。為什么還要連接系統(tǒng)庫中的某些目標(biāo)文件(crt1.o, crti.o等)呢?這些目標(biāo)文件都是用來初始化或者回收C運(yùn)行時(shí)環(huán)境的,比如說堆內(nèi)存分配上下文環(huán)境的初始化等,實(shí)際上crt也正是C RunTime的縮寫。這也暗示了另外一點(diǎn):程序并不是從main函數(shù)開始執(zhí)行的,而是從crt中的某個(gè)入口開始的,在Linux上此入口是_start。以上Makefile生成的是動(dòng)態(tài)連接的可執(zhí)行文件,如果要生成靜態(tài)連接的可執(zhí)行文件需要將Makefile中的相應(yīng)段修改:
hw: hw.o
ld -m elf_i386 -static -o hw /usr/lib/crt1.o \
/usr/lib/crti.o \
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtbeginT.o \
-L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6 \
-L/usr/i686-pc-linux-gnu/lib \
-L/usr/lib/ \
hw.o --start-group -lgcc -lgcc_eh -lc --end-group \
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtend.o \
/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crtn.o
至此,一個(gè)可執(zhí)行文件才最終創(chuàng)建完成。通常的項(xiàng)目中并不需要把編譯過程分得如此之細(xì),前三步一般是合為一體的,在Makefile中表現(xiàn)如下:
hw.o: hw.c
gcc -o hw.o -c hw.c
實(shí)際上,如果對(duì)hw.c進(jìn)行了什么更改,那么前三步大多數(shù)情況下都是不可避免的。所以把他們寫在一起也并沒有什么壞處,相反倒可以用--pipe參數(shù)告訴編譯器用管道替代臨時(shí)文件,從而提升編譯的效率。深圳專業(yè)嵌入式ARM、Linux、單片機(jī)技術(shù)實(shí)訓(xùn)提升,詳情咨詢郭老師,QQ754634522
歡迎光臨 (http://www.torrancerestoration.com/bbs/)
Powered by Discuz! X3.1