|
進(jìn)入2010年代以來,不管富有還是貧窮,生活在地球上的人類,幾乎每個人每天都在應(yīng)用處理器,與處理器對話:手機(jī),電腦,平板,無線網(wǎng)絡(luò),家用電器,汽車,甚至有的開關(guān)插座,照明器具都具有處理器?芍^處理器無所不在,影響和左右著人類文明的生活習(xí)性,并不斷改變?nèi)祟惖纳盍?xí)慣。
令人驚訝的是,處理器生態(tài)竟然和人類生態(tài)一樣,有著完全相同的對稱關(guān)系:人類世界并不完美,既存在不好的一面,也具有互助,彩虹般的多彩多姿,陽光笑面的一面;完美得十全十美的人和丑陋無比的人,都會絕子絕孫,只有中庸的人,才能長遠(yuǎn)源傳。同樣,在處理器生態(tài)中,缺陷嚴(yán)重,并不完美的處理器架構(gòu)統(tǒng)治著處理器生態(tài)圈;漂亮,更具完美的處理器架構(gòu)身陷囹圄,甚至死亡。下面讓我們來看看處理器生態(tài)的殊死搏斗與互助吧……
1946年2月,世界上第一臺計(jì)算機(jī)在美國賓夕法尼亞大學(xué)誕生,這是一臺需要上千萬美刀的計(jì)算機(jī),然而,它的爬行速度卻只有5000DMIPS。對于我們這些生活在2010年代的人來說,它比烏龜還要爬的慢啊。但它既是電子管老虎,也是電老虎:大約每15分鐘報(bào)廢一個電子管,更是幾百千瓦的耗電量。然而,它卻整整爬行了9年之多。不過那時還沒有處理器,所有的計(jì)算機(jī)都是通過電子管,后來是晶體管搭建的。
1971年11月15日,Intel在為計(jì)算機(jī)廠家提供芯片開發(fā)的過程中,在Federico Faggin的主持下,開發(fā)了采用4位并行二進(jìn)制數(shù)據(jù)的可編程IC芯片,命名為4004. 4004芯片基本具備了微處理器的特點(diǎn),用它來做計(jì)算器,改變了傳統(tǒng)計(jì)算器的形象。采用4004芯片后,再配用一塊程序存儲器,數(shù)據(jù)存儲器,移位寄存器,再加上鍵盤和數(shù)碼管,就構(gòu)成了一臺完整的微型計(jì)算機(jī)。但是4004并不能成為處理器,因?yàn)樗且粋嚴(yán)重缺陷的怪胎---可以編程,但不具備指令集和處理器框架(即架構(gòu))。不過它卻賣得風(fēng)生水起---幾乎所有的計(jì)算器都應(yīng)用了它。
1974年,F(xiàn)ederico Faggin離開英特爾公司,自立門戶,搞起了8位的ZiLog微處理器。
雖然Federico Faggin離開了,不過Intel卻從一家德州的Datapoint公司購得更先進(jìn)的可編程器件,它是一個具有指令集的可編程器件-8008.這就是Intel的X86架構(gòu)微處理器的指令集的最初原型。從此人類進(jìn)入了具有標(biāo)準(zhǔn)指令集架構(gòu)的處理器時代。也同時開創(chuàng)了處理器互相殘殺與互相幫助的局面,延續(xù)到現(xiàn)在,以及未來。
早期IC技術(shù)并不發(fā)達(dá),處理器速度和內(nèi)存速度沒有任何差別。此時,采用復(fù)雜指令集(CISC)計(jì)算機(jī)架構(gòu)具有相當(dāng)?shù)膬?yōu)勢,一條指令可以實(shí)現(xiàn)在存儲器內(nèi)的多種操作。于是乎,連摩托羅拉公司的處理器,也是CISC處理器。但是,隨著IC技術(shù)的發(fā)展,邏輯式IC的速度越來越快,而基于多晶體管的觸發(fā)器和基于電容的存儲器的速度改進(jìn)發(fā)展緩慢。導(dǎo)致了處理器與存儲器之間存在越來越嚴(yán)重的gap。
在美國stanford大學(xué)內(nèi),有人提出了新的處理器架構(gòu):精簡指令集(RISC),同時也很多公司開始研制新的處理器。包括DEC,IBM,惠普等。其中要算stanford大學(xué)的MIPS處理器架構(gòu)最為經(jīng)典,其經(jīng)典性到現(xiàn)在處理器技術(shù)飛速發(fā)展的今天依然毫不孫色,實(shí)現(xiàn)了在相當(dāng)小的Die面積下,小的功耗,實(shí)現(xiàn)了與其他很多處理器相當(dāng)?shù)奶幚砟芰。其次是IBM聯(lián)盟的Power/PowerPC處理器架構(gòu),實(shí)現(xiàn)了最早具有自解壓指令功能,實(shí)現(xiàn)指令密度壓縮到60%,性能損耗只有5%的效果。
ARM,這一自稱RISC指令集的處理器,并不算是一個好架構(gòu)。ARM原本想使用摩托羅拉的M68K處理器設(shè)計(jì)其計(jì)算機(jī)產(chǎn)品,但是被摩托羅拉公司拒絕,最后決定抄M68K處理器。由于版權(quán)、技術(shù)能力,最后只抄了M68K簡單的指令部分,并在后來不停的增加指令,構(gòu)成了后來的ARM處理器架構(gòu)。
然而,在這幾十年的處理器競爭下,過上好日子的,卻是黑寡婦Intel X86和年少輕狂的ARM這兩個相對其他處理器架構(gòu)來說相當(dāng)中庸的處理器架構(gòu),其它處理器都在生存與死亡之間掙扎。同時不論是最早提出最具RISC特性的MIPS,還是后來的PowerPC、ARM等處理器架構(gòu)都走向相當(dāng)復(fù)雜的具有互鎖特性的Multi-Issue的處理器實(shí)現(xiàn)上;那邊廂,復(fù)雜指令集的X86處理器實(shí)現(xiàn),則走向了通過不可見Cache翻譯復(fù)雜指令集為精簡指令集后與精簡指令集具有完全相同行為的精簡指令集化實(shí)現(xiàn)中來。大家都輔于perspective,Out of order, Superscalar(Multi-issue)等復(fù)雜特性應(yīng)用到內(nèi)核中。隨著IC技術(shù)的進(jìn)展緩慢和處理器性能要求越來越高的矛盾,處理器頻率的提升,導(dǎo)致了IC加速產(chǎn)生大量的熱量,溫升嚴(yán)重;另一個嚴(yán)重問題則是處理器頻率與內(nèi)存頻率的巨大差距(gap),數(shù)據(jù)從處理器寄存器到內(nèi)存需要經(jīng)過幾百個時鐘周期才能達(dá)到,提升處理器的速度變得越來越不現(xiàn)實(shí),于是多核就成了處理器性能提升與技術(shù)發(fā)展不匹配的折中方案了。
提到ARM,不得不提到Marvel和DEC,DEC通過購買ARM指令,實(shí)現(xiàn)了性能相當(dāng)強(qiáng)悍的StrongARM內(nèi)核,并被Intel收購后,廣泛應(yīng)用到消費(fèi)類產(chǎn)品和網(wǎng)絡(luò)處理器方面。Marvell,同樣是通過購買ARM內(nèi)核指令,應(yīng)用到其自研的處理器內(nèi)核中。Marvel之所以給我不錯的好感,也許是因?yàn),這家公司的以色列處理器架構(gòu)工程師David的幽默以及北大才子之一、前Marvel中國區(qū)銷售總監(jiān)林斌的有才吸引了我;亦或是在與Marvel處理器架構(gòu)工程師們討論過程中,能深入討論到處理器的架構(gòu)設(shè)計(jì),內(nèi)核實(shí)現(xiàn)對指令效率等相當(dāng)有趣而優(yōu)美的處理器設(shè)計(jì)細(xì)節(jié),有一種一起描繪阿羅多姿、優(yōu)美曲線般的處理器設(shè)計(jì)藍(lán)圖的感覺。同時,Marvel其時也購買了因?yàn)镮ntel拋棄ARM處理器架構(gòu),專注X86處理器開發(fā)而出售給Marvel的StrongARM處理器內(nèi)核。
ARM處理器架構(gòu)并不優(yōu)美,而且缺陷多多:ARM處理器指令不具有對齊性,源自于ARM原本是一個只有幾十個人的小公司,不像IBM那樣具有前瞻性的大公司,其處理器指令,是在不斷完善功能和實(shí)現(xiàn)客戶提出的需求過程中添加,同時因?yàn)槠溟_始客戶主要是英國學(xué)校的繪圖計(jì)算機(jī)需求,導(dǎo)致其關(guān)注連續(xù)視頻流處理的能力,而具有很多Single instruction multi-data類型的指令,這種指令本身就屬于復(fù)雜指令集的特性。不過正因?yàn)檫@種指令,讓其在視頻類應(yīng)用獲得了相對好的好評。雖然ARM一直宣稱其處理器是低功耗、高性能處理器,但真與MIPS比較,ARM就顯得一文不值了。在達(dá)到同樣的性能下,ARM還不如PowerPC的功耗低,Die面積也比MIPS的大接近50%。ARM多核處理器的多核互連架構(gòu),不具有任何優(yōu)勢,4核之間采用Crossbar結(jié)構(gòu),超過4核的互連存在嚴(yán)重的一致性問題。
X86是我最早接觸的處理器架構(gòu),卻是我最后了解的處理器架構(gòu),第二接觸到ARM處理器,同時也較深入了解ARM處理器架構(gòu)。第三接觸到PowerPC處理器,同時開始了解PowerPC處理器架構(gòu),但是IBM的Power處理器架構(gòu)卻是了解的較晚。MIPS處理器架構(gòu)則處于PowerPC和Power之間。
X86處理器架構(gòu)與ARM一樣,名聲并不好。Intel X86,世界上最大的黑寡婦,向上對王者窮追猛打,向下則以黑寡婦的優(yōu)勢,使勁擠壓美女們的活動空間。名如其曰,黑寡婦是那么的相當(dāng)不完美,Die size就是其一個致命的弱點(diǎn),其次是功耗。這兩個致命弱點(diǎn),都源自于Intel/AMD都采用先把CISC翻譯為RISC后,緩存在不可見的大cache內(nèi),同時通過大容量cache存儲數(shù)據(jù)和指令,這些cache就已經(jīng)占了超過50%的die size;采用太多的multi-issue(一般具有9 issue,甚至更多)及out of order實(shí)現(xiàn)導(dǎo)致增加了超過20%的Die size。之所以如此復(fù)雜,Intel美名其曰:指令兼容性;指令兼容確實(shí)給Intel帶來了好處,同時也成為Intel X86架構(gòu)最嚴(yán)重的歷史包袱。同時,因?yàn)閃indows的不兼容性而削弱其價值。就算Intel因?yàn)镻C的巨大市場,獲取了巨大好處,并投資工藝進(jìn)步,令所有半導(dǎo)體廠商無法企及,其這一包袱依然嚴(yán)重影響Intel進(jìn)入低功耗產(chǎn)品市場。
Power處理器,是IBM獨(dú)自占有的處理器架構(gòu)和內(nèi)核,從Power1到最新的Power7,以及今年出來的power7+, 2014年量產(chǎn)的Power8,一直領(lǐng)先所有處理器性能,堪稱處理器王者。Power處理器架構(gòu),以其完美的指令對齊而顯得威武挺拔,頻率一直走在前端。即使工藝不及Intel,依然毫不孫色。可惜王者太過關(guān)愛自己,不愿意多使用龍?bào)w,導(dǎo)致龍鐘繁殖緩慢,有慢慢被黑寡婦吞噬之險(xiǎn)。從Power7開始,IBM開始了其新的cache技術(shù):eDRAM,采用DRAM的技術(shù),實(shí)現(xiàn)只有1clk的延遲,并且速度與處理器的速度保持在1/2或1/3的范圍之內(nèi)。由于IBM長期生產(chǎn)和組建多處理器大型機(jī)系統(tǒng),在多個行業(yè)的應(yīng)用,其遷移式cache一致性特性都優(yōu)于目前所有的處理器的cache性能。
PowerPC處理器,是IBM和摩托羅拉公司合作研發(fā)的處理器架構(gòu)和內(nèi)核,其E300內(nèi)核具有簡約、高性能、two-issue、相對低功耗,而廣泛應(yīng)用到工業(yè)、通信、汽車電子等行業(yè)。E500內(nèi)核則以其復(fù)雜、高性能、技術(shù)先進(jìn)的out of order等技術(shù)而應(yīng)用到工業(yè)、通信等行業(yè)。PowerPC處理器架構(gòu)和這兩個內(nèi)核實(shí)現(xiàn)也是處理器架構(gòu)入門的好案例。
當(dāng)然了,保守的IBM,令其王子之身的光芒無法普照世界,失去了王子應(yīng)有的光環(huán)。
MIPS處理器架構(gòu)描述:MIPS的意思是“無內(nèi)部互鎖流水級的微處理器”(Microprocessor without interlocked piped stages),其機(jī)制是盡量利用軟件辦法避免流水線中的數(shù)據(jù)相關(guān)問題。是最早出現(xiàn)的商用RISC處理器架構(gòu)。可以毫不夸張的說,MIPS是處理器架構(gòu)的革命先驅(qū)。因?yàn)镸IPS的die size小,功耗低,性能相對高,曾經(jīng)風(fēng)靡全球,應(yīng)用廣泛:各種家用電器,打印機(jī),繪圖儀,形形色色的游戲機(jī),圖形工作站,服務(wù)器,大型機(jī),網(wǎng)絡(luò)產(chǎn)品,電信產(chǎn)品,工控產(chǎn)品,數(shù)字電視、數(shù)字機(jī)頂盒、DVD/藍(lán)光播放器、數(shù)碼相機(jī)和寬帶客戶端等,無處不現(xiàn)其身。大有稱霸處理器世界之勢。不過,由于stanford大學(xué)的教授們并不懂得太多的經(jīng)營,在授權(quán)方面也推出了用戶可修改和增加指令集而削弱了其生態(tài)系統(tǒng)的生命力。提到MIPS,不得不提SGI這一做圖形工作站和大型服務(wù)器的公司,可以說MIPS實(shí)現(xiàn)了強(qiáng)大的處理性能,和這家公司的需求密不可分。另外兩家,分別是網(wǎng)絡(luò)處理器芯片廠商Cavium和NetLogic(原RMI),Cavium以增加極少量的網(wǎng)絡(luò)應(yīng)用指令和多核互連,實(shí)現(xiàn)高性能的多核網(wǎng)絡(luò)應(yīng)用;NetLogic(RMI)則以修改內(nèi)核,實(shí)現(xiàn)4線程見長,輔于網(wǎng)絡(luò)應(yīng)用指令,實(shí)現(xiàn)高性能的網(wǎng)絡(luò)應(yīng)用。由于MIPS可以客戶化定制指令,使得早期MIPS應(yīng)用到各行各業(yè),同時,也嚴(yán)重破壞了處理器賴以生存的生態(tài)圈:編譯器、匯編器、庫函數(shù)等工具鏈、OS以及各行各業(yè)的千千萬萬,不計(jì)其數(shù)的應(yīng)用程序的兼容性。使得MIPS的應(yīng)用產(chǎn)品并無法持續(xù)降低運(yùn)營和維護(hù)成本,迫使應(yīng)用方改變方向。
多線程技術(shù):多線程技術(shù),目前廣泛應(yīng)用的有Intel X86、Power7等、MIPS(RMI)、ARM。ARM的多線程還沒有商用,依然在和高性能需求大廠商討,而且技術(shù)相對落后效率不高。在前面三者中,最優(yōu)秀的要算IBM的Power7,設(shè)置為兩個線程時,效率高達(dá)198%,設(shè)置為四線程時,效率大約250%,這源自于IBM的多線程技術(shù)和其高達(dá)12個isse的執(zhí)行單元。Intel X86只能設(shè)置為雙線程,效率大約為190%。NetLogic(RMI)的多線程介于IBM和Intel之間,也是可以配置為雙線程或四線程。在實(shí)現(xiàn)的基本原理上,三者之間已經(jīng)沒有差別,只有具體的實(shí)現(xiàn)上有些細(xì)微的差別。
多核多處理器互連技術(shù):IBM在多處理器的互連技術(shù)方面有著成熟的應(yīng)用甚至已經(jīng)應(yīng)用到內(nèi)存擴(kuò)展方面,多處理器的互連技術(shù)相對更多,Crossbar,Ring,2D-Mesh,6-cube,或他們的組合;多核處理器的互連技術(shù),則更少:主要使用線技術(shù)或面技術(shù),由于當(dāng)前IC工藝限制,無法使用3D技術(shù)。IBM和Intel都使用Crossbar的多核互連結(jié)構(gòu);Cavium使用RING+Crossbar復(fù)合結(jié)構(gòu);RMI使用RING結(jié)構(gòu);Telira的64核、100核之類的處理器則使用了2D-Mesh結(jié)構(gòu)。當(dāng)然核數(shù)超過8核,不適合應(yīng)用Crossbar,只能采用8核內(nèi)采用Crossbar,然后采用第二級互連。
cache技術(shù):Intel X86 Cache技術(shù)是大家都熟悉的共享型技術(shù),cache單元采用SRAM結(jié)構(gòu),加入了低功耗控制,IBM則采用了自有專利的eDRAM 的cache存儲單元,Cache一致性采用數(shù)據(jù)遷移式方式,在多核方面更具有優(yōu)勢。Telira的64核的cache與采用多核互連架構(gòu)一致,2D-Mesh方式,一致性采用復(fù)制方式,比較浪費(fèi)cache資源。不過高達(dá)64核,如果不像IBM的大型機(jī)系統(tǒng)那樣,進(jìn)行分區(qū)分割運(yùn)行,處理器的性能無法發(fā)揮出來。
專業(yè)業(yè)務(wù)模型對這些處理器的性能反應(yīng),具有可對比性的是Intel X86和IBM的Power7,MIPS、PowerPC之間因?yàn)榇嬖诙喾N加速引擎,他們之間可以進(jìn)行性能對比。以WCDMA的RNC業(yè)務(wù)模型來分析,Intel X86 8核 3.5GHz,16線程。IBM Power7 3.5GHz 8核 分16、32線程;Freescale的E500mc,8核,Cavium MIPS64 12核;RMI 8核 32線程后面三個輔以加速引擎。Power7大約處理20000個數(shù)據(jù)面用戶,Intel X86大約處理17000個數(shù)據(jù)面用戶;其它三個需要根據(jù)程序優(yōu)化,良好配合加速引擎,E500mc性能不好(加速引擎未配合好),Cavium和RMI的不相上下。以上處理器都是64位。
未來處理器技術(shù)的發(fā)展:因?yàn)槌绦虻捻樞蛐远鴮?dǎo)致多核處理器性能無法發(fā)揮,只要處理器頻率和存儲器頻率能提升,并且不導(dǎo)致大量發(fā)熱而溫升嚴(yán)重,個人應(yīng)用將是以單核處理器依然是首選,并行應(yīng)用和云、集群則以多核分區(qū)運(yùn)行為首選。以Stanford大學(xué)、Mit、IBM等大學(xué)和公司的研究中心已經(jīng)取得了石墨碳工藝技術(shù)的進(jìn)展,實(shí)驗(yàn)室環(huán)境下,據(jù)說處理器頻率超過1000GHz,溫升依然小于當(dāng)前大功率的處理器,處理器內(nèi)通過光通信技術(shù)實(shí)現(xiàn)處理器與內(nèi)存和外設(shè)的互連。存儲器廠商則努力研究相敏和磁敏存儲,從相敏和磁敏特性分析,個人認(rèn)為這兩種存儲器的頻率會有較大的提升,但依然無法達(dá)到石墨碳工藝的1000GHz,倒是以量子技術(shù)為理論基礎(chǔ)的中子技術(shù)革新存儲器,令未來的存儲器達(dá)到如此之高的速度,并不再受伽馬射線的影響而產(chǎn)生軟失效,大大縮小了處理器與存儲器之間的速率gap。
在參與與某公司處理器合作的過程中,終于有機(jī)會深入窺視某公司的Power架構(gòu)和內(nèi)核實(shí)現(xiàn),并對服務(wù)器應(yīng)用與其它專業(yè)應(yīng)用的巨大差別有了清晰的認(rèn)知。同時也學(xué)會了如何處理和推動兩艘航空母艦之間的合作進(jìn)展的方法,從加入合作開始,前面兩個多月,盡是和某公司各個地方的商務(wù)、研發(fā)、合作部門無休止的電話會議和郵件溝通,每每得到某公司的答復(fù)是,我沒有收到郵件!或是之前不是我在開會。北京分部如是、美國分部、澳洲分部如是;上海分部作為商務(wù),一樣無法協(xié)調(diào)某公司內(nèi)部的溝通,臺灣分部則是主持,本應(yīng)負(fù)有協(xié)調(diào)某公司內(nèi)部溝通和任務(wù)落實(shí)的責(zé)任,同樣沒有起到作用。而每次加入到電話會議的,則多達(dá)中國區(qū)北京、香港、臺灣、上海,美國東部和西部、澳大利亞。每每開完會,會上列出每個地方的任務(wù),并以會議紀(jì)要發(fā)出去,依然沒有效果。由于長時間未取得預(yù)期的進(jìn)展,承受了領(lǐng)導(dǎo)傳遞過來的強(qiáng)大壓力,但依然不知如何推進(jìn)。一天,在與某公司臺灣分部的項(xiàng)目負(fù)責(zé)人溝通后,依然未果。無奈之下,奮筆直書,寫下了短短100字左右的郵件(郵件內(nèi)容就不說了),找到某公司所有的名片,選出幾個VP頭銜的人物,將郵件直接發(fā)送過去,抄送給項(xiàng)目相關(guān)的所有人和本公司多個領(lǐng)導(dǎo)。哇塞!!某公司的反應(yīng)真快呀!連夜收到了多個VP的回復(fù)郵件,電話會議通知,第二天一大早,就是電話會議,效率真高,就定下來所有的具體責(zé)任人和時間表。某公司的技術(shù)工程師從美國多個地方、澳大利亞等地方在4天內(nèi)都趕到了。那進(jìn)展,簡直就是一天一小變,三天一大變呀!
處理器研發(fā)時,部門不愿意立項(xiàng)做FPGA的處理器驗(yàn)證單板,當(dāng)時倒是沒有感覺到挑戰(zhàn)。 也許我在公司呆了那么多年,依然不了解公司的流程和規(guī)范。 當(dāng)發(fā)現(xiàn)因?yàn)闆]有立項(xiàng),是不能獲得任何資源支撐的時候,能做的事情就是忽悠,不停的忽悠。于是就開始寫ppt,向需要的資源部門領(lǐng)導(dǎo)忽悠,一次不行,兩次,兩次不行,三次!哈哈,幸運(yùn)的是,感覺還是很順利的,最難通過的部門,也就修改了兩次ppt,忽悠三次就Pass了。當(dāng)然,這還得動用高鐵ATP項(xiàng)目時與多個部門建立起來的人脈關(guān)系 。對外,依然是困難重重,最難的就是FPGA芯片的交期能否保證這一難度不亞于與某公司的合作的推動,畢竟全球就那么兩家做高端FPGA的廠家,都很牛逼啊。因?yàn)榻黄诘膯栴},也是動用了兩艘大船的VP,并且一不小心,把對方的Sale給革職了,對這Sale,真是不好意思了。『昧,描述完協(xié)調(diào)的事情之后,該回到技術(shù)上來啦,我本是不謙虛的人,硬件對我來說,實(shí)在是太簡單的事情了,即使是4個規(guī)模膨大的FPGA,也沒有什么難的。更何況還有硬件工程師,軟件工程師完成,其他部門如PCB Layout,工藝,結(jié)構(gòu),EMC,線纜等的支持配合。不過愛好技術(shù)的我,還是把DDR2和DDR3的驗(yàn)證拿來親力親為了一把。結(jié)果,驗(yàn)證的時候,最嚴(yán)重的就是DDR部分啊,悲催的FPGA驗(yàn)證時,DDR控制器只能跑到50MHz+(因?yàn)樾枰?yàn)證DDR PHY,不能使用FPGA的DDR PHY),DDR芯片的廠家只保證到133MHz或以上的頻率下正常運(yùn)行。唯一能做的,就是計(jì)算DDR的數(shù)據(jù)刷新時間、其它各種時序及其延遲周期,經(jīng)過一個多月的奮戰(zhàn),DDR控制器終于在50MHz左右的情況下穩(wěn)定運(yùn)行了。在參與這個項(xiàng)目的過程中,讓我明白了忽悠是那么的重要,對內(nèi),對外忽悠的重要。項(xiàng)目完成之后,特意花了一周的時間,整理了一個16頁的ppt,描述了如何通過對內(nèi)各個部門,對外其它公司的協(xié)調(diào),如何帶領(lǐng)團(tuán)隊(duì)正確的完成任務(wù),減少或避免錯誤出現(xiàn),取得了何種成績,美名其曰:項(xiàng)目總結(jié),優(yōu)秀實(shí)踐!發(fā)出去,哈哈!
多核處理器技術(shù)藍(lán)皮書:以一個普通工程師的角色,請教公司內(nèi)外的資深工程師、教授、處理器名人,這是一個令人難忘的經(jīng)歷。有人懷著一顆熱情的心,耐心的解說、指導(dǎo),并和我交流討論,同時盡力提供資料;有人樂意幫助,并提供資料;有人愿意幫助,但不熱情;有人冷冷的幫助了我;有人耍太極,當(dāng)面說提供資料,后續(xù)查無回音,多次拜訪依然如此;有人以工作忙,或沒有了解為由,直接拒絕提供幫助。在這一過程中,需要和自己最親近的朋友、領(lǐng)導(dǎo)請教如何打動他人,樂意提供幫助的方法,同時在遇到冷遇與拒絕時保持良好的交流心態(tài)和語氣,這是一個忍受的過程。資料和信息獲取到了之后,就是學(xué)習(xí),整理,最終總結(jié)出幾個未來發(fā)展方向的觀點(diǎn),這只要運(yùn)用紙上的忽悠能力就可以解決的事情了。從IC工藝角度看,處理器未來會持續(xù)發(fā)展到現(xiàn)有半導(dǎo)體理論極限的16nm,至于Intel等提出的12nm,10nm,8nm,6nm等硅半導(dǎo)體工藝,暫時無法參透其半導(dǎo)體如何在如此之薄的晶圓上生長,難道雜質(zhì)只生長一半或不到一半到硅原子內(nèi)?另外,如此之薄,芯片電壓也變得難于實(shí)現(xiàn)的0.4V或以下。同時,IBM,Stanford,MIT等研究的石墨碳工藝,則是未來半導(dǎo)體工藝熱門的方向。處理器內(nèi)部互連,則通過光通信實(shí)現(xiàn)處理器與內(nèi)存、外設(shè)的高帶寬的通信,并最終實(shí)現(xiàn)芯片內(nèi)的WDM通信。更為突出的是,IC工藝從平面向3D方向進(jìn)軍,這同樣會深刻影響IC技術(shù)的變革。從處理器外部硬件上看,以后的硬件將更加歸一化,生命周期更短;虛擬化技術(shù)屏蔽了底層硬件的差異,實(shí)現(xiàn)了OS及其上層的統(tǒng)一性;多核處理器與內(nèi)存則通過虛擬化進(jìn)行分區(qū)劃分運(yùn)行,提升多核處理器運(yùn)行效率。
國內(nèi)外處理器技術(shù)差距:從宏觀的大環(huán)境看,處理器技術(shù)完全掌握在美國國內(nèi),無論是處理器芯片,還是處理器賴以生存的處理器生態(tài)系統(tǒng):半導(dǎo)體,處理器體系結(jié)構(gòu)和內(nèi)核實(shí)現(xiàn),工具鏈,OS,各種應(yīng)用程序。其它國家和中國都顯得那么蒼白無力。從與人的對話來看,與stanford大學(xué)教授,Intel, IBM,Marvel,F(xiàn)reescale,Cavium,NetLogic,處理器性能評估獨(dú)立人 markus.levy等的交流,都能深入的介紹處理器的體系結(jié)構(gòu)差異,內(nèi)核的實(shí)現(xiàn)細(xì)節(jié),底層程序,應(yīng)用程序如何影響處理器性能發(fā)揮,如何建立業(yè)務(wù)模型等。與國內(nèi)中科院龍芯處理器教授的交流,就顯得相當(dāng)空洞無力,教授們大談特談龍芯如何成功,基于什么樣的原因,諸如處理器生態(tài)系統(tǒng),處理器賴以生存的工具鏈,OS,和應(yīng)用程序來選擇處理器架構(gòu)和內(nèi)核等,取得了國家某某獎之類空乏無力的虛吹。
企業(yè)文化:在整個處理器職業(yè)生涯中,令我印象深刻的是stanford,intel,F(xiàn)reescale,IBM的企業(yè)文化對雇員的影響;stanford具有相當(dāng)?shù)膶W(xué)術(shù)自由,里面有相當(dāng)多的處理器學(xué)術(shù)派系,他們彼此表達(dá)出不同的觀點(diǎn),卻共融而一起研究處理器技術(shù);Freescale和IBM的雇員們,對工作懷有相當(dāng)?shù)臒嵴,對公司有著相?dāng)?shù)闹艺\和尊重;他們時刻不忘向客戶推介他們的產(chǎn)品和技術(shù),并兢兢業(yè)業(yè)的完成工作職責(zé)和任務(wù),同時,他們堅(jiān)實(shí)的技術(shù)基礎(chǔ)和技術(shù)能力,快速解決技術(shù)問題的能力,都讓我們肅然起敬。Intel的工程師們,則是完全相反的態(tài)度,公司賺錢與我一點(diǎn)關(guān)系都沒有,工作沒有熱情,沒有激情。帶著不情愿的表情完成工作職責(zé)和任務(wù)。當(dāng)然,Intel的工程師們的工作能力也是非常棒的。
透過處理器世界,我們同樣看到世界的不完美,也只有不完美,才會讓人類發(fā)奮努力去追求完美。
下一篇,將準(zhǔn)備撰寫 海陸空三維立體交通系統(tǒng)的系統(tǒng)和未來發(fā)展方向,或者是高鐵ATP系統(tǒng),也可能是通信網(wǎng)絡(luò)的歷史,現(xiàn)狀,未來的發(fā)展,…………
|
|