編者按:芯片業喊 “狼來了” 已經有將近 20年 了,但摩爾定律似乎每一次都能化險為夷,維持存在。但是這次不一樣了,隨著產業在技術、經濟層面摸到的天花板越來越多,自 1960年 代以來為信息革命提供動力的字面意義上的摩爾定律可能下個月就要正式終結了。不過,從摩爾定律所反映的價值來看,摩爾定律并沒有死,只是換了一個化身而已。來自自然雜志的這篇文章回顧了摩爾定律的光輝歷史,并總結了讓摩爾定律重生的未來路線。對于正在致力打造半導體超級大國的中國來說,這篇文章值得好好思考一下我們的努力方向。
半導體業很快就會放棄追求摩爾定律的努力,不過現在事情可以變得更加有趣。
下個月,全球半導體業將正式承認一個對于牽涉其中所有人來說已經變得越來越明顯的事實:自 1960年 代以來為信息革命提供動力的摩爾定律已接近終結。
作為統治計算的一個概測法則,摩爾定律指出,微處理器芯片上的晶體管數量大概每兩年左右就會翻番—通常這意味著芯片的性能也會有相應提升。該定律描述的指數式改進將 1970年 代第一代做工粗糙的家庭計算機變成了 1980年 代和 1990年 代的精致機器,高速互聯網、智能手機以及聯網汽車、冰箱和恒溫器也因此崛起并變成今日的無所不在。
不過所有這些都不是必然的:那是因為芯片制造商處心積慮地選擇了維持摩爾定律的軌跡。每一階段軟件開發者都會推出榨干現有芯片能力的應用,讓消費者呼喚更多的設備,然后制造商爭先恐后地用下一代芯片來滿足這種需求。實際上自 1990年 代以來,半導體行業每 2年 就會發布一份研究路線圖來協調成百上千的制造商和供應商的步調與摩爾定律保持一致—這種策略有時候被戲稱為More Moore(更多的摩爾)。計算機的發展遵循該定律的指數式增長很大程度上要得益于這份路線圖。
但這種情況持續不了多久了。由于越來越多的硅電路擠到同樣大小的一小塊區域,不可避免的發熱問題使得摩爾定律的翻番速度已成強弩之末。而且在 10年 之內摩爾定律還將觸碰到更多的天花板,那些局限性甚至是更根本性的。目前頂級的微處理器的硅電路器件特征尺寸大概是 14 納米,這已經比大多數病毒還要小了。不過到了 2020年 代初時,制定摩爾定律路線圖組織的主席 Paolo Gargini 說,“哪怕是采取極具攻擊性的做法,我們也將達到 2-3 納米的限制,那時候特征尺寸僅有 10 個原子大小了。這還算是設備嗎?” 也許不能算了—因為小到這種規模的情況下,電子行為戶受到量子不確定性的控制,這會導致晶體管的不可靠,甚至不可靠到了令人絕望的地步。盡管進行鍥而不舍的研究,但今日的硅晶技術尚無明顯的成功者。
下月發布的路線圖推出的將是第一份不以摩爾定律為中心的研發計劃。相反,它遵循的將是所謂的More than Moore(超越摩爾)戰略:它的目標不是造出更好的芯片然后讓應用跟進,而是反過來,從應用開始—從智能手機和超級計算機以及云端數據中心開始一路向下,看看需要什么樣的芯片來支持。這些芯片當中會有新一代的傳感器、電能管理電路,以及其他一些計算日益移動化的世界所需的硅設備。
版圖的變動反過來也會瓦解該行業一直追求摩爾定律的長期傳統。“每個人都在質疑這份路線圖的實際意義,” 愛荷華大學的計算機科學家 Daniel Reed 如是說。代表美國主要相關機構的半導體工業協會(SIA)已經表示,一旦報告發布后將停止參與路線圖的制定,并轉向尋求自己的研發議程。
不過大家都同意摩爾定律的日薄西山并不意味著進展的停滯。“我們可以看看飛機業發生的事,” Reed 說:“波音 787 并沒有比 1950年 代的 707 飛得更快—但二者卻是非常不同的飛機,” 其中已經進行了大量創新,從全電控到碳纖維機身,不一而足。計算機的情況也會這樣,他說:“創新絕對還會繼續—但這種創新會更細微更復雜。”
放棄定律
1965年 的那篇令戈登·摩爾揚名天下的文章以思考當時尚屬新技術的集成電路能做些什么為開頭。摩爾當時是仙童半導體公司的研究總監,他當時就預測到了家庭計算機、數字腕表、自動汽車以及 “個人便攜式通信設備”—移動手機等東西的出現。那篇文章的中心正是摩爾為這樣一種未來提供一份時間表的努力。他把實現計算數字化的開關裝置—晶體管作為衡量微處理器計算能力的指標。在所在公司和其他公司前幾年取得成就的基礎上,他估算出每塊芯片上的晶體管和其他一些電子器件的數量每年將會翻 1 番。
后來與人聯合創辦了英特爾的摩爾低估了翻番所需的時間,1975年,他把這一時間修正為更加現實的 2年。但是他的愿景是完全正確的。1970、1980年 代,隨著惠普手持計算器、蘋果 Apple II 以及 UBM PC 等配置了微處理器消費者產品的出現,他所預測的未來變成了現實。對此類產品的需求很快開始爆發,而制造商則爭相開發出尺寸越來越小能力越來越強的芯片來滿足這種需求。
這種代價是高昂的。改進微處理器的性能意味著要按比例縮小電路元素的尺寸以便在芯片上封裝更多的電路,并且讓電子的轉移更加快速。但縮小尺寸需要對光刻術(一項將微元素蝕刻到硅表面上的基本技術)進行重大改進。但是在芯片業繁榮時期這基本不算什么難事:一個自我強化的周期開始了。鑒于芯片的通用性如此之強,以至于制造商只需制造幾種類型—主要是處理器和內存,就能夠大量賣出去。這讓廠商獲得了足夠的資金,在彌補升級生產設備的成本的同時還能降低價格,從而又進一步刺激了需求的增長。
不過這種市場驅動的周期很快被證明難以維系摩爾定律無情的節律。芯片制造過程太過復雜,由于牽涉到數百道流程,也就意味著每縮小一次規模都需要一系列的材料供應商和設備制造商在合適的時間實現適當的升級。“如果你需要 40 種設備但只有 39 種就緒,那一切也都要停下來,” 德州大學奧斯汀分校研究計算機產業的經濟學家 Kenneth Flamm 說。
為了進行產業協調,半導體業開始制定第一份路線圖。Gargini 說他們的設想是讓 “大家對自己要做什么都有一個粗略的估計,并且在看到前面有路障時發出警報。” 1991年 美國半導體工業開始了第一份路線圖繪制的努力,來自各家公司的數百位工程師一起擬定了第一份報告及后續迭代,由當時是英特爾技術戰略總監的 Gargini 擔任主席。1998年 這項工作變成了國際半導體技術發展藍圖,歐洲、日本、臺灣地區及韓國等地的行業協會也開始參與進來(今年的報告將更換新名稱,叫做設備與系統國際路線圖,International Roadmap for Devices and System)。
Flamm 說:“這份路線圖是一項非常有趣的實驗。據我所知,像這樣把每一家制造商、供應商凝聚在一起,指導未來要做什么事情的,任何其他行業都沒有過這種的先例。” 從效果來看,它把摩爾定律從一項經驗觀測轉變成了自我實現的預言:新的芯片之所以遵循該定律是因為行業的努力確保了芯片如此。
一切都工作得非常好,直到有一天再也做不到。
高溫死亡
第一快絆腳石并不算出乎意料。Gargini 等人早在 1989年 就提出過警告,但大家還是撞了個結結實實—其原因是東西太小了。
“過去往往是只要我們把特征尺寸做得更小以后,好事情就會自動發生,” Third Millennium Test Solutions 總裁 Bill Bottoms 說:“芯片會跑得更快,功耗更低。”
不過到了 2000年 代初期,當特征尺寸縮小到 90 納米以下時,這種自動的神奇魔力開始失效了。隨著電子在尺寸越來越小的硅電路跑得越來越快,芯片開始變得過熱。
這個問題是根本性的。熱量是很難干掉的,燙手的手機沒人想要。所以制造商唯有抓住手上唯一的救命稻草,Gargini 說。首先,他們停止了提高 “時鐘頻率”(超頻,指提高微處理器執行指令的速率)的努力。這么做可以有效地對芯片電子的運行速度加以限制,同時也就限制了其發熱的能力。自 2004年 以來最大時鐘頻率就一直沒變過了。
其次,為了確保芯片性能在有速度限制的情況下仍遵循摩爾定律,他們重新設計了內部電路,這樣單塊芯片不再只包含一個處理器,或者說 “內核”,而是 2 個、4 個甚至更多(在當今的計算機和智能手機中,4 核或者 8 核都是很常見的)。Gargini 說,從原則上來說,“用 4 塊主頻 250MHZ 的內核可以得到跟一塊主頻 1GHZ 的內核同樣的輸出”。不過在實際應用時,要想利用上 8 個內核處理器意味著要把問題分解為 8 小塊—這對于許多算法來說難度太大甚至是不可能的。“無法并行化的部分會限制你的改進,” Gargini 說。
即便如此,在結合了富有創意的重新設計來彌補電子泄露等效應后,這兩個解決方案讓芯片制造商得以繼續縮小電路尺寸,設法讓晶體管數量跟上摩爾定律的曲線軌跡。現在的問題是到了 2020年 代初期,當尺寸縮小因為量子效應而難以為繼時會發生什么事情。接下來又該怎么辦?國際芯片制造商 GlobalFoundries 的電子工程師,同時是新路線圖的編制委員會主席的 An Chen 說:“我們還在努力。”。
還在努力的原因并不是由于缺少創意。他們想到的可能解決方案之一是擁抱一種全新的范式—比如像量子計算,這種計算模型有望為特定計算類型帶來指數性的速度增長;或者神經形態計算,其目標是對大腦神經元的處理要素建模。但是這些替代性計算模型尚未真正走出實驗室。而且許多研究人員認為量子計算只是在少量利基應用中體現出優勢,而不是數字計算所擅長的日常任務。“” 勞倫斯伯克利國家實驗室計算機科學研究的負責人 John Shalf 在思考的問題是:“對于支票本來說,量子平衡究竟意味著什么呢?”
材料差異
還有一種辦法的確仍堅守在數字化的陣地,這種辦法的目標是要找一種 “毫伏開關”:要找到一種能夠運用到設備上的材料,這種材料在速度上至少要能夠跟它的硅同行匹敵,但同時發熱卻少很多。候選的材料倒不少,從 2D 類石墨烯復合物到自旋電子材料都能夠通過電子自旋而不是電子移動來完成計算。“一旦邁出已有技術的范疇,外面就是一片待研究開發的廣闊天地,” 半導體研究公司(SRC)負責納電子學研究行動的物理學家 Thomas Theis 說。
不幸的是,目前同樣也還沒有任何毫伏開關走出實驗室。所以有人又提出了架構化的改進辦法:還是用硅,但是采用全新的配置方式。熱門的方案之一是 3D 化。摒棄過去在硅片表明蝕刻電路蓋平房的做法,轉而起摩天大樓:把許多蝕刻上微電路的硅薄層堆疊起來。從原則而言,這種做法應該能夠在同樣的空間內集中更多的計算資源。但實際上這種做法目前只對沒有發熱問題的內存芯片有效:它們采用的電路只是在存儲單元被訪問到時才會耗電,而某個存儲單元被訪問到并不是經常的事情。混合存儲立方體設計就是這種做法的案例之一,這種內存堆疊了多至 8 層內存,目前由三星和美光技術組成產業財團正在推動這種方案。
但是微處理器面臨的挑戰更多:一層層的堆疊發熱的東西只會讓它們更熱。不過有個辦法可以繞開這一問題,那就是廢棄內存和處理器分開的做法,這可以有效緩解發熱—至少可以減少 50%,因為機器發熱量的 50%正是由于處理器和內存之間數據的來回交換而引起的。把內存和處理器集成到納米級的高樓大廈內就可以干掉這部分發熱了。
但是這種辦法實現起來是相當棘手的,尤其是在當代的微處理器和內存芯片差異很大的情況下,這兩樣東西很難在同一條生產線上裝配出來;而把它們堆疊起來又需要對芯片架構進行徹底的重新設計。不過若干研究團體還是希望能夠實現這種辦法。斯坦福大學的電子工程師 Subhasish Mitra 和他的同事已經開發出了一種混合架構,這種架構能夠將內存單元和由碳納米管制成的晶體管堆疊起來,后者還負責電流在不同層之間的流動。該小組認為這種架構能夠把電耗降低到標準芯片的千分之一以下。
移動化
摩爾定律的另一塊絆腳石略為出乎意外,但遭遇到這塊絆腳石的時間跟第一塊大抵相同,這塊絆腳石是:計算的移動化。
25年 前,計算是由桌面計算機和筆記本的需求來定義的;超級計算機和數據中心采用的基本上是跟它們一樣的微處理器,只是打包到一起的數量要多得多。但現在不是這樣了。今天的計算越來越多的是由高端智能手機和平板電腦說了算,以及日漸興起的智能手表等可穿戴設備,乃至于從冰箱到人體監測等眾多數量呈爆發之勢的智能設備。這些移動設備的需求跟他們那些久坐不動的表親的是很不一樣的。
維系摩爾定律這項任務只能排在他們任務清單很后面的位置—尤其是在移動應用和數據的處理負荷基本上已經轉移到全球的服務器群網絡(也即所謂的云)上的情況下。那些服務器群現在統治著的確仍遵循摩爾定律的強大的、先進的微處理器的市場。“Google 和 Amazon 的購買決定對英特爾決定做什么具有巨大影響,” Reed 說。
對于移動來說,能保證移動設備與環境和用戶交互的電池續航時間要關鍵得多。典型智能手機里面的芯片在進行語音通話、使用 Wi-fi、藍牙以及 GPS 時都必須收發信號,與此同時還要感應觸摸、距離、加速、磁場,甚至還包括指紋。在此之上,設備必須有一個套專門的電路負責電能管理,一面那些功能耗光電池儲能。
對于芯片制造商來說,這種問題的特殊性正在挖掘出一個與維系摩爾定律運轉類似的自我強化的經濟周期。“過去的市場是做出來的東西類型很少,但是賣出去的數量很多,” Reed 說:“而新市場是你得做很多東西,但每樣只能賣一點—所以設計和組裝最好還是要保證成本低廉。”
這些都是持續的挑戰。把獨立的制造技術糅合到一起,讓它們在一個設備上和平共處往往是場噩夢,Bottom 說,他在新路線圖委員會中負責的正是這個專題:“不同的部件,不同的材料、電子、光電等統統打包在一起—這些問題都必須考新額架構、新的仿真、新的開關等來解決。”
對于許多專門電路來說,設計仍然處于手工作坊時代—這意味著時間久成本高。加州大學伯克利分校的電子工程師 Alberto Sangiovanni-Vincentelli 和他的同事正試圖改變這一點:他們不再打算每次都從頭做起,認為大家應該可以通過組合現有電路的一大塊也即所謂的功能化來創造出新設備。“這就好比搭樂高積木塊一樣,” Sangiovanni-Vincentelli 說。確保積木能協同工作是個挑戰,不過 “如果你采用的是老一點的設計方法,成本是不會太高的。”
毫無疑問,成本是芯片制造商最近很關心的問題。“摩爾定律的終結不是技術問題,而是經濟問題,” Bottom 說。一些公司,尤其是英特爾,在碰到量子效應的天花板之前仍然打算繼續縮小元件尺寸,他說。但是 “尺寸縮得越小,成本就越高。”
每把尺寸減少一半,制造商都需要有全新一代的更精確的光刻機器。現在建造一條新的生產線往往需要數十億美元的投資—這么多的錢只有少數公司能付得起(注:還要加上中國的傾國之力)。但是移動設備引發的市場碎片化導致投資回收更加困難。“只要下一個芯片的每晶體管成本超過現有成本,” Bottom 說:“瘦身就會停止。”
許多觀察者認為該產業目前已經非常接近那個點了。“我敢打賭,我們會在到達物理極限前就先把錢給花光了,” Reed 說。
的確,過去 10年 成本的不斷攀升已經導致了芯片業的大規模合并。現在全球大多數的生產線已經集中在英特爾、三星、臺積電等少數幾家企業手上。這些制造巨頭跟材料和生產設備供應商關系緊密,他們早已協調一致,路線圖對他們來說不再像過去那樣有用了。“芯片制造商的重視程度絕對比以前低了,” Vhen 說。
就拿擔任美國產業研究中介的 SRC 來說吧,SRC 曾是路線圖的長期支持者之一,SRC 的副總裁 Steven Hillenius 說:“但大概 3年 前,SRC 就不再提交貢獻了,因為成員公司看不出這么做有什么價值。” SRC,以及 SIA 希望推進一項更加長期、更加基礎的研究議程,并希望能獲得聯邦資金(可能是白宮去年7月 推出國家戰略計算行動計劃)的支持。
去年9月,這項議程推出了 5 份報告,描繪了未來面臨的研究挑戰。其中能效問題尤其緊迫—特別是物聯網所包含的嵌入式智能傳感器的能效問題,這需要在沒有電池的情況下利用新技術來解決設備存活問題,比如利用環境熱能和振動來收集能量。連接性同樣重要:數十億漫游設備相互之間以及與云之間的通信覆蓋的無線頻譜范圍將達到一度不可企及的太赫(TeraHertz)級。安全也至關重要—該報告呼吁研究出新的辦法來防范未來攻擊和數據盜竊。
諸如此類的優先事項夠研究人員未來幾年忙的了。不過至少有一部分的圈內人士對此表示樂觀,英特爾負責先進微處理器研究的 Shekhar Borkar 就是其中之一。是,他說,就字面意義而言,摩爾定律即將要終結了,因為晶體管數量的指數增長已經無法繼續。但從消費者的角度來說,“摩爾定律說的僅僅是用戶價值每兩年就會翻番。”所以這條定律還會以這種形式繼續維持下去,只要產業界能夠不斷往設備填充新功能的話。
想法已經有了,Borkar 說:“我們的任務是實現。”