- 相關(guān)推薦
計算機架構未來(lái)面臨的挑戰
過(guò)去10年,很多計算機體系結構研究學(xué)者都在感嘆體系結構的研究步履維艱,計算機架構未來(lái)面臨的挑戰,又會(huì )有哪些呢,我們一起來(lái)看看!
專(zhuān)用化的鴻溝:硬件設計大眾化
為了延續計算機工業(yè)創(chuàng )新的光榮歷史,開(kāi)發(fā)硬件必須像開(kāi)發(fā)軟件一樣簡(jiǎn)單、便宜和靈活。
廣泛和新興的看法一直認為,經(jīng)典的CMOS工藝縮放路線(xiàn)——基于晶體管越來(lái)越小、集成度越來(lái)越高的摩爾定律的技術(shù)引擎——將在不到3代半導體工藝(6~9年)之后面臨終結。而且,登納德縮放——隨著(zhù)CMOS的集成度提高但能夠使每個(gè)芯片的功耗保持不變的技術(shù)趨勢——也將在21世紀中葉終結,這將導致處理器設計的巨大變革:運算能效已經(jīng)取代面積效率或峰值邏輯門(mén)開(kāi)關(guān),成為最重要的一項限制峰值性能的設計約束。
從近期工業(yè)界的動(dòng)向中可以窺見(jiàn)到經(jīng)典工藝縮放路線(xiàn)即將到來(lái)的后果。例如,英特爾已經(jīng)放棄了長(cháng)期奉行的“工藝年-構架年(tick-tock)”開(kāi)發(fā)模式,從原先每代工藝推出兩款主要芯片設計,現已改為三款。這個(gè)改變意在通過(guò)維系“茍延殘喘”的摩爾定律從而延長(cháng)每代產(chǎn)品的市場(chǎng)壽命。更有甚者,美國半導體行業(yè)協(xié)會(huì )(Semiconductor Industry Association)也已放棄維持了數十年、每?jì)赡旮乱淮蔚膰H半導體技術(shù)路線(xiàn)圖(International Technology Roadmap for Semiconductors, ITRS)的老傳統,這一技術(shù)文檔為整個(gè)半導體產(chǎn)業(yè)界協(xié)調技術(shù)、制造與系統開(kāi)發(fā)提供了指導。由于沒(méi)有明確的方向維系縮放路線(xiàn),ITRS的價(jià)值也在逐漸衰退。
然而,新應用的不斷涌現,對計算能力的需求在日益增長(cháng)。其中最突出的就是那些由大規模機器學(xué)習所驅動(dòng)的、從前難以想象的應用:從圖像和語(yǔ)音識別到無(wú)人駕駛汽車(chē),再到擊敗圍棋頂尖高手。同樣可以看到對視覺(jué)數據處理和理解的需求的爆發(fā)式增長(cháng),有些前瞻性應用或許要求為世界上每個(gè)人提供每秒千兆像素級的運算能力。
過(guò)往計算技術(shù)的進(jìn)步主要來(lái)源于對通用計算設計的巨大投入,而這些設計依賴(lài)于經(jīng)典的縮放路線(xiàn),并且完全由少數幾家處理器制造商完成。得益于這些通用設計的計算機應用綜合市場(chǎng)的龐大體量,足以分攤這些廠(chǎng)商的大量投入。
隨著(zhù)傳統縮放路線(xiàn)的衰落,只通過(guò)改進(jìn)少數通用計算平臺將無(wú)法繼續滿(mǎn)足新興應用對計算性能的需求。相反,在過(guò)去的5~10年里,在一些計算密集型應用領(lǐng)域,一種新的性能優(yōu)化手段策略已經(jīng)興起——專(zhuān)用硬件設計。與在通用處理芯片上運行軟件的方案相比,專(zhuān)用硬件方案(如專(zhuān)用集成電路)單位操作上可提高能效10000倍。此能效的提升對于新興的物聯(lián)網(wǎng)的豐富應用是至關(guān)重要的。專(zhuān)用化已經(jīng)在圖形渲染和視頻播放等方面取得了巨大成功。機器學(xué)習應用也開(kāi)始取得商業(yè)成功。實(shí)際上,計算機體系結構領(lǐng)域的科研人員已經(jīng)認識到專(zhuān)用化的重要性并投身其研究:2016年體系結構領(lǐng)域三大頂級會(huì )議(ISCA、HPCA、MICRO)共收錄論文175篇,其中38篇是關(guān)于圖形處理器(GPU)和專(zhuān)用加速器設計的,還有17篇是關(guān)于機器學(xué)習專(zhuān)用化設計的。
然而,迄今為止,專(zhuān)用設計的商業(yè)化的成功,只限于擁有巨大市場(chǎng)的應用(例如視頻游戲、移動(dòng)視頻播放等),值得像通用處理器廠(chǎng)商那樣投資。以上市時(shí)間和金錢(qián)來(lái)衡量,設計和制造專(zhuān)用硬件的成本極高,只有極少數的設計可以在這樣巨大的市場(chǎng)逐步攤銷(xiāo)。
為了繼續有效創(chuàng )新的周期,關(guān)鍵是排除專(zhuān)用系統設計的障礙,從而在所有應用中體現出專(zhuān)用化在能效方面的優(yōu)勢。我們的愿景是“大眾化”硬件設計,也就是讓硬件設計變得像軟件設計那樣敏捷、便宜和開(kāi)放。軟件開(kāi)發(fā)團隊可以利用豐富的、擁有現成的可重用部件的生態(tài)系統(通常是免費和開(kāi)源的),使用高級語(yǔ)言加速提高單個(gè)開(kāi)發(fā)者的能力,并依靠強大和自動(dòng)化的程序分析、綜合、測試和調試來(lái)保證品質(zhì)。
盡管經(jīng)過(guò)了幾十年的投入,計算機輔助設計仍未能達到一個(gè)小開(kāi)發(fā)團隊即可進(jìn)行硬件設計的水平。硬件系統設計者需要更好的工具,提高在硬件描述方面的能力,更快的性能評估手段,更敏捷的原型化方法和更嚴謹的軟/硬件協(xié)同設計驗證方法。工具鏈要成熟,可以跨越多個(gè)硬件層次,從通用可編程處理核到大規?删幊踢壿嬯嚵、可編程加速器以及專(zhuān)用集成電路,從而能夠輕易實(shí)現重定位。更好的抽象描述對于硬件的組件化和可重用是必需的,這些抽象可以是以可綜合的知識產(chǎn)權(IP)模塊的形式,甚至可以是以物理芯片或芯片組的形式存在,在制造時(shí)可便宜地集成到系統中。對于體系結構領(lǐng)域的研究者來(lái)說(shuō),這是一次努力彌補通用和專(zhuān)用系統之間的鴻溝的機會(huì ),并開(kāi)發(fā)出一系列工具和框架平臺,使大眾化硬件設計成為現實(shí)。
云計算是對體系結構創(chuàng )新的抽象
利用規;吞摂M化技術(shù),云計算提供商可以透明和低成本地提供硬件創(chuàng )新,即使最小的客戶(hù)也是如此。
云計算對傳統商業(yè)模式的顛覆已被廣泛認可。云計算能夠促使新興企業(yè)的規模發(fā)展遠快于傳統的基礎設施投資。新產(chǎn)品的用戶(hù)可以在短短幾天時(shí)間內從幾百個(gè)增長(cháng)到幾百萬(wàn)個(gè),2016年7月迅速風(fēng)靡全球的手機游戲“口袋妖怪”(Pokemon Go)就是很好的例證。但是,云計算也打破了傳統財富500強的商業(yè)模式,因為以前擁有自己的IT基礎設施的企業(yè)實(shí)現了出租云資源帶來(lái)的成本收益。
云計算提供商利用規;粌H是為了自身業(yè)務(wù),也是為了投資IT的客戶(hù)的利益。因此,這些提供商往往會(huì )發(fā)現,進(jìn)行巨大的、非重復性的工程投資是合算的,例如,在內部開(kāi)發(fā)全新的軟件和硬件系統,而不依賴(lài)第三方產(chǎn)品供應商。
我們開(kāi)始看到出現了使得云計算實(shí)現前所未有的性能的專(zhuān)用計算機架構。無(wú)論是高端的超級計算機,還是商業(yè)的云端產(chǎn)品,GPU變得無(wú)處不在。微軟公司公開(kāi)披露了Catapult項目,該項目致力于整合現場(chǎng)可編程門(mén)陣列(FPGA)以促進(jìn)其數據中心的計算專(zhuān)用化。Cavium公司已經(jīng)發(fā)布了一個(gè)互聯(lián)網(wǎng)服務(wù)應用的專(zhuān)用架構ThunderX。谷歌公司公布了張量處理器TPU,這是一個(gè)面向機器學(xué)習應用的專(zhuān)用協(xié)處理器。上述項目表明,已經(jīng)有很多經(jīng)濟原因促使云計算提供商投資專(zhuān)用計算機架構。
對學(xué)術(shù)界的計算機體系結構研究者來(lái)說(shuō),現在是抓住這個(gè)機遇并展示跨層專(zhuān)用化愿景的時(shí)機。例如,專(zhuān)用集成電路云(ASIC Clouds)項目展示了如何協(xié)同開(kāi)發(fā)大量高度專(zhuān)用的處理器,從而讓關(guān)鍵應用得到明顯加速。
云計算模型的第二個(gè)關(guān)鍵優(yōu)勢是虛擬化。虛擬化這類(lèi)技術(shù)將新的硬件和軟件創(chuàng )新透明地引入現有的軟件系統。虛擬化使得云提供商可以為了更快、更便宜的技術(shù)替換處理器、存儲器和網(wǎng)絡(luò )部件,而不必與消費者溝通協(xié)調。虛擬化也促成了資源的超額認購——在消費者對特定資源的需求具有時(shí)變、碎片化特征的情況下,在消費者之間進(jìn)行透明的資源共享。超額訂購對云計算的成本結構很重要,和單獨的消費者購買(mǎi)專(zhuān)屬資源比較,它使得云供應商以極低的價(jià)格提供IT資源。
學(xué)術(shù)界的計算機體系結構研究長(cháng)期以來(lái)對實(shí)現虛擬化起到重要作用,例如威睿(VMWare)這個(gè)最被認可的虛擬化技術(shù)供應商,就是從一個(gè)大學(xué)研究計劃發(fā)起的。學(xué)術(shù)界的體系結構研究者必須繼續在開(kāi)發(fā)虛擬化技術(shù)中扮演關(guān)鍵角色,來(lái)縮短虛擬化性能與裸機性能之間的差距。此外,體系結構研究者必須開(kāi)發(fā)新型的虛擬化抽象,從而實(shí)現對專(zhuān)用硬件單元,比如Catapult、TPU和ASIC Clouds等的透明使用和超額訂購。
垂直化趨勢
三維(3D)集成提供了一個(gè)新的可擴展維度。
摩爾定律終結的重要后果是使得芯片設計師再也不能“無(wú)償地”每18個(gè)月將自己設計中的晶體管數量提高一倍。與此同時(shí),最近幾代芯片中,相對于計算,驅動(dòng)全局總線(xiàn)開(kāi)銷(xiāo)的增長(cháng)很快,因此不斷提升了互聯(lián)在芯片功耗預算中所占比例。
3D集成為芯片設計提供了一個(gè)新的擴展維度,盡管摩爾定律終結了,仍然可以在一個(gè)單系統上集成更多的晶體管,可以從3個(gè)維度縮減互聯(lián)開(kāi)銷(xiāo),并實(shí)現各種混合制造技術(shù)的緊密集成。因此,3D集成使3D結構內部的系統組件具有更高的能效、更寬的帶寬和更低的延遲。
從架構上來(lái)講,3D集成也說(shuō)明平衡系統的計算必須盡量靠近數據。盡管閃存和其他內存設備早已通過(guò)3D方式進(jìn)行容量擴展,但將內存設備與高性能邏輯集成的嘗試才剛剛開(kāi)始。例如,美光(Micron)公司推出的混合內存立方體(Hybrid Memory Cube),實(shí)現了快速邏輯和密度內存的3D堆疊,為學(xué)術(shù)界重新刮起“近數據計算”(near-data computing, NDC)和“內存處理”(processing-in-memory, PIM)架構的學(xué)術(shù)研究風(fēng)潮。盡管這個(gè)研究問(wèn)題早在20年前已相當流行,但受限于當時(shí)的工藝技術(shù),PIM架構并沒(méi)有進(jìn)一步實(shí)現商業(yè)應用。近幾年,隨著(zhù)實(shí)用芯片堆疊和多技術(shù)垂直集成技術(shù)的出現,這些架構成為提升擴展性的有效途徑。
盡管3D集成為芯片設計賦予了新能力,但同時(shí)也在實(shí)現高可靠性和高收益方面提出許多復雜的新挑戰,其中高可靠性和高收益可以通過(guò)架構支持解決。比如,3D集成內存啟發(fā)我們重新思考傳統內存和存儲架構。3D集成也對功率和溫度管理引入了全新的問(wèn)題,這是由于傳統的散熱技術(shù)不足以應對高性能集成設計帶來(lái)的功率密度提升。這些問(wèn)題和挑戰開(kāi)啟了全新的、豐富的體系架構創(chuàng )新的可能性。
體系結構“更接近物理層”
經(jīng)典縮放定律的終結,給計算機底層架構帶來(lái)更多的本質(zhì)變化。
新的器件技術(shù)和電路設計技術(shù)歷來(lái)引發(fā)新結構的產(chǎn)生。未來(lái)有若干可能的情況給計算機體系結構帶來(lái)深遠的影響。這些情況分為兩大類(lèi)。第一類(lèi)是通過(guò)更有效的信息編碼,更接近模擬信號,來(lái)更好地利用目前的材料和器件。對模擬計算的關(guān)注再次興起,因為它很適合需要控制準確度的應用。而且和數字信息處理相比,模擬信息處理通過(guò)把信息更密集地映射到模擬信號上,以及更高效的功能單元,能夠保證功耗更低。然而,這類(lèi)計算更易受到噪聲影響,需要有新的容錯方法才能實(shí)際應用。
第二類(lèi)機會(huì )是“新”材料的使用,包括更高效的交換、更密集的布局和獨特的計算模型。下面我們列出一些值得體系結構領(lǐng)域注意的努力方向。
新的存儲器件。幾十年來(lái),數據一直存儲在動(dòng)態(tài)隨機存取存儲器(DRAM)、閃存或磁盤(pán)上。但是,新的存儲器件(例如Intel/Micron 3D XPoint存儲器)正在進(jìn)入商用化,與傳統存儲層次部件相比,這些新器件在開(kāi)銷(xiāo)、密度、延遲、吞吐量、可靠性和壽命等方面完全不同。
碳納米管;谔技{米管(CNTs)的電子學(xué)研究持續取得顯著(zhù)進(jìn)展,最近的結果表明,只使用碳納米管搭建出一個(gè)簡(jiǎn)單的微處理器是可行的。碳納米管可以保證更高的密度和更低的功耗,并且可用在三維基底上。這使得碳納米管成為體系結構方案是非?尚械。
量子計算。量子計算利用量子力學(xué)現象存儲和操縱信息。它的主要優(yōu)點(diǎn)是,“疊加”量子現象有效地允許同時(shí)表達0和1狀態(tài),這使得量子計算實(shí)現選擇算法時(shí)比傳統計算有了指數級加速。
超導邏輯。量子計算的一個(gè)姊妹方向是超導邏輯,使用約瑟夫森結等超導器件的系統,能夠提供“免費”的通信,因為在超導線(xiàn)上傳輸信號幾乎不消耗能量。另一方面,在數據操作上比傳輸數據有更高的能耗。這些權衡與CMOS硅電路正好相反,在CMOS電路上大部分能量消耗在通信而不是數據操作。
微軟、谷歌、IBM和I-ARPA等公司和機構都已經(jīng)宣布在量子計算和超導邏輯進(jìn)行了大量投資。我們認為量子計算機結構得到再次關(guān)注的時(shí)機是成熟的,量子計算在十年內可能會(huì )產(chǎn)生實(shí)際影響。
借鑒生物學(xué)。利用生物學(xué)基底做計算很早就想到了,有可能實(shí)現。DNA計算已經(jīng)演示了簡(jiǎn)單的邏輯操作,最近的許多結果也表明DNA作為檔案存儲器和納米結構自組裝的數字媒介具備潛力。對研究人員來(lái)說(shuō),生物科技產(chǎn)業(yè)推動(dòng)的DNA操縱技術(shù)所取得的進(jìn)展使得體系結構研究人員認為,使用生物是可行的。除了DNA,還有諸如蛋白質(zhì)等其他生物分子能夠用于計算,這些生物分子工程在過(guò)去十年進(jìn)步顯著(zhù)。
機器學(xué)習作為核心負載
機器學(xué)習正在改變我們實(shí)現應用的方式。硬件性能提升使得機器學(xué)習應用于大數據成為可能。
機器學(xué)習在過(guò)去十年中取得了長(cháng)足的進(jìn)步,產(chǎn)生了很多長(cháng)期以來(lái)只存在于科幻小說(shuō)里的應用?梢哉f(shuō),這一進(jìn)步在很大程度上受益于豐富的數據和強大的計算能力。大規模機器學(xué)習應用也促進(jìn)了存儲系統和專(zhuān)用硬件(GPU, TPU)等的設計。
盡管目前的重點(diǎn)是支持云端的機器學(xué)習,但是在諸如智能手機和超低功耗傳感器節點(diǎn)等低功耗設備中支持機器學(xué)習應用也有非常重要的機會(huì )。幸運的是,許多機器學(xué)習內核具有相對規整的結構,能夠在準確率和資源需求之間進(jìn)行權衡。因此,它們適用于專(zhuān)用硬件、重構和近似計算等技術(shù),為體系結構的創(chuàng )新開(kāi)啟了新空間。
機器學(xué)習從業(yè)者在計算上花費相當長(cháng)的時(shí)間用于模型訓練。即便使用超大規模的計算集群,花費一星期到一個(gè)月來(lái)訓練一個(gè)模型也是普遍的。雖然這樣的計算資源投資能夠分攤到對模型多次調用,但模型較長(cháng)的更新迭代周期可能會(huì )對用戶(hù)體驗產(chǎn)生負面影響。因此,對體系結構研究人員來(lái)說(shuō),設計能更好地支持機器學(xué)習模型訓練的系統是一個(gè)新的機遇。
【計算機架構未來(lái)面臨的挑戰】相關(guān)文章:
招聘發(fā)展面臨的挑戰10-24
CFO面臨著(zhù)轉型挑戰05-12
企業(yè)中層管理面臨哪些挑戰09-22
中國學(xué)生面臨新SAT挑戰09-12
秒殺系統架構分析09-22
華為認證架構介紹10-03
智慧健康系統架構09-01
什么是系統架構師-如何成為系統架構師08-10
濕地資源面臨的問(wèn)題08-17