米樂m6網址:多核芯片性能顯著改善:科學家設計硬件加速核間通信
作者:米樂發布時間:2025-02-09
(圖片來源于:Christine Daniloff/麻省理工學院)
引言
摩爾定律正走向失效,計算機芯片性能進一步提高面臨挑戰。然而,多內核技術,可提高單芯片并行處理能力,改善其性能。但是,多個內核間的通信和協同工作,一直影響多核芯片性能的關鍵因素。最近,研究人員研發了一種新方法,使用硬件協調多個處理器內核,顯著加速核間通信,改善整體性能。
摩爾定律和多核技術
摩爾定律正走向終結
1971年,英特爾推出的全球第一顆通用型微處理器4004,由2300個晶體管構成。當時,公司的聯合創始人之一戈登摩爾(Gordon Moore),就提出每過18個月,芯片上可以集成的晶體管數目將增加一倍。這就是著名的“摩爾定律”。
隨著芯片上集成的晶體管數增多,運芯片的運算速度即主頻則越快。但是,隨著主頻接近4GHz,計算機性能提高的瓶頸出現了:單純提升主頻,無法顯著提高系統整體性能。另外,隨著主頻的提高,發熱的問題也更加突出,處理器可靠性也受到巨大影響。正如IntelligentThings在多篇文章中所提及的,“摩爾定律”正在走向終結。
多核技術及應用
然而,多核技術的出現,給人們“柳暗花明又一村”的感覺。所謂的多核即多個內核,是指一個芯片處理器中集成兩個或者多個完整內核。單芯片通過集成多個內核,可以提高執行程序并行性。多個內核并行執行代碼,可提高主頻,降低功耗。所以,各大芯片廠家例如英特爾、AMD、ARM、高通、華為等等,紛紛推出了它們各自的多核處理芯片。
(圖片來源于:維基百科)
之前,IntelligentThings也介紹過一款具有1000個內核的處理器芯片(點此閱讀),這款芯片由加州大學戴維斯分校電子和計算機工程系團隊開發,最大計算速率達每秒1.78萬億次指令,包含6.21億個晶體管。
(圖片來源: Andy Fell/加州大學戴維斯分校)
多核間的通信成為瓶頸
但是,多核技術相對于單核技術來說,性能的提高并“不是”核與核簡單的加法:即64核芯片的性能是單核芯片的64倍。整體性能,除了單純依靠核的數量增多外,還涉及到因素很多,然而主要是可編程性,因為實際利用多核處理器處理程序時,面臨并行計算,內核執行的程序需要進行核之間的數據共享與同步,從而設計到多核間通信問題。
共享內存方法的缺陷
隨著多核系統內核的增加,核間(C2C)通信越來越多地影響到芯片整體性能提高。傳統的內核間通信,是通過分享內存的辦法進行。然而,分享內存的通信方式,會帶來相干性失效和緩存遺漏,同時需要巨大的性能和網絡開銷。雖然,之前IntelligentThings也在《新的芯片Swarm:讓并行編程更簡單》(點此閱讀)一文介紹過一款Swarm芯片,通過設計“布隆過濾器”(一種硬件電路),實現事務性內存機制,解決共享內存遇到的問題,保證多處理器并行運行且相互不沖突,有序更新共享內存位置的數據,避免多任務之間的沖突。
軟件隊列加大時間開銷
許多重要的工作任務,都需要C2C通信,并且會增加運算開銷。線程運行在不同的內核上,多內核之間的任務協同,需要通過軟件隊列收發軟件命令來進行,從而增加了通信負擔和時間開銷。
新方法
簡介
北卡羅萊納州立大學和英特爾公司的研究人員一起開發了一種新方法,通過內置的硬件取代軟件指令,協調多個處理器內核的操作,顯著地加速核間通信。
CAF
北卡羅來納州立大學電子與計算機工程系的教授,這項論文的合著者Yan Solihin稱這種方法為“核間通信加速框架”(CAF),可以將通信性能提高2到12倍。換句話說,從開始到結束的執行時間,可以快2倍或者更多米樂m6網址。
QMD

CAF設計的關鍵,就是隊列管理器(QMD),這是一種附著于芯片處理器網絡上的一種小型設備。OMD能夠進行簡單的計算,有效的處理核間通信請求,而無須依賴軟件例程。因為它可以進行基本計算,QMD可用于聚合來自多核的數據,將一些基本計算的功能加快15%。
后續研究
研究人員目前正在繼續開發一種芯片上的設備,可以加速更多基于多內核的計算。米樂M6
論文和研究團隊
這項論文,題為:“CAF:核間通信加速框架”,將發表于9月11日至15日,在以色列海法召開的并行體系結構和編譯技術第25界年度會議上。論文首席作者是北卡羅來納州立大學的前博士生Yipeng Wang,合著者包括英特爾公司的Ren Wang、Andrew Herdrich 、James Tsai。
參考資料
【1】https://news.ncsu.edu/2016/09/hardware-boosts-core-to-core-communication/
更多內容,請關注微信公眾號:IntelligentThings