為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

最近 ARM 指令集相容處理器占據不少新聞版面,除了千呼萬喚始出來、預定兩年內完全取代英特爾處理器的 Apple Silicon,再來就是引起不少討論、先後在 2019 年 11 月 Green500 和 2020 年 6 月 Top500 奪下榜首的日本理化學研究所超級電腦「富岳」(富士山的別稱)的關鍵技術核心:Fujitsu A64FX 處理器。
為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

整體來看,無論從哪個角度觀察,這應該是目前最高階的 ARM 指令集相容處理器了。

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

其實 Fujitsu 早在 2018 年夏天的處理器業界盛事 IEEE HotChips 30,就公開 A64FX 的技術細節(其中部分內容更在 4 月就先行披露),本質算是「電腦的語言」指令集架構從 SPARC-v9 轉換成 ARM-v8.2-A 的 SPARC64fx 處理器(因衍生於高階伺服器專用的 SPARC64,也繼承了諸多類似特色,如大型主機等級的資料可用性),採用台積電 7 奈米製程生產,主記憶體使用近來因高階繪圖晶片逐漸普及的 HBM2,和運算核心由台積電的 2.5D 封裝 CoWos 技術包成一顆,毋需外部的記憶體顆粒。

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

講更精確點,Fujitsu A64FX 是「針對超級電腦量身訂做的 ARM 指令集系統單晶片」(System-on-Chip,SoC),其概念更可追溯於 2004 年 11 月,一舉趕下雄踞「世界最強超級電腦王座」超過兩年半(2002 年 3 月到 2004 年 11 月)地球模擬器(Earth Simulator)的 IBM BlueGene/L,體積僅有容納 1,024 個運算節點和 8TB 主記憶體的 16 座機櫃,反觀地球模擬器動用 640 個運算節點,總共 5,120 顆 NEC SX-6 向量處理器和 10TB 主記憶體,多達 320 座運算機櫃,彰顯了追求建造速度的獨到思維與異質功能融合的潛在威力。

後來勞倫斯利佛摩國家實驗室(Lawrence Livermore National Laboratory,LLNL)的 BlueGene/L 持續擴充到 104 座機櫃(478TeraFlops,峰值 596TeraFlops),2008 年 6 月被同樣出自 IBM 的洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory,LANL)的 Roadrunner 超越,穩占 Top500 首位長達 3 年半之久。後者是人類史上第一台效能達 1PetaFlops 的超級電腦。

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

那年剛好微處理器論壇(Microprocessor Forum)首次在台灣舉辦(新竹煙波大飯店),IBM 也在活動議程裡,充分闡述 BlueGene/L 的技術細節與設計理念,筆者有幸坐在台下躬逢其盛,富岳和 Fujitsu A64FX 則讓筆者回憶起歷歷在目的往事。

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

於「日用品」堆砌超級電腦以外的另類系統單晶片路線

「世界最快的超級電腦」不但是國家科技能力的重大象徵,更是科技強權之間的國力較量,根據國家的 Top500 進榜數與總效能「圓餅圖」,比重與趨勢或多或少反映了國家的影響力。前述的富岳超級電腦,相關費用總計 1,300 億日圓,其中 1,100 億日圓由日本納稅人買單,日本政府「宣揚國威」的強烈動機,不言可喻。

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

為了超級電腦而生的系統單晶片:從 IBM BlueGene_L 到 Fujitsu A64FX

自從個人電腦與叢集運算環境(Cluster)普及後,超級電腦業界逐漸從特別客製化且量少價昂向量處理器、系統控制與記憶體晶片,朝向採用市售的「日用品」(Commodity)或系出同源的衍生產品(如 nVidia 的高階運算用 GPU),除了降低購置與維護成本,亦可進一步提高超級電腦的可靠性與可用性。

最新科技新聞
人氣科技新聞
行動版 電腦版