首個(gè)基于RISC-V的HPC集群
意大利E4ComputerEngineering公司可能大多數(shù)人都沒有聽過,但他們與EVIDEN合作打造的LEONARDO系統(tǒng),卻是目前世界上排名第6的超算電腦。
他們認(rèn)為RISC-V是近十年來相對較新的架構(gòu),但隨著越來越多的廠商推出帶有矢量拓展的核心,并基于此打造出了量產(chǎn)落地的處理器,他們也開始探索RISC-V在HPC上的可行性。
于是,他們基于SiFive的HiFiveUnmatched開發(fā)板,打造成了首個(gè)基于RISC-V的HPC集群,MonteCimone。HiFiveUnmatched搭載的是SiFive的FreedomU740SoC,集成了4個(gè)U74CPU核心,而每個(gè)MonteCimone刀片服務(wù)器都搭載了兩塊HiFiveUnmatched開發(fā)板。
他們從2021年就開始這一項(xiàng)目,將其作為RISC-V在HPC應(yīng)用上的試驗(yàn)床。而如今他們在MonteCimone第二版上,選擇了基于算能的SG2042硬件,開展新一輪的測試與驗(yàn)證。
SG2042,RISC-V在HPC領(lǐng)域的新秀
盡管Esperanto推出了搭載了千核的RISC-V芯片,但其主要定位是AI加速器,且目前并沒有太多公開的硬件落地。反倒是算能推出的SG2042,作為已經(jīng)實(shí)際商用落地的首個(gè)高核心數(shù)RISC-VSoC,在Milk-V等公司的推動下,已經(jīng)有不少主機(jī)搭載了這一高性能處理器,上文提到的MonteCimonev2就是典例。
發(fā)布于2022年末的SG2042,集成了64個(gè)平頭哥的C920RISC-VCPU核心,CPU主頻達(dá)到2.0GHz。其支持0.71版本的矢量拓展,L1、L2與LLC緩存分別為4MB、16MB、64MB,最高可擴(kuò)展256GB的DDR4內(nèi)存。超強(qiáng)的性能,以及120W的TDP,使其成了業(yè)內(nèi)首個(gè)服務(wù)器級別的RISC-VCPU處理器。
Milk-V基于這一SoC,推出了評估板、主機(jī)、2U服務(wù)器以及16U集群等各種硬件,算能也將50份主機(jī)捐獻(xiàn)給了RISC-V基金會。不過算能并不打算止步于此,今年Q1,他們計(jì)劃發(fā)布最新的SG2044SoC。
SG2044將支持Vector1.0擴(kuò)展和平頭哥的Matrix擴(kuò)展,并將64核CPU主頻提升至2.5GHz,并通過LPDDR5x和PCIe5.0,把帶寬進(jìn)一步擴(kuò)大到300GB/s。甚至SG2044計(jì)劃將支持70億參數(shù)的Llama7B,并做到40Token/s的生成速度。
寫在最后
盡管RISC-V在HPC領(lǐng)域的創(chuàng)新突破令人期待后續(xù)的發(fā)力,但在實(shí)際的商用項(xiàng)目中,我們還是要對這未來可能會出現(xiàn)的轉(zhuǎn)變提出疑問,比如考慮在HPC負(fù)載中,RISC-V相比別的架構(gòu)能提供哪些優(yōu)勢?基于RISC-V的AI加速器又能不能在未來超算系統(tǒng)的構(gòu)建中,成為用上最先進(jìn)技術(shù)的架構(gòu)?
這些都是HPC相關(guān)研究人員必須去考慮的問題,在各個(gè)廠商的不懈努力下,在RISC-V硬件上運(yùn)行一個(gè)HPC節(jié)點(diǎn)已經(jīng)相當(dāng)容易了,但HPC是一個(gè)尤其講究優(yōu)化的任務(wù),無論是架構(gòu)、軟件還是指令集上的優(yōu)化,都能顯著改善其運(yùn)行效率,而其他架構(gòu)已經(jīng)有了多年的歷史經(jīng)驗(yàn),RISC-V在這方面還需要迎頭趕上。