本報(bào)記者 梁傲男
近日,在新一代計(jì)算標(biāo)準(zhǔn)工作委員會(huì)主辦的“新一代計(jì)算產(chǎn)業(yè)大會(huì)”上,中科馭數(shù)(北京)科技有限公司(以下簡稱“中科馭數(shù)”)CEO鄢貴海帶來題為《數(shù)據(jù)處理器(DPU)構(gòu)建新一代AI網(wǎng)絡(luò)的優(yōu)勢與關(guān)鍵技術(shù)》的主題報(bào)告。
“之前我們做過一個(gè)比喻:如果把CPU比做大腦、那么GPU就好比是肌肉,DPU是神經(jīng)中樞。CPU承載了應(yīng)用生態(tài),決定了計(jì)算系統(tǒng)是否可以通用;GPU提供了大量不同精度要求的算力,決定了系統(tǒng)是否有足夠的‘力量’;DPU負(fù)責(zé)數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。”鄢貴海表示。
他認(rèn)為,隨著人工智能的快速發(fā)展,傳統(tǒng)計(jì)算架構(gòu)已經(jīng)無法滿足海量數(shù)據(jù)的處理需求,基于DPU高速網(wǎng)絡(luò)的新一代計(jì)算架構(gòu)成為提升效能的關(guān)鍵。DPU通過卸載GPU的計(jì)算負(fù)擔(dān)、優(yōu)化數(shù)據(jù)預(yù)處理、加速通信和存儲(chǔ)任務(wù),正成為大模型訓(xùn)練和推理的重要助力。
鄢貴海提到,DPU從誕生之初,就帶著網(wǎng)絡(luò)基因,并且天生傾向于通過數(shù)據(jù)加速處理來優(yōu)化系統(tǒng)的性能,通過全棧協(xié)議支持對CPU屏蔽網(wǎng)絡(luò)的多樣性和網(wǎng)絡(luò)傳輸天然的不可靠性。當(dāng)前國際上DPU的代表性廠商有AMD、NVIDIA、Intel、Marvell等,這些廠商都把DPU當(dāng)作一條重要的產(chǎn)品線來對待。但凡之前涉及高速網(wǎng)絡(luò)業(yè)務(wù)的廠商,大都會(huì)斥巨資投入DPU的研發(fā)或并購DPU。
當(dāng)前,中科馭數(shù)聚焦于高速網(wǎng)絡(luò)數(shù)據(jù)處理芯片的研發(fā),旨在解決計(jì)算節(jié)點(diǎn)間遠(yuǎn)程資源訪問本地化、硬件資源虛擬化、數(shù)據(jù)安全內(nèi)聯(lián)化、系統(tǒng)運(yùn)維一體化過程中所面臨的挑戰(zhàn)。
隨著AI時(shí)代對算力的爆發(fā)式需求,通用計(jì)算、智能計(jì)算、高性能計(jì)算走向融合,在平臺(tái)層面云原生疊加上AI原生,使得對網(wǎng)絡(luò)的核心需求已經(jīng)不僅是互聯(lián)互通,而是網(wǎng)絡(luò)與計(jì)算一體化、即“算網(wǎng)融合”發(fā)展。DPU在繼承傳統(tǒng)網(wǎng)卡功能的基礎(chǔ)上,承載AI原生和云原生衍生的核心需求,以極高的性價(jià)比和網(wǎng)絡(luò)線速處理能力來解決數(shù)據(jù)傳輸帶寬、延遲、運(yùn)維、安全等核心問題。
為了適應(yīng)并推動(dòng)計(jì)算機(jī)體系結(jié)構(gòu)的變革,中科馭數(shù)自主研發(fā)了通用DPU的芯片架構(gòu),在繼承傳統(tǒng)網(wǎng)絡(luò)處理器的基礎(chǔ)上創(chuàng)新了針對AI和云原生場景下的低時(shí)延、高帶寬屬性和靈活的應(yīng)用卸載能力,其傳輸層兼容以太網(wǎng),可以平滑切入廣泛的應(yīng)用場景,基于DPU芯片開發(fā)了面向四個(gè)場景的產(chǎn)品線。
一是符合行業(yè)標(biāo)準(zhǔn)的高性能網(wǎng)卡,特點(diǎn)是通用性,為國產(chǎn)的高端服務(wù)器提供能媲美英偉達(dá)和英特爾的同類高性能網(wǎng)卡產(chǎn)品,并針對國產(chǎn)CPU進(jìn)行深度優(yōu)化。當(dāng)前主力產(chǎn)品是FlexFlow 2200T。
二是面向金融行業(yè)的超低時(shí)延網(wǎng)卡和超低時(shí)延計(jì)算開發(fā)平臺(tái),特點(diǎn)是亞微秒級的回環(huán)時(shí)延,為電子交易場景提供極致的數(shù)據(jù)鏈路,產(chǎn)品性能對標(biāo)證券期貨行業(yè)內(nèi)主流使用標(biāo)桿Solarflare的方案,當(dāng)前主力產(chǎn)品是Swift 2200N、2502N、NDPP X500、X1100、X3000。
三是面向云原生網(wǎng)絡(luò)的數(shù)據(jù)流卸載的網(wǎng)卡,特點(diǎn)是靈活的數(shù)據(jù)流處理,包括高效的流表卸載、虛擬轉(zhuǎn)發(fā)卸載、Hypervisor卸載等靈活的功能,相當(dāng)于在服務(wù)器側(cè)的網(wǎng)卡上“再生”一個(gè)輔助專用服務(wù)器。當(dāng)前主力產(chǎn)品是Conflux 2200E、2200P。
四是面向AI集群的后端網(wǎng)絡(luò)網(wǎng)卡,特點(diǎn)是支持Scale-Out的高性能RDMA網(wǎng)卡和支持Scale-Up的高性能網(wǎng)卡,前者兼容RoCE協(xié)議,后者將支持基于各種GPU構(gòu)造算力的超節(jié)點(diǎn)。當(dāng)前主力產(chǎn)品是FlexFlow 2200R。
據(jù)記者了解,以上產(chǎn)品傳輸數(shù)據(jù)帶寬覆蓋25G、40G、100G、200G,同時(shí)兼容X86平臺(tái)和國產(chǎn)主流CPU和操作系統(tǒng),可廣泛適用于云數(shù)據(jù)中心、智算中心、金融計(jì)算、5G邊緣計(jì)算、高性能計(jì)算、高速存儲(chǔ)等場景。
鄢貴海提到,目前,中科馭數(shù)的部分產(chǎn)品競爭力已經(jīng)可以與國外產(chǎn)品對標(biāo),甚至在一些細(xì)分場景上還有優(yōu)勢,但必須承認(rèn)整體競爭力與國外廠商還有一定差距。從整體市場趨勢看,需求側(cè)將會(huì)持續(xù)強(qiáng)勁,中科馭數(shù)有望在這個(gè)階段抓住機(jī)會(huì),實(shí)現(xiàn)跨越式發(fā)展。
(編輯 張昕)
衛(wèi)星通信萬億賽道起飛,手機(jī)直連時(shí)代開啟
衛(wèi)星通信管理制度及政策法規(guī)進(jìn)一步完善……[詳情]
版權(quán)所有《證券日報(bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注