全球Av一区二区|婷婷五月丁香社区亚洲中文字幕在线观看|欧美高清日韩xxxx在线观看|五月天这里只有精品|真人九七,毛片亚洲国产高潮不卡|亚洲精品家庭乱伦|67194最新地址|国产一区视频97在线|91网站在线播放|国产在线免费观看黄色三级网站

證券日?qǐng)?bào)微信

證券日?qǐng)?bào)微博

您所在的位置: 網(wǎng)站首頁(yè) > 會(huì)議活動(dòng) > 正文

存力中國(guó)行暨先進(jìn)存力AI推理工作研討會(huì)在京順利召開(kāi)

2025-11-07 15:02  來(lái)源:證券日?qǐng)?bào)網(wǎng) 

    本報(bào)記者 許林艷

    11月4日,由中國(guó)信息通信研究院組織召開(kāi)的“存力中國(guó)行暨先進(jìn)存力AI推理工作研討會(huì)”在北京順利召開(kāi)。本次會(huì)議深入探討了AI時(shí)代下先進(jìn)存力賦能AI大模型發(fā)展的支撐作用。

    中國(guó)信息通信研究院首席專家石友康出席研討會(huì)并致辭,中國(guó)信息通信研究院云大所總工程師郭亮主持。中國(guó)移動(dòng)云能力中心項(xiàng)目總師周宇,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線戰(zhàn)略與業(yè)務(wù)發(fā)展部總裁王旭東,北京硅基流動(dòng)科技有限公司解決方案總監(jiān)唐安波發(fā)表主題演講。

    研討會(huì)上,中國(guó)信息通信研究院首席專家石友康深刻闡述了當(dāng)前AI規(guī)?;瘧?yīng)用推進(jìn),推理環(huán)節(jié)的成本、效率、質(zhì)量問(wèn)題凸顯,先進(jìn)存力成為提升AI推理效能、控制成本的關(guān)鍵。當(dāng)前,國(guó)家高度重視先進(jìn)存力發(fā)展,在《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》等政策中明確提出“加速存力技術(shù)研發(fā)應(yīng)用”“持續(xù)提升存儲(chǔ)產(chǎn)業(yè)能力”“推動(dòng)存算網(wǎng)協(xié)同發(fā)展”,為產(chǎn)業(yè)發(fā)展指明了方向。中國(guó)信息通信研究院在政策研究、標(biāo)準(zhǔn)制定、測(cè)試服務(wù)等方面開(kāi)展多項(xiàng)工作,并聯(lián)合產(chǎn)業(yè)鏈企業(yè)成立“算力產(chǎn)業(yè)發(fā)展方陣先進(jìn)存力AI推理工作組”,同時(shí)提出了三點(diǎn)建議:鼓勵(lì)前沿存儲(chǔ)技術(shù)研發(fā)創(chuàng)新,推動(dòng)存算運(yùn)深度融合,加強(qiáng)存算協(xié)同產(chǎn)業(yè)生態(tài)建設(shè),呼吁業(yè)界同仁凝聚共識(shí),共同推動(dòng)我國(guó)存算協(xié)同發(fā)展。

    周宇分享了面向推理的存儲(chǔ)技術(shù)趨勢(shì)與實(shí)踐,圍繞推理挑戰(zhàn)、存儲(chǔ)破局及趨勢(shì)判斷展開(kāi)。當(dāng)前推理面臨KV Cache存儲(chǔ)需求升級(jí)、多模態(tài)數(shù)據(jù)協(xié)同、存算協(xié)同帶寬不足、負(fù)載潮汐性及成本控制等挑戰(zhàn)。移動(dòng)云針對(duì)性采用分層緩存調(diào)度、高速數(shù)據(jù)互聯(lián)技術(shù)提升帶寬、多模數(shù)據(jù)專屬存儲(chǔ)與標(biāo)準(zhǔn)化、架構(gòu)池化重組等技術(shù)破局,還通過(guò)高密全閃存儲(chǔ)、數(shù)據(jù)縮減、自研SPU高密服務(wù)器提高存儲(chǔ)效能和降低成本。未來(lái)趨勢(shì)上,移動(dòng)云推動(dòng)存儲(chǔ)從被動(dòng)存儲(chǔ)轉(zhuǎn)向智算協(xié)同,分階段落地高密全閃存儲(chǔ)、數(shù)據(jù)高速互聯(lián)、存算一體等技術(shù),長(zhǎng)遠(yuǎn)構(gòu)建池化多體存儲(chǔ)體系,同時(shí)強(qiáng)調(diào)技術(shù)整合與生態(tài)協(xié)同。

    王旭東介紹了AI時(shí)代,IT基礎(chǔ)設(shè)施能力面臨三大挑戰(zhàn):“管不好”的數(shù)據(jù)、“喂不飽”的算力、“降不下”的成本。推理數(shù)據(jù)來(lái)源多樣難以形成高質(zhì)量、可持續(xù)供應(yīng)的數(shù)據(jù)集,存儲(chǔ)系統(tǒng)的帶寬和IOPS(每秒讀寫(xiě)次數(shù))不足,導(dǎo)致GPU等昂貴算力資源長(zhǎng)時(shí)間空閑。傳統(tǒng)存儲(chǔ)架構(gòu)難以兼顧高吞吐、低時(shí)延及異構(gòu)數(shù)據(jù)融合的需求,造成業(yè)務(wù)發(fā)展瓶頸,阻礙AI應(yīng)用落地。華為針對(duì)AI推理研發(fā)的UCM推理記憶數(shù)據(jù)管理技術(shù)在行業(yè)落地中的核心作用,通過(guò)“集中高質(zhì)數(shù)據(jù)、提速AI訓(xùn)練、優(yōu)化推理效能”三個(gè)角度,打造AI推理加速解決方案。

    唐安波在會(huì)上圍繞大模型推理“推不動(dòng)、推得慢、推得貴”問(wèn)題展開(kāi)分享,硅基流動(dòng)構(gòu)建的AI infra工具鏈,聚焦提升算力利用率。核心推理框架適配100多款開(kāi)源大模型,并通過(guò)公有云服務(wù)平臺(tái)為廣大開(kāi)發(fā)者和企業(yè)提供優(yōu)質(zhì)的大模型服務(wù)。解決方案上,結(jié)合UCM技術(shù)卸載KVCache釋放顯存、提升推理性能,同時(shí)通過(guò)智能網(wǎng)關(guān)進(jìn)一步優(yōu)化流量調(diào)度、彈性擴(kuò)縮容等策略,來(lái)應(yīng)對(duì)高并發(fā)、低延時(shí)、高吞吐、長(zhǎng)上下文等痛點(diǎn),基于存儲(chǔ)的KVCache方案可大幅提升系統(tǒng)吞吐。

    在內(nèi)部研討環(huán)節(jié),參會(huì)專家圍繞算力產(chǎn)業(yè)發(fā)展方陣先進(jìn)存力AI推理工作組下一階段工作建議進(jìn)行研討,中國(guó)移動(dòng)云能力中心、華為、硅基流動(dòng)、浪潮信息、清微智能、東方算芯、智元芯、算苗科技、得一微電子等工作組成員單位參與討論,貢獻(xiàn)實(shí)踐經(jīng)驗(yàn)。存力中國(guó)行暨先進(jìn)存力AI推理工作研討會(huì)的成功舉辦,為存力產(chǎn)業(yè)創(chuàng)新發(fā)展凝聚共識(shí),指明方向。

(編輯 郭之宸)

-證券日?qǐng)?bào)網(wǎng)
  • 24小時(shí)排行 一周排行

版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)

證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。

證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注