本報訊 (記者梁傲男)7月28日,北京智譜華章科技股份有限公司(以下簡稱“智譜”)發(fā)布新一代旗艦?zāi)P虶LM-4.5,專為智能體應(yīng)用打造的基礎(chǔ)模型。Hugging Face與ModelScope平臺同步開源,模型權(quán)重遵循MIT License。
據(jù)悉,GLM-4.5在包含推理、代碼、智能體的綜合能力達到開源SOTA,在真實代碼智能體的人工對比評測中,實測國內(nèi)最佳。
智譜方面有關(guān)人士表示,衡量AGI的第一性原理,是在不損失原有能力的前提下融合更多通用智能能力,GLM-4.5是智譜對此理念的首次完整呈現(xiàn),并有幸取得技術(shù)突破。GLM-4.5首次在單個模型中實現(xiàn)將推理、編碼和智能體能力原生融合,以滿足智能體應(yīng)用的復(fù)雜需求。

智譜/供圖
記者了解到,為綜合衡量模型的通用能力,智譜選擇了最具有代表性的12個評測基準(zhǔn),綜合平均分,GLM-4.5取得了全球模型第三、國產(chǎn)模型第一,開源模型第一。
在參數(shù)效率方面,GLM-4.5參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項標(biāo)準(zhǔn)基準(zhǔn)測試中表現(xiàn)得更為出色,這得益于GLM模型的更高參數(shù)效率。在衡量模型代碼能力的SWE-benchVerified榜單上,GLM-4.5系列位于性能/參數(shù)比帕累托前沿,表明在相同規(guī)模GLM-4.5系列實現(xiàn)了最佳性能。
在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實現(xiàn)突破,由此帶來遠(yuǎn)低于主流模型定價:API調(diào)用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。同時,高速版本實測生成速度最高可至100 tokens/秒,支持低延遲、高并發(fā)的實際部署需求,兼顧成本效益與交互體驗。
真實場景表現(xiàn)比榜單更重要。為評測GLM-4.5在真實場景Agent Coding中的效果,智譜接入Claude Code與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進行對比測試。測試采用52個編程開發(fā)任務(wù),涵蓋六大開發(fā)領(lǐng)域,在獨立容器環(huán)境中進行多輪交互測試。實測結(jié)果顯示(如下圖),GLM-4.5相對其他開源模型展現(xiàn)出競爭優(yōu)勢,特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間,在大部分場景中可以實現(xiàn)平替的效果。
(編輯 張明富)
衛(wèi)星通信管理制度及政策法規(guī)進一步完善……[詳情]
| 23:50 | 奮力實現(xiàn)“十五五”良好開局 頭部... |
| 23:50 | 中國資本市場制度型開放邁入系統(tǒng)化... |
| 23:50 | 前11個月全國鐵路發(fā)送旅客42.8億人... |
| 23:49 | 前11個月我國郵政行業(yè)寄遞業(yè)務(wù)量累... |
| 23:49 | 四季度以來多份民間資本推介項目清... |
| 23:49 | 多地布局未來產(chǎn)業(yè)激發(fā)經(jīng)濟增長新動... |
| 23:49 | 服務(wù)外包提質(zhì)升級迎政策東風(fēng) 多層... |
| 23:49 | 看好中國股市 國際長線資金源源不... |
| 23:49 | 上市公司如何加速品牌價值沉淀 |
| 23:49 | 黃金以舊換新經(jīng)營服務(wù)迎新規(guī) |
| 23:49 | 多家銀行調(diào)整代理上海黃金交易所貴... |
| 23:49 | 四川長虹等上市公司跨界掘金飛行汽... |
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注