全球Av一区二区|婷婷五月丁香社区亚洲中文字幕在线观看|欧美高清日韩xxxx在线观看|五月天这里只有精品|真人九七,毛片亚洲国产高潮不卡|亚洲精品家庭乱伦|67194最新地址|国产一区视频97在线|91网站在线播放|国产在线免费观看黄色三级网站

證券日?qǐng)?bào)微信

證券日?qǐng)?bào)微博

北京人形機(jī)器人創(chuàng)新中心提出具身世界模型WoW

2025-10-20 20:02  來(lái)源:證券日?qǐng)?bào)網(wǎng) 

    本報(bào)訊 (記者賈麗)繼DeepSeek在大語(yǔ)言模型開(kāi)源促進(jìn)行業(yè)發(fā)展后,北京人形機(jī)器人創(chuàng)新中心(以下簡(jiǎn)稱(chēng)“北京人形”)再次打破邊界并開(kāi)源了全新的世界模型架構(gòu),提出了一個(gè)讓機(jī)器人真正“看見(jiàn)、理解并行動(dòng)于世界”的具身世界模型——WoW(World-Omniscient World Model),旨在幫助具身智能機(jī)器人快速學(xué)習(xí)掌握各項(xiàng)技能,助力行業(yè)打造“最好用”的機(jī)器人。一經(jīng)發(fā)布,該模型便受到學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。

    據(jù)介紹,相較于Sora2,WoW具身世界模型在模擬機(jī)器人操作的時(shí)空一致性、物理推理能力方面表現(xiàn)更為出色。這不僅僅是一次視覺(jué)模型的升級(jí),更是一個(gè)融合了視覺(jué)、動(dòng)作、物理感知與推理的統(tǒng)一世界生成框架。它讓AI不再只是“看視頻”或“生成圖像”,而是能通過(guò)交互學(xué)習(xí)世界的物理規(guī)律,實(shí)現(xiàn)在真實(shí)環(huán)境中的自主操作。如果說(shuō)GPT系列讓機(jī)器“讀懂語(yǔ)言”,Sora系列是在“看世界”,那么WoW就是讓機(jī)器人“理解物理世界”,并且給到算法觸摸世界的雙手。創(chuàng)新的技術(shù)架構(gòu)、完全開(kāi)源的策略、完整的工具支持,使得WoW有望成為世界模型領(lǐng)域的“DeepSeek”。

    創(chuàng)新的技術(shù)架構(gòu)體系

    重新定義世界模型能力邊界

    北京人形提出了一個(gè)全新的多模態(tài)大模型框架,將世界生成、動(dòng)作預(yù)測(cè)、視覺(jué)理解和自我反思融合為一個(gè)統(tǒng)一系統(tǒng),成功解決傳統(tǒng)架構(gòu)物理一致性、因果推理和跨本體跨場(chǎng)景跨動(dòng)作泛化方面的局限。

    WoW是一個(gè)融合了感知、預(yù)測(cè)、判斷、反思與行動(dòng)五個(gè)環(huán)節(jié)的具身世界模型。它從真實(shí)的機(jī)器人交互數(shù)據(jù)中學(xué)習(xí),能在已知與未知場(chǎng)景中生成高質(zhì)量、物理一致的機(jī)器人視頻,最終讓想象中的動(dòng)作真正落地于現(xiàn)實(shí)。

    同時(shí),WoW不是在記憶訓(xùn)練場(chǎng)景,而是在學(xué)習(xí)“物理規(guī)律的抽象本質(zhì)”,具備跨機(jī)器人形態(tài)泛化、任務(wù)泛化、場(chǎng)景泛化全方位能力,這類(lèi)“視覺(jué)+物理”的泛化能力,是通向具身智能的關(guān)鍵指標(biāo)。

    WoW具身世界模型遵循SOPHIA范式,讓模型越看越準(zhǔn),越生成越真實(shí)。SOPHIA自反范式是指,業(yè)內(nèi)首次提出SOPHIA框架,讓世界模型“自己教自己”。

    據(jù)了解,WoW具身世界模型可以實(shí)現(xiàn)視頻生成和機(jī)器人動(dòng)作閉環(huán),意味著AI不再停留在“想象中”,而能真正“動(dòng)手”去驗(yàn)證自己的理解,標(biāo)志著真正實(shí)現(xiàn)從生成到執(zhí)行的跨越。

    北京人形提出了專(zhuān)測(cè)“物理一致性與因果推理”的新基準(zhǔn)WoWBench,也是全球首個(gè)針對(duì)具身世界模型的綜合基準(zhǔn),從四大核心維度評(píng)估模型能力——感知理解、預(yù)測(cè)推理、決策與規(guī)劃、泛化執(zhí)行,覆蓋視覺(jué)保真與時(shí)間一致、指令理解與語(yǔ)義正確性、物理與因果推理、規(guī)劃與任務(wù)分解等多個(gè)指標(biāo),采用混合評(píng)測(cè)機(jī)制(專(zhuān)家模型+GPT或精調(diào)VLM+人類(lèi)專(zhuān)家)進(jìn)行評(píng)分,確保模型表現(xiàn)與人類(lèi)認(rèn)知保持一致。

    北京人形開(kāi)源WoW具身世界模型部分模型權(quán)重,大大降低了世界模型研究的入門(mén)門(mén)檻,加速具身智能機(jī)器人走入生活方方面面。

    應(yīng)用前景廣闊

    實(shí)現(xiàn)從技術(shù)到產(chǎn)業(yè)的全面賦能

    北京人形發(fā)布的WoW具身世界模型,以創(chuàng)新的技術(shù)架構(gòu),優(yōu)越的性能表現(xiàn)以及開(kāi)源開(kāi)放合作賦能,助力具身智能機(jī)器人多場(chǎng)景落地。北京人形為世界模型研究提供統(tǒng)一的基準(zhǔn)平臺(tái)和可比較的評(píng)估體系,并將WoWBench基準(zhǔn)和模型開(kāi)源,加速研究進(jìn)展,促進(jìn)科研復(fù)現(xiàn)。

    據(jù)介紹,產(chǎn)業(yè)應(yīng)用層面,一方面WoW具身世界模型可以實(shí)現(xiàn)數(shù)據(jù)遷移與擴(kuò)增,從少量真實(shí)數(shù)據(jù)出發(fā),生成更多合成樣本,完成“想象-生成-再標(biāo)注-遷移”的自循環(huán)過(guò)程,讓AI擁有“自我造數(shù)”能力。

    另一方面,WoW具身世界模型可以從視覺(jué)“想象”中反推真實(shí)可執(zhí)行的動(dòng)作指令,可遷移真實(shí)機(jī)器人本體上執(zhí)行抓取、裝配等各類(lèi)操作任務(wù),使機(jī)器人具備了在復(fù)雜環(huán)境中自主理解與執(zhí)行自然任務(wù)指令的能力。

    此前,北京人形“具身天工Ultra”獲得全球首個(gè)人形機(jī)器人半程馬拉松冠軍,并且采用“全自主”方式在首屆世界人形機(jī)器人運(yùn)動(dòng)會(huì),獲得100米短跑項(xiàng)目的冠軍,成為人形機(jī)器人史上首個(gè)百米“飛人”,充分展示其“最能跑”的領(lǐng)先技術(shù)實(shí)力;基于慧思開(kāi)物平臺(tái)下的具身大小腦協(xié)同,北京人形僅憑天軼2.0一款機(jī)器人,在首屆世界人形機(jī)器人運(yùn)動(dòng)會(huì)一舉斬獲一金三銀一銅的成績(jī)。

    本次WoW具身世界模型的開(kāi)源,進(jìn)一步展現(xiàn)了北京人形在大腦方面的領(lǐng)先實(shí)力,從理解世界到重建世界,WoW具身世界模型讓我們看到人工智能真正成為具身智能體的未來(lái),圍繞“最能跑、最好用”的目標(biāo),北京人形機(jī)器人創(chuàng)新中心將持續(xù)開(kāi)源開(kāi)放,加速具身智能落地應(yīng)用。

(編輯 李家琪 張昕)

-證券日?qǐng)?bào)網(wǎng)
  • 24小時(shí)排行 一周排行

版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)

證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。

證券日?qǐng)?bào)社電話(huà):010-83251700網(wǎng)站電話(huà):010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶(hù)端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注