值得買與中國人民大學(xué)高瓴人工智能學(xué)院聯(lián)合取得AIGC研究成果

2025-06-12 13:59 來源：證券日?qǐng)?bào)網(wǎng)

本報(bào)訊（記者桂小筍）6月11日至6月15日，2025國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議（CVPR2025）召開。北京值得買科技股份有限公司（以下簡稱“值得買”）與中國人民大學(xué)高瓴人工智能學(xué)院在多模態(tài)領(lǐng)域的最新聯(lián)合研究成果《圖像轉(zhuǎn)有聲視頻》（《Animate and Sound an Image》）成功入選。

該成果首次提出了一種從靜態(tài)圖像直接生成同步音視頻內(nèi)容的生成框架JointDiT（Joint Diffusion Transformer），實(shí)現(xiàn)了從圖像到“動(dòng)態(tài)視頻+聲音”的高質(zhì)量聯(lián)合生成。這不僅展現(xiàn)了雙方在AIGC領(lǐng)域的技術(shù)創(chuàng)新突破，也為AI多模態(tài)的高質(zhì)量發(fā)展提供了新的思路與啟發(fā)。

據(jù)介紹，《圖像轉(zhuǎn)有聲視頻》首次提出并系統(tǒng)定義了圖像到有聲視頻生成（Image-to-Sounding-Video，I2SV）這一新任務(wù)：讓靜態(tài)圖像“動(dòng)”起來的同時(shí)，生成與之語義匹配、時(shí)間同步的音頻內(nèi)容。同時(shí)還提出了一種新穎的內(nèi)容生成框架JointDiT（Joint Diffusion Transformer），并具體闡述了如何利用兩個(gè)強(qiáng)大的單模態(tài)預(yù)訓(xùn)練擴(kuò)散模型（一個(gè)視頻生成器，一個(gè)音頻生成器），構(gòu)建統(tǒng)一的聯(lián)合生成框架，實(shí)現(xiàn)多模態(tài)協(xié)同生成。

人大高瓴人工智能學(xué)院長聘副教授宋睿華表示：“接下來，研究團(tuán)隊(duì)計(jì)劃將JointDiT擴(kuò)展至圖像、文本、音頻、視頻四模態(tài)的聯(lián)合建模，為構(gòu)建更通用、更智能的多模態(tài)生成系統(tǒng)奠定基礎(chǔ)。”

（編輯何成浩郭之宸）

-證券日?qǐng)?bào)網(wǎng)

熱點(diǎn)新聞

中國資本市場(chǎng)制度型開放邁入系統(tǒng)化加速階段

看好中國股市國際長線資金源源不斷流入

奮力實(shí)現(xiàn)“十五五”良好開局頭部公募勇?lián)姑颉靶隆倍?/a>

一致魔芋：點(diǎn)“土”成“金”

24小時(shí)排行一周排行

深度策劃

衛(wèi)星通信萬億賽道起飛，手機(jī)直連時(shí)代開啟

衛(wèi)星通信管理制度及政策法規(guī)進(jìn)一步完善……[詳情]

市場(chǎng)快訊

23:50	奮力實(shí)現(xiàn)“十五五”良好開局頭部...
23:50	中國資本市場(chǎng)制度型開放邁入系統(tǒng)化...
23:50	前11個(gè)月全國鐵路發(fā)送旅客42.8億人...
23:49	前11個(gè)月我國郵政行業(yè)寄遞業(yè)務(wù)量累...
23:49	四季度以來多份民間資本推介項(xiàng)目清...
23:49	多地布局未來產(chǎn)業(yè)激發(fā)經(jīng)濟(jì)增長新動(dòng)...
23:49	服務(wù)外包提質(zhì)升級(jí)迎政策東風(fēng) 多層...
23:49	看好中國股市國際長線資金源源不...
23:49	上市公司如何加速品牌價(jià)值沉淀
23:49	黃金以舊換新經(jīng)營服務(wù)迎新規(guī)
23:49	多家銀行調(diào)整代理上海黃金交易所貴...
23:49	四川長虹等上市公司跨界掘金飛行汽...

版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證京B2-20250455

京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)

證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考，使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明，風(fēng)險(xiǎn)自負(fù)。

證券日?qǐng)?bào)社電話：010-83251700網(wǎng)站電話：010-83251800

網(wǎng)站傳真：010-83251801電子郵件：xmtzx@zqrb.net