全球Av一区二区|婷婷五月丁香社区亚洲中文字幕在线观看|欧美高清日韩xxxx在线观看|五月天这里只有精品|真人九七,毛片亚洲国产高潮不卡|亚洲精品家庭乱伦|67194最新地址|国产一区视频97在线|91网站在线播放|国产在线免费观看黄色三级网站

證券日?qǐng)?bào)微信

證券日?qǐng)?bào)微博

您所在的位置: 網(wǎng)站首頁 > TMT頻道 > TMT行業(yè) > 正文

值得買與中國人民大學(xué)高瓴人工智能學(xué)院聯(lián)合取得AIGC研究成果

2025-06-12 13:59  來源:證券日?qǐng)?bào)網(wǎng) 

    本報(bào)訊 (記者桂小筍)6月11日至6月15日,2025國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR2025)召開。北京值得買科技股份有限公司(以下簡(jiǎn)稱“值得買”)與中國人民大學(xué)高瓴人工智能學(xué)院在多模態(tài)領(lǐng)域的最新聯(lián)合研究成果《圖像轉(zhuǎn)有聲視頻》(《Animate and Sound an Image》)成功入選。

    該成果首次提出了一種從靜態(tài)圖像直接生成同步音視頻內(nèi)容的生成框架JointDiT(Joint Diffusion Transformer),實(shí)現(xiàn)了從圖像到“動(dòng)態(tài)視頻+聲音”的高質(zhì)量聯(lián)合生成。這不僅展現(xiàn)了雙方在AIGC領(lǐng)域的技術(shù)創(chuàng)新突破,也為AI多模態(tài)的高質(zhì)量發(fā)展提供了新的思路與啟發(fā)。

    據(jù)介紹,《圖像轉(zhuǎn)有聲視頻》首次提出并系統(tǒng)定義了圖像到有聲視頻生成(Image-to-Sounding-Video,I2SV)這一新任務(wù):讓靜態(tài)圖像“動(dòng)”起來的同時(shí),生成與之語義匹配、時(shí)間同步的音頻內(nèi)容。同時(shí)還提出了一種新穎的內(nèi)容生成框架JointDiT(Joint Diffusion Transformer),并具體闡述了如何利用兩個(gè)強(qiáng)大的單模態(tài)預(yù)訓(xùn)練擴(kuò)散模型(一個(gè)視頻生成器,一個(gè)音頻生成器),構(gòu)建統(tǒng)一的聯(lián)合生成框架,實(shí)現(xiàn)多模態(tài)協(xié)同生成。

    人大高瓴人工智能學(xué)院長(zhǎng)聘副教授宋睿華表示:“接下來,研究團(tuán)隊(duì)計(jì)劃將JointDiT擴(kuò)展至圖像、文本、音頻、視頻四模態(tài)的聯(lián)合建模,為構(gòu)建更通用、更智能的多模態(tài)生成系統(tǒng)奠定基礎(chǔ)。”

(編輯 何成浩 郭之宸)

-證券日?qǐng)?bào)網(wǎng)
  • 24小時(shí)排行 一周排行

版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)

證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。

證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注