本報訊 (記者李喬宇)
8月11日,昆侖萬維科技股份有限公司(以下簡稱“昆侖萬維”)SkyWorkAI技術(shù)發(fā)布周正式啟動。8月11日至8月15日,公司每天發(fā)布一款新模型,連續(xù)五天,覆蓋多模態(tài)AI核心場景的前沿模型。
截至目前,昆侖萬維已經(jīng)發(fā)布SkyReels-A3、Matrix-Game2.0、Matrix-3D、SkyworkUniPic2.0、SkyworkDeepResearchAgent模型。8月15日,昆侖萬維正式上線MurekaV7.5模型。至此,昆侖萬維SkyWorkAI技術(shù)發(fā)布周完美收官。
MurekaV7.5在中文歌曲上的演繹再上新臺階,不僅實現(xiàn)了中文歌曲音色、演奏技法的大幅提升,還完成了中文歌曲咬字與情感表現(xiàn)提升。
首先,基于對中文曲風和元素的強大理解,Mureka的理解模型對傳統(tǒng)民歌、戲曲到經(jīng)典華語流行金曲乃至當代民謠音樂擁有深刻認知。這種在中文音樂多樣性與文化特性上的深度積累,使模型在理解和生成中文音樂時,能夠更準確地傳達其特有的藝術(shù)神韻和情感色彩。
其次,為了進一步提升生成音樂中人聲表現(xiàn)的真實性與情感深度,昆侖萬維針對歌曲特點優(yōu)化了ASR技術(shù),使之成為理解模塊的有力延伸。這項技術(shù)深入到演唱的微觀層面,不僅精準識別唱詞,更能通過分析真實演唱中的氣息運用、情感起伏和唱法細節(jié),智能劃分出符合演唱規(guī)律的樂句,并確定自然的換氣與停頓位置。結(jié)合同樣精準的樂段識別,顯著提升了生成人聲的段落清晰度與結(jié)構(gòu)真實感。
同時,在語音模型方向上,昆侖萬維語音團隊推出MoE-TTS——首個基于MOE的角色描述語音合成框架。
MoE-TTS創(chuàng)新性地結(jié)合預訓練大語言模型(LLM)文本能力與語音專家模塊(SpeechExpertModules),為文本與語音分別配置專用專家模塊,并在Transformer核心結(jié)構(gòu)中引入模態(tài)路由,確保各模態(tài)獨立優(yōu)化、互不干擾。
(編輯 張明富)
2025陸家嘴論壇6月18日正式啟幕……[詳情]
12:02 | 良信電器上半年營業(yè)收入同比增長16... |
12:02 | 寶豐能源:上半年凈利潤同比大增73... |
12:00 | 獅頭股份戰(zhàn)略轉(zhuǎn)型人工智能賽道 并... |
11:56 | 天潤科技上半年營收同比增長超五成... |
11:56 | 思特威上半年營收凈利雙增 加強多... |
11:56 | 圓通東方天地港航空貨站區(qū)土建工程... |
11:55 | 合康新能2025上半年營收利潤雙高增... |
11:55 | 商業(yè)化進程加速 迪哲醫(yī)藥上半年營... |
11:55 | 博騰股份上半年凈利潤扭虧為盈 |
11:51 | 贛鋒鋰業(yè)上半年同比大幅減虧 鋰電... |
11:43 | 祥源文旅上半年營收凈利雙增 持續(xù)... |
11:43 | 汽車、摩托車銷量增長 千里科技上... |
版權(quán)所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注