7月11日,2023中國新媒體技術(shù)展在湖南國際會展中心舉行。本屆技術(shù)展以“智慧促深融”為主題,重點聚焦人工智能新技術(shù)新應(yīng)用、智慧媒體服務(wù)社會治理新場景等,呈現(xiàn)新技術(shù)賦能融合發(fā)展新生態(tài)。

會上,騰訊多媒體實驗室展出了自研AI通用作曲框架XMusic,基于AIGC技術(shù),用戶只需上傳視頻、圖片、文字、標(biāo)簽、哼唱等任意內(nèi)容,即可生成情緒、曲風(fēng)、節(jié)奏可控的高質(zhì)量音樂,能夠大幅降低音樂創(chuàng)作的門檻。該產(chǎn)品前幾日首度亮相2023年世界人工智能大會,并被評為“鎮(zhèn)館之寶”,引發(fā)廣泛關(guān)注。
隨時隨地實現(xiàn)AI輔助創(chuàng)作,打造專屬“行走的音樂庫”
在日常生活中,用戶對使用音樂有著多種多樣的需求。比如在視頻剪輯時,需要應(yīng)用多樣的配樂來讓畫面更加生動,但音樂搜索一般只能用歌曲名字、歌手名字等指向性強的信息來搜索,需要耗費大量的時間精力;亦或在商超、會場等場所布置時,傳統(tǒng)的環(huán)境音樂選擇容易受到版權(quán)限制,很難獲得多樣且合法的音樂素材。
面對這些難題,騰訊多媒體實驗室自研AI通用作曲框架XMusic可以隨時隨地利用AI輔助實現(xiàn)音樂創(chuàng)作,打造個人專屬的“行走的音樂庫”。一張圖片、一段文字、一個視頻,甚至是一段哼唱,XMusic都能夠?qū)?yīng)生成出樂曲優(yōu)美連貫、旋律起伏明顯、節(jié)奏強弱交替的高質(zhì)量音樂。比如輸入“逗趣橫生,讓人捧腹大笑”的描述,XMusic就會生成一段節(jié)奏俏皮、旋律歡快的音樂。
對于視頻創(chuàng)作者而言,XMusic無疑是解決配樂難題的一大利器。除此之外,針對互動娛樂、輔助創(chuàng)作、音樂教育、互動娛樂、音樂治療等諸多場景,XMusic也有著很高的實用價值。
以場景音樂生成為例,XMusic的商用級音樂生成能力可以有效解決線下展廳、體驗展、餐廳商超等場景中的環(huán)境音樂版權(quán)問題,為展廳提供多樣化的公播音樂,并在體驗展中融入多種智能音樂方案,提升展廳的科技感和體驗感。

此外,XMusic也可以發(fā)揮重要的教學(xué)輔助能力,推進(jìn)線上音樂教育的發(fā)展。比如在智慧音樂課堂中,教師可以用XMusic生成多樣的節(jié)拍、節(jié)奏、音高練習(xí)曲目,結(jié)合實際教學(xué)場景,發(fā)揮AI生成音樂的教學(xué)輔助能力,為學(xué)生在演奏、練耳等多種場景中提供個性化的指導(dǎo)和訓(xùn)練,幫助學(xué)生更快地提升音樂技能。
全面AIGC能力矩陣支撐,實現(xiàn)音樂高效精準(zhǔn)創(chuàng)作
作為本次技術(shù)展中的亮點之一,XMusic背后的騰訊多媒體實驗室也受到了廣泛關(guān)注,一位熱愛音樂的科學(xué)家,帶領(lǐng)一群同樣熱愛音樂的工程師們從零到一落地了XMusic項目。2019年,騰訊多媒體實驗室負(fù)責(zé)人、騰訊杰出科學(xué)家、IEEE Fellow 劉杉博士帶領(lǐng)實驗室開展“基于多模態(tài)融合的智能內(nèi)容生產(chǎn)”相關(guān)技術(shù)能力研發(fā)并逐步完善AIGC能力矩陣。
騰訊多媒體實驗室自研AI通用作曲框架XMusic,是基于自研的多模態(tài)和序列建模技術(shù),可以將提示詞內(nèi)容解析至符號音樂要素空間,并以此為控制條件引導(dǎo)模型生成豐富、精準(zhǔn)、動聽的音樂,達(dá)到商用級的音樂生成能力要求。
劉杉博士表示,人工智能技術(shù)的飛速發(fā)展對多媒體和相關(guān)領(lǐng)域產(chǎn)生深遠(yuǎn)影響。“騰訊(多媒體實驗室)將繼續(xù)推動人工智能和多媒體及相關(guān)領(lǐng)域的國際和國家標(biāo)準(zhǔn)制定,打造音視頻、互動沉浸和智能媒體核心能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球用戶、助力各行業(yè)發(fā)展并踐行科技向善。”

騰訊多媒體實驗室還在展區(qū)展出前沿技術(shù)方面的三個項目:“全景'云'游東北虎豹國家公園”通過自研技術(shù)智能影像處理和自研VR360解決方案供所有人在“云端”走進(jìn)這片山林秘境;“虛實融合技術(shù)”產(chǎn)品,可將傳統(tǒng)虛擬制片的成本與難度大幅降低,無需傳感器,只通過一臺相機或手機,就可將自己植入到虛擬世界中;“騰訊水墨畫”產(chǎn)品融合了視覺、音樂、文字等多種模態(tài),結(jié)合山水畫創(chuàng)作、智能作詩、音樂生成等多種技術(shù)能力,形成了多模態(tài)融合且能互動娛樂的完整技術(shù)方案。
騰訊多媒體實驗室專注于多媒體和相關(guān)領(lǐng)域的前沿技術(shù)探索、產(chǎn)品研發(fā)和應(yīng)用落地,其行業(yè)領(lǐng)先的視頻圖片壓縮和處理引擎、沉浸式VR系統(tǒng)和智能媒體能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球海量用戶并助力傳媒、文化、旅游等行業(yè)的發(fā)展。同時代表騰訊參與多個國際及國家標(biāo)準(zhǔn)制定,數(shù)十人次擔(dān)任聯(lián)合主席、主編等核心職務(wù),數(shù)百項技術(shù)提案被國際標(biāo)準(zhǔn)采納,榮獲工程艾美獎、技術(shù)盧米埃獎、ISO/IEC杰出貢獻(xiàn)獎等,享有國際盛譽。
未來,騰訊多媒體實驗室將以創(chuàng)新的視角和前瞻的思維,不斷探索多媒體技術(shù)與AIGC能力的融合,拓展多領(lǐng)域的應(yīng)用場景,為用戶提供更加智能、便捷和豐富的多媒體體驗。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。