據(jù) HuggingFace 報道,Meta AI 近日發(fā)表論文,推出了一個名為 FoleyGen 的音頻生成系統(tǒng)。
FoleyGen 利用現(xiàn)成的神經(jīng)音頻編解碼器在波形和離散標(biāo)記之間進(jìn)行雙向轉(zhuǎn)換。音頻標(biāo)記的生成由單個變換器模型完成,該模型以從視覺編碼器中提取的視覺特征為條件。
VGGSound 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明, FoleyGen 在所有客觀指標(biāo)和人類評估方面都優(yōu)于以前的系統(tǒng)。

文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實(shí)、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計劃發(fā)布會。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。