Rhymes AI近日發(fā)布了其革命性文本-圖像到視頻生成模型Allegro-TI2V,這一突破性技術(shù)為數(shù)字內(nèi)容創(chuàng)作開辟了全新的疆界。作為生成式AI的最新進(jìn)展,Allegro-TI2V為創(chuàng)意工作者提供了前所未有的視覺敘事工具,標(biāo)志著AI技術(shù)在創(chuàng)意領(lǐng)域的巨大潛力。
Allegro-TI2V在多個技術(shù)規(guī)格上表現(xiàn)卓越,支持高達(dá)79.2K的上下文長度,相當(dāng)于88幀視頻。其輸出分辨率為720×1280像素,視頻生成速度為每秒15幀,用戶還可以選擇插值至30FPS,以滿足不同應(yīng)用場景的需求。這款模型的架構(gòu)非常復(fù)雜,包含了1.75億參數(shù)的VideoVAE和28億參數(shù)的VideoDiT模型,使其能夠精準(zhǔn)捕捉用戶輸入的文本提示和初始圖像的本質(zhì)。此外,Allegro-TI2V還支持多精度模式(FP32、BF16、FP16),在BF16模式下,生成視頻僅需9.3GB的GPU內(nèi)存,極大降低了硬件需求。
Allegro-TI2V的創(chuàng)新之處在于其引入了兩種全新的生成模式:后續(xù)視頻生成:基于文本提示和初始幀,創(chuàng)建連續(xù)的視頻內(nèi)容。這種模式能夠幫助創(chuàng)作者輕松生成符合設(shè)定主題和風(fēng)格的視頻。中間視頻生成:在給定視頻的首尾幀的基礎(chǔ)上,生成自然過渡的中間幀,打破傳統(tǒng)視頻編輯的時間與空間限制。
這些創(chuàng)新模式使得Allegro-TI2V能夠為創(chuàng)作者提供更高效、更靈活的視頻創(chuàng)作方式,大大提升了創(chuàng)作效率和質(zhì)量。
Rhymes AI在Apache2.0許可下發(fā)布了Allegro-TI2V,使得研究人員、開發(fā)者和內(nèi)容創(chuàng)作者能夠更容易地訪問和使用這一技術(shù)。用戶只需安裝Python3.10+、PyTorch2.4+和CUDA12.4+,便可輕松上手并快速體驗這一先進(jìn)技術(shù)。
Allegro-TI2V的應(yīng)用前景極為廣泛,從電影制作、游戲開發(fā)到數(shù)字藝術(shù)和創(chuàng)意原型,都能充分發(fā)揮其強(qiáng)大的生成能力。根據(jù)開發(fā)者提供的數(shù)據(jù),單個***GPU在約20分鐘內(nèi)即可生成6秒的視頻,而使用8個***GPU配置,生成時間將縮短至3分鐘,顯著提升了視頻內(nèi)容創(chuàng)作的效率。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。