數(shù)字人主播和數(shù)字人模特的發(fā)展速度超乎想象。
據(jù)中商產(chǎn)業(yè)研究院預(yù)計(jì),2030年中國(guó)數(shù)字虛擬人整體市場(chǎng)規(guī)模將超過(guò)2700億元,其中身份型數(shù)字人約1747億元占比達(dá)65%;服務(wù)型數(shù)字人約955億元,占比達(dá)35%,市場(chǎng)發(fā)展空間廣闊。
在電商行業(yè),數(shù)字人的應(yīng)用已經(jīng)初見(jiàn)成效。京東戰(zhàn)報(bào)顯示,今年618,言犀虛擬主播開(kāi)播商家數(shù)較去年11.11增幅近5倍,其成交額環(huán)比去年11.11提高246%。
尤其值得關(guān)注的是數(shù)字人在跨境電商領(lǐng)域的應(yīng)用。從歐美到東南亞,全年無(wú)休的AI數(shù)字人,可以為企業(yè)節(jié)約傳統(tǒng)外模拍攝所需的大量人力、物力和資金。對(duì)于有大量SKU的企業(yè)來(lái)說(shuō),AI模特還能通過(guò)自動(dòng)化和計(jì)算機(jī)生成的方式,快速呈現(xiàn)不同的產(chǎn)品和款式,大幅提升企業(yè)營(yíng)銷(xiāo)效率。
例如,這是易點(diǎn)天下憑借剛剛發(fā)布的AIGC數(shù)字營(yíng)銷(xiāo)平臺(tái)——KreadoAI的數(shù)字人視頻生成能力,為某知名旅行類(lèi)APP做的數(shù)字人視頻。
值得思考的是,盡管AI技術(shù)在語(yǔ)音合成、人臉生成和動(dòng)作模擬等方面取得了一定的進(jìn)展,但要實(shí)現(xiàn)高度逼真、自然流暢的虛擬形象仍然存在挑戰(zhàn)。特別是在情感表達(dá)、細(xì)節(jié)準(zhǔn)確性和真實(shí)感方面,技術(shù)的成熟程度仍有待進(jìn)一步提高。
AI數(shù)字人背后的技術(shù)成熟度究竟如何?我們特別邀請(qǐng)易點(diǎn)天下技術(shù)中心總經(jīng)理秦鵬,為我們分享了當(dāng)前AI主播和AI模特技術(shù)的挑戰(zhàn)與發(fā)展方向,以及易點(diǎn)天下剛剛發(fā)布的AIGC數(shù)字營(yíng)銷(xiāo)創(chuàng)作平臺(tái)——KreadoAI在解決跨境電商營(yíng)銷(xiāo)痛點(diǎn)方面的實(shí)戰(zhàn)方法。
AI主播如何適應(yīng)文化差異進(jìn)行個(gè)性化表達(dá)?
對(duì)于AI主播的帶貨效果,不同商家有不同看法。一些商家認(rèn)為,AI主播的確可以降低直播成本,解決場(chǎng)地和場(chǎng)景的問(wèn)題,提高直播效率。在做跨境電商時(shí),同一位AI主播可以同時(shí)說(shuō)著印尼語(yǔ)、泰語(yǔ)、英語(yǔ),出現(xiàn)在不同的直播間。
但面對(duì)出海市場(chǎng),AI主播和真人主播一樣,都要面臨不同國(guó)家和地區(qū)的語(yǔ)言及文化差異,包括使用怎樣的語(yǔ)音、語(yǔ)調(diào)、語(yǔ)速才能更貼合本土喜好,如何準(zhǔn)確地使用俚語(yǔ)而不會(huì)引發(fā)誤會(huì)等。同時(shí),情感上的連接和共鳴對(duì)于消費(fèi)者的購(gòu)買(mǎi)決策至關(guān)重要,而目前的多數(shù)AI主播在情感表達(dá)和人性化方面還存在不足,普遍存在“話(huà)術(shù)太假太套路”、缺乏感染力等問(wèn)題。
針對(duì)AI主播的個(gè)性化表達(dá)問(wèn)題,秦鵬分享了易點(diǎn)天下KreadoAI數(shù)字人模塊的技術(shù)研發(fā)思路:“我們將AI主播的音頻分為四個(gè)維度:語(yǔ)種、音色、語(yǔ)速和間隔、語(yǔ)調(diào)。其中最影響情感表達(dá)的是音色。我們會(huì)使用一些外部的大模型或接口,結(jié)合此前的經(jīng)驗(yàn)積累,找出最匹配的音色。”
除了口播之外,KreadoAI的數(shù)字人模塊還支持1:1真人數(shù)字分身克隆和語(yǔ)音聲紋克隆。用戶(hù)只需提交五分鐘的拍攝畫(huà)面,即可創(chuàng)建定制化的1:1真人數(shù)字人分身,代替自己出鏡;還可以提交五分鐘的原音頻,復(fù)刻本人的音色和音律。值得一提的是,語(yǔ)音克隆之后,還可以切換多國(guó)語(yǔ)言,同時(shí)依然保持整體音源的特征。這些能力都可以增加AI主播的個(gè)性化表達(dá)。
與此同時(shí),AI主播的個(gè)性化表達(dá)也與AI文案生成能力密切相關(guān)。AI主播“話(huà)術(shù)太假太套路”的問(wèn)題,也是因?yàn)楝F(xiàn)有的訓(xùn)練數(shù)據(jù)往往存在樣本不平衡、數(shù)據(jù)質(zhì)量差、領(lǐng)域局限等問(wèn)題,導(dǎo)致生成的文案缺乏多樣性和個(gè)性化,總是呈現(xiàn)出類(lèi)似的模式和套路。
“這方面的效果差異,一方面來(lái)自于基礎(chǔ)大模型本身,另一方面來(lái)自于提示詞的能力。”秦鵬介紹,為解決這個(gè)問(wèn)題,易點(diǎn)天下在數(shù)字人的提示詞中設(shè)置了大量營(yíng)銷(xiāo)文案輸入,幫助用戶(hù)優(yōu)化文案的邏輯結(jié)構(gòu)。“我們還利用多年來(lái)對(duì)垂直行業(yè)的理解和豐富的營(yíng)銷(xiāo)服務(wù)數(shù)據(jù),包括廣告文案內(nèi)容、營(yíng)銷(xiāo)轉(zhuǎn)化歸因數(shù)據(jù)和廣告投放數(shù)據(jù)等,進(jìn)行語(yǔ)義分析和模型訓(xùn)練,將不同地域的多語(yǔ)種內(nèi)容分析與本地化文化特色相結(jié)合,最終生成個(gè)性化的營(yíng)銷(xiāo)文案。”
“目前,我們?cè)谏搪谩⑴嘤?xùn)和企業(yè)服務(wù)這三個(gè)領(lǐng)域,生成文案的直接應(yīng)用率能達(dá)到85~90%。而在應(yīng)用下載領(lǐng)域,它的直接應(yīng)用率大約在50~60%,因?yàn)檫@個(gè)領(lǐng)域需要更多‘標(biāo)題黨’,而AI目前還沒(méi)發(fā)完全滿(mǎn)足,我們也在持續(xù)的訓(xùn)練過(guò)程中。”
各行各業(yè)需求不同,如何打造“懂行”的數(shù)字人?
不同行業(yè)對(duì)于數(shù)字人的形象、聲音和表達(dá)方式的要求都各有差異。而通用的數(shù)字人未必能完全掌握這些行業(yè)特定的要求,導(dǎo)致表現(xiàn)失真或無(wú)法達(dá)到預(yù)期效果。
例如,在時(shí)尚行業(yè),數(shù)字人如果在形象上缺乏時(shí)尚感和個(gè)性,在表達(dá)上缺乏對(duì)時(shí)尚潮流的理解,就會(huì)影響營(yíng)銷(xiāo)效果;在餐飲行業(yè),數(shù)字人如果不能生動(dòng)描述食物的口感,在微表情與語(yǔ)調(diào)上不能呈現(xiàn)品嘗美食后的愉悅,就會(huì)導(dǎo)致內(nèi)容缺乏可信度。
為此,KreadoAI與各行各業(yè)企業(yè)展開(kāi)合作,深入了解不同行業(yè)的需求,并開(kāi)發(fā)了針對(duì)性的數(shù)字人形象和驅(qū)動(dòng)技術(shù)。目前,KreadoAI已經(jīng)打造出100多個(gè)全球不同地域、膚色、風(fēng)格的數(shù)字人,每一個(gè)都經(jīng)過(guò)特別訓(xùn)練,保證他們的口型、表情、情感表達(dá)等效果都盡可能最優(yōu),且能滿(mǎn)足各行各業(yè)的不同需求。
這樣一來(lái),客戶(hù)在實(shí)際使用時(shí),只需從這100多位數(shù)字人形象中進(jìn)行篩選,再?gòu)?40多種多國(guó)語(yǔ)言、400多種不同行業(yè)的人物音色中選擇目標(biāo)語(yǔ)種,即可快速獲得離自己需求最接近的數(shù)字人。
“我們內(nèi)部有超過(guò)150名設(shè)計(jì)師,持續(xù)地進(jìn)行創(chuàng)意產(chǎn)出和創(chuàng)意迭代。因此,跟其他家單純做數(shù)字人的企業(yè)相比,我們有更多持續(xù)的創(chuàng)意源輸入、數(shù)據(jù)結(jié)果的輸出和模型的調(diào)優(yōu),來(lái)保證這些數(shù)字人的形象、肢體動(dòng)作更符合客戶(hù)的營(yíng)銷(xiāo)訴求。”秦鵬介紹,“未來(lái),我們也會(huì)通過(guò)聯(lián)合創(chuàng)新,進(jìn)行更細(xì)致的數(shù)據(jù)整理,再利用像Amazon SageMaker平臺(tái)的訓(xùn)練能力對(duì)模型進(jìn)行調(diào)優(yōu)。我們希望未來(lái)可以從100多個(gè)數(shù)字人發(fā)展到1000個(gè)、10000個(gè)。”
據(jù)統(tǒng)計(jì),在營(yíng)銷(xiāo)視頻場(chǎng)景中,通過(guò)KreadoAI的多語(yǔ)種數(shù)字虛擬人創(chuàng)作,使用者可以將視頻制作效率從此前的12小時(shí)/個(gè)縮短至6-8分鐘/個(gè)。借助自研的數(shù)字人物庫(kù),KreadoAI能夠?yàn)槿蚩蛻?hù)提供符合其需求的人物形象和口型驅(qū)動(dòng)。同時(shí),結(jié)合Amazon Polly服務(wù)提供的多語(yǔ)言、高質(zhì)量自然人聲,這些數(shù)字人視頻能夠呈現(xiàn)出逼真的效果,迅速傳播于電商、游戲直播等領(lǐng)域,為觀眾提供本地化的沉浸式體驗(yàn)。
在KreadoAI過(guò)去幾個(gè)月的產(chǎn)品測(cè)試階段,易點(diǎn)天下邀請(qǐng)了全球多個(gè)國(guó)家與地區(qū)的很多中小企業(yè)、創(chuàng)意設(shè)計(jì)公司、KOL、自媒體工作者和AIGC的愛(ài)好者進(jìn)行體驗(yàn)和使用。在YouTube和B站上,KreadoAI相關(guān)的自媒體創(chuàng)作視頻均有超過(guò)十萬(wàn)+播放量的視頻。
“在阿里巴巴、攜程、BIGO、Habby等出海客戶(hù)的營(yíng)銷(xiāo)創(chuàng)新測(cè)試中,相較于其他的素材類(lèi)型,帶真人或數(shù)字人的創(chuàng)意營(yíng)銷(xiāo),平均投放時(shí)間增加了1.5倍,素材的點(diǎn)擊率、視頻的轉(zhuǎn)化率、播放時(shí)長(zhǎng)等數(shù)據(jù)都有20%以上的提升。”秦鵬分享。
亞馬遜云科技:KreadoAI背后的核心動(dòng)力
當(dāng)前市場(chǎng)中,摩拳擦掌進(jìn)軍數(shù)字人領(lǐng)域的不在少數(shù),而強(qiáng)有力的AI技術(shù)支撐是數(shù)字人行業(yè)發(fā)展的關(guān)鍵。一個(gè)數(shù)字人背后的AI技術(shù),包括自然語(yǔ)言處理、語(yǔ)音識(shí)別、文字分析等等。不同公司的AI模型的訓(xùn)練數(shù)據(jù)量、模型性能和響應(yīng)速度也會(huì)不同。這些差異都會(huì)直接影響數(shù)字人最終的呈現(xiàn)效果。
易點(diǎn)天下的KreadoAI,背靠的是亞馬遜云科技所驅(qū)動(dòng)的生成式人工智能技術(shù)。
整個(gè)KreadoAI的核心產(chǎn)品服務(wù)包含四大模塊,AI數(shù)字人是其中之一。另外三個(gè)模塊分別是AI模特、AI工具,以及針對(duì)AI創(chuàng)意資產(chǎn)的智能管理和AI分析。
其中,AI模特與AI數(shù)字人一樣,在電商行業(yè)具有廣泛的應(yīng)用價(jià)值。以往,一些跨境電商為降低海外模特成本,已開(kāi)始嘗試使用AI模特。但現(xiàn)有市場(chǎng)上的AI模特在面部表情、動(dòng)作流暢性和細(xì)節(jié)還存在一些不足。對(duì)于服裝、化妝品等商品來(lái)說(shuō),AI模特在還原真實(shí)色彩和細(xì)節(jié)方面也有一定限制。
為此,KreadoAI專(zhuān)設(shè)AI模特模塊,利用生成式AI技術(shù)訓(xùn)練了大量的營(yíng)銷(xiāo)素材和數(shù)據(jù)模型。通過(guò)這些工具,使用者能夠快速創(chuàng)建具有不同地域、膚色、年齡和表情等特征的數(shù)字人形象,制作視效逼真的商品圖和廣告物料。這些數(shù)字人視頻能夠媲美棚拍,適用于櫥窗圖、商品詳情頁(yè)、廣告投放等多個(gè)電商應(yīng)用場(chǎng)景。目前,KreadoAI已覆蓋了假發(fā)、服裝和眼鏡等細(xì)分行業(yè)。
“借助AI模特生產(chǎn)工具,電商客戶(hù)的海外營(yíng)銷(xiāo)成本大幅降低,素材出圖時(shí)間從3至5天縮短至1至2小時(shí)。以前使用外模的單張照片成本就要百元左右,現(xiàn)在有了AI模特,電商素材生產(chǎn)的成本降低50%。某假發(fā)客戶(hù)使用AI模特,點(diǎn)擊率提升了35%,單次點(diǎn)擊成本降低了45%。此外,KreadoAI的算法研發(fā)團(tuán)隊(duì)正在不斷調(diào)優(yōu)和定制化算法和模型,準(zhǔn)備將AI模特拓展到更多的電商領(lǐng)域,如家居生活、3C電子、護(hù)膚美妝和珠寶首飾等。”秦鵬說(shuō)。
KreadoAI之所以能實(shí)現(xiàn)如此高效的AIGC研發(fā),得益于亞馬遜云科技提供的彈性算力支持與托管式機(jī)器學(xué)習(xí)服務(wù)。
早在2014年,易點(diǎn)天下就開(kāi)始采用亞馬遜云科技的云基礎(chǔ)設(shè)施為智能營(yíng)銷(xiāo)業(yè)務(wù)提供支持,并在每個(gè)季度獲得亞馬遜云科技提供的新技術(shù)培訓(xùn),獲取應(yīng)用構(gòu)建過(guò)程中問(wèn)題的指導(dǎo)。
現(xiàn)在,利用亞馬遜云科技的云基礎(chǔ)設(shè)施,KreadoAI在構(gòu)建模特解決方案時(shí)選擇了Amazon EC2和Amazon EKS進(jìn)行站點(diǎn)托管和預(yù)處理服務(wù),在后端則使用Amazon SageMaker運(yùn)行模型訓(xùn)練任務(wù)和異步推理,并將素材和結(jié)果存儲(chǔ)在Amazon S3中。這樣,電商客戶(hù)可以通過(guò)Amazon Route 53和Amazon CloudFront獲得低延遲的訪(fǎng)問(wèn)體驗(yàn)。
“KreadoAI目前已實(shí)現(xiàn)對(duì)AIGC領(lǐng)域文本、圖片、視頻、創(chuàng)意的全面覆蓋。我們通過(guò)產(chǎn)品系統(tǒng)化來(lái)推動(dòng)創(chuàng)作效率的提升,降低整體的制作成本。與其他AIGC產(chǎn)品相比,我們的優(yōu)勢(shì)在于將AI技術(shù)、服務(wù)解決方案的場(chǎng)景及營(yíng)銷(xiāo)數(shù)據(jù)實(shí)現(xiàn)了閉環(huán),通過(guò)持續(xù)的反饋和迭代,快速實(shí)現(xiàn)整個(gè)數(shù)據(jù)鏈路的增長(zhǎng)飛輪。”秦鵬介紹。
結(jié)語(yǔ)
可以預(yù)見(jiàn),隨著技術(shù)的不斷進(jìn)步,數(shù)字人將不斷精進(jìn)與完善。想象一下,在未來(lái)的電商平臺(tái),數(shù)字人主播和模特不僅可以按照預(yù)設(shè)的文本進(jìn)行口播,而且可以與用戶(hù)進(jìn)行實(shí)時(shí)互動(dòng),展示商品、提供購(gòu)物建議。無(wú)論用戶(hù)來(lái)自世界的哪個(gè)角落,都能享受到本地化的服務(wù),感受到真實(shí)的情感共鳴。這將推動(dòng)電商行業(yè)走向更加全球化、多樣化的發(fā)展,為消費(fèi)者帶來(lái)更便捷和更有趣的購(gòu)物體驗(yàn)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫(xiě)實(shí)、二次元、插畫(huà)、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類(lèi)型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類(lèi)強(qiáng)勁的市場(chǎng)需求。