據(jù)Gantise投研分析師的研究報(bào)告指出,中國(guó)的數(shù)字人市場(chǎng)正處于快速增長(zhǎng)階段。2023年時(shí),市場(chǎng)規(guī)模已經(jīng)接近200億元人民幣,預(yù)計(jì)到2027年這一規(guī)模將突破1000億元人民幣,顯示出高達(dá)60%的復(fù)合年增長(zhǎng)率。這種迅猛的增長(zhǎng)勢(shì)頭反映了區(qū)塊鏈、物聯(lián)網(wǎng)以及虛擬現(xiàn)實(shí)等關(guān)鍵技術(shù)的不斷發(fā)展,這些技術(shù)被視為構(gòu)建元宇宙的重要基礎(chǔ)設(shè)施。AR/VR設(shè)備作為進(jìn)入元宇宙的關(guān)鍵硬件,隨著其便攜性和用戶體驗(yàn)的不斷提升,預(yù)計(jì)到2027年,相關(guān)設(shè)備的市場(chǎng)規(guī)模將達(dá)到2500億元人民幣。這表明隨著硬件技術(shù)的進(jìn)步,越來越多的人將能夠以更加便捷的方式接入元宇宙,享受其中的各種服務(wù)和體驗(yàn)。數(shù)字人有望在宇宙失重地區(qū)、高寒缺氧地區(qū)和不便長(zhǎng)期居留地區(qū)等場(chǎng)景中替代真人進(jìn)行任務(wù)執(zhí)行。上海一站式數(shù)字人直播系統(tǒng)
虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語音生成、動(dòng)畫生成、音視頻合成顯示、交互等5個(gè)模塊構(gòu)成。非交互型數(shù)字人,系統(tǒng)依據(jù)目標(biāo)文本生成對(duì)應(yīng)的人物語音及動(dòng)畫,并合成音視頻呈現(xiàn)給用戶。交互型數(shù)字人,智能驅(qū)動(dòng)型數(shù)字人:通過智能系統(tǒng)自動(dòng)讀取并解析識(shí)別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語音與動(dòng)作來使數(shù)字人跟用戶互動(dòng)。真人驅(qū)動(dòng)型數(shù)字人:真人根據(jù)視頻監(jiān)控系統(tǒng)傳來的用戶視頻,與用戶實(shí)時(shí)語音,同時(shí)通過動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶進(jìn)行交互。山西數(shù)字人模特?cái)?shù)字人的培養(yǎng)需要結(jié)合大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)。
AI數(shù)字人還要通過機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等技術(shù),實(shí)現(xiàn)數(shù)字人的自主學(xué)習(xí)和優(yōu)化。機(jī)器學(xué)習(xí)是一種用數(shù)據(jù)進(jìn)行模型訓(xùn)練和預(yù)測(cè)的技術(shù),包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等類型;強(qiáng)化學(xué)習(xí)是一種用環(huán)境反饋進(jìn)行模型學(xué)習(xí)和決策的技術(shù),包括策略梯度、值函數(shù)、深度強(qiáng)化學(xué)習(xí)等方法。機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)在決策能力方面有著重要的作用,但也存在一些問題,例如數(shù)據(jù)稀疏、信號(hào)延遲、泛化能力等。為了解決這些問題,研究者提出了許多基于深度學(xué)習(xí)的機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)方法,例如基于卷積神經(jīng)網(wǎng)絡(luò)或循環(huán)神經(jīng)網(wǎng)絡(luò)的特征提取,基于注意力機(jī)制或變換器的序列建模,基于元學(xué)習(xí)或多任務(wù)學(xué)習(xí)的遷移學(xué)習(xí)。這些方法可以實(shí)現(xiàn)更高效、更適應(yīng)性的模型訓(xùn)練和預(yù)測(cè),以及跨領(lǐng)域和跨任務(wù)的模型應(yīng)用。
而對(duì)于早些進(jìn)入人們眼簾的AI數(shù)字人,今年相對(duì)熱度沒那么高。從2021年元宇宙帶火數(shù)字人,將數(shù)字人推向創(chuàng)新的風(fēng)口后,這幾年數(shù)字人的應(yīng)用并沒有得到普遍的普及。一方面是由于數(shù)字人需要基于頂端的適配設(shè)備,二是數(shù)字人的實(shí)際制作成本偏高。目前應(yīng)用較多的當(dāng)屬短視頻數(shù)字人,被應(yīng)用于直播帶貨和短視頻IP分身。就目前整個(gè)數(shù)字人而言,數(shù)字人的形象也是參差不齊。有的形象太假,有的場(chǎng)景單一,整體運(yùn)營(yíng)成本普遍偏高,目前主要應(yīng)用在一些頭部企業(yè)。虛擬偶像數(shù)字人的更新和變換形象能夠持續(xù)吸引粉絲的關(guān)注和支持。
產(chǎn)業(yè)鏈上游:包括形象設(shè)計(jì)、內(nèi)容策劃、建模、引擎、動(dòng)捕、渲染、交互技術(shù)、邊緣計(jì)算、智能算力、機(jī)器視覺、深度學(xué)習(xí)等領(lǐng)域相關(guān)企業(yè);產(chǎn)業(yè)鏈中游:涉及到AI 類廠商、垂直虛擬廠商、互聯(lián)網(wǎng)技術(shù)廠商、XR/CG 廠商等設(shè)計(jì)服務(wù)相關(guān)企業(yè);產(chǎn)業(yè)鏈下游:泛娛樂的傳媒、游戲、影視、體育、文博、零售、金融、教育、醫(yī)療類等應(yīng)用數(shù)字人技術(shù)的相關(guān)企業(yè);專業(yè)服務(wù)類:為數(shù)字人企業(yè)提供產(chǎn)業(yè)服務(wù)、知識(shí)產(chǎn)權(quán)服務(wù)、技術(shù)服務(wù)等相關(guān)專業(yè)機(jī)構(gòu)。產(chǎn)業(yè)鏈向上游延伸,主動(dòng)掌握前瞻性技術(shù)領(lǐng)域的主動(dòng)權(quán),是確保產(chǎn)業(yè)鏈完整性、穩(wěn)定性和競(jìng)爭(zhēng)力的關(guān)鍵,只有支撐產(chǎn)業(yè)發(fā)展的底層技術(shù)實(shí)現(xiàn)進(jìn)展,技術(shù)應(yīng)用才能向前奔跑。產(chǎn)業(yè)鏈向下游延伸,進(jìn)入市場(chǎng)拓展和應(yīng)用環(huán)節(jié),以上中游企業(yè)創(chuàng)新促進(jìn)下游應(yīng)用,以下游應(yīng)用的需求促進(jìn)技術(shù)發(fā)展,有利于形成產(chǎn)業(yè)可持續(xù)發(fā)展的良性循環(huán)。社交平臺(tái)數(shù)字人通過智能算法和用戶數(shù)據(jù)分析,為用戶提供個(gè)性化推薦和社交互動(dòng)。虛擬教師數(shù)字人參考價(jià)
數(shù)字人的可塑性可以讓其迅速適應(yīng)不同的業(yè)務(wù)需求。上海一站式數(shù)字人直播系統(tǒng)
數(shù)字人的發(fā)展也帶來了許多商業(yè)機(jī)會(huì)。目前,許多公司已經(jīng)開始在數(shù)字人技術(shù)方面進(jìn)行投資和開發(fā),例如亞馬遜的Alexa和蘋果的Siri等數(shù)字助手,以及韓國(guó)的Miquela和日本的Imma等數(shù)字藝人。預(yù)計(jì)數(shù)字人市場(chǎng)規(guī)模將會(huì)在未來幾年內(nèi)不斷擴(kuò)大,并為相關(guān)產(chǎn)業(yè)帶來巨大的商業(yè)價(jià)值。盡管數(shù)字人技術(shù)的應(yīng)用前景廣闊,但也需要注意一些潛在的風(fēng)險(xiǎn)和挑戰(zhàn)。例如,數(shù)字人的出現(xiàn)可能會(huì)導(dǎo)致虛擬和現(xiàn)實(shí)之間的界限進(jìn)一步模糊,引發(fā)更多的道德和隱私問題。此外,數(shù)字人技術(shù)的發(fā)展還需要更多的人才和技術(shù)支持,以確保數(shù)字人技術(shù)的可持續(xù)發(fā)展。上海一站式數(shù)字人直播系統(tǒng)