01
數(shù)字人出現(xiàn)在屏幕中為時不算久,但卻是科技尤其是人工智能時代的代表性應(yīng)用之一。我本人也經(jīng)常用,用了有三四年了,俗務(wù)繁忙時分身乏術(shù),讓數(shù)字人替我出鏡,念念稿子,發(fā)發(fā)視頻,做出來的內(nèi)容像模像樣,蠻稱心的。
「科技就是生產(chǎn)力」這句話在「數(shù)字人」身上盡顯無遺。最近不僅短視頻,連傳統(tǒng)的影視劇也把虛擬角色作為正常的生產(chǎn)環(huán)節(jié)來對待了。數(shù)字人是伴隨著AI的顛覆性科技運動出現(xiàn)的必然結(jié)果。
數(shù)字人也稱虛擬人,亦有人名之為超人類,顧名思義,即指用軟件生成的虛構(gòu)角色或人類。它可以說話、移動、與外界互動,有時還能模擬個性,給人類帶來情緒價值。
![]()
它們?nèi)诤狭酥T如語言模型、語音合成技術(shù)、面部動畫生成、情感交互系統(tǒng)等科技手段,成為一個智能綜合體,發(fā)展日新月異。
如今的數(shù)字人已不再單純地扮演游戲角色。許多數(shù)字人成為了交互式AI代理,應(yīng)用于客戶服務(wù)、直播、教育、娛樂、醫(yī)療保健和社交媒體等領(lǐng)域。
這些數(shù)字人引領(lǐng)著新的敘事構(gòu)建方式,變革了企業(yè)與消費者互動形態(tài),并帶動人類身份在虛擬環(huán)境中呈現(xiàn)方式的革命性飛躍。數(shù)字人遠非傳統(tǒng)聊天機器人的簡單升級,而是連接算法處理的機械效率和生物操作者微妙的情感智能的動態(tài)橋梁。許多人用數(shù)字人作為自己的替身做節(jié)目,已然司空見慣。
如今的數(shù)字人雖然主要出現(xiàn)在屏幕上,但是熟悉汽車生產(chǎn)的人都知道,廠商總是在新車出廠前的安全測試環(huán)節(jié)放置一個虛擬人在駕駛位,以考察不同速度和碰撞下人的受損程度,并改進安全設(shè)置。這也是虛擬人,但不具備說話和交流的功能,還不夠智能化。
02
如今,一切都變了。數(shù)字人的出現(xiàn)并非突然的技術(shù)升級,而是計算機生成圖像和模擬科學幾十年年發(fā)展演變的結(jié)果。數(shù)字人的發(fā)展雖然短暫,也經(jīng)歷了一波三折。
現(xiàn)在讓我們回顧一下它的發(fā)展歷程。它大概經(jīng)歷了四個階段。
第一階段:數(shù)字人出現(xiàn)
1990年代的一些影視劇和游戲場景中出現(xiàn)了最早的模擬人,諸如電子游戲角色、電影角色、虛擬偶像之類。此時這些形象是手動制作的,互動性有限,幾乎沒有人工智能的痕跡和表現(xiàn)力,主要致力于讓圖像和角色更逼真。
第二階段:動作捕捉和實時渲染期
2010年代,在游戲和影視制作上,虛擬人的形象和功能得到了極大提升。一些游戲引擎諸如Epic Games等,能夠使得實時面部渲染成為可能,用戶體驗變得豐富而細微。此時的好萊塢電影和3A級游戲開始使用動作捕捉、面部掃描、數(shù)字替身等,構(gòu)成了復雜而生動的動畫系統(tǒng),但仍然不具備智能化的功能。
第三階段:元宇宙時期
2020年代最初幾年,隨著「元宇宙」浪潮涌現(xiàn),一些企業(yè)設(shè)想人們可以通過虛擬化身進行工作和社交,這樣可以大大節(jié)省開支,搞不好還能提高效率。于是,虛擬網(wǎng)紅數(shù)量激增,有錢的品牌紛紛投入巨資進軍虛擬世界。
這一階段發(fā)生了一件大事,3D虛擬形象社交應(yīng)用ZEPETO的注冊用戶居然超過4億,其中大部分是Z世代用戶。不同以往,他們對社交虛擬化身、虛擬時尚和在線身份很感興趣。與此同時,許多類似的項目失敗,原因在于虛擬現(xiàn)實的硬件普及率不夠,互動體驗比較生硬,更重要的是沒有催生可持續(xù)發(fā)展的盈利模式。
第四階段:人工智能革命帶來的變化
從2023年開始,隨著人工智能的爆炸式發(fā)展,數(shù)字人也隨之突變,各種大型語言模型使數(shù)字人能夠進行有效對話。這不僅讓人們意識到虛擬世界的邏輯演繹力量,也意識到人工智能真得具備了智能化的能力,帶來根本性的變革,從靜態(tài)界面過渡到真正的「數(shù)字人」。
![]()
如今,虛擬化身不再傻呵呵的只能做一些死板的應(yīng)景對話,它們可以自然地回答問題,記住上下文,模擬個性,使用全球不同的語言,實時生成面部表情,滿足對話者的各種需求,不僅是智力的和邏輯的,也包括情感的。有時候,它們甚至為了滿足客戶而撒謊。
這讓數(shù)字人從「動畫玩偶」直接進化為為「交互式人工智能代理」,需求量日益增大。
當前數(shù)字人的組成極為復雜,不僅需要語言模型,還要求人工智能語言合成功能,并且連帶面部的實時動畫跟隨,身體動作也要協(xié)調(diào)跟進,還得有記憶力,辨析力,表達能力,總之它是朝著「交互式智能」的方向發(fā)展,力求能夠發(fā)展個性并適應(yīng)社會環(huán)境。
數(shù)字人在大型公司作為「售后服務(wù)」面貌出現(xiàn)已經(jīng)蔚然成風,你甚至不知道對面跟你通話、解釋問題的人到底是不是真人。有報告估計,在中國如火如荼的電商領(lǐng)域,有超過10萬個虛擬人在工作。
這種虛擬人與真人同時存在的網(wǎng)絡(luò)商業(yè)環(huán)境,也帶來相當多的問題與爭議。
數(shù)字人能夠代替真人的判斷和解決問題的最后權(quán)力是首當其沖的,當發(fā)生紛爭時,到底什么才是有效的,因此也引發(fā)了數(shù)字人的法律責任問題。此外,客戶難免感到數(shù)字人固然反應(yīng)敏捷功能強大,但也情感空洞,具有欺騙性。
另外,人工智能的設(shè)置有討好人類和用戶的傾向,這就為無助和彷徨者陷入機器人的陪伴陷阱無法自拔帶來了隱患。數(shù)字人還威脅實體人類的工作和就業(yè),帶來一系列社會問題。這都是急于解決的現(xiàn)實。
尤其是一些人(無論是否名人)可能被AI學習其面部和聲音系統(tǒng),冒充出現(xiàn)在網(wǎng)絡(luò)上,可能引發(fā)名譽受損、欺詐和操縱的風險,不一而足。
第五階段:未來世界,機器人、數(shù)字人與自然人共存的世界
仔細思考不難發(fā)現(xiàn),越來越智能化的汽車自動駕駛技術(shù)就如同一個虛擬的看不見的數(shù)字人在偷偷操縱著方向盤,它們能夠通過各種傳感器返回的信息解決現(xiàn)實中汽車面對的所有問題。
![]()
這幾乎是一個啟示。它告訴我們,數(shù)字人將全面切入人類的生活場景,并主導許多生活形態(tài)。數(shù)字人或許會出現(xiàn)在醫(yī)療體系、賓館酒店體系、影視劇中、教育培訓市場、博物館講解事務(wù),乃至一切需要綜合和輸出信息的工作崗位上。
屆時,我們將生活在機器人、數(shù)字人和自然人共存的世界中。雖然還不能說這就是硅基世界,畢竟人還是社會目標,但人的比重會降低。
03
總之,數(shù)字人已從科幻電影中像素化的實驗對象,發(fā)展成為全球經(jīng)濟中價值數(shù)十億美元的支柱產(chǎn)業(yè)。其發(fā)展反映了人類對技術(shù)個性化與決策交互人性化的普遍渴望。盡管技術(shù)和法律挑戰(zhàn)依然巨大,但數(shù)字人背后的商業(yè)和發(fā)展勢頭不容忽視。
它們不再是一種模糊的展望,而是清晰的現(xiàn)實。數(shù)字人和人工智能技術(shù)正在重塑21世紀人際互動的形態(tài),不能理解它就不能理解未來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.