随着ChatGPT爆火,生成式AI算法的突破,使得AIGC(人工智能生产内容)进入应用爆发期,将给元宇宙相关产业链带来全新的想象空间。
近日,天娱数科等多家上市公司宣布,要将ChatGPT与公司虚拟数字人融合,研发出更加智能化、拟人化的虚拟数字人。
作为当前数字技术与文艺创作深度融合的产物,虚拟数字人(或数字人)体现了数字文化新业态、新模式的发展趋势,也打开了网络文艺新媒介产品的审美想象和创新创意空间。
所谓数字人,是指通过计算机图形渲染、动作捕捉、深度学习、语音合成等技术打造的虚拟或仿真人物。自2020年以来,随着资本加速进入数字人市场,促进了技术的快速发展和应用场景的加速探索,现在的数字人技术也在朝着多样化、智能化、便捷化、精细化的方向发展。
据IDC《中国AI数字人市场现状与机会分析,2022》报告显示,中国AI数字人市场规模呈现高速增长趋势,预计到2026年将达到102.4亿元人民币。
然而,透过丰富的“数字人景观”可以发现,令人过目不忘的优质数字人却不多,而一些频繁出场的数字人形象总体上趋向单一化、标签化、扁平化,尚不能清晰传递数字人的功能、内涵及审美。
如何赋予数字人丰富的文化内涵,创造一批兼具中国文化品格和“流量密码”的优质形象,满足人们日益增长的优质数字内容需求,是数字人发展需要思考的问题。
对数字人同样适用的“颜值即正义”
数字人的发展历史由来已久。
早在20世纪80年代,人们就开始尝试将虚拟人物引入到现实世界,比如1982年,世界上第一位虚拟歌姬林明美出现了,虽然当时技术是以传统的手绘为主,但呈示出了虚拟人概念的萌芽。
21世纪初,计算机技术飞速发展,CG(计算机动画)技术和动作捕捉技术发展日益成熟,日本制作了第一个被广泛认可的虚拟偶像——初音未来,对虚拟数字人的探索越来越丰富。
图 | 初音未来
近5年来,随着深度学习的算法取得突破,数字人的制作过程也得到了有效简化。
数字人的制作流程一般包括模型绑定、动作捕捉、动画解算、实时渲染等步骤,其中要运用到大量的现实增强、深度学习等高科技前沿技术。比较简单的动漫形象数字人,一般1个月就能完成;而制作一个超写实的3D数字人,从角色设计到完成渲染需要3至6个月甚至更久。数字人越是精致、逼真,越花费时间、人力和金钱成本。
在数字人的形象表达方面,目前,在大多数VR、游戏、会议等场景中,供应商往往会选择“乐高式卡通”或其他二次元风格的3D模型,如元宇宙第一股Roblox。
哪怕是微软在Ignite大会上引以为傲的虚拟世界项目,也尚且没有涉足到真实形象还原的阶段。恐怖谷效应的存在使得虚拟形象“真人化”的难度极高,除此之外,超高精度的真身复刻3D数字人制作成本高也是一个制约因素,高成本意味着技术供应商很难在短时间内将技术进行商业化落地,更别说使其成为数字资产,打造一个集中的交易平台,去消费与收藏。
时拓智能创始人指出,真身复刻的孪生数字人,可以说是元宇宙的主角,金字塔的顶尖。在所有类型的复刻中,人的构建无疑是最难的,对技术的要求不能与静物相提并论,从皮肤质感,到眼神和面部对于环境的判别,都非常复杂而精细。
时拓智能作为入选上海科创企业上市培育库的数字人企业,选择采用阵列相机结合自主研发LFM技术的方案,通过200余台相机进行光学立体三维建模,模型生成效率被大幅提高,从拍摄到建模完成最快只需要75秒,而目前即使是最先进的手持扫描仪激光点云建模方案,生成一个高清3D模型也需要数天的时间。
图 | 时拓智能旗下阵列相机影棚和数字人建模
在人像真实度上,时拓智能已经聚焦到了“毛孔级别”,一次拍摄可产生12亿像素的数据量,经过拓扑、法线贴图、粗糙度贴图、金属贴图、光线贴图、AO闭环等20余层还原处理,3D模型最高可实现700亿像素,静态模型的分辨率达到6μm(约为头发直径的1/8),远超人眼可分辨的极限。同时,时拓智能的技术支持以每秒60帧的速率捕获3D模型,使得动态模型的分辨率能够突破8K。
数字人的设计制作并非易事,既需要技术支撑,又需要“有趣的灵魂”赋予其文化与内涵。
始于颜值,终于价值
2022年,数字人大量涌现,中国文物交流中心的“文夭夭”、新华网的“筱竹”、浙江卫视的“谷小雨”、敦煌研究院的“伽瑶”、国家博物馆的“艾雯雯”、中华书局的“苏东坡数字人”……他们或化身为文博场所的导游,或成为文化短剧的主角,或担任对外传播的文化大使,以又潮又酷的方式讲述着传统文化的故事。
不难看出,数字人要在弘扬传承中华优秀传统文化方面发挥作用。可以始于颜值,但最后还是要终于价值,因为人们开发数字人,不是为了观赏,而是为了使用。2022年被业界称为“数字人元年”,数字人的相关应用刚刚起步。传统文化领域是应用数字人比较多的领域,且应用场景越来越丰富。
2022年7月,身着汉服的“艾雯雯”在国家博物馆上岗。她穿梭于国博各展厅,为慕名而来的全球游客介绍着国博140多万件馆藏文物。中国文物交流中心的“文夭夭”,除了在各大博物馆提供讲解、导览服务,还担任“文博虚拟新闻官”,经常跟随展览出海,传播中华文化。
图 | 数字人艾雯雯
除了文化价值,数字人的商业价值也不可或缺。
今年2月,涉及数字人业务的企业世优科技、风语筑等均提到正在研发相关技术,试图将数字人接入ChatGPT。
这其中,吸引了大半科技圈关注的是,百度在短短一周时间内,连发四条官方推文,介绍其即将推出中国版“GPT大模型”文心一言。
而发布这条消息的责任编辑,正是百度的希加加、度晓晓等数字人“成员”。数字人和“ChatGPT”的联动,让不少网友期待不已。
据了解,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的近300家头部企业宣布加入百度“文心一言”生态。
图 | 不同类型的虚拟数字人
天娱数科证券部人士认为,AI和数字人结合会成为一种趋势。“聪明且人性化的对话体验,不再只依托于文字,而是以生动形象的数字人形式输出,或将成就AIGC数字人的另一个里程碑。”
不过,业界也有观点认为,当前ChatGPT尚处于发展的早期探索阶段,关键核心技术发展尚不成熟。从数据上来看,目前ChatGPT背后的GPT3.5大模型,参数大概1750亿个,而人脑拥有近1000亿个神经元和100万亿个连接,模型的参数量级还远没有达到人脑的数量级。同时,AIGC模型需要大量数据参与训练,因此对算力基础设施有较高要求。
IDC中国助理研究总监卢言霞指出,当前AI数字人在部分领域已经发挥出明显的商业价值,未来在生活与工作中,将会有大规模的数字人队伍与人类共存。不过,也要理性看待行业发展,尽管目前数字人市场火热,前行仍需脚踏实地。
*声明:本文为MetaPost原创,如需转载请联系我们。未经允许严禁转载,文章版权及最终解释权归MetaPost所有。
图 | 网络