元宇宙热潮之下,被视为“实现元宇宙的必要元素之一”的虚拟人火了。近两年,国内虚拟人项目呈现井喷态势,IDC 预计,到 2026 年中国 AI 数字人市场规模将达到 102.4 亿元。: W- e; A8 y! g2 B5 W
! e. o. Z4 q. R% w( N% |" S, |/ j" m
作为产业链中偏工具和服务的环节,Cocos 基于沉淀多年的技术能力和与丰富的开发实践经验,致力于为元宇宙世界提供技术平台底座,降低元宇宙内容开发门槛。Cocos 即将发布自研虚拟角色编辑器,为行业提供覆盖虚拟角色创作、使用全生命周期的虚拟角色产品线。 ; G/ _) b, B3 H% {$ f* n* i( U8 [- j- ^4 E
近日,Cocos 虚拟角色项目团队负责人倪飞接受了 InfoQ 的专访,详细介绍了 Cocos 在虚拟角色构建上的技术创新以及应用落地实践。以下为正文。5 z4 X/ W. F! f) W% f H; B (, 下载次数: 12)
上传
点击文件名下载附件
8 R* p4 H* S& e4 u4 d
Cocos 入局虚拟数字人 & z" ~0 {7 L+ S! S8 E& p$ y! ^# \2 t3 Q9 r+ L7 S. I
当前,元宇宙的话题度无疑空前高涨,正迅速攀升为顶流概念。 ; q! B% Y! M$ M; X# y5 ^ # d8 @5 j8 h' l7 z \% A) D在不久前 Gartner 发布的 2023 年十大战略技术趋势中,元宇宙技术上榜。Gartner 将元宇宙定义为:由虚拟技术增强的物理和数字现实融合而成的集体虚拟共享空间。" R' Y! t' J* }3 |1 ^) g7 {
+ [- R( b+ q* I) }5 v. ]7 v. n元宇宙火爆之下,虚拟人作为元宇宙的场景入口与连接纽带也备受瞩关注。艾媒咨询发布的《2022-2023 年中国虚拟人行业深度研究及投资价值分析报告》中提到,2020-2021 年,虚拟人相关企业数量逐渐呈现快速增长趋势。 : Q% z( U/ e% `% n+ J: o' r7 V; S8 M0 g' W6 W! P+ Y8 x0 u" Z7 |
目前,海内外的厂商正在加快布局虚拟人赛道,尤其是巨头厂商正在占得先机。, }4 k0 s! F& ?9 G7 X
2 z" C& A) g& F; H
近两年,Cocos 将“触角”延伸到了虚拟角色领域。Cocos CEO 林顺十分看好元宇宙的发展,他认为元宇宙技术带来的颠覆性改革,或许可以媲美上一个软硬结合的划时代发明——互联网。林顺认为,元宇宙有三种呈现形态:虚拟空间、增强现实、平行世界。而不论是哪一种呈现形态,不管是哪一种虚拟世界,都需要一个强大的 3D 技术作支撑。 5 E3 h. A' e* E + S& j C, j) T w X8 Y# I3D 技术正是 Cocos 的擅长领域,Cocos 在该领域已有数年技术积累,凭此入局元宇宙已是水到渠成,Cocos 更是直接成立了虚拟角色项目团队。 + p4 e. E1 m( R $ y, m5 K6 l4 w. M5 x在虚拟数字人产业链中,基础层为其提供必要的软件和硬件支撑;平台层为其制作及开发提供技术,连接技术和服务使之呈现出不同的虚拟人样态;应用层令虚拟数字人在各领域应用实践。3 j5 e* @3 B% V
+ X8 [: p, M0 R
倪飞认为,无论虚拟角色未来会发展成什么样的应用形态,其底层是通用的工具化的能力。像 Cocos 这样长期致力于工具开发和技术能力赋能的厂商,处在虚拟数字人全产业链中偏工具和服务的环节。Cocos 更擅长做工具赋能,将工具做好赋能给第三方厂商使用。 1 r% C' Q1 O0 a : D# A! K( n9 C+ H, w% ?, j如何在低算力终端中运行虚拟角色,是一个十分复杂的难题,需要专业积淀和积累。凭借过往在渲染层、移动端适配、工具化等方面沉淀多年的丰富技术经验,Cocos 试图让这一问题简单化。而这些经验也成为 Cocos 进入虚拟角色领域的底气和优势。6 |2 S f1 {) ~0 ~
/ b4 Y1 F1 D2 p, g
倪飞告诉我们:“面向未来的 3D 化交互,大致分为人、事物、组织在 3D 空间里的活动。Cocos 从发散的数字孪生的逻辑,收敛到数字孪生中的‘人’的部分,我们团队专注于通过虚拟角色构建来推动数字孪生,以及未来面向未来的 3D 交互。” ! v, Q/ P8 Q) S! @% _) u* o 3 ~/ ]% I% `9 l! A R5 ]如何创建一个全周期的虚拟角色? * b. t( W% _ [& _" t# H* G& _ 9 G; x" `/ f6 N6 L1 n基于沉淀多年的引擎底层技术能力和与开发实践经验,Cocos 为开发者提供了多个低门槛、高效率、跨平台的虚拟内容生产工具,降低整个生产链路和实际发布链路的成本和门槛,为行业提供覆盖虚拟角色创作、使用全生命周期的虚拟角色产品线。 6 X% d% |: [( J 5 ?1 |4 P; Q/ W自研多项虚拟角色编辑工具 * E# ~/ a) e- C0 n' B% Z, H' V& O+ [8 r( F( A
如何既能让虚拟角色动起来,又具有性格,且能够跨平台进行交互,具有相当高的技术门槛,Cocos 希望用自身擅长的工具化能力将技术门槛降下来。 2 b8 `( h+ v6 g% Q- Y; I 1 a# _( D1 w$ {% e6 [" f7 _针对虚拟角色制作,目前 Cocos 已自研了 Cocos Creator、Cocos Persona Editor 编辑器、Cocos Avatar SDK 等多款虚拟角色编辑工具。3 b" q. }9 o, Y2 |; Z7 z# P
) l! t9 M1 z7 f* b& f: ~! ACocos 认为,虚拟角色涵盖的范畴大于数字人。目前,整个虚拟角色行业分布的大类是写实、卡通和二次元,其中,写实虚拟数字人是当下的主流方向。倪飞介绍,写实数字人、卡通数字人、二次元数字人等人形的角色都是 Cocos 的工具支持的方向,希望这些工具能够支持美术创作者自定义生产写实类或卡通类、二次元类的虚拟角色。 0 j; T( Q8 P {' c/ g& s. w, \0 _2 J, o5 u! o. T1 e
今年 8 月,Cocos Creator 3.6 正式发布,这一版本被官方称为是 Cocos 近两年来最重要的版本,在画面渲染、性能、原生化、编辑器优化等方面都做了大幅进化。在 3.6 版本中,引擎在 3D & 2D 开发上体验更好、性能更高、效果更出众。: a* O) Y1 D1 i
+ f4 P$ g) R8 v
倪飞介绍,Creator 3.6 版本做了更易用的封装和升级,引入了动画系统,增加了对材质和光照模型进行优化等新功能,这一新版本引擎的发布能够提高虚拟角色的表现效果,让虚拟角色呈现出的光影更加真实。) A' g( H7 _4 `
! v2 M7 Z1 e. ]' a; o/ \目前,Cocos Persona Editor 编辑器,Cocos Avatar SDK 正在紧锣密鼓地开发中,预计不久后将正式推出。2 U: N0 [! T5 b4 K. l
: ^9 J) H! U2 v4 s采访中,倪飞向 InfoQ 透露了上述工具的一些核心功能。Cocos Avatar SDK 的核心逻辑是快速让 B 端用户拥有创建、操作虚拟角色的能力,SDK 已经适配了安卓、iOS、H5、微信小程序/小游戏端,可以直接嵌入到 APP 内,实现流量的闭环,为用户提供更好的体验,据悉目前市场上已经有知名 APP 采用了 Cocos 的这套 SDK 逻辑。7 F* z0 r" D' s9 l
6 \, T3 z- N+ e- r; c. R2 D
Cocos Avatar SDK 最核心的三个特点是高性能、可热更、易使用。它提供了 SaaS 化美术素材托管与热更服,通过对“指定素材的分发、热更 + SDK 展现 + 编辑器快速编辑”的逻辑,Cocos 形成了一个开箱即用的虚拟角色创建、展示能力工具集,不仅能够让传统的软件开发商无需追加 3D 开发人员即可立即拥有虚拟角色的加载、替换、捏脸、换装、插入视频播放、替换 2/3D 背景和场景、3D 空间音频等能力,而且内置动捕、面捕、WAV 口型播报等 AI 能力,能够接收本地/远程的结构化数据,驱动虚拟人进行表情、动作、口型、特效等表演。; V# F8 y- B1 m* x9 h1 G2 j* M. N (, 下载次数: 12)
上传
点击文件名下载附件
Cocos 虚拟角色编辑器预览9 ?2 z6 ~3 e' D" a0 W; Q
Cocos Persona Editor 编辑器的逻辑是,从预制模型到直接输出,内部已预制了多种不同风格的虚拟角色的基础模型,提供了 200 多个参数,包括脸型、服装、道具、妆容、鞋子、配饰等,用户可以通过预设的参数创建虚拟角色。与创建游戏角色的逻辑类似,通过 Cocos Persona Editor 编辑器,用户选择想要的美术风格,选择想要的虚拟角色的类型,再进行捏脸,选择动作、表情等,就可以输出一个虚拟角色。' q/ P% Y j$ C7 Q
# g$ z' U6 Q8 `/ e# J3 @, S* M+ J渲染、AI 接入五大关键技术 ' g- B6 j) s# |# H7 U: z0 k y" t6 Z6 Z% m& D, d$ @! t, @, A
据悉,目前 Cocos 基于虚拟人已实现了建模、口型、动捕、渲染、AI 接入五大关键技术。2 K4 d* Y$ _' e. g
3 \- y, e+ `9 d5 W9 L
高度自定义角色编辑 & AI 建模 / a2 J. [% o; F 9 [2 b# r3 i* ^3 t预置角色模型拥有多达 263 个脸部、身体调节系数,支持用户自主开发独一无二的虚拟形象。同时 AI 建模技术能让用户利用照片快捷生成真人数字化身。 # y6 }2 u. |8 d( }5 h$ i - |/ q8 n d& g: S* C" j0 T实时渲染6 Y- T: s8 U7 \% n) \
$ L% K& @$ g2 t4 X7 Q渲染能力对虚拟角色来说非常重要,这也是 Cocos 引擎所提供的一项基础能力。 " x8 p) S1 Q! }( O' \2 Y; F3 [5 }) A e8 g. ~6 D, @/ _
渲染分非实时渲染和实时渲染两种逻辑。以前影视剧、动画中逼真、漂亮的虚拟角色,大多是离线,非实时渲染出来的,先给虚拟角色做好 3D 模型,再在离线渲染器中渲染出来。这类虚拟角色的存储格式是视频,交互较困难,无法做到和人进行交互。 3 ^9 k" \/ A+ C! j( N7 i3 y& W1 t Q0 k2 E
如果希望虚拟角色能够像真人一样说话,并展现相应的表情和体态动作,让人觉得是舒服、有温度的交流,这就需要有实时渲染的能力。现在大量数字人应用场景里的虚拟助手、身份 IP、偶像 IP 等,都要求虚拟角色被实时渲染出来,且能够被驱动起来,包括脸部驱动、身体、动作、手势驱动等。让虚拟角色在移动端能够跑起来且能够跟人做实时交互,这也需要用较小的算力把虚拟角色渲染出来。此外,在虚拟角色应用的场景里,如在虚拟角色在元宇宙里开会、办公、展览等,这些场景实现都依赖实时渲染能力。 % A; K9 X, V; ?6 g- b& [- l% `( }9 v P" Y+ t. Z, U# x7 M! l
与卡通、二次元类的虚拟角色相比,写实的虚拟角色对渲染管线的要求更高,且需要采用不同的渲染技术,如次表面反射、双向反射分布函数等。Creator 3.6 版本在 3D 画面渲染能力上,重点优化了对 3D 内容非常重要的材质导入功能与渲染算法,包括 Su**ce Shader 自定义材质、CSM 级联阴影、各向异性光照模型、GGX 环境反射卷积图等,以达到更好的渲染效果。( d( L) i0 P! F+ |. z
8 t) f& F% h3 r& o
人物动态捕捉及采集技术 5 L& `/ i- W/ p' T: N2 ]2 d6 K2 x1 |/ _8 r
骨骼动画重定向后能让虚拟人拥有无限的动作表现潜能。一张照片、一段视频,无需专业动捕演员,你的虚拟形象便能拥有精彩的动作表现。- t( @) {& C& k7 t2 o7 e
+ O0 U& \1 Y: ^2 v7 T
Cocos 已经实现了用通用摄像头进行中低精度动作捕捉。基于视觉的动作捕捉分为 TOF、激光、基于 RGB-D 摄像头和直接基于普通的 RGB 的摄像头做形象、图像等信息采集。 , I& d G z) G1 i7 w1 S. M$ s O0 | ` M' q3 R
目前 Cocos 正在尝试通过 RGB-D 的摄像头采集数据进行 AI 训练解决动作捕捉遮挡定位与 3D 空间关系问题。基于 AI 训练能够自动补全视觉当中图像未可见部分的手部、脚部等 3D 空间位置,自动预判躯干前后遮挡关系。 ) l" n1 w( O) n! p: l2 q 3 ?! D' P! h( c, j面部系统捕捉技9 s8 G9 Y1 m) h3 [ ^$ T# V
6 {1 w, o' ^/ Y: l' o
Cocos 实现了高精度实时表情捕捉技术,利用大量视频数据来训练模型,最终产生高质量的连续变形体(Blendshape)权值输出,用于驱动完整的虚拟角色,实时表情捕捉效果与离线效果相近,可实现高精度捕捉。" Q- S# D3 O- `% d
! W8 V) E3 M \$ Q# W, }
基于人工标注的脸部数据、拟真的渲染数据进行机器学习训练,将采集到的语音播报和人脸数据进行学习后,输出学习模型,实现面部捕捉。 * {, ^% U" E3 j$ j+ S [(, 下载次数: 12)
上传
点击文件名下载附件
' }4 y, ^1 ~2 k! a( Q
Cocos 虚拟角色面部捕捉技术演示
口型驱动技术 4 Z! c' v3 K5 d0 X- i' T - K8 ?, i5 I/ i) N& ^7 e语音口型驱动是通过对音频中的音素进行识别,通过大量的数据 AI 训练模型,以 mesh 变换的形式驱动 3D 人物口型,从而达到高拟真语音播报。 1 s# c' F0 U* T9 w' ?1 [, Y4 R( |2 C
AI 骨骼绑定技术 I: n, W n% t- s! c8 G