NVIDIA:为什么说智能AI算法是数字人的未来?

青亭网( ID:qingtinwang )--链接科技前沿,服务商业创新

不管是在2D还是3D时代,大家对数字人技术应该已经不陌生。目前,这项技术已经广泛应用于媒体、娱乐等领域,比如电影中的CGI角色、游戏中的3D虚拟角色,或是电视节目、演唱会中的AR虚拟偶像等等。

1_aI6OVs2aNryBij1Rvw2cJA

实际上,创建高保真数字人需要大量时间和经历,甚至可能需要数百名艺术家、程序员和工程师参与。此外,尽管3D渲染技术在不断提升数字人的数字效果和细节,人们依然可以清晰分辨它和真人的不同。毕竟人们对于恐怖谷效应非常敏感。

为了简化并加速数字人开发过程,NVIDIA推出了AI虚拟形象工具Omniverse Avatar。NVIDIA表示:我们相信,实现这一目标的关键是人工智能和模拟工具。

0_toTTSi-EVky7jD9V

此外,为了帮助你了解数字人的前景,NVIDIA图形和AI总监Simon Yuen介绍了数字人的定义、重要性基于和AI结合的潜在应用。据青亭我那个了解,Yuen在NVIDIA负责Digital Human相关工作,目标是开发新的角色技术和基于深度学习的解决方案,以便以新的和更有效的方式创建高质量的数字角色。在加入NVIDIA之前,Simon在视觉效果行业工作了超过21年,曾在Method Studios、数字王国、索尼图形图像动作公司、梦工厂、暴雪娱乐等公司负责逼真数字角色创作。

数字人定义

Yuen认为,数字人指的是我们在虚拟世界中的数字表现形式。在3D游戏初期,《VR战士》游戏就展示了玩家用3D角色进行战斗的玩法。如今,《战神》、《最后生还者》等热门游戏中,也能看到许多令人难忘的数字角色。

0_kBvMSWBKQq1xxkj7

基于CGI打造的数字人也可以扮演电影中的角色,比如《复仇者联盟:终局之战》中的灭霸、《本杰明·巴顿》中主角的老年形象。

一些交互式媒体则将数字人与AI结合,利用智能的数字人来讲故事,比如Fable、Baobab等工作室创建的AI数字角色,他们还将这些角色应用于交互式VR内容中。

那么,数字人的定义具体是什么?应该用什么样的指标来分类数字人呢?

数字人通常分为三大标准:1)写实还是风格化;2)实时在线还是离线;3)由AI驱动还是由人驱动。

为数字人注入生命

前面提到,创造数字人需要大量时间和经历。整个过程通常包括三大步骤:生成、加动画和智能系统,而这三个步骤都需要融合不同的艺术和技术元素。

0_J7hXL0eRCNsSAPN9

细节方面,开发者首先需要3D建模,然后渲染纹理、着色、绑定骨架、绑定皮肤变形。在加入动画和动作的时候,开发者需要考虑物理模拟,不管是数字人的四肢、躯干还是面部、头发和衣服,其运动和变化效果应该足够符合物理规律,模拟真实的动作。为了提升数字人运动的准确性,开发者通常采用两种方法:手动制作动画,或是通过动捕技术来获取运动数据。更常见的是两种方法结合。

在过去几年中,越来越多人开始用AI来生成、合成动画,控制数字人的动态行为。常见的AI主要控制数字人的特定行为,随着技术发展,AI数字人的应用场景也越来越广泛,分析环境、上下文的能力也越来越好,因此其移动方式和行为的可信度也更高。另一方面,AI数字人需要能同时识别虚拟环境和现实环境,包括环境中的人、物体等等,目的是更好的导航和交流。

尽管如此,模拟真人情感和行为细节对于数字人来讲仍然困难。如果希望数字人更加智能,将需要支持与真人的双向交互,这是将需要自然语言处理和自然语音技术(Riva、Ensemble AI、Replica等等),才能模拟和真人对话。

数字人的重要性

应用场景方面,数字人可以应用于媒体、娱乐领域,游戏、AR/VR等其他领域对这项技术的需求也在增长,各种案例也足够丰富。

0_drvb9uZxDcPVGI31

比如:AI数字助理在医疗保健、零售等行业已经展现巨大潜力,AI数字助理可以帮助医疗人员改善培训和工作流程。此外,医生可以在保真的虚拟环境中模拟培训,不受时间和地理位置限制,可重复数百次,锻炼肌肉记忆。而在零售业,AI数字人可以为客户带来个性化体验,提升客户服务。

为了更好的服务医疗人员、消费者,AI数字助理需要对语言交流有深刻的理解,才能与人类自然交流,并完成各种任务。

在去年11月的Project Tokkio数字人演示中,NVIDIA CEO黄仁勋展示了AI版的自己(Toy Jensen Omniverse Avatar),这个AI数字人拥有黄仁勋的声音、动态和形象,可以跟专家讨论生物学、气候科学等话题。除此之外,Project Tokkio技术还可以为零售店提供自助服务,为客户提供支持。

0_pCxPVZV_OcJehP-C

而在应用于视频会议的Project Maxine演示中,则展示了一个智能降噪、实时转录、翻译的AI数字形象,其特点是可以模拟说话人的口型和语调。

在建筑和制造等领域,数字孪生技术正在帮助工厂、企业模拟大规模环境(工厂、城市、建筑物等),以及环境中的工作人员。与此同时,在数字人帮助下,企业可以通过准确的模拟来评估风险和预测环境变化,以此来优化建筑的设计。

与语音助手等AI数字助理相比,AI数字人需要达到的标准更高,当置于工厂、摩天大楼虚拟环境中,AI数字人需要模拟工人、游客等人类的行为,在虚拟世界中移动和表现。

toy-jhh

此外,数字人将有助于生成合成的数据,以训练AI模型,比如模拟工厂中工人的行为等等。未来,合成数据将有望成为人工智能发展的关键,因此数字人类在合成模拟领域也足够关键。

随着技术发展,未来数字人将应用在多样化的创意场景,比如AR/VR、线上虚拟模拟、虚拟社交等等。NVIDIA预计,未来每个人都会拥有数字虚拟形象,来代表自己。此外,NVIDIA Omniverse将成为兼容3D行业标准USD格式的虚拟平台,允许各种类型的数字人共存,人们可以通过数字人的形式在Omniverse上交换数据与交流。参考:Medium

更多精彩内容,关注青亭网微信号(ID:qingtinwang),或者来微博@青亭网与我们互动!转载请注明版权和原文链接!
青亭网

微信扫码关注青亭网

青亭网

青亭 | 前沿科技交流群01

责任编辑:hi188
分享到QQ 分享到微信

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录
切换登录

注册