通过这项技术,你可以让一个虚拟的3D人物模型模仿真实人的表情和头部动作。
而且这个过程是实时的,通过摄像头输入,当真人改变表情或头部姿势时,3D模型也会立即做出相同的反应。
通俗来说就是:3D变脸术
主要特点:
3D感知一次性头部再现:能够完美复制头部动作和表情,同时保持源图像的身份特征。而且只需要一次性的输入数据。
全息显示:设计允许在全息显示设备上实时渲染头部模型。
多视角渲染:能够同时渲染多达45个不同的视角,适用于需要从多个角度展示头部模型的应用。
高保真度:VOODOO 3D在保持源身份的同时,能够准确再现驱动视频中的表情和动作。
VOODOO 3D技术的实现基于几个关键技术:
1. 3D提升网络(Lp3D)
核心组件:Lp3D是VOODOO 3D中的核心网络,负责处理面部图像。
功能:它将2D面部图像转换成3D辐射场,这是一种三维数据结构,用于表示和存储3D对象的信息。
过程:网络分析面部图像,预测其在三维空间中的外观和结构,从而创建一个详细的3D模型。
2. 体积解耦
技术方法:体积解耦是一种分离和处理不同数据源的技术。
应用:在VOODOO 3D中,它用于区分源图像(原始人物的面部)和驱动视频帧(要复制的表情和动作)。
实现:这项技术将源图像和驱动视频的信息提升到一个共享的3D体积表示中,使得源身份和目标表情可以独立处理。
3. 三平面渲染
控制机制:使用从驱动视频中提取的表情信息来控制源图像的3D模型。
灵活性:允许从任意视角渲染头部图像,增加了输出的真实感和多样性。
4. 实时渲染
高效能力:VOODOO 3D能够实时渲染多达45个不同视角的图像。
应用重要性:这对于全息显示和3D视频会议系统等应用至关重要,因为它们需要从多个角度展示逼真的3D头部模型。
应用场景:
该方法能够实时生成高保真、视角一致的输出,适用于基于全息显示的3D视频会议系统。它解决了现有方法中的身份泄露和表情不自然问题。
3D视频会议:在3D视频会议中,VOODOO 3D可以用来实时创建参与者的3D头部模型,提供更加沉浸和真实的会议体验。
虚拟现实(VR)和增强现实(AR):在VR和AR应用中,VOODOO 3D可以用于生成逼真的3D头部模型,增强用户的沉浸感和交互体验。
电影和游戏制作:在电影和游戏行业,这项技术可以用于快速生成逼真的3D角色,特别是在需要精细表情捕捉的场景中。
社交媒体和娱乐:在社交媒体和娱乐领域,VOODOO 3D可以用于创造个性化的3D头像或动画表情包。
项目及演示:https://p0lyfish.github.io/voodoo3d/
论文:https://arxiv.org/pdf/2312.04651.pdf
GitHub:coming soon…