数字人-数字人开发|AI手语服务|虚拟数字人定制|手语

形象定制

Image

customization

专业的模型技术有利于建立良好的心里链接

AI换脸

二次元

3D卡通

美型型

真实写真

高逼真型

功能服务

Functional Services

多项领域成熟技术的综合应用
是支撑数字人发展的底层动力

形象定制

真人扫描、美型设计、卡通设计年龄、性别、职业、个性特征等品品牌代言、企业形象、个人IP

声音定制

可复刻真人声音提供百种不同类型音库资源

表情数据

表情自然、写实，A.l自动预测情感面部表情自然生动

语音技术

支持中、英、等 17 国语言支持藏语、维语、彝语3种民族语言支持广东话、四川话、山东话等11种方言

动作、行为驱动

动作表情自然拟人，具备丰富的才艺学习及表演能力强大的 AI 行为驱动能力。丰富的动作库，支持动作定制支持真人实时驱动:动捕设备实时驱动、摄像头实时驱动

AI智能驱动

面对面实时拟人交互能力丰富的算法驱动，具备文本、图片、视频等资料深度学习能力上百场景知识库，多场景交互能力、支持自定义知识库、支持 AI 手语双向无障碍交流

核心技术

CORE TECHNOLOGY

先进底层技术支撑产业持续发展

基于光学传感器空间阵数字人建模

阵列对真人进行高精度 3D 扫描，形成高精度的人脸模型、身体模型及高分辨率贴图，实现高精度三维人体重建及模型参数化，相机采样分辨率为 2400 万像素、灰模重建精度达到毫米级，贴图精度为毛孔级。实现从动作、手势、表情、皮肤纹路、牙齿等仿真外观的真实感虚拟人，用户评测达到 85%以上

多模态语义分析

研究云化多模态视频分析，建立多模态视频大数据集并提取对应的符号化语料，采用多模态符号化语言进行视频资源检索和内容生成。人物视频语义提取算法实现前景、背景、角色、行为、姿态、口型、手势、时序关系、空间关系等内容的语义提取

语音智能

基于预计算大模型，实现语言智能 SaaS 模块，包括高质量自然语言处理、语义分析、对话系统、知识图谱等。API 包括分词、词性标注、命名实体、句法分析、语义角色标注；主题词提取、情感分析、文本分类、文本摘要；多轮对话、问题回答、知识理解、知识图谱生成、心智模型等

行为驱动

色动作合成计算流程，实现文本到符号化语言的自动产生，通过行为描述语言指导动作序列的生成和转化，实现运动、群集、交互、姿态、口唇动画等功能性角色行为，生成合成虚拟人的视频流及动作流数据

场景生成

基于深度学习机制的场景生成模型，联合使用 scene graph 及知识蒸馏的方式，确保生成精度的同时提高计算效率，对已有场景设计进行特征的提取和学习，通过知识蒸馏方法形成场景环境的自动规划和生成

应用终端

APPLICATION TERMINAL

我们的虚拟分身，成为数字世界的交互入口