功能服务
Functional Services
多项领域成熟技术的综合应用
是支撑数字人发展的底层动力
是支撑数字人发展的底层动力
形象定制
真人扫描、美型设计、卡通设计
年龄、性别、职业、个性特征等
品品牌代言、企业形象、个人IP
声音定制
可复刻真人声音 提供百种不同
类型音库资源
表情数据
表情自然、写实,A.l自动预测
情感 面部表情自然生动
语音技术
支持中、英、等 17 国语言支持藏语、维语、彝语3种民族语言支持广东话、四川话、山东话等11种方言
动作、行为驱动
动作表情自然拟人,具备丰富的才艺学习及表演能力强大的 AI 行为驱动能力。丰富的动作库,支持动作定制支持真人实时驱动:动捕设备实时驱动、摄像头实时驱动
AI智能驱动
面对面实时拟人交互能力 丰富的算法驱动,具备文本、图片、视频等资料深度学习能力 上百场景知识库,多场景交互能力、支持自定义知识库、支持 AI 手语双向无障碍交流
核心技术
CORE TECHNOLOGY
先进底层技术支撑产业持续发展
基于光学传感器空间阵数字人建模
阵列对真人进行高精度 3D 扫描,形成高精度的人脸模型、身体模型及高分辨率
贴图,实现高精度三维人体重建及模型参数化,相机采样分辨率为 2400 万像素、
灰模重建精度达到毫米级,贴图精度为毛孔级。实现从动作、手势、表情、皮肤
纹路、牙齿等仿真外观的 真实感虚拟人,用户评测达到 85%以上
01
多模态语义分析
研究云化多模态视频分析,建立多模态视频大数据集并提取对应的符号化语料,
采用多模态符号化语言进行视频资源检索和内容生成。
人物视频语义提取算法实现前景、背景、角 色、
行为、姿态、口型、手势、时序关系、
空间关系等内容的语义提取
02
语音智能
基于预计算大模型,实现语言智能 SaaS 模块,包括高质量自然语言处理、语义
分析、对话系统、知识图谱等。API 包括分词、词性标注、命名实体、句法分析、
语义角色标注; 主题词提取、情感分析、文本分类、文本摘要;多轮对话、问题
回答、知识理解、知识图 谱生成、心智模型等
03
行为驱动
色动作合成计算流程,实现文本到符号化语言的自动产生,通过行为描述语言指
导动作序 列的生成和转化,实现运动、群集、交互、姿态、口唇动画等功能性角
色行为,生成合成 虚拟人的视频流及动作流数据
04
场景生成
基于深度学习机制的场景生成模型,联合使用 scene graph 及知识蒸馏的
方式,确保生 成精度的同时提高计算效率,对已有场景设计进行特征的提取
和学习,通过知识蒸馏方法 形成场景环境的自动规划和生成
05
应用终端
APPLICATION TERMINAL
我们的虚拟分身,成为数字世界的交互入口