Skip to main content
Link
Menu
Expand
(external link)
Document
Search
Copy
Copied
MediaPipe4U
首页
安装和配置
环境要求
安装插件
GStreamer 配置
动作和表情
快速入门
准备动补角色
准备运行时组件
自定义骨骼
开始动补
头部算解器
半身/全身动补
动补数据导出
图像回显
核心功能
姿势算解节点
位置算解节点
表情捕捉
M4U Remoting
Image Source
UE Editor 工具箱
进阶用法
MediaPipeHolisticComponent
MediaPipeAnimInstance
算解器(蓝图)
算解器(C++)
关节扭曲矫正
校准
手指矫正
切换动画蓝图
镜像/翻转视频流
统计数据
扩展点
Image Consumer
实验性功能
NvAR 表情捕捉
大语言模型(LLM)
系统要求
使用 LLM
会话参数
CUDA 加速
构建聊天程序
UE Editor 工具箱
UE 工具
Control Rig Pose Baker
语音套件
安装语音模型包
快速入门
语音合成 (TTS)
离线语音合成
自定义 PaddleSpeech 模型
集成其他TTS方案
Metasound 集成
语音识别 (ASR)
离线语音识别
自定义 Whisper 模型
口型同步(Lip Sync)
打包部署
源码版引擎打包
常见问题
授权许可
授权有效期
更新许可证
商业授权
设备机器码
更新日志
English Release Notes
Demo Project
GitHub
语音套件
语音合成 (TTS)
语音合成(TTS)
MediaPipe4USpeech 提供了语音合成(TTS)方案,支持实时的,离线的,低延迟的语音到文本的转换。
MediaPipe4USpeech TTS 提供以下功能:
离线语音合成(基于 PaddleSpeech)。
语音合成接口,方便集成第三方的语音合成服务。
MetaSound 集成支持 (Coming soon)。
Table of contents
离线语音合成
自定义 PaddleSpeech 模型
集成其他TTS方案
Metasound 集成