快速入门¶

MediaPipe4U 提供离线的，实时的语音合成和语音识别功能，让你的 3D 角色具备 "听" 和 "说" 的能力。

安装模型包¶

在开始使用语音套件之前，你必须先下载和安装语音模型包。
从 https://huggingface.co/endink/M4U-Speech-Models 页面中找到语音模型，下载对应语言的模型包。

关于语音模型下载和安装的详细说明，请阅读安装语音模型文档。

向场景中添加一个 MediaPipeSpeechActor。

Place Speech Actor

在蓝图中使用 MediaPipeSpeechActor 的 SpeakTextAsync 函数，可以进行文本朗读。

Speak Text Async

其中 Message 参数为要朗读的文字

在蓝图中使用 MediaPipeSpeechActor 的 StopSpeakAsync 函数，可以停止朗读。

Stop Speak Async

使用 MediaPipe4U 的语音识别功能，可以将输入的语音识别为文本，只需要几个简单步骤：

Tip

当你不再需要语音识别时，你应该停止语音识别。

在蓝图中绑定 MediaPipeSpeechActor 的 OnTextRecognized 事件，可以在事件回调中获取到 ASR 识别到的文本。

On Text Recognized

事件参数中的 Text 是识别到的文本。

在蓝图中调用 MediaPipeSpeechActor 的 StartCaptureMicrophoneAsync 函数，可以从默认的音频输入设备（麦克风）中捕获语音数据并识别为文本。

StartCaptureMicrophoneAsync

Tip

如果你发现无法识别到语音，并且日志中无错误，请检查你的操作系统中的默认声音输入设备是否是你的麦克风，MediaPipe4U Speech 将自动使用操作系统中默认的输入设备。

在蓝图中调用 MediaPipeSpeechActor 的 StopCaptureAsync 函数，可以停止捕获音频数据。

StopCaptureAsync

让 3D 角色的口型和朗读的文本同步，只需要几个简单步骤：

下面，详细介绍这些步骤的操作方法。

制作一个姿势资产（PoseAsset）兼容 ARkit Blend Shape 标准（包含 52 条曲线，命名不区分大小写）

在动画蓝图中添加 MediaPipe LipSync 节点和 Evalute Pose 节点。

Lip Sync Anim Node

speech

此时，当 MediaPipeSpeechActor 的 SpeakTextAsync 函数被调用，就会朗读文本, 并在 Character 生成和发音一致的口型动画。