2024-05-24
Current
- [new] 在编辑器中使用 MediaPipe4U 不再需要授权(即使授权文件过期,依然可以在编辑器中使用)。
- [new] Unreal Engine 5.4 版本支持,我跳过了 5.3 版本,精力有限,实在抱歉。
- [new] 加入 Control Rig 支持 (预览质量). 新的动画蓝图节点
ControlRigFromPose
已经可用,可以将任意姿态转换到 ControlRig 蓝图中,方便使用 ControlRig 制作关节限制、全身 IK 等。 - [new] 对齐 google mediapipe 到最新版本,使用全新的 holistic task api, 整体追踪方案性能进一步提升,表情算解效果提升。
- [new]
MediaPipeHolisticComponent
中加入StopAsync
函数以支持异步停止 mediapipe. - [new] Android 平台的
MediaPipeHolisticComponent
组件支持 “Raw 模式” 显示帧图像. - [fix] #130: 当打包游戏时,mediapipe 模型文件丢失.
- [fix] #124: 当动画中的 CSPose 没有使用骨架(skeleton)的骨骼索引时,BVH Recoder 导致程序崩溃.
- [fix]
AnchorWidgetInCanvas
函数缩放帧图像时大小超出限制. - [improve] 安卓平台性能优化, 现在,M4U 在安卓手机上可以跑到 15-20 fps (CPU: 高通骁龙 870 ).
- [improve] 算解器能够适应 LOD 变化,LOD 变化时依然能够求解姿态并进行动作捕捉.
- [remove] LLM 插件被移除. 由于大语言模型(LLM)本地推理需要苛刻的硬件资源,加之 llama.cpp 长期高频发布,没有稳定版本,暂时移除这个插件,或许将来还会回归。
- [remove] 从这个版本开始,5.0.x 的 Unreal Engine 版本将不再支持. 因为 5.0.X 需要 VS 2019 才能编译,我的开发机中已经不再安装 VS 2019, 非常抱歉 !旧版的 5.0.x 插件任然可用。
- [break change]
ASRCaptureComponent
更名为SpeechCaptureComponent
;
2023-10-10
- [new] MediaPipe4U Mobile 安卓打包编译支持, 开发体验和 Windows 版本保持一致.
- [new]
StartCamera
andStartImageSource
现在支持蓝图异步函数,蓝图中可以方便的进行异步操作. - [improve] 优化帧处理管道, 带来了巨大的性能提升, 现在 windows 动作捕捉可以达到 25 fps (CPU: AMD 3600, Frame Size: 1280 * 720).
2023-08-29
- [fix] 使用 LLM, ASR 加载模型时,如果文件路径包含非英语语言的字符时会失败。
- [fix] LLM , ASR 打包可能出现无法运行。
- [fix] 打开动画蓝图时出现错误: #104, #101
2023-08-17
- [new] Speech 语音识别 (ASR) 加入 whisper 模型支持(GPU 加速)。
- [new] 大语言模型(LLM)支持使用 CUDA 推理(文档)。
- [fix] 修复 Speech 模型导入界面卡住的问题(#96)。
- [fix] LLM 推理过程可能导致内存泄露。
2023-08-11
- [new] 聊天运行时(LLMSpeechChatRuntime),仅需要很少简单的蓝图就可以构建复杂的的聊天和问答程序。
- [new] 大语言模型加载时支持预热(WarmUp),解决第一轮对话反应慢的问题。
- [new] LipSync 支持了 Remap 资产,曲线名称不必遵循 Facebook 的 Viseme 名称,可以运行时映射。
- [new] SpeechActor 加入了蓝图函数(IsTTSReady/IsTTSReady), 用来检查模型是否已经加载。
- [imporve] SpeechActor::IsTTSSpeaking 现在可以精准判断是否还在朗读。
- [fix] Speech 可能因为编码问题,在磁盘创建无效的空文件夹。
- [fix] Issues fixed: #95, #96
2023-08-07
- [new] 新增大语言模型(LLM)功能,支持离线部署并推理 LLaMA2 模型(文档)。
- [new] 新增 LLM Speech 功能,集成语音插件到 LLM, 可以自动朗读模型生成结果。
- [new] 发布新的 ONNX 语音模型包(音质更好),新增四个语音模型包:中文、中文男声、英文、英文女声(语音包发布页)。
- [new] TTS 推理支持 Onnx 推理,可以使用质量更高的声码器。
- [new] 加入异步开启摄像头支持(StartCameraAsync),防止摄像头启动时界面卡顿。
- [new] MediaPipeSpeechActor 中加入 TTS 蓝图操作函数(LocalTTSComponent 部分函数不再支持蓝图访问)。
- [improve] TTS 支持文本朗读排队,可以连续朗读多个文本(SpeakText 函数新增 StopPrevious 参数)。
- [improve] 移除 pdb 文件,进一步缩减打包尺寸。
- [improve] 当 NvAR SDK 未安装时打包不会再失败,而是给出警告信息。
- [fix] 修复表情捕捉时如果开启 Unreal Engine 的 LiveLink 界面将导致程序崩溃。
- [fix] 修复语音识别事件中直接进行 UI 处理时程序崩溃(#90)。
- [fix] 修复 Pose Asset Baker 工具在 UE 5.2 版本使用崩溃问题 (#88)。
- [fix] TTS 停止朗读小概率发生无法停止。
- [fix] TTS/ASR 解析文件夹时编码存在问题,可能导致在磁盘创建错误的文件夹。
2023-07-18
- [new] 支持在插件配置界面中更新许可证(文档)。
- [new] 支持在插件配置界面中更新语音模型(文档)。
- [new] 加入离线语音识别(ASR)功能(需要下载模型包)从麦克风识别语音并转为文字(文档)。
- [new] 支持从蓝图中更新许可证,方便从自己的服务器分发许可证到客户端。
- [improve] MediaPipe 升级到 0.10.2, 更新了 google 模型,使用新的 mediapipe solution api,表情捕捉大幅改进,普通摄像头的表情捕捉已经处于 Production Ready 水平了。
- [improve] 使用 Pose Tracker 装饰线条(Annotion)时,不再绘制 ROI 红色线框(详情: #81)。
- [improve] GStreamer 打包时不再打包无用的 PC (C++ package config) 文件,进一步减小打包尺寸。
- [fix] 暂时移除 FixMediaPipe,因为它会导致腿部跳变(详情: #81)。
2023-06-28
- [new] MediaPlayerImageSource: 支持从 Unreal Engine 的 MediaPlayer 中捕获画面作为图像源(文档)。
- [new] 上半身锁定:支持设置上半身三个轴向的锁定 (文档)。
- [fix] 修复校准时初始关节带有旋转角时产生的校准错误。
- [fix] 阻尼算法造成的关节扭曲矫正错误。
- [fix] 半身模式时校准无法正常工作。
2023-06-20
- [new] Pose Solver: 支持开启/关闭姿势优化的具体项。
- [improve] 缩减编译后的体积(磁盘空间占用从 10GB 降低到 6GB)。
- [fix] 脊柱旋转模式时可能造成姿势校准不正确。
2023-06-17
- [new] 新增姿态校准功能,纠正 mediapipe 原始数据中脊柱、小腿没有伸直的问题(文档)。
- [new] 新增手动校准功能,姿势校准,位置校准均支持手动校准和自动校准设置(文档)。
- [new] 新增脊柱旋转模式,有助于运动中稳定脚部(文档)。
- [new] 手指捕捉手掌丢失时回弹处理规则 。
- [new] UE Editor 动补工具加入关节锁定、校准等功能。
- [new] UE Editor 动补工具支持对视频文件快进、暂停。
- [improve] mediapipe 升级到最新版(v0.10.1)。
- [improve] Hand Solver:加入手腕旋转阻尼,防止跳变。
- [improve] LocationSolver: Location IK 算法改进,位移计算更合理。
- [improve] Ground IK: 脚步和脚踝旋转平滑。
- [improve] Ground IK: 加入脚步限滑,改善脚步抖动问题。
- [fix] GroundIK: 检测脚踝位置不正确。
- [fix] GroundIK: 节点 FeetVerticalOffset 等几个属性设置无效。
- [fix] ControlRigPose Baker 工具生成的 PoseAsset 不正确。
2023-05-21
- [new] 新增 MediaPipe4USpeech 插件支持离线 TTS 和音唇同步(文档)。
- [new] ControlRigPose 烘焙工具,方便制作 Metahuman 的口型资产。
- [fix] 移除工具箱材质,使用 C++ 动态创建,修复 UE5.0 打包材质问题。
2023-04-23
- [new] 加入 M4U Remoting, 支持从安卓设备捕捉表情(文档)。
- [new] Android 面补工具开放下载(商业授权功能,免费授权无法打包)
- [new] UE 编辑器工具新功能:
- LiveLink 追踪
- 位移、姿势校准
- 面容校准
- [new] 统一位置、姿态校准,从 AnimationInstance 访问 CalibrationCountDownSeconds 等参数;现在,支持手动校准位置和姿势(Break Changes)。
- [fix] 动补回调包发生错误时可能导致 texture 被占用无法释放
- [fix] 退出编辑器时概率引发崩溃
- [fix] UE 工具箱状态不同步
2023-04-08
- [new] 添加 UE 编辑器工具箱功能,方便在编辑器中调试参数 (文档)
2023-04-03
- [fix] LOD 变化时,如果骨骼变化,引发程序崩溃
- [fix] MediaPipe 表情解算 BrowDown 时右眼误差
- [fix] UE Editor 中 LiveLink管理器状态和 MediaPipeFaceLinkActor 不一致
- [fix] LiveLink Source 无法删除的问题
2023-04-01
全新的 MediaPipe BlendShapes 求解器,不依赖 Nvidia GPU,兼容苹果 51 个 Arkit 表情 (文档)。
- [new] MediaPipe4U 的 LiveLink 统一成全新的 MediaPipeFaceLinkActor(文档),支持在 MediaPipe/NvAR 算法切换,可以自动降级算法。
- [new] 全新的面容校准(Face Calibration)算法。
- [new] 动态 MediaPipe Graph 构造支持,支持切换装饰线条显示风格,Pose/Holistic/Face 之间切换。
- [new] 位置校准倒计时读秒蓝图支持,方便集成校准 UI (请下载最新的 Demo Project 查看)。
- [new] GStreamer 使用GStreamer uridecodebin工作流,支持从 HTTP/RTSP/RMTP/M3U8 等网络协议中解析视频流(#37)。
- [improve] Pose Solver 优化(Optimization)加入膝盖极像矫正。
- [improve] GStreamer 显示警告信息,更容易定位产生错误的原因。
- [improve] MediaPipe 更新到 0.9.2,TFLite 模型更新到最新。
- [improve] MediaPipe/NvAr 连接库不再使用嵌入 CRT。
- [improve] MediaPipe/NvAr 中的 OpenCV 支持 Highgui,方便图形调试。
- [fix] 某些视频文件在缩放时产生异常(#43)。
- [fix] StaticImageSource 可能引发图片未释放的警告。
- [fix] GStreamer 出现错误不会自动关闭 Pipline, 从而导致下次启动异常。
2023-03-16
- [new] 位置算解节点加入 GroundIK,支持将脚贴合到地面(文档)
- [fix] 动画蓝图切换后资源重复释放 (#30),问题无法复现,需要等待反馈者测试
- [fix] BVH 插件骨骼节点索引错误 (#28)
2023-03-11
- [fix] Unreal Engine 5.1 打包后启动程序死锁(卡住,Blocking)
2023-03-09
- [new] Unreal Engine 5.1 版本加入 NvAR 表情捕捉支持
2023-02-27
- [new] NvAR 统计数据加入(文档)
- [imporve] GStreamer 升级到 1.22.0 (如果出现 GStreamer 相关编译错误,请重新安装 GStreamer Runtime 和 SDK)
- [fix] 修复 MediaPipe NvAR 史诗级 BUG,随着启停次数增加,NvAR 帧率逐渐下降 (如果你使用了 MediaPipe4UNvAR , 必须更新此版本!!!)
- [fix] 修复 0225 版本编译错误
2023-02-25
- [new] 加入了指标统计,可以通过 Stat 查看关键性能数据 (文档)
- [new] 支持获取图像源的 FPS,方便排查性能问题
- [new] IK 驱动模式,方便集成 ControlRig (实验性)
- [imporve] 移除 protobuf 依赖,避免使用 protobuf 的项目打包出现冲突
- [imporve] 优先摄像头 RBG 编码,某些摄像头默认 YUV 编码时帧率过低
- [fix] 编辑器中强行退出游戏可能导致崩溃
2023-02-12
- [new] MediaPipeAnimInstance 增加手动连接 MediaPipe 功能,当场景中存在多个带有 MediaPipe 动画蓝图的角色时,你可以手动控制驱动其中一个
- [new] 支持动态切换动画蓝图(SetAnimInstanceClass)后连接 MediaPipe
- [fix] 网络游戏模式下,MediaPipeAnimInstance 可能会崩溃 BUG #20
- [fix] 摄像头动补在 Annotated 回显模式下工作不正常
2023-02-10 (milestone)
重构底层代码,一致的图片处理工作流,减少了一次图片内存复制,这个版本带来了帧率提升
里程碑版本
- [new] 预览版质量的 Nvidia AR 表情捕捉集成, (文档,示例已经包含在 Demo 工程中)
- [new] 手指矫正,解决手指无法伸直的问题(TODO:文档暂缺)
- [new] MediaPipeHolistic 生命周期事件(OnInitialized, OnStarted, OnStopeed)蓝图支持
- [new] 图片、摄像头、视频图像回显都支持开启/关闭 MediaPipe 装饰(Annotated)模式了,便于分析动补帧
- [new] 摄像头捕捉加入了限制图片分辨率能力,在低端机器上可以提升帧率 (TODO:文档暂缺)
- [new] 全新重构的图片工作流,可以和任何第三方图片处理库集成(集成用例: NvAR 集成,文档)
- [new] 修正头部算解器(HeadSolver) Roll 偏差
- [new] MediaPipeLiveLink 可以被禁用,多个主题(LiveLink Subject)同时工作时,禁用不需要的主题可以避免不必要的开销
- [imporve] 更易于实现的自定义图像源基类 MediaPipeImageSourceComponent (C++)
- [imporve] MediaPipeRemapAsset 现在可以在编辑器中导入/导出 Json 文件,方便在多人开发时共享资产
- [imporve] 摄像头动补也使用异步模式回显图片,提高了性能和帧率
- [fix] MediaPipeLinkLink 表情捕捉卡顿的严重性能问题 (Big Bug)
- [fix] 重置缓存可能存在线程不安全问题,(BUG #18)
- [fix] 骨骼绑定缺失时可能引起的程序崩溃
- [fix] 快速反复启停时导致静态图片绘制出错
2023-01-15
- [new]前胸关节如果未配置映射,自动获取颈骨(neck)的父关节作为前胸
- [new]头部算解器添加新的滤波算法,减少抖动(效果明显)
- [new]半身模式不只是锁定关节了,半身模式脊柱骨骼添加新的滤波算法(效果明显)
- [new]StandardMediaPipeAnimInstance 正式可用,可以通过 C++ 代码为角色动态设置 MediaPipe 动补(运行时附加动画蓝图,不用在编辑器中绑定骨骼制作动画蓝图,适用于动态加载模型场景)
- [fix]自定义骨骼无效(issue #13 无法验证,本机测试无误)
- [fix]编辑器模式下,偶尔多播委托失效导致动补停住
- [fix]图片动补模式下,当前图片源(ImageSource)属性为空
-
[fix]半身动补模式,头部扭曲矫正可能失效
- [improve]mediapipe 底层代码改进,开启关闭 pipeline 现在是线程安全的,回调事件只会在游戏线程执行(方便更新 UI)
- [improve]提高膝盖极向准确性,减少膝盖扭曲(膝盖极像开关即将移除)
2023-01-06
2023-01-04
- [fix]带有初始旋转角度的模型扭曲矫正错误
- [new]扭曲矫正开关,可以控制是否开启扭曲矫正
- [new]表情捕捉标定功能加入
- [new]表情捕捉重制:
- [new]表情降噪与平滑参数
- [new]膝盖极像开关(矫正膝盖侧弯问题)
- [new]表情平滑支持分别设置脸部和眼部平滑
- [new]表情捕捉加入虹膜追踪
2022-12-20
- [new] BVH 导出
- [new] 头部算解器(从 face mesh 计算头部旋转)
- [new] 关节扭曲校正
- [new] 关节二次平滑支持(C++)
- [new] 前胸 (chest) 关节映射
- [fix] 侧身时位移计算错误
- [fix] 脊柱锁定不生效
2022-11-25
- [fix] Pose 算解器骨骼映射索引超出范围错误,感谢网友 tiantianaixuexi 提交反馈(#3)
- [improve] 骨骼缓存时机变为第一帧数据,解决多次重复发生缓存
2022-11-22
- [new] 集成 UnrealEngine OpenCV,升级到 4.5.5
- [fix] Pose 算解器骨骼缓存 BUG
- [new] 兼容UrealEngine 5.1 API (目前仍然使用 5.0 编译)
2022-11-18
- [fix] 自定义骨骼映射无效的严重 BUG, 感谢网友 Gobcurry 抽出宝贵时间发现问题。(issue: #2)
- [new] 新增骨骼映射资产 (Remap Asset),动画蓝图骨骼映射使用映射资产。
- [new] 手腕扭曲矫正,通过肘部随动旋转简单矫正手腕扭曲变形。
- [remove] 动画蓝图中移除 BoneSettings 变量,不再通过 BoneSettings 配置骨骼,请使用新的映射资产映射。
2022-11-12
- [fix] 图片动补重复释放内存引起崩溃的问题
- [fix] 启动时 GStreamer 未配置导致 UE Editor 崩溃,改为延迟启动
- [fix] 上半身模式脊柱锁定无效问题