安信可离线语音模组 VC-01、VC-02 系列教程【二次开发篇】SDK音频替换失败记录过程

VC系列 · 2025-5-23 06:08:22

本帖最后由 WangChong 于 2025-5-23 07:13 编辑

简介

在安信可离线语音模组 VC-01、VC-02 系列教程【中级入门篇】中我们根据设置的不同回复词和命令字进行了固件生成。我在出教程的时候在考虑有没有什么办法来替换到SDK中的音频. 在我尝试了各种办法后发现很难办到（建议直接使用云平台生成。不要在SDK里手动添加，匹配不上）

1- 首先我使用了TTSmaker生成了一段音频数据 “你好，我是小美”

2- 我使用在线MP3转换WAV文件将其转换成了WAV并且放到了wav_tones文件夹下

登录/注册后可看大图

其构建脚本res_build_tool.py 文件会自动将wav文件转换成MP3 或者转换成PCM文件供语音识别成功播放。

登录/注册后可看大图

3- 搜索了项目中所有的唤醒词 “你好小美” 的配置音频播放

比如/home/vc02/Downloads/uni_hb_m_solution/unione_lite_app_hb_m/include/uni_nlu_content.h
比如/home/vc02/Downloads/uni_hb_m_solution/unione_lite_app_hb_m/tools/scripts/cmd_reply_data.json
比如/home/vc02/Downloads/uni_hb_m_solution/unione_lite_app_hb_m/tools/scripts/custom_config.json
比如/home/vc02/Downloads/uni_hb_m_solution/unione_lite_app_hb_m/tools/scripts/pcm_map.txt

登录/注册后可看大图

4- 我把上述文件中关于PCM播放的全部都替换成了对应的命名 108.PCM和 WAV音频文件保持了一致。

但是在编译成固件之后，所有的音频响应等还是沿用之前的并没有改变。

5- 于是我尝试修改/home/vc02/Downloads/uni_hb_m_solution/unione_lite_app_hb_m/tools/scripts/cmd_reply_data.json 和 /home/vc02/Downloads/uni_hb_m_solution/unione_lite_app_hb_m/tools/scripts/custom_config.json 。实际上这两个文件就算全部清空掉。也对程序没有任何影响。

6- 我尝试修改了上述配置文件中的唤醒等待时间（默认是十秒）。实际上编译后并不生效。（只能各个事件的KEY words 查找使用）

7- 于是我将所有的唤醒回复词的音频 103.WAV 104.WAV 105.WAV 和对应的MP3全部进行了删除，然后使用108（我自己生成的音频文件）命名成上述删除的103-105进行替换。并且进行了程序烧录。所有的语音唤醒回复词全部失效。所以我猜测所有的音频文件或者是语音识别的模型等，在下载SDK的时候，其内部嵌入的声学模型都已经对文件进行了某种校验或者加密算法。当识别到文件hash值相同或者输入音频的nlu映射一致的话才能触发。

注意: 如果你尝试了上述操作造成音频不播放的情况，请使用原本固件的音频文件夹替换现在SDK里的音频文件夹即可恢复

总结

对于音频文件的替换等，不建议使用SDK进行二次开发，建议直接使用安信可语音平台进行生成。然后生成后可以根据不同的事件来播放对应的音频。不过也并不是没办法实现音频的播放，我们将在下一篇文章中进行介绍。

WT_0213 · 2025-5-23 09:17:18

我也想过替换唤醒词什么的，后来放弃了。最简单方便的办法还是先从平台把音频指令都设置好，然后下载下来sdk再修改细节。

WangChong · 2025-5-23 09:34:12

WT_0213 发表于 2025-5-23 09:17
我也想过替换唤醒词什么的，后来放弃了。最简单方便的办法还是先从平台把音频指令都设置好，然后下载下来sd ...

应该是下载SDK的时候就已经固定好了

沈夜 · 2025-5-23 13:10:56

播放的语音能替换吗

WangChong · 2025-5-23 17:21:30

沈夜发表于 2025-5-23 13:10
播放的语音能替换吗

至少目前看来不可以。但是可以使用对应的函数播放音频。替换的话可能不行，能实现一样的效果

Ai-Thinker小泽 · 2025-5-27 11:32:29

我来啦，两种土办法，第一种就是用安信可平台生成命令的时候多|上去，也可以在原厂的平台上自定义生成，不过需要账号。另外一种就是自己的文件去替换原本的文件，/uni_hb_m_solution/unione_lite_app_hb_m/tools/scripts/tones下替换对应的MP3文件，序号承接原来的即可，音频格式要求为16Khz采样率，单声道，16位。然后播报在逻辑里面用int user_player_play (AUDIO_PLAY_TYPE type, const char *file) ，后一个参数用"[序号]"，即可

Ai-Thinker小泽 · 2025-5-27 11:34:43

Ai-Thinker小泽发表于 2025-5-27 11:32
我来啦，两种土办法，第一种就是用安信可平台生成命令的时候多|上去，也可以在原厂的平台上自定义生成，不 ...

格式工厂转一下，好用爱用，非广

正在攻略大书库 · 2025-11-3 10:14:50

研究了一下，如果直接使用官方的build.sh进行编译，其中对于res_build_tool.py的调用方法为
./build.sh: 41: cd tools/scripts && python res_build_tool.py manual
res_build_tool.py中，将wav文件转换为mp3文件的函数为_wav_2_mp3_tones()，其调用位置在
res_build_tool.py: 135-136:
if (ctrl == "auto"):
_wav_2_mp3_tones()
也就是说，使用官方编译脚本时，将不会调用_wav_2_mp3_tones()函数，自然也就不能执行wav到mp3格式的转换

账号		自动登录	找回密码
密码			立即注册

安信可离线语音模组 VC-01、VC-02 系列教程【二次开发篇】SDK音频替换失败记录过程

7 回复

浏览过的版块

今日推荐

Ai-BV01-32S 参数全解析——一颗语音模组的底牌，规格书里没写的

第十期电子DIY——用 Ai-WV01-32S 打造一个会说话的AI 小玩意

【DIY小项目分享】AI语音便携可调电源

ai wb2 串口调试，疯狂输出乱码

BW16打板擦除失败是什么原因

我在Application中使能了blinky sample, 程序并没有运行

机器人量产，以后会不会搬砖越来越难

FreeRTOS学习-02-i2c

FreeRTOS学习-01-PWM

FreeRTOS学习-00-led

安信可离线语音模组 VC-01、VC-02 系列教程 【二次开发篇】SDK音频替换失败记录过程

7 回复

浏览过的版块

今日推荐

安信可离线语音模组 VC-01、VC-02 系列教程【二次开发篇】SDK音频替换失败记录过程