用料
示例
说明
在此示例中,我们将使用图像和录制的音频文件一起向 LLM 服务器执行 Post 请求。此示例不包含与 LLM 服务器的集成,而是包含与 HTTP 服务器的集成。
实现流程
- 打开 “文件” -> “示例” -> “AmebaHttp” -> “Capture_Image_HTTP_Post_Image_Llava_Server”
- 将按钮和电阻器连接到 BW21-CBV-Kit,如下所示。
- 编译并运行示例。
- 通过找到名为 whisper_server_test_2_endpoints.py 的 python 脚本来设置 HTTP 服务器。
- 转到命令提示符并转到 src 文件夹。执行此命令 python3 whisper_server_test_2_endpoints.py。
请注意:
此服务器只能在 Linux 操作系统上运行,尚不支持 Mac OS 和 Windows。
当您希望拍摄快照并对着麦克风讲话时,请按住按钮 2 秒,以提示询问视觉语言模型 (VLM)。
如果 HTTP Post 图像和音频文件成功,则图像和音频文件将保存在运行此脚本的位置。 |