【教程】小安派BW21-CBV-Kit——HTTP 请求图片和 MP4

[复制链接]
查看15 | 回复0 | 前天 14:56 | 显示全部楼层 |阅读模式

用料

示例

说明

在此示例中,我们将使用图像和录制的音频文件一起向 LLM 服务器执行 Post 请求。此示例不包含与 LLM 服务器的集成,而是包含与 HTTP 服务器的集成。

实现流程

  • 打开 “文件” -> “示例” -> “AmebaHttp” -> “Capture_Image_HTTP_Post_Image_Llava_Server”

image.png

  • 将按钮和电阻器连接到 BW21-CBV-Kit,如下所示。

image.png

  • 编译并运行示例。
  • 通过找到名为 whisper_server_test_2_endpoints.py 的 python 脚本来设置 HTTP 服务器。
  • 转到命令提示符并转到 src 文件夹。执行此命令 python3 whisper_server_test_2_endpoints.py。

请注意:

此服务器只能在 Linux 操作系统上运行,尚不支持 Mac OS 和 Windows。

当您希望拍摄快照并对着麦克风讲话时,请按住按钮 2 秒,以提示询问视觉语言模型 (VLM)。

如果 HTTP Post 图像和音频文件成功,则图像和音频文件将保存在运行此脚本的位置。

用心做好保姆工作
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则