OpenClaw QQBot 语音识别配置:使用 SiliconFlow SenseVoiceSmall

AI摘要

介绍了在OpenClaw QQBot中配置硅基流动平台的SenseVoiceSmall模型以实现中文语音识别的步骤。该模型针对中文优化,识别准确率高、速度快且提供免费额度。配置过程包括获取API密钥、修改配置文件并重启服务,完成后机器人可自动转录语音消息。方案对比显示,该云端API在中文识别、成本和易用性上具有优势。

在 QQ 机器人中使用语音功能,需要一个好用的语音转文字(STT)服务。今天介绍如何在 OpenClaw 的 QQBot 中配置硅基流动(SiliconFlow)的 SenseVoiceSmall 模型,实现高质量的中文语音识别。

SenseVoiceSmall 是阿里开源的语音识别模型,具有以下特点:

  • 中文识别优秀:针对中文场景优化,识别准确率高
  • 速度快:Small 版本推理速度快,延迟低
  • 免费额度:在 SiliconFlow 平台有免费调用额度
  • 支持多语言:中文、英文等多种语言

硅基流动(SiliconFlow)是一个 AI 模型推理平台,提供多种模型的 API 服务:

  • 语音识别:SenseVoiceSmall、Whisper 等
  • 大语言模型:DeepSeek、Qwen、Kimi 等
  • 图像生成:Stable Diffusion、FLUX 等

平台提供免费额度,足够个人使用。

  1. 访问 SiliconFlow 云平台
  2. 注册/登录账号
  3. 进入「账户设置」→「API 密钥」
  4. 创建新的 API Key 并复制保存

打开 OpenClaw 配置文件:

nano ~/.openclaw/openclaw.json

找到 channels.qqbot 部分,添加 STT 配置:

{
  "channels": {
    "qqbot": {
      "enabled": true,
      "appId": "你的QQ机器人AppID",
      "clientSecret": "你的QQ机器人Secret",
      "allowFrom": ["*"],
      "stt": {
        "provider": "siliconflow",
        "model": "FunAudioLLM/SenseVoiceSmall"
      }
    }
  }
}

在同一个配置文件中,确保 models.providers.siliconflow 部分有你的 API Key:

{
  "models": {
    "providers": {
      "siliconflow": {
        "baseUrl": "https://api.siliconflow.cn/v1",
        "apiKey": "sk-xxxxxxxxxxxxxxxx",
        "api": "openai-completions"
      }
    }
  }
}

配置修改后,重启服务使配置生效:

systemctl --user restart openclaw-gateway

配置完成后,在 QQ 中给机器人发送语音消息:

  1. 用户发送语音消息
  2. OpenClaw 自动调用 SenseVoiceSmall 进行转录
  3. 机器人收到文字内容,进行智能回复

在聊天记录中会显示类似:

🎤 [语音消息] 你好,今天天气怎么样?

SiliconFlow 的 SenseVoiceSmall 模型:

  • 免费额度:新用户有一定免费调用次数
  • 按量计费:超出后按音频时长计费
  • 价格低廉:比 OpenAI Whisper 便宜很多

方案 优点 缺点
SiliconFlow SenseVoiceSmall 中文识别好、速度快、有免费额度 需要联网
本地 Faster-Whisper 免费、隐私安全 中文效果差、需要 GPU
OpenAI Whisper API 识别准确率高 价格贵、需要国际支付

检查:

  • 配置是否正确(provider、model 名称)
  • API Key 是否有效
  • Gateway 服务是否正常运行
  • 查看日志:journalctl --user -u openclaw-gateway -f

可能原因:

  • 音频质量差(环境噪音)
  • 说话含糊不清
  • 方言或特殊口音

SiliconFlow 控制台可以查看 API 调用记录和费用明细。

在 OpenClaw QQBot 中配置 SiliconFlow SenseVoiceSmall,只需几行配置就能获得高质量的中文语音识别能力。相比本地模型,云端 API 省心省力,而且有免费额度,非常适合个人使用。

Saiita

我还没有学会写个人说明!

相关推荐

OpenClaw v2026.4.10:新增 Active Memory 自动记忆、Codex 原生支持、本地 MLX 语音

OpenClaw v2026.4.10版本带来了多项重要更新。核心亮点是全新的Active Memory插件,它能自动管理用户偏好和历史上下文,实现“无感记忆”,显著提升长期对话体验。同时,版本原生集成了Codex,方便开发者直接进行编程任务。针对macOS用户,新增了实验性的本地MLX语音支持,提供更低延迟和更好隐私的语音对话。其他更新还包括视频生成模型支持、Microsoft Teams功能增强、CLI

OpenClaw 2026.4.9 发布:Memory/Dreaming 增强,多项安全修复

OpenClaw发布2026.4.9版本,带来多项功能更新与安全修复。新功能包括增强记忆/梦境处理、结构化日记视图、字符氛围评估报告、提供商认证别名及iOS版本控制改进。关键安全修复涉及浏览器SSRF防护、环境变量安全、远程节点事件清理等。官方建议用户尽快升级,特别是使用浏览器功能或连接远程节点的用户。

暂无评论