介绍了在OpenClaw QQBot中配置硅基流动平台的SenseVoiceSmall模型以实现中文语音识别的步骤。该模型针对中文优化,识别准确率高、速度快且提供免费额度。配置过程包括获取API密钥、修改配置文件并重启服务,完成后机器人可自动转录语音消息。方案对比显示,该云端API在中文识别、成本和易用性上具有优势。
在 QQ 机器人中使用语音功能,需要一个好用的语音转文字(STT)服务。今天介绍如何在 OpenClaw 的 QQBot 中配置硅基流动(SiliconFlow)的 SenseVoiceSmall 模型,实现高质量的中文语音识别。
SenseVoiceSmall 是阿里开源的语音识别模型,具有以下特点:
- 中文识别优秀:针对中文场景优化,识别准确率高
- 速度快:Small 版本推理速度快,延迟低
- 免费额度:在 SiliconFlow 平台有免费调用额度
- 支持多语言:中文、英文等多种语言
硅基流动(SiliconFlow)是一个 AI 模型推理平台,提供多种模型的 API 服务:
- 语音识别:SenseVoiceSmall、Whisper 等
- 大语言模型:DeepSeek、Qwen、Kimi 等
- 图像生成:Stable Diffusion、FLUX 等
平台提供免费额度,足够个人使用。
- 访问 SiliconFlow 云平台
- 注册/登录账号
- 进入「账户设置」→「API 密钥」
- 创建新的 API Key 并复制保存
打开 OpenClaw 配置文件:
nano ~/.openclaw/openclaw.json
找到 channels.qqbot 部分,添加 STT 配置:
{
"channels": {
"qqbot": {
"enabled": true,
"appId": "你的QQ机器人AppID",
"clientSecret": "你的QQ机器人Secret",
"allowFrom": ["*"],
"stt": {
"provider": "siliconflow",
"model": "FunAudioLLM/SenseVoiceSmall"
}
}
}
}
在同一个配置文件中,确保 models.providers.siliconflow 部分有你的 API Key:
{
"models": {
"providers": {
"siliconflow": {
"baseUrl": "https://api.siliconflow.cn/v1",
"apiKey": "sk-xxxxxxxxxxxxxxxx",
"api": "openai-completions"
}
}
}
}
配置修改后,重启服务使配置生效:
systemctl --user restart openclaw-gateway
配置完成后,在 QQ 中给机器人发送语音消息:
- 用户发送语音消息
- OpenClaw 自动调用 SenseVoiceSmall 进行转录
- 机器人收到文字内容,进行智能回复
在聊天记录中会显示类似:
🎤 [语音消息] 你好,今天天气怎么样?
SiliconFlow 的 SenseVoiceSmall 模型:
- 免费额度:新用户有一定免费调用次数
- 按量计费:超出后按音频时长计费
- 价格低廉:比 OpenAI Whisper 便宜很多
| 方案 | 优点 | 缺点 |
|---|---|---|
| SiliconFlow SenseVoiceSmall | 中文识别好、速度快、有免费额度 | 需要联网 |
| 本地 Faster-Whisper | 免费、隐私安全 | 中文效果差、需要 GPU |
| OpenAI Whisper API | 识别准确率高 | 价格贵、需要国际支付 |
检查:
- 配置是否正确(provider、model 名称)
- API Key 是否有效
- Gateway 服务是否正常运行
- 查看日志:
journalctl --user -u openclaw-gateway -f
可能原因:
- 音频质量差(环境噪音)
- 说话含糊不清
- 方言或特殊口音
SiliconFlow 控制台可以查看 API 调用记录和费用明细。
在 OpenClaw QQBot 中配置 SiliconFlow SenseVoiceSmall,只需几行配置就能获得高质量的中文语音识别能力。相比本地模型,云端 API 省心省力,而且有免费额度,非常适合个人使用。

暂无评论
要发表评论,您必须先 登录