基于腾讯云 TRTC 的 AI 实时语音对话应用,集成 ASR(语音识别)、LLM(大语言模型)和 TTS(语音合成)能力。
- 实时语音对话:基于 TRTC 实现低延迟音视频通信
- 智能语音识别:支持中文 8k 大模型,带降噪功能
- LLM 对话:支持 OpenAI 协议的大语言模型(如 DeepSeek)
- 语音合成:支持多种 TTS 服务商(如 MiniMax)
- 智能打断:支持声纹识别的自动打断模式
- 语义断句:基于语义的智能句子分割
npm install编辑 server.js 中的 CONFIG 对象,填入以下必要配置:
-
apiConfig: 腾讯云 API 密钥
SecretId: 腾讯云 SecretIdSecretKey: 腾讯云 SecretKey
-
trtcConfig: TRTC 应用配置
sdkAppId: TRTC 应用 IDsecretKey: TRTC 密钥
-
LLMConfig: 大语言模型配置
Model: 模型名称APIUrl: API 地址APIKey: API 密钥
-
TTSConfig: 语音合成配置
AppId: TTS 应用 IDAPIKey: TTS API 密钥
npm start服务默认运行在 http://127.0.0.1:3000/
| 接口 | 方法 | 说明 |
|---|---|---|
/ |
GET | 对话页面 |
/getInfo |
POST | 获取用户凭证 |
/startConversation |
POST | 启动 AI 对话 |
/stopConversation |
POST | 停止 AI 对话 |
- Node.js + Express
- 腾讯云 TRTC SDK
- TLS Sig API v2
MIT