Appearance
📚 AI语音问答系统 - 详细使用手册
在线预览
🚀 快速入门
第一步:环境准备
浏览器要求
- 推荐使用 Chrome 88+ 或 Edge 88+
- 确保浏览器支持麦克风权限
- 网络连接稳定
硬件准备
- 麦克风设备(内置或外接)
- 音响或耳机(推荐)
第二步:获取API密钥
方式一:DeepSeek API(推荐新手)
1. 访问:https://www.deepseek.com/
2. 注册 → 登录 → API管理
3. 创建API密钥
4. 复制密钥(sk-开头)
方式二:Qwen API(阿里云)
1. 访问:https://dashscope.aliyuncs.com/
2. 阿里云账号登录
3. 开通DashScope服务
4. 获取API-KEY
第三步:配置应用
- 打开应用
- 点击右上角 ⚙️ 配置图标
- 选择AI提供商
- 粘贴API密钥
- 点击"测试连接"
- 配置成功后点击"保存配置"
第四步:开始对话
- 选择合适的职业领域
- 点击"开始连续对话"
- 允许麦克风权限
- 开始说话!
🖥 界面介绍
主界面布局
┌─────────────────────────────────────────────┐
│ 🎤 AI语音问答系统 [⚙️][🌙] │ 头部
├─────────────────────────────────────────────┤
│ [📢 状态提示区域] │
│ │
│ ┌─────────────────────────────────────┐ │
│ │ 🎤 开始连续对话 │ 🗑 清除所有 │ │ 控制区
│ │ ✓ 启用AI问答 │ │
│ └─────────────────────────────────────┘ │
│ │
│ 🔧 语音识别设置 │ 设置区
│ [语言] [职业] [模型] [选项] │
│ │
│ 🤖 AI对话 │ 对话区
│ ┌─────────────────────────────────────┐ │
│ │ 👤 用户: 问题 │ │
│ │ 🤖 AI: 回答 │ │
│ └─────────────────────────────────────┘ │
│ │
│ 🎤 语音识别结果 │ 结果区
│ ┌─────────────────────────────────────┐ │
│ │ 📝 识别的文字内容 │ │
│ │ 📊 置信度: 85.5% │ │
│ └─────────────────────────────────────┘ │
├─────────────────────────────────────────────┤
│ © 2024 AI语音问答系统 │ 底部
└─────────────────────────────────────────────┘
状态指示器说明
- 🟢 正在录音中:绿色,表示正在监听
- 🔵 AI思考中:蓝色,表示AI正在处理
- 🟡 配置警告:黄色,需要配置API
- 🔴 错误状态:红色,出现异常
- ⚪ 待机状态:灰色,等待开始
🔧 功能详解
语音识别功能
基本设置
设置项 | 选项 | 说明 |
---|---|---|
语言设置 | 中文/英文/日文/韩文 | 影响识别准确度 |
连续识别 | 开启/关闭 | 保持录音状态 |
显示临时结果 | 开启/关闭 | 实时显示识别过程 |
自动重启监听 | 开启/关闭 | 意外中断自动恢复 |
职业领域选择
- 前端工程师:Web开发、Vue、React等
- 后端工程师:服务器、数据库、API等
- 测试工程师:测试框架、自动化等
- 产品经理:需求分析、用户体验等
- 运维工程师:部署、监控、DevOps等
- 数据分析师:数据处理、可视化等
AI模型管理
模型对比
特性 | DeepSeek | Qwen |
---|---|---|
响应速度 | 快 | 中等 |
中文支持 | 优秀 | 优秀 |
技术问题 | 专业 | 专业 |
创意回答 | 好 | 很好 |
成本 | 较低 | 中等 |
智能选择
- 系统自动显示已配置的模型
- 支持实时切换模型
- 配置变化后自动更新选项
对话历史管理
上下文保持机制
用户: "什么是Vue3的响应式原理?"
AI: "Vue3使用Proxy实现响应式..."
用户: "那它和Vue2有什么区别?" ← AI知道"它"指Vue3
AI: "与Vue2相比,Vue3的响应式..." ← 基于上下文回答
清除策略
- 部分清除:清除语音识别结果
- 完全清除:清除所有对话和语音记录
- 自动清除:浏览器关闭后自动清除
⚙️ 高级设置
自动重启功能
javascript
触发条件:
✓ 网络连接中断
✓ 语音引擎异常
✓ 浏览器权限重置
✗ 手动停止录音
保护机制:
- 最多重启3次
- 每次延迟2秒
- 冷却期3秒
- 10秒后重置计数
主题定制
- 亮色主题:白色背景,适合白天使用
- 暗色主题:深色背景,适合夜间使用
- 自动切换:根据系统设置自动调整
- 持久保存:设置会保存到本地
数据管理
本地存储内容:
├── API密钥配置
├── 主题偏好设置
├── 语音识别设置
└── 职业领域选择
隐私保护:
- 密钥加密存储
- 不上传服务器
- 可随时清除
- 无跟踪代码
🔍 故障排除
常见问题及解决方案
问题1:无法开始录音
症状:点击按钮没有反应,或提示权限错误
解决方案:
- 检查浏览器麦克风权限
- Chrome:地址栏左侧 🔒 → 网站设置 → 麦克风
- 设置为"允许"
- 检查系统麦克风设置
- Windows:设置 → 隐私 → 麦克风
- macOS:系统偏好设置 → 安全性与隐私 → 麦克风
- 尝试其他浏览器
- 重启浏览器
问题2:识别准确度低
症状:语音转文字错误率高
解决方案:
- 环境优化
- 选择安静环境
- 关闭音响避免回音
- 距离麦克风15-30cm
- 说话技巧
- 语速适中,不要太快
- 发音清晰,避免方言
- 适当停顿,便于断句
- 设置调整
- 选择正确的语言
- 开启"显示临时结果"
- 尝试不同麦克风
问题3:AI不回答或回答不相关
症状:AI无响应或答非所问
解决方案:
- 检查配置
✓ API密钥正确 ✓ 网络连接正常 ✓ 模型服务可用 ✓ 余额充足
- 优化提问
- 问题表达清楚
- 选择合适职业领域
- 避免过于简短的问题
- 尝试切换模型
- DeepSeek ↔ Qwen
- 不同模型有不同特点
问题4:应用卡死或重复重启
症状:界面无响应,或无限重启录音
解决方案:
- 立即操作
- 关闭"自动重启监听"
- 手动停止录音
- 刷新页面
- 检查控制台
- F12 → Console
- 查看错误信息
- 截图报告问题
- 清除数据
- 清除浏览器缓存
- 重新配置API
错误代码对照表
错误代码 | 含义 | 解决方案 |
---|---|---|
network | 网络错误 | 检查网络连接 |
not-allowed | 权限被拒绝 | 允许麦克风权限 |
no-speech | 未检测到语音 | 检查麦克风,重新说话 |
aborted | 识别被中断 | 重新开始录音 |
audio-capture | 音频捕获失败 | 检查麦克风设备 |
service-not-allowed | 服务不可用 | 尝试其他浏览器 |
💡 最佳实践
高效使用技巧
对话技巧
- 开场:先简单问候,测试系统响应
- 背景:简单说明问题背景
- 具体:提出具体明确的问题
- 追问:基于回答继续深入
示例对话:
👤 "你好,我想了解Vue3的新特性"
🤖 "你好!Vue3相比Vue2有很多新特性..."
👤 "Composition API具体怎么使用?"
🤖 "Composition API是Vue3的核心特性之一..."
👤 "能给个实际的代码例子吗?"
🤖 "当然可以,这里是一个基础示例..."
设置优化
推荐配置:
✓ 连续识别:开启
✓ 显示临时结果:开启
✓ 自动重启:关闭(新手)
✓ 语言:选择母语
✓ 职业:选择相关领域
环境建议
- 最佳时段:安静时段(早晨/深夜)
- 推荐设备:头戴式耳机+独立麦克风
- 房间要求:封闭空间,减少回音
- 网络要求:稳定宽带,避免移动网络
进阶功能
批量问题处理
- 准备问题清单
- 逐个语音提问
- 保持对话连续性
- 定期清除历史
专业领域深度对话
场景:前端技术咨询
策略:
1. 设置职业为"前端工程师"
2. 从基础概念开始
3. 逐步深入技术细节
4. 结合实际项目问题
多轮复杂对话
技巧:
- 保持话题连贯性
- 适当引用前面内容
- 使用"基于刚才的回答"
- 明确指代关系
性能优化
减少延迟
- 使用有线网络
- 选择地理位置近的模型
- 避免同时运行其他音频软件
- 定期清理浏览器缓存
提高准确性
- 标准普通话发音
- 避免口音过重
- 控制语速在120-150字/分钟
- 适当停顿让系统处理