Skip to content

📚 AI语音问答系统 - 详细使用手册

在线预览

https://qa.fjxylin.cn/

🚀 快速入门

第一步:环境准备

  1. 浏览器要求

    • 推荐使用 Chrome 88+ 或 Edge 88+
    • 确保浏览器支持麦克风权限
    • 网络连接稳定
  2. 硬件准备

    • 麦克风设备(内置或外接)
    • 音响或耳机(推荐)

第二步:获取API密钥

方式一:DeepSeek API(推荐新手)

1. 访问:https://www.deepseek.com/
2. 注册 → 登录 → API管理
3. 创建API密钥
4. 复制密钥(sk-开头)

方式二:Qwen API(阿里云)

1. 访问:https://dashscope.aliyuncs.com/
2. 阿里云账号登录
3. 开通DashScope服务
4. 获取API-KEY

第三步:配置应用

  1. 打开应用
  2. 点击右上角 ⚙️ 配置图标
  3. 选择AI提供商
  4. 粘贴API密钥
  5. 点击"测试连接"
  6. 配置成功后点击"保存配置"

第四步:开始对话

  1. 选择合适的职业领域
  2. 点击"开始连续对话"
  3. 允许麦克风权限
  4. 开始说话!

🖥 界面介绍

主界面布局

┌─────────────────────────────────────────────┐
│  🎤 AI语音问答系统    [⚙️][🌙]          │ 头部
├─────────────────────────────────────────────┤
│  [📢 状态提示区域]                          │
│                                            │
│  ┌─────────────────────────────────────┐   │
│  │  🎤 开始连续对话  │  🗑 清除所有    │   │ 控制区
│  │  ✓ 启用AI问答                      │   │
│  └─────────────────────────────────────┘   │
│                                            │
│  🔧 语音识别设置                           │ 设置区
│  [语言] [职业] [模型] [选项]               │
│                                            │
│  🤖 AI对话                                 │ 对话区
│  ┌─────────────────────────────────────┐   │
│  │ 👤 用户: 问题                      │   │
│  │ 🤖 AI: 回答                        │   │
│  └─────────────────────────────────────┘   │
│                                            │
│  🎤 语音识别结果                           │ 结果区
│  ┌─────────────────────────────────────┐   │
│  │ 📝 识别的文字内容                   │   │
│  │ 📊 置信度: 85.5%                   │   │
│  └─────────────────────────────────────┘   │
├─────────────────────────────────────────────┤
│  © 2024 AI语音问答系统                      │ 底部
└─────────────────────────────────────────────┘

状态指示器说明

  • 🟢 正在录音中:绿色,表示正在监听
  • 🔵 AI思考中:蓝色,表示AI正在处理
  • 🟡 配置警告:黄色,需要配置API
  • 🔴 错误状态:红色,出现异常
  • 待机状态:灰色,等待开始

🔧 功能详解

语音识别功能

基本设置

设置项选项说明
语言设置中文/英文/日文/韩文影响识别准确度
连续识别开启/关闭保持录音状态
显示临时结果开启/关闭实时显示识别过程
自动重启监听开启/关闭意外中断自动恢复

职业领域选择

  • 前端工程师:Web开发、Vue、React等
  • 后端工程师:服务器、数据库、API等
  • 测试工程师:测试框架、自动化等
  • 产品经理:需求分析、用户体验等
  • 运维工程师:部署、监控、DevOps等
  • 数据分析师:数据处理、可视化等

AI模型管理

模型对比

特性DeepSeekQwen
响应速度中等
中文支持优秀优秀
技术问题专业专业
创意回答很好
成本较低中等

智能选择

  • 系统自动显示已配置的模型
  • 支持实时切换模型
  • 配置变化后自动更新选项

对话历史管理

上下文保持机制

用户: "什么是Vue3的响应式原理?"
AI: "Vue3使用Proxy实现响应式..."

用户: "那它和Vue2有什么区别?"  ← AI知道"它"指Vue3
AI: "与Vue2相比,Vue3的响应式..." ← 基于上下文回答

清除策略

  • 部分清除:清除语音识别结果
  • 完全清除:清除所有对话和语音记录
  • 自动清除:浏览器关闭后自动清除

⚙️ 高级设置

自动重启功能

javascript
触发条件:
✓ 网络连接中断
✓ 语音引擎异常
✓ 浏览器权限重置
✗ 手动停止录音

保护机制:
- 最多重启3次
- 每次延迟2秒
- 冷却期3秒
- 10秒后重置计数

主题定制

  • 亮色主题:白色背景,适合白天使用
  • 暗色主题:深色背景,适合夜间使用
  • 自动切换:根据系统设置自动调整
  • 持久保存:设置会保存到本地

数据管理

本地存储内容:
├── API密钥配置
├── 主题偏好设置
├── 语音识别设置
└── 职业领域选择

隐私保护:
- 密钥加密存储
- 不上传服务器
- 可随时清除
- 无跟踪代码

🔍 故障排除

常见问题及解决方案

问题1:无法开始录音

症状:点击按钮没有反应,或提示权限错误

解决方案

  1. 检查浏览器麦克风权限
    • Chrome:地址栏左侧 🔒 → 网站设置 → 麦克风
    • 设置为"允许"
  2. 检查系统麦克风设置
    • Windows:设置 → 隐私 → 麦克风
    • macOS:系统偏好设置 → 安全性与隐私 → 麦克风
  3. 尝试其他浏览器
  4. 重启浏览器

问题2:识别准确度低

症状:语音转文字错误率高

解决方案

  1. 环境优化
    • 选择安静环境
    • 关闭音响避免回音
    • 距离麦克风15-30cm
  2. 说话技巧
    • 语速适中,不要太快
    • 发音清晰,避免方言
    • 适当停顿,便于断句
  3. 设置调整
    • 选择正确的语言
    • 开启"显示临时结果"
    • 尝试不同麦克风

问题3:AI不回答或回答不相关

症状:AI无响应或答非所问

解决方案

  1. 检查配置
    ✓ API密钥正确
    ✓ 网络连接正常
    ✓ 模型服务可用
    ✓ 余额充足
  2. 优化提问
    • 问题表达清楚
    • 选择合适职业领域
    • 避免过于简短的问题
  3. 尝试切换模型
    • DeepSeek ↔ Qwen
    • 不同模型有不同特点

问题4:应用卡死或重复重启

症状:界面无响应,或无限重启录音

解决方案

  1. 立即操作
    • 关闭"自动重启监听"
    • 手动停止录音
    • 刷新页面
  2. 检查控制台
    • F12 → Console
    • 查看错误信息
    • 截图报告问题
  3. 清除数据
    • 清除浏览器缓存
    • 重新配置API

错误代码对照表

错误代码含义解决方案
network网络错误检查网络连接
not-allowed权限被拒绝允许麦克风权限
no-speech未检测到语音检查麦克风,重新说话
aborted识别被中断重新开始录音
audio-capture音频捕获失败检查麦克风设备
service-not-allowed服务不可用尝试其他浏览器

💡 最佳实践

高效使用技巧

对话技巧

  1. 开场:先简单问候,测试系统响应
  2. 背景:简单说明问题背景
  3. 具体:提出具体明确的问题
  4. 追问:基于回答继续深入

示例对话

👤 "你好,我想了解Vue3的新特性"
🤖 "你好!Vue3相比Vue2有很多新特性..."

👤 "Composition API具体怎么使用?"
🤖 "Composition API是Vue3的核心特性之一..."

👤 "能给个实际的代码例子吗?"
🤖 "当然可以,这里是一个基础示例..."

设置优化

推荐配置:
✓ 连续识别:开启
✓ 显示临时结果:开启
✓ 自动重启:关闭(新手)
✓ 语言:选择母语
✓ 职业:选择相关领域

环境建议

  • 最佳时段:安静时段(早晨/深夜)
  • 推荐设备:头戴式耳机+独立麦克风
  • 房间要求:封闭空间,减少回音
  • 网络要求:稳定宽带,避免移动网络

进阶功能

批量问题处理

  1. 准备问题清单
  2. 逐个语音提问
  3. 保持对话连续性
  4. 定期清除历史

专业领域深度对话

场景:前端技术咨询
策略:
1. 设置职业为"前端工程师"
2. 从基础概念开始
3. 逐步深入技术细节
4. 结合实际项目问题

多轮复杂对话

技巧:
- 保持话题连贯性
- 适当引用前面内容
- 使用"基于刚才的回答"
- 明确指代关系

性能优化

减少延迟

  • 使用有线网络
  • 选择地理位置近的模型
  • 避免同时运行其他音频软件
  • 定期清理浏览器缓存

提高准确性

  • 标准普通话发音
  • 避免口音过重
  • 控制语速在120-150字/分钟
  • 适当停顿让系统处理

Last updated: