Skip to content

🎤 语音配置

语音配置使用指南

📖 什么是语音配置?

语音配置是 Dinox 中用于设置语音转录相关功能的配置页面,它可以帮助你自定义语音识别和转录的行为,让语音功能更符合你的使用习惯。

简单理解

  • 🎤 语音转录:将你说的话转换成文字

  • 🌍 语言偏好:设置语音识别使用的语言

  • 🤖 语音模型:选择用于转录的 AI 模型

  • 🔥 热词设置:添加常用词汇,提高识别准确率

  • 润色提示词:让 AI 对转录结果进行优化

举个例子

  • 设置语言为”中文”,语音识别会更准确识别中文

  • 添加”Python”、“React”等专业术语作为热词,提高识别准确率

  • 设置润色提示词,让转录结果更规范、易读

语音配置的优势

  • 提高准确率:通过语言和热词设置,提高语音识别准确率

  • 个性化定制:根据使用场景定制语音功能

  • 优化输出:通过润色提示词,让转录结果更规范


🎯 语音配置的使用场景

场景一:提高专业术语识别准确率

需求:经常使用专业术语,希望识别更准确

配置方式

  • 设置合适的语言偏好

  • 添加专业术语作为热词(如”Python”、“React”、“API”)

场景二:优化转录结果

需求:希望转录结果更规范、易读

配置方式

  • 设置润色提示词,让 AI 对转录结果进行优化

  • 启用”在简洁模式启用提示词”选项

场景三:使用本地语音模型

需求:希望离线使用语音转录功能

配置方式

  • 选择”本地模型”作为语音模型

  • 下载并配置本地语音模型


🚀 如何进入语音配置?

第一步:进入设置页面

  1. 打开应用

    • 在应用主界面,点击底部导航栏最右侧的”设置”图标(⚙️)

    • 进入设置主页面

  2. 找到”语音配置”选项

    • 在设置页面中,向下滚动

    • 找到第二个设置卡片组(包含”语音配置”、“AI 配置”、“全局记忆”、“创意工坊”)

    • 在这个卡片组中找到”语音配置”选项(带有 🎤 图标)

    • 点击”语音配置”这一行

  3. 进入语音配置页面

    • 页面顶部显示标题”语音配置”

    • 右上角有一个”保存”按钮(✓ 图标)

    • 页面分为多个设置分组


⚙️ 基础设置

语言偏好

用途:设置语音识别使用的语言,提高识别准确率

操作步骤

  1. 找到”语言偏好”选项

    • 在”基础设置”分组中,找到”语言偏好”选项

    • 显示当前设置的语言(如”中文”、“English”)

  2. 点击”语言偏好”

    • 点击这一行,会从底部弹出语言选择列表
  3. 选择语言

    • 在列表中,可以看到所有支持的语言

    • 每个语言显示:语言名称(如”中文”、“English”)

    • 点击要选择的语言

    • 选中的语言会显示勾选标记(✓)

  4. 确认选择

    • 选择后,弹窗会自动关闭

    • 页面会显示新选择的语言

    • 注意:需要点击右上角的”保存”按钮才能保存设置

支持的语言

  • 中文(简体、繁体)

  • English(英语)

  • 日语、韩语等

建议

  • 根据主要使用语言选择

  • 如果经常使用多种语言,选择最常用的语言


🎨 高级设置

语音模型

用途:选择用于语音转录的 AI 模型

操作步骤

  1. 找到”语音模型”选项

    • 在”高级设置”分组中,找到”语音模型”选项

    • 显示当前选择的模型(如”官方模型”、“本地模型”)

  2. 点击”语音模型”

    • 点击这一行,会从底部弹出模型选择列表
  3. 选择模型

    • 在列表中,可以看到所有可用的语音模型

    • 每个模型显示:

      • 模型名称:如”官方模型”、“本地模型”

      • 模型 ID:技术标识

      • 描述:模型的特点和用途

    • 点击要选择的模型

    • 选中的模型会显示勾选标记(✓)

  4. 确认选择

    • 选择后,弹窗会自动关闭

    • 页面会显示新选择的模型

    • 注意:需要点击右上角的”保存”按钮才能保存设置

模型类型

  • 官方模型:使用云端服务,准确率高,需要网络

  • 本地模型:在设备上运行,可离线使用,需要下载模型文件

本地模型设置

  • 如果选择了”本地模型”,下方会显示”本地模型”选项

  • 点击可以进入本地模型管理页面

  • 可以下载、删除本地模型

热词设置

用途:添加常用词汇或专业术语,提高语音识别准确率

操作步骤

  1. 找到”热词设置”选项

    • 在”高级设置”分组中,找到”热词设置”选项

    • 显示当前热词数量(如”3”)

  2. 点击”热词设置”

    • 点击这一行,会从底部弹出热词管理弹窗
  3. 添加热词

    • 在弹窗顶部的输入框中,输入热词

    • 支持批量添加

      • 可以用中文逗号(,)分隔多个热词

      • 可以用英文逗号(,)分隔多个热词

      • 可以用换行分隔多个热词

    • 点击”添加”按钮

    • 热词会添加到列表中

  4. 删除热词

    • 在热词列表中,找到要删除的热词

    • 点击热词右侧的”ד按钮

    • 热词会从列表中移除

  5. 保存设置

    • 点击弹窗右上角的”保存”按钮(✓ 图标)

    • 设置会保存并应用到语音识别

    • 弹窗会自动关闭

热词使用技巧

  • 添加专业术语:如”Python”、“React”、“API”

  • 添加人名:如”张三”、“李四”

  • 添加地名:如”北京”、“上海”

  • 添加公司名:如”阿里巴巴”、“腾讯”

  • 不要添加常见词:如”的”、“是”、“在”(系统已能识别)

示例

Python, React, API, 张三, 北京, 阿里巴巴

✨ 润色配置

在简洁模式启用提示词

用途:控制是否在简洁模式下使用润色提示词

操作步骤

  1. 找到”在简洁模式启用提示词”选项

    • 在”润色配置”分组中,找到这个选项

    • 右侧有一个开关按钮

  2. 切换开关

    • 点击开关,可以开启或关闭

    • 开启:在简洁模式下也会使用润色提示词

    • 关闭:在简洁模式下不使用润色提示词

  3. 保存设置

    • 需要点击右上角的”保存”按钮才能保存设置

润色提示词

用途:设置 AI 对转录结果进行优化的提示词

操作步骤

  1. 找到”润色提示词”输入框

    • 在”润色配置”分组中,找到”润色提示词”输入框

    • 输入框下方有标题”润色提示词”

  2. 输入提示词

    • 点击输入框,输入你想要的润色提示词

    • 提示词应该说明你希望如何优化转录结果

    • 示例

      • “请将转录结果整理成规范的书面语,去除口语化表达”

      • “请修正错别字,补充标点符号,使文本更易读”

      • “请将转录结果格式化为标准的会议记录格式”

  3. 保存设置

    • 需要点击右上角的”保存”按钮才能保存设置

润色提示词的作用

  • 修正错别字

  • 补充标点符号

  • 去除口语化表达

  • 格式化文本

  • 优化语言表达


💾 如何保存设置?

操作步骤

  1. 完成所有配置

    • 设置语言偏好

    • 选择语音模型

    • 添加热词(可选)

    • 设置润色提示词(可选)

  2. 点击保存按钮

    • 点击页面右上角的”保存”按钮(✓ 图标)

    • 系统会保存所有设置

  3. 确认保存成功

    • 保存成功后会显示提示:“已保存”

    • 如果未登录,会提示:“请先登录”

    • 如果保存失败,会提示:“保存失败,请重试”

注意

  • 所有设置都需要点击”保存”按钮才会生效

  • 如果未登录,无法保存设置

  • 建议在修改设置后立即保存


💡 使用技巧和最佳实践

1. 合理设置语言偏好

  • 根据主要使用语言选择

  • 如果经常使用多种语言,选择最常用的语言

  • 切换语言后,识别准确率会相应变化

2. 善用热词功能

  • 添加专业术语:提高专业术语识别准确率

  • 添加人名地名:提高人名地名识别准确率

  • 定期更新:根据使用情况,添加新的热词,删除不常用的热词

  • 不要过度添加:热词太多可能影响识别速度

3. 优化润色提示词

  • 明确目标:说明你希望如何优化转录结果

  • 简洁明了:提示词不要太长,重点突出

  • 测试效果:设置后测试效果,根据结果调整

4. 选择合适的模型

  • 网络良好:使用官方模型,准确率高

  • 需要离线:使用本地模型,需要先下载

  • 混合使用:可以根据场景切换模型


❓ 常见问题

Q1: 语音识别不准确怎么办?

A:

  • 检查语言偏好设置是否正确

  • 添加相关热词,提高识别准确率

  • 尝试切换不同的语音模型

  • 确保录音环境安静,发音清晰

Q2: 热词可以添加多少个?

A:

  • 理论上没有限制,但建议添加 10-20 个常用热词

  • 热词太多可能影响识别速度

  • 建议只添加真正需要的专业术语或特殊词汇

Q3: 润色提示词有什么用?

A:

  • 润色提示词可以让 AI 对转录结果进行优化

  • 可以修正错别字、补充标点、格式化文本等

  • 让转录结果更规范、易读

Q4: 本地模型和官方模型有什么区别?

A:

  • 官方模型:使用云端服务,准确率高,需要网络

  • 本地模型:在设备上运行,可离线使用,需要下载模型文件

  • 选择建议:网络良好用官方模型,需要离线用本地模型

Q5: 如何下载本地模型?

A:

  1. 选择”本地模型”作为语音模型

  2. 点击下方的”本地模型”选项

  3. 进入本地模型管理页面

  4. 下载所需的模型文件

Q6: 热词支持批量添加吗?

A:

  • 支持!可以用中文逗号(,)、英文逗号(,)或换行分隔多个热词

  • 例如:Python, React, API, 张三, 北京

Q7: 设置后没有生效怎么办?

A:

  • 检查是否点击了”保存”按钮

  • 确认是否已登录账号

  • 尝试重新打开语音配置页面

  • 如果问题持续,可以尝试重启应用

Q8: 可以同时使用多个语言吗?

A:

  • 目前只能设置一个语言偏好

  • 如果经常使用多种语言,建议选择最常用的语言

  • 可以在使用时手动切换语言设置


🎓 进阶使用

创建热词库

对于特定领域,可以创建专门的热词库:

示例:编程领域

Python, JavaScript, React, Vue, API, Git, Docker, Kubernetes

示例:商务领域

会议, 项目, 客户, 合同, 报价, 方案, 预算, 进度

优化润色提示词

根据不同场景,设置不同的润色提示词:

会议记录场景

请将转录结果整理成规范的会议记录格式,包含时间、地点、参会人员、议题、决议等内容。

学习笔记场景

请将转录结果整理成学习笔记格式,补充必要的标点符号,使文本更易读。

📝 总结

语音配置功能是 Dinox 中一个非常实用的功能,它可以帮助你:

提高准确率:通过语言和热词设置,提高语音识别准确率

个性化定制:根据使用场景定制语音功能

优化输出:通过润色提示词,让转录结果更规范

开始使用

  1. 进入语音配置页面

  2. 设置语言偏好

  3. 选择语音模型

  4. 添加常用热词(可选)

  5. 设置润色提示词(可选)

  6. 保存设置

需要帮助? 如果遇到问题,可以:

  • 查看应用内的帮助文档

  • 在设置中查看相关说明

  • 联系客服获取支持

祝你使用愉快!🎉