百度大脑语音方向正式推出语音自训练平台,面向外部个人及企业开发者提供语音识别训练平台,支持零代码自助训练语言模型,高效提升特定业务词汇/用语的识别准确率。


尊敬的百度AI开放平台用户:

百度大脑语音方向正式推出语音自训练平台,面向外部个人及企业开发者提供语音识别训练平台,支持零代码自助训练语言模型,高效提升特定业务词汇/用语的识别准确率。

 

功能介绍

  ●  创建模型、系统评估

用户可上传业务场景音频+标注文件,由系统自动评估多种语音识别基础模型得到基线准确率并进行模型推荐。输出字准、句准、核心词准等多维度评估结果报告。

  ●  上传语料、训练模型

用户选择一个基础模型后上传业务场景相关文本训练语料即可自助训练语言模型,支持词汇、长文本等多种训练方式。训练结束后自动评估训练后模型并输出多维度训练结果报告。

  ●  快速迭代、上线使用

用户可以上传数据多次迭代训练,直至达到预期效果。可以通过自助流程申请模型上线,审批通过后模型自动化上线,目前支持Android、iOS、Linux SDK三种方式调用。

 

平台优势

  ●  深度训练,零代码自助操作

全流程平台化自助操作,上传业务场景下的文本训练数据即可训练,生成业务专属模型。

  ●  精准有效,训练效果直观可视

通过上传的语音标注文件科学评估训练前后准确率对比,直观展示训练提升效果,提供多维度训练结果报告。

  ●  迭代优化,个性化模型专属使用

支持词汇、长段文本的训练方式,可以多次上传数据迭代训练直至效果满意,用户模型上线后专属使用。

 

适用场景

  ●  语音助手

会议室预订、功能指令等短句语音交互场景中,可通过手机app实现智能语音交互,通过训练业务场景所需识别的词汇和句子,提升识别效果,提高流程效率。

  ●  语音输入

即时通讯、订单录入等长句语音识别场景中,可以上传业务场景句子或长段文本语料训练优化识别模型,使您的长语音录入识别更加精准,服务更流畅。

  ●  智能客服

通过使用特定业务领域语料如运营商业务、金融业务等,训练出更适配业务场景的识别模型,解决客服对话中的专有名词、人名等识别不准确的问题,提升通话识别准确率。

 

详细产品介绍请见:https://ai.baidu.com/tech/smartasr

技术文档地址:https://ai.baidu.com/docs#/SmartASR-intro/top

 

欢迎新老用户试用,同时您还可以进入AI开发者社区,进行沟通交流。