1月28日,百度大脑语音能力引擎论坛在北京召开,会上百度大脑语音引擎宣布日均调用量已经超过100亿次,全新发布和升级了14大产品内容。


语音技术作为人机交互的重要手段,不仅减轻了许多职业的信息录入压力,也在改变着传统行业的工作方式。11月28日,百度大脑语音能力引擎论坛在北京召开,会上百度大脑语音引擎宣布日均调用量已经超过100亿次,全新发布和升级了14大产品内容。其中,全新升级的语音自训练平台已覆盖到医疗护理、农业种植、桥梁建筑等多个场景,专业领域词汇识别率有效提升5%-25%。

(百度AI技术生态部总经理喻友平介绍百度大脑语音引擎全栈开放能力)


语音技术如何结合传统行业实现智能化应用?在合作伙伴分享环节,北京子杰宝贝科技有限公司项目经理肖云峰登台演说,为现场观众分享垂直专业领域语音信息录入的难点,并解说百度AI的语音技术如何助力子杰宝贝打造临床护理数据采集系统,解放医护人员的双手。

 白衣天使要用语音录入信息,难点在于专业词汇和结构化语句 

对大部分人而言,手机输入法、聊天APP、智能家居的语音输入能够满足日常生活的需求,但对医护人员而言远远不够。以最常见的临床护理数据采集分析为例,医护人员所面对的表单超过6大类,大约有100多个临床不同类型,包括各类护理记录单、各类交班报告、各类体温表单、各类评估表单、各类巡视表单等。这些表格中所涉及到的医疗、护理等专业领域词汇,都是不容易识别正确的。


这也催生了医护人员工作中一大痛点:60%的护士在护理文书书写占用时长平均为45分钟-90分钟,换算下来,一年就需要花费188小时-375小时,产生的时间成本是惊人的。究其原因,在于手工录入信息已经成为效率低下的手段,现在许多医疗机构推行设备电子化,但PC端键盘录入与PAD触摸录入本质上没有区别。


因此,语音录入成为较为高效的解决方案,但语音录入识别为文字在实际落地应用中仍然存在诸多难点,首当其冲的就是很多语音厂商的识别模型在面对医疗专业名词、生僻词时识别率过低,比如在日常语境中“房颤”可能会被识别为“房产”、“脐部”可能被识别为“齐步”。此外,医护人员录入信息往往是“数字+汉字+医疗单位”的形式,例如“早上7:20血压50,呼吸17,体温36.7,血氧99,血压120/80,胎心155”这样的结构化语句,市场上厂商也往往达不到应用标准。

 百度大脑语音自训练平台高效助力,解决多行业专业词汇识别难题 

医疗、农业、建筑、教育、政务等领域的专业词汇语音识别一直是各行业进行语音智能化转型的难题,而百度大脑语音自训练平台为各行业合作伙伴不但提供了高准确率的基础识别模型,还支持零代码的上传业务词汇、专业用语,自动地进行模型训练优化,有效提升专业词汇的识别准确率。在已经应用的客户场景上,专业领域词汇识别率有5%到25%不等的提升,而这样的大幅提升,业务人员就可以操作训练,每次训练的过程,也只需要几分钟到半小时,可以高效地完成训练优化,应用到业务场景。本次升级地智能语言处理,将识别结果根据含义、停顿,增加更合适的标点、纠错,来达到更好地识别效果、让人类更好理解。


(北京子杰宝贝科技有限公司项目经理肖云峰)


北京子杰宝贝科技有限公司项目经理肖云峰介绍,相比其他厂商,百度大脑语音自训练平台上传医疗专业词汇文本后就可以快速进行训练,操作简单易用,实现了将语音处理为数字+汉字+医疗单位组合的结构化语句。此外,百度大脑语音自训练平台支持多次补充不同科室、药品名称等语料,不断迭代优化模型版本。


“通过百度大脑语音自训练平台进行语音识别模型训练,多次迭代之后,识别率从80%提升至95%以上。” 肖云峰表示,在子杰宝贝与百度大脑合作打造的临床护理数据采集系统里,护士先对表单进行语音录入,上传到疗护理采集终端,会被自动识别为文字,再一键上传到数据分析系统,最终生成准确的结构化表单,供医生和护士查阅。


(语音录入并自动生成的结构化表单)


这一方案不仅有效降低了医护人员的工作强度,也极大提升了医院的临床护理效率,并间接降低医院科室运营成本。肖云峰表示,未来子杰宝贝将与百度大脑进一步合作,实现对医疗数据的分析与数据增值开发,并拓展医生端的语音录入解决方案。


据了解,不仅限于医疗行业,在工业、农业、金融业等等行业中,百度大脑也正在通过其强大的AI实力为三百六十行带来“智变”。 如今,百度大脑已对外开放了228项领先的AI能力,开发者超过150万,其中百度语音日调用量超过100亿,应用规模业界第一。