OCR 技术最大化的方便了信息以“更自由的”方式进行快速高效地传播。其中,百度大脑 OCR 基于深度学习技术,更是突破了很多外在环境限制,在教育领域中极大地促进了教育信息化的发展,满足了千万老师、学生、家长以及培训机构等等多方的日常需求。


“教育信息化”是信息与信息技术在教育中的应用与推广,它的发展离不开各种信息技术的支持。光学字符识别(Optical Character Recognition,简称 OCR)是人工智能技术之一,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,它让“计算机”和“ 人”一样, 看图识字。


OCR 技术最大化的方便了信息以“更自由的”方式进行快速高效地传播。其中,百度大脑 OCR 基于深度学习技术,更是突破了很多外在环境限制,在教育领域中极大地促进了教育信息化的发展,满足了千万老师、学生、家长以及培训机构等等多方的日常需求。


百度大脑 OCR 技术具备识别准确率高、场景覆盖多、语种丰富、兼容性强等特性,支持文档电子化,卡证核验、财会报销、交通物流、教育培训、内容审核等各类文字识别场景,以及中、英、日、韩、法、德、意等20多种语种,并可以云端、嵌入式、私有化等多种部署方式赋能多种多样的场景。


目前,这一技术已被教育行业迫切应用,“解放知识分享的生产力”,减轻家长辅导的压力、提升老师阅卷效率,同时也实现了高校智能化管理考生信息。


▲ 百度大脑 OCR 技术在教育场景的应用


 拍照搜题:妈妈再也不用担心孩子作业不会做 

近日,“浙江杭州吴先生辅导孩子写作业时把自己的手用绳子绑在了身后”的新闻引起了广泛热议。“反复讲过的题,还是一遍遍地错,我心里那个火啊。”吴先生这样解释到。这句话似乎道出了所有家长在辅导孩子写作业时的“崩溃”心态。面对家长辅导作业的“世纪难题”,一款叫做“导学号”的 App 研发了可以准确对课本题目进行识别的“一键拍照解题”功能,让孩子不用家长的“苦心”“手把手”辅导,也能自行搜索解题思路和答案,帮助家长减轻了辅导压力。


导学号 App 是一款专门为中小学生设计的专业辅导应用。在大多数实际使用场景下,市面上现有的“拍照解题”功能,容易受到拍照角度、环境光线、设备配置、书本的颜色差异等因素的各种影响,从而使得题目的识别准确率很低,导致用户体验较差。


为提升识别准确率,导学号 App 接入了百度大脑结合深度学习技术的 OCR 通用文字识别技术。用户只需通过导学号自定义相机拍摄题目,裁切选中需要搜索的题目,App 会快速准确识别题目,然后自动通过搜索引擎搜索答案,为用户返回匹配度最高的题目及题目的解析辅导内容。


在接入百度大脑 OCR 技术后,导学号 App 有效字符识别率大幅提升40%,题目搜索成功率由原来的56%提升至98%。在提升了识别搜索准确率的同时,大大优化了体验,也相应地减轻了家长辅导压力与学生的自学压力。


▲ 导学号 APP 拍照搜题流程


 智能阅卷:将老师从繁琐的批改中解放出来 

在教育领域中的另一经典场景中,阅卷对老师来说一直以来都是一项繁重的机械式“劳动”。随着2019年渐入尾声,每年岁末的期末考试也随之而来。期末考不仅仅是对学生的考验,也是对阅卷老师的“体力考验”。庞大的阅卷工程造成阅卷老师过度疲劳的同时,也难免面临着因人工批改带来的批阅误差。


“河南悦学” 是一家主要从事互联网科技应用服务的新兴技术公司,在其数字教材应用云软件中运用了百度大脑 OCR 手写识别和数字识别技术,来帮助老师实现智能阅卷,解决了阅卷老师手动阅卷易出错、耗时多的难题。


通过这两项技术对经过分割处理的答题卡图片进行扫描,一方面,能够智能识别学生考号、姓名等信息,以此来判断学生的身份;另一方面,也可以自动识别试卷中的客观题答案,自动计算考生分数,生成考生的个人学科分析报告,最终以四芒星图来展示学生的学业水平和解答能力,帮助老师更加直观地了解考生的学业状况。


相较于传统手动批阅试卷的方式,接入了百度大脑 OCR 技术的智能阅卷方式节约了老师约40%的时间,大大解放了被束缚于阅卷重复劳动的老师,也提升了阅卷效率。


  
▲ 河南悦学智能阅卷过程


 考生信息智能化管理:信息化时代高校的有效“管理法” 

此外,考生信息管理也是 OCR 技术落地的一大重要领域。据教育部公布数据显示,2019年全国高考报名人数达1031万,而即将到来的考研,报名人数也已达290万。如何对如此庞大的考生报考信息进行有效的管理与录入,同时在报考志愿填写期间对海量的招生信息进行电子化管理,让考生和家长更快捷的获取,也成了信息化时代高校智能化管理的重要课题之一。


针对考生准考证信息的有效录入与管理,苏州白鸽云通过集成百度大脑 iOCR 自定义模板文字识别开发平台,成功搭建了高校 CET(大学英语四六级考试)考生信息管理系统,能快速精准地对 CET 准考证文件中多项考生信息(如:考生姓名、准考证号、座位等)及学生成绩报告单中的关键字段进行结构化识别提取,并将其自动录入高校教务系统、考生信息档案,帮助各大高校降低了人工录入造成的校验成本,缩减了超40%的人力成本,从而实现了高校对 CET 考生信息及考试成绩的智能化便捷管理。


▲ 白鸽云对高校 CET 考生信息的录入


除了苏州白鸽云通过 iOCR 自定义模板文字识别开发平台对准考证信息进行结构化识别之外,杭州布谷科技也推出了高考志愿填报类 App 云志愿,来帮助高校实现招生信息的智能化管理。运用了百度大脑 OCR 技术及 NLP 技术的云志愿 App 在短短的2天内就完成了对全国28个省份的《招生计划》和《报考指南》的全部电子化工作,在电子化录入的过程中,节省了89%的时间成本和75%的人力成本,同时也为考生与家长带来了良好的查询体验。



▲ 云志愿 APP《招生计划》和《报考指南》的电子化


目前,百度 OCR 技术已通过百度大脑 AI 开放平台全面开放给第三方使用,以打破封闭的研发生态,积极推动技术在具体场景上的落地。


除了教育场景外,百度大脑 OCR 技术也已在医疗、交通、财税等场景实现了通用化的综合解决方案,未来百度大脑 OCR 也将继续利用技术优势,助力更多行业场景的智能化升级。