语音合成音库上新、OCR升级优化6大技术、全新开放4大开发平台、UNIT全面升级至3.0、PaddlePi-K210重磅首发、百度AI体验中心小程序更新至40项能力可体验......与百度大脑一起成长,见证AI的力量。



与百度大脑一起成长,见证AI的力量。

2019年5月

 

 AI开放能力 

1. 语音合成:全新推出精品音库

语音合成新增5个精品音库,童声音库度米朵、度小童,情感男声度博文,情感女声度小娇、度小雯,满足更多场景需求。立即体验>

2. 文字识别OCR

  • 手写文字识别模型升级
    1)支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,中文识别准确率提升38%以上,识别准确率可达90%以上;
    2)现注册即享 50 次 / 天的免费调用额度,开通付费后即可无限调用;价格低至4.5元 / 千次起。
    立即使用>

  • 数字识别模型升级
    1)支持对图片中的数字进行提取和识别,自动过滤非数字内容,返回结果包含数字内容及其位置信息,识别准确率超过99%;
    2)现注册即享 200 次 / 天的免费调用额度,开通付费后,并发量即可提升至10次/秒,超出免费额度将按次进行阶梯计费;价格低至2元 /千次起。
    立即使用>

  • 身份证识别模型升级
    1)正面:即人像面-住址字段识别准确率提升至95%+;
    2)反面:即国徽面-签发机关字段识别准确率提升至98%+。
    立即使用>

  • 银行卡识别模型升级
    支持对银行卡的卡号、有效期、发卡行、卡片类型4个关键字段进行结构化识别,识别准确率超过99%。模型升级支持识别更多地方银行的银行卡及非常规卡片(如卡号在背面)。
    立即使用>

  • 出租车票识别模型升级
    支持城市由北、上、深扩增至全国 30 余个主要城市和地区,精准识别出租车票的6个关键字段,包括发票号码、代码、车号、日期、时间、金额。
    立即使用>

  • 网络图片文字识别模型升级
    模型升级,整体识别准确率提升 11.8%,能够快速准确识别各种网络图片中的文字,在复杂字体和复杂背景的情况下仍能保持非常高的识别准确率。
    立即使用>

3. 人体分析:人体检测与属性识别模型升级

模型升级,21类属性的平均准确率从84.4%提升至88.1%。立即使用>

4. 图像识别

  • 红酒识别技术正式开放
    识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息,可识别数十万中外红酒。
    立即使用>

  • 货币识别技术正式开放
    识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币。立即使用>

  • 通用物体与场景识别模型升级
    模型升级,Top1准确率绝对值提升7%。支持超过10万类物体和场景识别,接口返回单张图片内的1个或多个物体的名称,并关联百科词条信息,广泛应用于广告及内容推荐等业务场景中。立即使用>

  • 植物识别模型升级
    模型升级,Top1准确率绝对值提升11.76%。支持识别2万多种植物和近8000种花卉,接口返回植物的名称,及百科信息,适用于拍照识图类APP中。立即使用>

 

 AI开发平台 

新开放4个开发平台:EasyDL定制视频分类、智能视频监控开发平台、一站式内容审核平台、iOCR财会版; 智能对话训练和服务平台UNIT全面升级至3.0

1. EasyDL定制视频分类

面向视频分析场景,通过标注每类50个、10s以内的视频片段进行训练,从而实现 “需要连续图片帧组合判断”的视频内容分析,可用于定制工人操作行为规范识别AI模型、定制物体移动方向判断的AI模型等业务场景中。立即使用>

2. 智能视频监控开发平台

由监控系统框架与众多视觉技能(技能是模块化的代码,包含AI模型,输入图片,可以输出检测结果) 组成的配置平台。用户通过选择技能组合并由平台自动将其与系统框架有机组合起来,即可得到一个完整的监控系统,实现陌生人、未佩戴安全帽等违规行为识别。立即使用>

3. 一站式内容审核平台

全类型、多维度整合百度大脑视觉、语音、语义能力,业界最全;基于多年业务积累,模型精度业界领先;对接海量人物库,动态更新,针对突发事件,用户可自助添加人脸,快速拥有定制审核能力。立即使用>

4. iOCR财会票据识别

1)新增票据检测分类功能,可直接识别发票粘贴单上的多张不同类型发票;

2)系统预置7种报销常用票据模板、4大行及招商银行的银行对账单模板,可满足80%以上财会场景需求;

3)对于特殊票据,支持快速自定义模板及分类器;

4)底层模型针对财会场景进行专项优化:支持自动去红章;支持套打偏移识别;金额数字识别精度更高。

查看详情>

5. 理解与交互技术UNIT 3.0

1)重磅发布「我的知识」,一站式实现知识挖掘与语义理解

「我的知识」模块在UNIT中引入了百度知识图谱通用算法集合,帮助开发者使用自有数据构建企业图谱知识库与问答知识库,挖掘的知识可用于优化技能模型的理解效果、完善对话流程的控制与答复。查看详情>
 2)全新推出「对话式文档问答」,导入业务文档自动构建对话模型

基于「对话式文档问答」技术,开发者只需导入业务文档,即可自动构建出基于文档理解的对话技能,允许开发者对对话效果进行调优,具备持续学习能力,大幅降低了产品介绍、说明等场景下的智能业务问答开发成本。查看详情>

3)全新发布对话日志挖掘工具「DataKit」,大幅提升模型调优效率

离线对话日志挖掘工具Data Kit,支持从对话日志中挖掘出对话训练样本,来训练、优化对话模型的理解效果,帮助开发者低成本地不断提升模型理解效果,样本生产和标注效率平均提升8倍。查看详情>

4)开放支持自定义调优的离线SDK,确保断网环境下的语义解析能力

具有端计算能力的离线SDK,可提供智能车载、智能家居等多个场景下的离线场景文件,并支持自定义调优,实现设备在断网环境下也可以提供语义解析服务。查看详情>

5)预置技能增至58个,满足更多场景需求

新上线可定制预置技能3个,包括会议室预定、电台控制、购买药品,开发者可以根据业务需求调整这些技能的词典,让预置技能效果更贴合业务;同时还上线了含资源预置技能:成语问答、计算器、进制转换、单位换算,可直接解析出问题的答案。立即使用>

 

 集成与部署 

1. 高性能计算卡EdgeBoard软核升级

1)网络模型阵容继续壮大,新增支持网络mobilenet-ssd、densenet,总计已支持10个网络结构;

2)多项能力持续升级,视频输入支持mipi摄像头,预测结果支持DP(DispalyPort)直接实时显示,YUV数据支持高速转RGB。

查看详情>

2. 高性价比计算卡PaddlePi-K210重磅首发

Paddle Pi-K210是一款由百度大脑与嘉楠耘智共同打造、适配PaddlePaddle模型的深度学习计算卡,包含AI Studio模型训练、应用开发、模型部署等整套解决方案。开发应用便捷、周边配套完整、百元级优质终端核心运算模块,用于AI核心运算处理单元。

查看详情>

3. 私有化部署方案升级

全面支持AI能力在物理机,虚拟机,云服务器三种环境下的私有化部署。新增支持AI能力在百度云服务器上的私有化部署:

1)满足用户数据安全的需求,实现云上用户专属AI服务; 
2)提升运维效率,享受简单高效的云服务器资源管理。

立即申请>

 

 场景方案 

1. 呼叫中心语音场景方案

包括呼叫中心场景专属语音识别模型和语音合成专属音库;适配 MRCP 标准协议,与对话系统深入配合,灵活支持打断等需求;全双工流式交互,提供低延迟、高并发的企业级语音服务。查看详情>

2. 虚拟真人助理场景方案

针对视频、媒体、广电行业需求,基于百度领先的人工智能和深度学习技术,提供定制虚拟视觉助理形象的解决方案,从而丰富用户产品形态,提高节目互动娱乐趣味性,降低运营成本。查看详情>

 

 

 百度AI市场 

1. AI市场移动版上线 
AI市场客户可通过移动设备,随时随地浏览与分享商品与店铺,并可拨打电话或提交咨询单与服务商及时沟通。 
AI市场移动版已全面推广,为服务商提供新流量入口。立即使用>

2. 商品展示支持多图与视频 
商品编辑增加多图和视频上传功能,商家可为商品信息添加多张细节图片描述、短视频描述。 
同时对商品的信息丰富程度进行了量化,丰富度高的商品会在平台推广中享有更多的推广机会。 立即使用>

3. 优质服务商及商品持续入驻

北京嘉楠捷思、无锡沃克特、青岛阿波牛、上海品览、上海图漾等多家优质服务商于AI市场上线售卖合作款芯片、人脸识别门禁、镜头模组、智能机器人等硬件产品,以及智慧农业、工业监测、SKU识别等解决方案,性价比高,品质有保障。

1)沃克特10.1寸人脸识别终端

10.1寸人脸识别终端,高清摄像头,识别速度快,活体检测,防照片伪认证。立即购买>

2)图漾科技3D摄像头FS830-HD

双目结构光RGBD 3D摄像头,工作距离0.24-3.5米,尺寸 130*32*36(mm)。适用于3D活体检测,机器人避障。立即购买>

4. 限时优惠活动-7家服务商发送3000元优惠券 
赛蓝、慧谷航天、睿识、贝塔、视派尔、奥比中光、麦哲7家热销服务商各发送3000元满减优惠券,有效期至2019年12月31日。 
您可在以下7家服务商中扫码领取优惠券,并在AI市场内下单相应商品、填写优惠码即可享受丰厚优惠。



更多商品,欢迎选购>


 百度AI体验中心小程序 

新增红酒识别、货币识别2项能力,目前已开放40项AI能力可体验,打开微信扫一扫立即体验↓ 欢迎分享到朋友圈一起AI!


 

此外,欢迎您进入AI开发者社区,进行沟通交流。