伴随着2020年的第一缕光,愿您开好头、起好步,带着 AI 在最近一个月新增的30余项技术能力上线和升级,使您的应用更顺畅,技术基础更扎实,朝着梦想更进一步。



伴随着2020年的第一缕光,愿您开好头、起好步,带着 AI 在最近一个月新增的30余项技术能力上线和升级,使您的应用更顺畅,技术基础更扎实,朝着梦想更进一步。

 

无论您在使用音频文件转写、实时语音识别、文字识别、图像技术、人体分析、自然语言处理、知识图谱等在线接口能力;还是需要人脸识别私有化部署;亦或是根据自身开发运用 AI 开发平台;还是在软硬一体的 AI 市场生态中,寻觅所需配套设施,您都可以在这里获得更多最新信息,为您的 AI 应用添砖加瓦。

 

 AI 开放能力 

 

全面开放、服务升级、商用保障,多种形式支持您的产品服务,加速创新、稳定可靠。

 

 1. 语音技术:2项能力开放邀测,1项能力增加线上自助购买方式 

 

·      语音识别-音频文件转写接口-开放邀测

将批量上传的音频文件快速识别为文字,12小时内返回识别结果。支持中文普通话及英语识别。自动将音频中的语音进行切分,并可返回每句识别结果的时间戳。适合大批量录音转文字,录音内容质检、音频内容分析等场景。查看详情>

 

·      语音识别-实时语音识别接口-开放邀测

将音频流实时识别为文字,并返回每句话的开始和结束时间,支持 websocket API 和 Android、iOS、LinuxSDK 方式调用,支持中文普通话,方言及英语识别。适用于长句语音输入、音视频字幕、会议等场景。查看详情>

 

·      离线语音合成-新增美式英语、粤语等5个离线精品音库,支持线上自助购买

推出美式英语、粤语等5个基于新技术的离线精品音库(度小译、度小台、度小粤、度小乔、度小鹿),离线音库总数达到14个,覆盖有声朗读、订单播报、新闻播报、儿童故事机、智能硬件设备等各类应用场景。查看详情>

 

 

 2. 文字识别 OCR:6项能力升级,4款产品正式商用 

 

·      身份证识别升级

身份证正面住址字段准召提升3%,背面签发日期字段提升0.8%,整体平均响应时间缩短近一半,同时增加身份证号码与出生日期、性别校验的功能,可自动判断身份证号码与性别、生日是否匹配。立即使用>

 

·      行驶证识别升级

行驶证主页车辆所有人、号牌号码、发动机号码、车辆识别代码、品牌型号、注册日期等字段识别准确率提升2%左右。立即使用>

 

·      通用文字识别升级

通用文字识别(高精度版)、通用文字识别(高精度含位置版)新增小语种识别功能,目前可支持中、英、日、韩、法、意、俄、西等20种语言,小语种平均识别准确率可达85%以上。查看详情>


 

·      网络图片文字识别升级

网络图片文字识别针对全场景图片识别准确率提升2%以上,其中针对电商场景图片识别准确率提升7%以上。查看详情>

 

·      增值税发票识别升级

新增卷票识别功能,现已支持普通发票、专用发票、电子发票、卷票等全部类型增值税发票的识别能力,全面覆盖财税报销、发票验真、账单记录等场景的识别需求。查看详情>

 

·      VIN 码识别-升级并正式商用

VIN 码识别针对车辆挡风玻璃处车架号识别准确率提升13%以上。同时,在12月5日已上线计费功能,一次性享有1000次免费调用量,超出免费调用量可开通按量后付费或购买次数包。查看详情>

 

·      护照识别-正式商用

支持对中国大陆护照个人资料页所有10个字段进行结构化识别,包括国家码、护照号、姓名、姓名拼音、性别、出生地点、出生日期、签发地点、签发日期、有效期。在12月5日已上线计费功能,一次性享有500次免费调用量,超出免费调用量可开通按量后付费或购买次数包。查看详情>

 

·      二维码识别-正式商用

对图片中的二维码、条形码进行检测和识别,返回存储的文字信息。在12月5日已上线计费功能,一次性享有1000次免费调用量,超出免费调用量可开通按量后付费或购买次数包。查看详情>

 

·      iOCR 财会版-正式商用

iOCR 财会版是针对财会报销场景提出的专项解决方案,可对各类财务票据、报销发票、银行回单、对账单进行自动分类及结构化识别,并支持用户为固定版式的新票据/单据自定义结构化识别模板及分类器,一步实现票据的自动分类及结构化识别。该产品现已全面升级,并于12月13日上线计费功能,支持按量后付费。

查看详情>

 

 3. 人脸识别:1款产品增加线上自助购买方式,灵活计费,畅享实惠 

 

·      人脸私有化部署包

全新升级为2.0版本,可适配最新主流显卡,单卡性能最高可达80 QPS。可部署在本地服务器或云服务器的软件服务,包含人脸检测、人脸对比、人脸搜索、活体检测等功能,支持百万级超大型人脸库搜索,全流程耗时 500ms 以内。在此基础上,可快速搭建一套完全自主管理的人脸识别业务系统。查看详情>


 

 4. 人体分析:1项能力开放邀测 ,1项能力全面升级 

 

·      3D 肢体关键点 SDK-开放邀测

业内首创核心技术,通过普通单目摄像头输入 RGB 图像,输出人体16个核心关键点的三维坐标信息,实时检测跟踪并精准估算人体三维姿态。高性能离线 SDK,可兼容 iOS、Android、Windows、嵌入式多种平台,在 iPhone 8 plus 上可达80 fps+,低端嵌入式平台速度可达25 fps+。可用于建立真人驱动的虚拟形象、体育类应用、康复训练等。查看详情>

 

·      人体检测与属性识别-模型升级

人体检测与属性识别算法全面优化,有效提升人体检测、抽烟、使用手机等属性行为的识别效果。支持在线 API 调用和本地服务器私有化部署,可广泛应用于人体结构化分析、电子围栏、行为监测等场景。

查看详情>


 

 5. 图像技术:2款产品开放邀测,2项能力全面升级,3款产品正式商用 

 

·      图像清晰度增强-开放邀测

对压缩后的模糊图像实现智能快速去噪,优化图像纹理细节,使画面更加自然清晰。可用于提升网站图片、手机相册图片、视频抽帧的图像质量。在安防监控/车载系统场景下,提高图像清晰度,重建画面更可辨析的监控材料。立即体验>


 

·      人像动漫化-开放邀测

运用对抗生成网络技术,结合人脸检测、头发分割、人像分割等技术,为用户量身定制千人千面的二次元动漫形象。可用于开展趣味 h5 活动或者集成到相册、美图应用等。立即体验>

 

·      商品图片搜索模型升级

优化算法,提升检索精度,在服装、鞋帽、图书、配饰、家纺等多种典型品类上,同款商品的检索效果均有明显提升。了解详情>

 

·      植物识别升级

识别种类由1.9W 种增加至2.4W 种,识别准确率提升显著。目前,支持识别超过2万种通用植物和近8千种花卉,接口返回植物的名称,并获取百科信息,适用于拍照识图类 APP 中。查看详情>

 

·      自定义菜品识别-正式商用

支持自建菜品图库,可准确识别图片中的菜品名称、位置、入库时上传的图片信息。上线计费后用户可一次性享有3000次免费调用量,超出免费额度将按次进行阶梯计费。查看详情>

 

·      果蔬识别-正式商用

支持识别近千种水果和蔬菜的名称,适用于识别只含有一种果蔬的图片,可自定义返回识别结果数。上线计费后用户可一次性享有3000次免费调用量,超出免费额度将按次进行阶梯计费。查看详情>

 

·      地标识别-正式商用

支持识别中外著名地标、景点,由原来的8万种增加至12万种;上线计费后用户可一次性享有3000次免费调用量,超出免费额度将按次进行阶梯计费。查看详情>

 

 6. 自然语言处理:2款产品开放邀测,2项解决方案开放邀测 

 

·      地址识别-开放邀测

精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业效率。立即体验>

 

·      多实体情感倾向分析-开放邀测

针对特定场景下带有主观描述的篇章文本,自动识别文本中的核心实体词,并分别判断每个实体词对应的情感极性和置信度,为新闻舆情分析、品牌口碑监测提供技术支持。立即体验>

 

·      消费者评论分析解决方案-开放邀测

挖掘消费者评论中的核心观点,全面理解售后反馈与消费者感受,帮助企业快速搭建基于评论的数据业务分析系统,通过用户反馈找到产品优化方向并提升口碑。立即体验>

 

·      智能招聘解决方案-开放邀测

包含简历解析、人岗匹配、人才评估、招聘机器人等多项应用能力,帮助企业节省招聘成本,缩短招聘周期。立即体验>

 

 7. 知识图谱:1款产品开放邀测,4款产品正式商用 

 

·      事件图谱-开放邀测

基于业界领先的知识图谱,提供不同粒度的事件图谱底层技术,主要功能有资讯事件判别,事件名称抽取,事件通用属性抽取,事件相似度判别等,可在金融风控、智能营销、舆情监控等多个场景中应用。

立即体验>

 

·      实体标注-正式商用

通过结合上下文,识别文本中的实体并将其关联到百科知识库中的唯一实体对象,同时输出实体在当前上下文最合适的概念,以达到对文本中的实体进行辨别的作用,可用于文本理解、知识抽取等场景。查看详情>

 

·      汉语检索-正式商用

融合需求识别与理解、知识推理与计算等 AI 认知层技术,基于百度汉语知识图谱积累的汉语字典及问答能力,提供汉语领域的知识检索服务,可用于在线阅读、儿童早教等场景。查看详情>

 

·      知识问答-正式商用

基于海量数据,对用户需求进行深层次、知识化理解,并结合知识查询、推理、计算等多种技术,精准满足用户需求。为用户提供多领域、细粒度的知识问答服务。查看详情>

 

·      作文检索-正式商用

基于大量作文范文数据库,提供精准体裁类别与多样化标签标记,为日常写作指导场景,提供多维度作文内容检索服务,可用于作文仿写、优秀范文学习等场景。查看详情>

 

 8. 智能创作:5项能力开放邀测 

 

·      行业热点发现-开放邀测

分析当前热点事件和话题,给您推荐适合创作的热门话题,目前已涵盖10+个行业的热点榜单,分钟级更新,网罗最新最热的行业线索。

 

·      事件脉络-开放邀测

通过热点事件脉络进行自动追溯,让您根据时间线对热点进行全面了解。

 

·      地域热点-开放邀测

覆盖全国省、市、区热点信息,7*24小时不间断更新,实时展示各个地域的 TOP 热点。

 

·      主题短语生成-开放邀测

通过输入新闻文本,快速生成5-8字新闻短标题,可广泛应用于新闻客户端、网站热搜榜单生成场景,用以提升搜索检索效果。

 

·      资讯地域识别-开放邀测

通过输入新闻文本,可对新闻中省、市、县级别的地域信息进行提取,可用于分地域频道推荐等场景,提升分发效率。立即体验>

体验接口能力请在控制台提交工单进行申请。

 

 

 AI 开发平台 

 

零代码基础、零开发成本,也能轻松使用 AI 开发平台,操作简单,功能强大。

 

 1. EasyDL 定制化训练和服务平台 

 

EasyDL 是基于飞桨的定制化 AI 训练和服务平台,面向各行业有定制 AI 需求的企业级开发者,提供从数据管理与标注、模型训练、服务部署的一站式 AI 开发全流程支持。目前 EasyDL 已推出经典版、专业版、零售版,分别面向零算法基础、AI 专业算法工程师、零售行业品牌及服务商,让各行业客户都能通过 EasyDL 一站式获取高精度 AI 服务。

 

·      EasyDL 经典版在模型精度、离线服务部署方面全新升级

物体检测设备端 SDK 高精度算法精度进一步提升,平均精度提升5%。

 

图像分割模型类型全新支持将模型发布为设备端 SDK 或部署在私有服务器,目前已支持 X86、GPU 多种硬件架构,可以实现离线计算。

 

图像分类、物体检测设备端 SDK 服务全新适配英伟达 Jetson(TX1/TX2/Nano/Xavier 版),识别速度最快可达10ms。

 

经典版设备端 SDK 上线计费,支持企业用户及开发者在线购买,单台设备授权价格低至200元。

 

·      EasyDL 专业版进一步扩展支持的训练任务类型、数据服务持续升级

全新上线自然语言处理-序列标注功能,通过定制标签,实现对一串文本中的每个序列单元进行分类标注。目前专业版支持 CRF 网络进行模型训练。在自然语言处理方向,目前专业版已支持文本分类、短文本匹配、序列标注三类任务,内置百度自研 ERNIE 2.0预训练模型,ERNIE 2.0已累计学习10亿多知识,中英文效果全面领先,适用于各类 NLP 应用场景,可在少量数据实现更高精度的模型效果。

 

数据服务持续升级,目前已经上线图像分类、物体检测云服务数据管理功能,开通该服务后,可支持用户纠正云服务模型识别结果并保存到数据集中,持续迭代模型效果。

 

·      EasyDL 零售版推出多项无需训练的标准化接口服务,进一步降低零售行业在货架巡检场景的应用门槛

翻拍识别开放邀测。商品陈列翻拍识别能够识别出通过手机翻拍出的商品陈列照片,比如商品货架陈列图片和地堆商品陈列图片,可降低人工审核人力,高效审核零售业务中通过翻拍原有图片来造假的图片。

 

门脸识别开放邀测。目前接口支持识别20万类预置商店门脸,支持自建门脸库,入库后即可识别,可准确识别门脸名称及在图片中的位置。

 

EasyDL 零售版-标准商品检测服务-日化品检测 API 开放邀测。支持识别包含常见日化用品品牌共计784种日化用品,接口返回商品名称及在图片中的位置。

 

 2. 智能对话定制与服务平台 UNIT  

 

·      结构化知识问答-开放邀测

上传表格即可一键获取对表格数据的自动问答能力,进一步降低智能对话的实现成本。查看详情>

 

·      “垃圾分类”预置技能-正式上线

预置技能再添新成员,新增“垃圾分类(上海版)”,开发者无需任何配置即可回答客户的垃圾分类问题。查看详情>

 

·      “订咖啡”预置场景方案-开放邀测

全新推出“订咖啡”预置场景方案,支持饮品推荐、下单、改单、删单等功能,节省门店服务人力,提升客户点单体验。立即体验>

 

·      对话模板升级,新增“黑名单”功能

新增“对话模板黑名单”功能,快速解决意图歧义问题,大幅降低对话模型效果优化成本。查看详情>

 

 3. AI Studio 

 

·      支持 Github 登录

支持 Github 账号 Oauth 登录 AI Studio,欢迎身在海外的您来 AI Studio 做客。立即体验>

 

·      新手引导上线

通过四个新手任务引导您进行用户认证、运行项目、学习课程、报名比赛,使您快速熟悉 AI Studio 功能及操作。完成新手任务还有礼物赠送!查看详情>

 

·      积分体系上线
AI Studio 积分奖励上线,与 AI 社区打通,总积分值可以兑换多重大礼,边学边玩赢积分,Mac、单反等你来拿!查看详情>

 

·      AI 学习地图上线

对平台精品课程进行了体系化梳理,使学习更加明确,您可以像闯关一样学习各门课程,学完之后参加考试还有礼品相送。查看详情>


 

·      项目大厅全新升级
1) 公开项目专题展示方式优化,“我的项目”增加项目标签筛选,查看项目更加便捷;同时新增上线9个优质开源项目,涵盖 CV、NLP、Rec、强化学习等热门深度学习方向,目前  AI Studio  精选专题已推出了92个优质开源项目。查看详情>

 

2) “公开项目”及“我的收藏”点击区域优化,支持头像可点击,跳转个人主页,方便查看感兴趣作者的主页。

 

·      用户关注上线

新增支持关注其他用户,增强您与其他用户的互动同时也方便您学习其他优质用户的公开内容。

 

·      Notebook 持续优化

1) 支持 PaddlePaddle 1.6.2 + PaddleHub 1.4.1;
2) 支持多终端功能,使您的训练过程更加高效;
3) Notebook 左侧区域、编码区域优化;同时优化智能感知提示,支持内存溢出错误提示及文件清理优化,使您的体验进一步提升。

 

·      课程体验升级
1) 学生课程移动端全新上线,提升学习体验;
2) 支持查看教师发布作业/考试版本,并重置作业/考试试题内容;支持教师手动对课程内容进行再排序;教学内容管理更加便捷。

 

·      多项大赛重磅上线
1)中国人工智能大赛-语言与知识技术竞赛上线。查看详情>


 

2)高规格国际化赛事——ACL 同声传译大赛上线!比赛即将开放报名,欢迎来战!查看详情>

 

 

 AI 市场 

 

丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。

 

 ·  服务商积分管理上线 

 

AI 市场服务商可在后台详细了解目前积分情况与排名,并可根据积分规则要求获取更多积分。积分越多,商品的展示与推广资源位越好。积分致力于让市场反馈好、服务质量高与百度合作深入的服务商脱颖而出,从而获得更优质的商机与订单。

 

 ·  服务商概览页升级 

 

AI 市场服务商概览页全面升级,新增消息通知、运营概况、积分概况与新功能发布列表板块,其中运营概况包括商品、客户浏览、商机、交易与开票多个子板块,方便服务商及时了解店铺运营情况,优化信息展示与服务质量,更好地满足客户需要。

 

 ·  需求广场商机发布规则优化 

 

为了及时、高质量地响应客户需求,并减少对于客户的打扰。需求广场单个商机领取次数上限降低为5次,默认公开招标时间为2个月。建议服务商定期关注需求广场,抢占优质商机,快速与客户达成商业合作意向。

 

 ·  开票流程优化 

 

客户购买 AI 市场商品,可在下单页直接填写发票信息,减少后续索取发票的填写成本。同时服务商在订单详情页,也可直接看到客户发票信息,货票地址一致,可直接合并寄送,从而节省物流成本。 

 

 ·  优质服务商及商品持续入驻 

 

深圳原图光电、福建科融世纪、北京卓视智通、广州德生智盟、厦门十一街、北京坦途世纪等多家优质服务商于 AI 市场上线并售卖抓拍机、人脸识别门禁、镜头模组、智能机器人等硬件产品,以及智能园林、车辆检测,车辆特征识别解决方案,性价比高,品质有保障。

 

1)双目活体人脸识别摄像头模组

USB 双目1080p 全高清摄像头,采用 HDR(高动态范围)技术。有效克服传统摄像头强光下人脸过曝,强逆光环境下人脸看不清楚等缺点。立即购买>

 

2)智慧食堂人脸消费系统

通过人脸替代传统的餐卡交易的模式,让学校、企业、单位等就餐可以直接刷脸进行就餐。立即咨询>


同时,欢迎大家使用百度大脑开放服务,如有任何问题请联系百度大脑小助手,您的反馈是我们持续改进的动力。