金秋9月,您是否收获了百度大脑 CV 盛典的应用案例、使用攻略等各种技能?不仅如此,其他技术服务、开发平台、场景方案、配套软硬件方面,我们也做了多项升级和上新,为您实现全链条服务而努力,一起来看!




 AI 开放能力 

 

全面开放、服务升级、商用保障,多种形式支持您的产品服务,加速创新、稳定可靠

 

 1. 语音技术:2项能力优化,2项产品增加线上自助购买方式,付费方式更灵活,价格更优惠 

·     语音识别-输入法模型优化

将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。语音识别-输入法接口,模型全面更新,识别准确率提升;识别速度提升3倍,耗时仅音频时长五分之一。立即使用>

 

·      呼叫中心音频文件转写产品优化

批量精准识别呼叫中心录音文件。增加支持双轨左右声道音频及 Mp3 音频格式,减少音频格式处理步骤,提升接入效率及易用性。立即使用>

 

·      语音识别极速版-预付次数包低价来袭

将60秒以内的语音快速识别为文字,更高识别率,更快响应速度。新推出预付次数包购买方式,价格更优惠,购买后一年内有效。次数包100万起卖,单次调用低至0.0012元。立即使用>


·      离线语音合成 SDK 支持自助购买

在无网或弱网环境下,支持在硬件设备端离线语音合成,提供稳定一致、流畅自然的合成体验。

离线语音合成 SDK 支持按设备数自助购买,适用于儿童故事机、服务机器人等智能硬件终端场景,支持 Android/iOS 双端 SDK 集成。100个起售,2-5元即可在设备端拥有永久合成能力。立即购买>

 

 2. 人脸识别:2款配套硬件发布及升级 

·      人脸识别开发套件——壁虎 

预置人脸识别产品终端开发所需的软硬件模块。软件包含人脸采集、活体检测、离线1:1、1:N 识别等核心功能;硬件包含定制主板、镜头、屏幕、串口及线材等配件,加上结构外壳,即可快速投入生产及部署。查看详情>


·      寻相 VX-HT01 人脸抓拍机 

百度自研人脸抓拍机,采用1/2.7''星光级 CMOS 图像传感器,并结合深度学习算法智能捕获人脸。典型场景中召回可达99%以上,准确率可达97.5%,具有高指标、高性价比的特点。

本次新增多项智能化管理功能——支持设置捕捉人脸的大小、侧脸过滤、目标区域人脸检测、支持云端固件升级。同时推出 Wi-Fi 模块版抓拍机,适用于在有 Wi-Fi 覆盖而无网线的场景下捕捉人脸。查看详情>

 

 3. 人体分析:1项能力正式商用,1项能力升级 

·      驾驶行为分析

驾驶行为分析 API 服务已于近日正式商用,每个用户可免费调用10000次,超出部分按调用量计费,单次调用低至0.0008元。针对车载场景,可识别驾驶员使用手机、抽烟、不系安全带、双手离开方向盘等动作姿态,及时发现、预警危险驾驶行为,提升行车安全性。立即使用>

 

·      人体分析私有化部署包

可以部署到「本地服务器」的「纯软件」人体识别模型服务,新增支持人体检测、人像分割等功能。适配主流 GPU 显卡,提供一键部署工具和常用运维工具,半小时即可部署完成。查看详情>

 

 4. 文字识别 OCR:3项能力开放公测 

·      名片识别

支持对各类名片的9个关键字段进行结构化识别,包括姓名、公司、职位、邮编、邮箱、电话、网址、地址、手机号。近期该模型全面升级,各字段识别准确率大幅度提升,部分字段提升超过30%。立即使用>

 

·      二维码识别

支持对图片中的二维码、条形码进行检测和识别,返回存储的文字信息。近期模型能力进一步优化,二维码/条形码识别准确率提升11%。立即使用>

 

·      保险单识别

支持对保险单中的投保人、被保人、受益人的各项信息及保费、保险种类等字段进行识别,暂支持识别各类人身保险保单。立即使用>

 

 5. 自然语言处理:1项能力开放邀测 

·      地址识别

精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业效率。立即使用>

 

 

 6. 图像效果增强:4项能力正式商用 

·      图像去雾

图像去雾服务已于近日正式商用,每个账户一次性共3000次免费调用,超出部分按调用量计费,单次调用低至0.0042元。对浓雾天气下拍摄,导致细节无法辨认的图像进行去雾处理,还原更清晰真实的图像。
立即使用>

·      图像对比度增强

图像对比度增强服务已于近日正式商用,每个账户一次性共3000次免费调用,超出部分按调用量计费,单次调用低至0.0036元。对于拍摄的过暗或者过亮图像进行对比度智能调整,使图像更加鲜明。立即使用>

 

·      黑白图像上色

黑白图像上色服务已于近日正式商用,每个账户一次性共1500次免费调用,超出部分按调用量计费,单次调用低至0.006元。可智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活。立即使用>

 

·      拉伸图像恢复

拉伸图像恢复服务已于近日正式商用,每个账户一次性共3000次免费调用,超出部分按调用量计费,单次调用低至0.0048元。可智能识别过度拉伸的图像,将图像内容恢复成正常比例。立即使用>

 

 7. 图像效果增强:1项能力开放邀测 

·      图像修复

支持去除图片中不需要的遮挡物、修复图片缺损内容,并使用背景内容进行填充,帮助提高图像资源质量。立即使用>

 

 AI 开发平台 

 

零代码基础、零开发成本,也能轻松使用 AI 开发平台,操作简单,功能强大。

 

 1. EasyMonitor 视频监控开发平台 

一站式视频监控系统配置平台依托百度大脑的人脸、人体、图像识别等计算机视觉能力,针对视频监控场景,提供丰富的预置 AI 技能,零开发门槛快速搭建一套多路视频智能监控系统。立即使用>

 

 2. 内容审核平台 

审核模型支持快速定制,审核维度更全面、策略更新更及时,同时上线多项强大能力,更灵活的贴合您的审核需求。查看详情>

 

 3. 语音自训练平台 

零代码自助训练语言模型,高效提升业务场景下的识别准确率。平台新增呼叫中心场景的语音识别基础模型,支持训练后在呼叫中心语音解决方案产品中使用,支持 MrcpServer 方式调用。立即使用>

 

 4. 智能对话定制与服务平台 UNIT 

·      全新上线结构化知识问答技能,只需提供结构化知识表格,即可实现表格数据的自动问答。查看详情>

 

·      知识建设能力重大升级:知识图谱支持可视化展示与编辑,实体关系浏览更清晰、编辑更高效;预置数据类型扩展到10种,大幅降低从文档中进行属性挖掘的成本;增加辅助实体抽取功能,实现数据的高效复用。查看详情>

 

·      网站配置功能全面通过 API 开放,企业可以通过 API 将业务系统与 UNIT 实现无缝对接,强化产品实力,拓展产品形态。查看详情>

 

·      预置技能新增“智能翻译”技能,支持对话式场景翻译,覆盖28种目标语种;“天气”技能现已接通服务资源,无需任何配置即可实时查询天气情况。立即使用>

 5. AI Studio 

·      Notebook

(1)完美支持支持 Paddle 1.5.1 以及 PARL 1.1.2新特性。

(2)项目加载速度优化,可基本保证您在 5s 内进入 Notebook 环境;同时在 Notebook 内文件较多时,同步速度提升并呈现同步状态,减少您的等待时间。

(3)菜单重组,外观升级,同时对其中容易产生歧义的名词进行了替换,使您的使用更加便捷。

(4)Terminal 功能上线, 与本地开发环境的操作相似, 提升您的开发效率。

(5)运行状态监控上线, 在状态切换时予以明确提示,便于您了解代码执行器的工作状态。

(6)Notebook 编辑过程中的 cell 模块代码提示功能优化,markdown 模块新增公式模板;支持对更多文件的在线编辑。

 

·      项目大厅

(1)上线6个新的专题,共46个官方精选项目,后续还将更新更多精选内容,方便您的学习。

(2)NLP 专区上线,对相关精华内容进行了整合,您可以更方便地找寻到自己需要的内容和解决方案。

查看详情>


·      GPU 资源

GPU 资源池进一步扩大,同时响应10月深度学习主题月活动,AI Studio 高级算力大放送。您每日点击运行项目时,自动获赠算力卡金额从12小时升级至24小时。该活动至10月底结束,小手一点,算力安排!
查看详情>

 

·      教育专区

教育版内增加考试作业功能, 进一步完善教学环节,方便教师的教学考核。立即申请>

 

·      赛事

基线挑战赛-城市区域功能分类专场上线,送出万元奖金,加送每天24小时算力,现已上线组队功能,赶快参与比赛组件您的团队吧!立即报名>

 


 场景案例 

 

跨行业场景应用,聚焦产业智能化落地,完整方案,共享成果。

 

 1. 语音识别助力农业大数据高效采集 

·      华智水稻生物技术公司旗下研发的华智育种管家 APP,通过结合百度 AI 语音自训练平台的模型训练能力与长语音识别技术,让一线育种信息采集人员通过手机 APP 即可语音采集农作物的名称、性状、指标等数据,录入工效提升一倍,农业专业词汇的识别率也通过自训练平台训练后大幅提升,实现了育种信息语音录入系统结构化管理,及专业的数据化分析等能力。查看详情>

 

 

 AI 市场 

 

丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。

 

 1. 需求广场日渐丰富 

买家需求经过市场审核即可挂在需求广场中公开招标,AI 市场服务商自由认领后即可与买家直接沟通联系。优质商机获得最快速的响应,目前已有大量商机不断对接。立即认领>

 

 2. 优质服务商及商品持续入驻 

深圳创百杭州艾芯智能北京利卓创新上海小零昆山云景上海慧逊等多家优质服务商于 AI 市场上线并售卖抓拍机、人脸识别门禁、镜头模组、智能机器人等硬件产品,以及智能化线下渠道核查、文本、语音数据标注与采集、语音对话式酒店管家解决方案,性价比高,品质有保障。

 

(1)创百 RK3399 工控主板

高性能、高稳定、高集成、高扩展的 RK3399 安卓一体板,便于适配各种场景应用。立即购买>


(2)TicHotel

是一款语音对话式酒店管家技能,搭载智能硬件可让用户以对话的交流方式,实现呼唤客房服务、声控酒店设备、酒店信息查询等服务。立即咨询>