百度AR应用VPAS视觉定位与增强技术,让圆明园大水法景观在原址重现,以全新的方式将历史还原呈现。


2015年,尼泊尔遭遇8.1级地震,大量古建筑群遭遇灭顶之灾,百度通过数字影像对加德满都古迹进行全景复原,为我们留存下宝贵的历史文化财富。四年之后,百度AR应用VPAS视觉定位与增强技术,让圆明园大水法景观在原址重现,以全新的方式将历史还原呈现。



2019百度AI开发者大会上,百度AR首次对外正式公布了自主研发的大场景物理世界交互系统 ,以VPAS(视觉定位与增强服务)为核心实现大范围的虚拟信息与物理世界的精准叠加。从偏重展示的空间级AR到注重互动的环境级AR,VPAS的发布标志着百度AR技术从能力到应用场景的全面提升。


第一个落地实例:通过百度地图入口进行实时跟踪定位,在圆明园大水法遗址上将这座宏伟建筑的原貌实景还原,让每一个走进圆明园景区的游客都能体会到AR科技带来的震撼!在DuMix AR公开课环节,我们特意邀请了百度AR资深研发工程师张永杰,对VPAS背后的技术能力进行详细的拆解。


 


 什么是VPAS?

VPAS全称Visual Positioning and Augmenting Service,即视觉定位与增强服务。




对于定位服务,大家可能对移动端的GPS 定位非常熟悉。在户外开阔的区域打开手机的GPS定位功能,手机总能显示出当前用户所在的精准位置。然而在室内或者楼宇间的窄路上,GPS定位的精度通常会受到信号弱的影响导致实际定位结果存在较大偏差。


VPAS是通过采集摄像头及其他传感器数据并进行深度融合所实现的精准定位,可以很好的覆盖室内和楼宇间的窄路场景,从而与GPS 定位服务形成很好的互补关系。此外,区别于GPS的定位,百度AR提供的视觉定位能力可以返回信息维度更多的6Dof的姿态信息(同时包含三维位置信息和朝向数据)用以支持AR 内容的精准叠加显示。

 

 三大要素满足大场景物理世界实时交互 

大场景物理世界下的实时交互需要满足三大要素:定位能力、实时跟踪能力以及对物理世界的理解能力。VPAS 中的视觉服务主要由三大模块构成,分别为高精地图构建和更新、实时视觉定位和在线融合跟踪。VPAS 方案中的视觉三维地图是通过二维视觉特征与三维空间点的对应来表示。




在高精地图构建和更新阶段VPAS采用了众源图像数据,实现了地图数据的自主更新以适应外部的环境变化,而开放性的数据接口又可以保证第三方数据的轻松接入。目前,百度AR正与多家视觉三维地图领域企业探讨数据对接合作,同时希望更多合作伙伴加入AR开放生态,共建视觉信息世界。


百度搭建了一套高实时响应的视觉定位服务,支撑用户高并发地访问定位服务器,并支持不同级别的定位能力用以满足不同的用户场景需求。而在在线融合跟踪阶段,既提供基于百度自研的支持中低端机型的跟踪框架,同时也完全兼容业内其他跟踪能力(如ARKit / ARCore),以此实现在不同场景下的连续定位能力。

VPAS 中的增强服务则是依托于百度强大的视觉计算能力,将所收集到的众源数据在后台进行集中分析处理,如批量化的语义分割、目标检测、平面检测等一系列操作。这些语义和结构化的信息一方面用于地图的维护和定位算法的增强,另一方面在用户交互时提供更丰富的空间数据,例如道路信息可用于导航,楼宇的平面信息可用于广告展示。


对于开发者而言,百度AR VPAS 系统支持不同的接入方式,既支持SDK 成套服务的整合,也支持云端API 接口的灵活接入。此次,百度开放VPAS 将进一步提升百度AR能力的对外开放力度。

 

 AR体验驱动智能旅游产品升级 

目前,百度AR VPAS技术能力已成功落地百度地图,用户可更新百度地图APP至最新版赴实景体验。基于百度地图客户端和导航的各项基础能力,将大水法古迹的AR实景复原,与语音、OCR等百度大脑丰富的AI能力相结合,实现智能旅游产品升级,让游客在游览过程中获得更为沉浸式的体验。百度AR技术团队表示,未来将继续在各类AR核心算法上持续研发,为用户提供更好的AR技术能力,并在此基础上与生态伙伴一起,提供更多场景的AR行业解决方案,赋能各行各业,共同探索AR价值。

 

了解更多百度AR最新技术,请访问链接:https://ar.baidu.com/home