科技,正在一次次帮劳动者减轻工作的繁杂与沉重。从第一次科技革命开始,人类一步步从蒸汽时代迈入电力时代,再从计算机及信息技术时代迈进“第四次工业革命”——人工智能时代。


       科技,正在一次次帮劳动者减轻工作的繁杂与沉重。


       从第一次科技革命开始,人类一步步从蒸汽时代迈入电力时代,再从计算机及信息技术时代迈进“第四次工业革命”——人工智能时代。AI开始逐渐取代那些繁重、危险、重复性的工作,让工作效率更高、让重复性工作更少、让劳动变得更有创造性。今天要讲的故事,就和人工智能这位“隐形劳模”有关,它无需历经挨饿受冻,也不会把工作谱写得惊心动魄,但是,它却在21世纪,用各种算法串联出一场新工业革命下的“AI的奉献”。

“在我们眼里,云是一串数字”


       从南宋皇城遗址的凤凰山脚路一直向南走,只需要数百米就可以到馒头山,这里是杭州最老的社区——相比山下的智能化设施遍地、互联网公司林立,馒头山社区更像是一下穿越回了80年代,到处可见的铁锈斑斑和吱嘎作响的竹椅似乎都在见证着时光的洗礼。


       杨焕强和同事们所在的杭州环境气象中心就在馒头山顶。2006年毕业后,杨焕强就住到了馒头山,这一住,就是12年。


       作为气象观测业务人员,杨焕强的工作就是看云观天,用眼睛看、用仪器看、用探空气球“看”,最近又变成了用AI软件看……飘过杭州的每一朵云,杨焕强和他的同事们都见过。


       把家安在山上的原因很简单:气象观测的工作时间是早上7:00到晚上20:30,这还是近年调整之后的时间。杨焕强刚来馒头山时,面对的是24小时3班倒的工作模式,不把家安在山上,根本留不出给自己休息的时间。


       过去的12年,除了偶尔去附近的钱塘江边跑跑步,杨焕强连过年都待在山上。他至今还记得自己第一次独自在山上过年的场景,以往都是和家人过团圆年,但现在陪伴他的只有三五个同事和布满整个场地的观测仪器。“这是岗位需要,但没点毅力还真坚持不下来。”杨焕强说。



       “与星为伴、与云为伍,这在别人看来是件浪漫的事。但在我们眼里,它就是一串数字。”胡德云说,他是杭州环境气象中心主任、高级工程师,在他和杨焕强这样的专业人士眼里,云,是可以量化的——普通人眼里的白云、彩云、乌云,在他们眼里可以细分成三族十属二十九类,天空的云量可以细化到11个级别。而他们要做的就是准确地“认”出这些云,且识别准确率不能低于80%。


       馒头山与杭州市区平均海拔相差不大,但让人感觉气温比城区里低几度,花开也比外面晚一点。但胡德云的意识却一点也不慢,他的想法总是很超前:以前气象环境中心是24小时人工值守,现在大部分气象要素实现自动化了,那能不能把剩下的部分也实现自动化,让气象观测员从馒头山的气象观测场解放出来?


       天气瞬息万变,可人工的定时观测始终不能实现高时空密度的连续观测,这个时候,AI帮到了胡德云和杨焕强。用高清视频摄像机图像结合人工智能算法,如果能够有一个云图的模型规范了不同形状的云图对应的结果,那么当产生新的云图时,只要输入模型进行比对,就能得出结果。为了验证这个想法的可行性,胡德云和他的同事在全国建立了28个站点,收集了内蒙古、青海、黑龙江、北京等多地不同的气候图片,从沙暴、扬尘到高原云状,他们全都“捕捉”到了,数量达100万张。


       收集到足够多的图片样本只是第一步。之后,他们将精选的2万张气候图片,借助百度EasyDL定制化训练和服务平台进行训练(百度EasyDL定制化训练和服务平台是一个零技术门槛的快速应用平台,用户根据文字提示进行简单的页面操作,只需四步,最快10分钟即可训练业务定制的深度学习模型。


       目前EasyDL已经开放了定制化图像分类、物体检测和声音识别、声音分类等能力),打造了一套能够智能“看云”的AI系统,这套系统里包括观察云状、云量、天况、霜露、雨凇雾凇、茶叶霜冻识别等气象图片的定制化模型,目前,已经对20多种云状、11种云量,以及雾、霾、沙尘、霜露、结冰、结雪、雨凇雾凇、茶叶霜冻等天气状况进行自动观测。



       经过不断的优化迭代,现在这套人工智能天气观测系统对20多种类型的云状识别准确率达87.5%,云量识别实际准确率也在85%以上,霜露、雨凇雾凇识别准确率均在80%以上。


       就像“人脸识别”一样,AI帮胡德云和他的同事们实现了24小时“天脸识别”,准确度不输于人工观察,杨焕强不用再每天必须守在观测场了。胡德云说:“这套系统在五月份会在3到5个气象站进行试点,效果好就有机会推广到全国。”


高清摄像机(左图)和获取的全天空云图(右图)


“AI是推动电力行业向智能化转型的关键技术之一”

       杨焕强孤守山顶仰望天空的日子里,徐振磊正在用脚丈量佛山的输电线路。

       在佛山市不到4000平方公里的土地上,铺设着超过5000公里的输电线路,而徐振磊和同事们要做的,就是保护这些线路的安全可靠运行,确保电力供应的安全。徐振磊所在的南方电网广东佛山供电局输电管理所,有9个线路班组,每班平均十来人,这些人每天要驱车100多公里,巡查沿途输电线路的情况。


       线路运维人员每天大部分的时间都消耗在路上,不仅工作量大,有些地方路况不佳,开车都很难到达。最近几年,他们开始尝试用科技进行改善,比如应用无人机帮忙巡线,还在一些线路上安装了摄像头。


       但是,即使有了摄像头和无人机等新型设备,他们依然需要定期到工地现场,和施工人员沟通情况,针对施工密集的隐患点甚至要三天一查,时刻监督现场施工安全,保障输电线路安全运行。输电线路在线监控装置的大面积部署能让人少跑几趟,但带来了新的挑战——传回来的照片仍然需要人工筛别,且数据量呈几何式增长,平均每人每天要面对几千张照片,这给审核人员带来了巨大的工作压力。


       面对庞大的工作量,徐振磊也选择了AI。


       他们借助百度大脑EasyDL训练了一套输电线路外部隐患识别模型,用来识别出输电线路中存在的吊车、挖掘机等外部隐患,一旦发现隐患,就实时通知负责该区域线路运维的班组及时排查处理,确保输电线路安全运行。


       “以前安装监控,相当于给输电线路安装了‘眼睛’,现在有AI技术,输电线路就像是有了自己的‘大脑’,不仅更快更便捷,检测的水平也提高了。”徐振磊说。


       正是AI的这个“大脑”,监测系统可以自动识别输电线路外部隐患,让班组人员和巡检员工作量减少了20%。


       当然,事情也不是一开始就这么顺利。徐振磊说,他们需要AI的识别准确率达到90%,但是最早的版本,准确度提高到80%左右就遇到了瓶颈。“只能一版一版地做迭代。”徐振磊和百度的技术人员一直琢磨怎么提高精确度。“前后迭代了十几个版本,终于把准确率给提升到了90%以上,和人工水平持平。”


       至此,AI才终于“上岗”。“那阵子振磊真是钻到里面去了,识别精度训练期间,他被派去一个偏远的地方出差,大晚上还跟我们在群里讨论。后来聊天才知道,他入住的酒店网速跟不上,他是跑去网吧做的调试。”徐振磊的同事小麦说。


       作为一个输电线路运维人员,徐振磊觉得,人工智能把自己从巡线这种重复性高、人力和时间成本高的工作中解放出来,而节省出来的时间和精力又能用来搞研发,这样就形成了一个良性循环。


       徐振磊认为,人工智能有很多优点,它是推动电力行业向智能化转型的关键技术之一,无论是配电、调度、营销都可以用AI完成——巡检机器人、智能客服、大数据分析等“隐形劳模”都在降低一线员工作业风险和强度,更重要的是让百姓用电变得更加安全可靠。

“让人工智能在工业上形成生产力,最可能的方向就是质检”


       佛山向东南145公里,就是改革开放的第一个窗口——深圳。作为新时代劳动的结晶,每个来到深圳的人,都会感受到这座城市的独特气质:现代化、科技感、活力、年轻化。自1980年成为经济特区以来,深圳一直在以惊人的速度成长,在外围郊区,座落着几家大型工厂,它们是世界级品牌苹果与三星产业链上的一个齿轮:核心零部件生产供应商。


       华付瑶,就是这些工厂里数万工人中的一个。与其他流水线上的工人不同,华付瑶身体不如他们那么健壮,还戴着一副眼镜,“别人说我不像工人,更像是个搞学术的。”华付瑶说,“我的工作是质检员,也就是产品质量的把关者。”


       “以前这活儿很枯燥,也很伤眼。”华付瑶在深圳呆了十年,见证了深圳的制造业由小到大、由传统到智能化的过程,每次走进自己的工间,他都会想起自己最初工作的样子,“那些零件,最小的可以达到1mm X 1mm,质检员都得拿放大镜看。”



       那时候,人们在手机上花费的时间还没有现在这么多,质检员要低头一批一批地检查,睁大了双眼去找零件中的瑕疵。“我们就是最早的低头族。”付瑶不止一次和别人这么自嘲,比起颈椎受到的压力,更大的伤害在于视力。高亮度的工作间里,质检员每天都要重复这样的工作8至12小时,下了班眼睛都是痛的,见风就会流泪,高度近视是常见的现象。除此之外,质检员还面临着因一个漏判整批次零件打回的风险。


       “让人工智能在工业上形成生产力,最可能的方向就是质检。”领邦仪器公司CEO崔忠伟博士说。领邦是一家为制造业提供自动化快速检测设备的高新技术企业,他们开发了零件智能分选机器人,利用人工智能的视觉技术把瑕疵零件快速精准地挑选出来。


       如何增强机器的深度学习能力,让质检过程精度更高、速度更快、运行更稳定?领邦引入了百度的开源深度学习框架PaddlePaddle,通过训练和研发,AI做到了可以检测45mm以下零件外观缺陷,如刀痕、磕边、麻点、砂眼等,并实现缺陷位置标注和分类。而且AI的工作效率很高——一台零件智能分选机器人能达到10个工人的工作效率。


       这一次,AI这个“隐形劳模”帮工厂生产成本平均降低15%,效益提升15%。由于机器检验水平稳定,大大提高了产品的交付质量,交付投诉率平均降低了30%,综合生产力水平平均提高了30%。


       让华付瑶感到安心的是,智能工厂、智能流水线并没有像以往想象的那样让他失业,他的工作从质检员变成了智能分选机器操作员,经过培训,他已经能熟练地进行零件样本数据采集、标注,分拣机器维护、数据统计和分析等工作。




“终于有空闲好好看看故乡宁波的山水了”


       崎岖行石道,外折入青云。


       很多人登上宁波市远郊陡峭的山区,都会想起李白的诗句,这里也是人们周末游览的好去处,自驾的游人总是络绎不绝,站在山顶,能看到平坦宽阔的公路在山间蜿蜒,穿过隧洞,延伸到看不见的远方。


       但在山顶上远眺的,除了游客,还有被称为桥隧养护工程师的职业人员,他们来不及去看这春意盎然的画面和嶙峋骨气的山景,就要走向下一个观测点,去检查桥梁桥墩、桥台、桥面、栏杆等,刘瑞江就是其中一位。


       “宁波有6000多座桥梁。”刘瑞江说,“宁波市下属有40名左右的桥隧工程师,再下面是一线巡检工人,每人每个月要检查一次,每次大概400至500座桥。”桥梁监测并不是远远看一看就好,他们需要现场采集病害图片,手写记录相关数据,回到工作单位后再将巡检内容汇总、分类数据并提报系统。


       “内容要记录的东西很多,比如哪座桥上、哪个部件、什么位置、病害类型、病害尺寸、定损等等。”刘瑞江说,录入很耗时,一般要花3到4天,提报系统后,会按照提报情况、区域分配维修工程师做相关维护。


       这项工作频率高、时间长、过程繁琐,愿意干的年轻人已经越来越少了,公路管理局在缺少人力的情况下,不得不将巡检工作外包给第三方。手动录入还可能错录漏录,长此以往,道路桥梁安全隐患得不到处置,会极大影响到交通安全。


       “其实公路养护行业有大量的纸质历史数据,但是传统手段应用它们成本高、效率低。”刘瑞江说,人工智能的一些技术解决方案比如NLP 、OCR 、知识图谱这时候就派上了用场。


       在北京,新桥信息研发部部门经理张磊也在想,能不能借助技术,帮助宁波的巡检工人更轻松地巡检桥梁。


       结合历史积累的道路及病害图像,北京新桥使用百度的EasyDL训练了图像分类、物体检测算法,实现训练桥梁结构类型分类、桥梁破损部位、道桥病害模型,用于帮助全国日常道路桥梁维护巡查工作。如今,EasyDL训练处的模型对桥梁破损部位识别准确率可达94%,并能识别出结构物破损、裂缝等十多种病害,完全是一名合格的路桥巡检员了。


       现在,刘瑞江和他的同事们只需要现场拍照,并测量病害尺寸即可,后台算法就能实时识别并作出相关反馈,只需要花费原来三分之一的时间,而且原来人看不见的地方,比如悬索桥顶部、桥底部,也可以通过无人机拍摄,再交给人工智能这位“员工”处理。


       刘瑞江觉得自己工作最大的变化是,他跑现场的时候,终于有空闲好好看看故乡宁波的山水了。

AI 为生物多样性研究与保护提供新的选择”


       对于刘瑞江来说,看看山水目前还是一种奢望,但是对于林聪田来说,山水,是他再熟悉不过的工作环境。


       林聪田博士就职于中国科学院动物研究所,不久前,他开发出了一个名为“生物记”的平台,这是通过百度EasyDL训练野生动物(如中国鸟类等)模型,有效解决了生物分类学研究、生物科学普及中快速鉴定识别物种难题的平台,可支持科学考察与科学普及活动,网站平台目前已经上线服务,即将推出生物记APP。


       “生物记将为中国科学院A类先导专项‘地球大数据科学工程’积累更丰富的生物物种数据,也将为野外博物教育提供强有力的科学支持。”林聪田介绍,在最新版本的生物记中,物种智能识别工具可与分类专家的专业知识相结合,帮助分类专家及野外观测人员大大提高物种识别的效率和可靠性。目前训练后的鸟类识别模型能够识别1000多种常见中国鸟类,Top3准确率达到92%,蝴蝶物种模型能够识别12个科级类别的蝴蝶。


       生物科学是如何与AI结缘的?实际上,林聪田的研究方向是生物多样性信息学,是计算机与生物学的交叉学科,于是他自然而然地把目光集中在如何用信息学的方式解决和研究生物多样性的问题。此前,林聪田也用过比较主流支持向量机、神经网络等模型,但深度学习的到来让他眼前一亮。


       生物多样性野外调查是一件枯燥的事,观测员到某一个研究区域,会沿着一定的样线进行边观察边记录样点所观测到的信息,包括观测时间、位置、生境、物种类别、数量、行为等等。



       近年来,搞生物分类的研究人员在不断减少,甚至一些学校已经放弃了相关专业招生。分类的专业人员越来越少,但是公众想了解自然,了解生物的愿望却越来越强。随着人民生活水平的不断提高,越来越多人的愿意去野外看看,想了解这些生物知识。这就产生了一个矛盾——专业人员太少,没有办法给公众提供丰富充足的知识。


       而林聪田想做的,就是在二者中间搭一座桥。“我们希望做一个平台,把人工智能、专业人员和公众整合到一起,科学研究来支持公众科学,公众科学又反哺科学研究。通过AI形成一个良性循环。”


       “比如我拿一个手机,看到了就拍到,拍到就留下一条记录。因为大众是百万量级,只要每人提供一张照片,每人提供一个位置信息,那么这个生物记录的信息成百倍地增长。”林聪田说,国外的公众科学很发达,现在单单鸟类的记录通过公众科学,就能达到几亿条。“中国你知道多少条?现在估计只在百万级别。”


       从2017年开始,林聪田就不断尝试用AI训练动物识别模型。经过不断地累积上传,现在已经突破一千种鸟类了,中国鸟类的总数在1300-1400种左右。


       并且,通过版本的快速迭代,现在借助EasyDL的定制化训练,生物记平台的鸟类识别准确率有很大提高,在保证物种覆盖度的同时,TOP3的识别准确度在92%以上,TOP5的准确率接近95%。


       在林聪田眼里,AI就是搭建专家跟公众之间的桥梁。“专家不能天天跟着公众跑,但是AI在吸取专家的知识以后,可以传播给公众。那些比较普通的工作,就由AI来做。公众可以为AI提供图像数据、记录数据,同时获取生物知识。而公众反馈给AI的数据,可以进一步训练,增强AI的能量。”


       林聪田花费了2年多的时间,终于让生物记成为了专家与公众之间的“调解员”。这两年,他带着团队收集整理野外鸟类生态图片40万幅,经过分类学专家标注筛选,最终选出20万幅,覆盖1000多个中国鸟类物种。通过使用百度EasyDL定制化图像识别进行训练,先后进行雀形目鸟类模型、非雀形目鸟类模型到1000多种鸟类模型训练,并进行逐步优化。




       目前,生物记APP框架搭建已经完毕,正在进行内部测试运营,预计5月就会上线。届时,公众只需要下载一个App,就能在人工智能的引导下,随时随地记录身边观测到的物种,包括观测时间、观测地点、观测笔记等。用户可以为每一条观测记录提供相关证据,批量上传物种图片。通过百度EasyDL训练的鸟类识别模型,用户可以快速获取物种名称与百科知识。