整个行业都把希望寄托在智能化上,所谓智能化就是能够把人工智能引进来,把所有的视频数据除了人以外,引进人工智能 Consumer,能自动把这些视频数据里面的内容和目标变成结构化数据。
一、传统安防的现状和急需解决的问题
安防监控行业大家可能是既熟悉又陌生,如果你不是这个行业的从业者,对你来说布满摄像头的整个街道便是安防监控最重要的一种表现形式。中国是全世界最大的安防市场,十几年前国家就开始建设平安城市体系,这个体系基本决定了中国安防行业的组成和现状。
1.传统安防行业的现状
从产品角度讲,平安城市的建设会布置大量摄像头,这些摄像头产生大量录像数据。大量录像机背后有着庞大的视频网络,而这些影像数据需要传到监控中心。在监控中心,人们几乎可以看到任何地方的视频。
在中国平安城市建设里,大多数摄像头都已实现了数字化和网络化。如果想要了解中国的安防行业,我觉得可参考一下全世界规模最大的安防企业海康威视官网。我发现一件特别有意思的事,当我打开海康威视的官网时,他们这样定位自己:
海康威视对自己的定位是:以视频为核心的物联网解决方案提供商。
以视频为核心是一句很精确的话。在今天的安防监控行业里,几乎所有组成都是以视频为核心:摄像头是视频的生产者,录像机是视频的存储者,网络是视频的传播者,监控中心是视频呈现的地方。
海康威视的产品栏有网络摄像机、模拟摄像机、数字摄像机、摄像机配件,显示与控制产品、存储产品、传输产品、编解码产品、完全是以视频为核心的。
目前国内物联网规模已非常巨大,一位硬盘公司的朋友告诉我,他们公司生产的硬盘,每两块就有一块进入了安防行业。
以北京为例,属于政府和社会公共机构的摄像头总数超过 200 万个,这些摄像头和我们手机摄像头不一样的地方在于它每分每秒都在保持录像,它每天就会产生长达 200 多万天的录像,折合成年就是 5000 多年。
所以我们整个安防体系,从摄像头到存储都是一个拥有极大数据量的网络。这个网络的数据是由谁生产?当然是摄像头生产的。但这些数据是由谁消费呢?大家想想这个问题。
在我们当前的安防监控视频网络上,唯一的消费者就是监控中心里的工作人员。简单来说就是警方,他们在破案时会去查看很多录像,个数据生产的速度远超过数据消化的速度,这就导致今天安防监控行业的一个主要矛盾:我们产生了太多的视频,可这些视频却没办法消化。
《速度与激情 7》里面有一个场景,这个场景就是里有个非常强大且神秘的技术系统。
这个系统可从全世界所有的监控摄像头里面自动搜索和跟踪任何目标。好莱坞显然对视频安防行业了解甚少,观众也以为今天的 FBI、CIA 以及国内的公安局都已经开始用这样的体系,但现实并不是这样。
当今全世界的安防监控体系自动化程度离电影描述的场面相差非常遥远。
2.急需解决的问题:把普通视频数据变为有意义的“情报”
我们现在来看一下今天的视频安防网络,如海康威视所描述:它是一个以视频数据为核心的网络,这个网络产生了大量的视频数据。
那么这些数据需要谁去消化呢?当然需要人去消化,通过人工分析得到有意义的情报。
客户需要的永远是有意义的情报。无论它是出于对安全因素破案,还是因为管理因素希望了解这个城市里发生的一些事情,这些均是有意义的情报。在《速 7》中呈现了几个技术细节,如人的检测、人脸识别、车辆识别、车辆跟踪等等。这些情节在两、三年以前,每项功能和精确度并不是很高。但随着人工智能技术,尤其是深度学习的成熟,现在车辆识别、人脸识别这些基础模块的性能、精度已大大提升。
目前以视频数据为核心的安防监控体系,其实给客户带来了大量的麻烦。因为你产生了非常多的数据,把这些数据放在客户跟前,然后寻找线索,这好比大海捞针。所以整个行业都把希望寄托在智能化上,所谓智能化就是能够把人工智能引进来,把所有的视频数据除了人以外,引进人工智能 Consumer,能自动把这些视频数据里面的内容和目标变成结构化数据。
何为结构化数据?
结构化数据就是数据能够直接表达目标的性状、属性以及身份。
这种数据可以大规模去检索,大规模地分析、统计。智能化是希望 AI 能够变成以视频数据为核心的物联网里面,这些数据的 Consumer,这时候 Consumer 的 Output 就是结构化数据。
结构化数据也不能直接拿来使用,因为这些数据一旦实现了大规模结构化后,数据量仍旧非常庞大。
我们来想这么一件事,我个人对物联网的理解就是当互联网发展到一定程度,它的网民就不仅仅是人了,有很多设备也与人一样属于互联网。这些设备会自动产生数据,有一些设备会自动消化数据。
在安防监控网络上,数据的产生者是摄像头、录像机。数据的消化者是人工智能和人。
但是当人工智能把这么多的录像转变成结构化数据后,就会产生一个新的数据海洋:结构化数据海洋。如果数据没有经过很好的挖掘,那它也不是有意义的情报。
结构化数据目前已经可以使用非常成熟的手段去挖掘,这个过程中会有一些非常浅度地挖掘、简单的筛选:比如黑名单。检测到一辆车时,车牌号码是一个嫌疑犯车牌号,当我检测到车牌号码时,这辆车就被后台预警。
再比如说我要检测一个人:假设我有一张逃犯的照片,当我在某个地铁站的摄像头里看到一个人长得像这个逃犯时,它可能就变成了一个有意义的情报。
在医院里也可以有一个非常浅度的挖掘,如在医院会发现有些人来闹事,它可以把这些人提前放在“医闹库”里。当这些人来到医院时,医院的保安就能第一时间得到警告。
事实上还有很多挖掘是比上述的挖掘复杂得多,比如医院挂号的地方有很多号贩子,这些人扰乱了医院的服务的秩序,如何把这些号贩子找出来?怎样能够挖掘出号贩子和普通正常病人的差别?这里就要对号贩子的行为做一些分析,从大量的人脸数据和行为数据中自动把这些特定的人员挑选出来。
除此之外,还有一件有趣的事,当人工智能产生大量的结构化数据后,会有大量空间需要去做针对应用的数据挖掘。因为以前在没有结构化数据时期,不同客户使用的摄像头和录像机都是标准设备,他只要看到画面就行。它从画面里观察得到的信息如何体现到它的业务内容,这些事情需要人去做的。
当今天这些数据变成了结构化数据以后,在不同行业、不同场景要有大量的数据挖掘应用才能够有效地把结构化数据变成有意义的情报。
所以我认为未来人工智能在安防监控行业会有大量应用软件的市场空间,为各个垂直行业去做针对性的数据挖掘。
二、图像识别在垂直安防行业的成果
我们给大家简单地展示一下图像识别技术在一些不同垂直领域的应用成果。
1.已经成熟的车辆识别
现在下面视频是利用深度学习算法开发的车辆大数据结构化引擎。
从画面可以看到每个交通单元中,无论是机动车还是非机动车都可被检测与跟踪,对应每一个目标的属性也会被识别出来:可以检测出车牌号码、生产商、型号、年检标的状态,甚至具体是哪个年份的型号也可以被识别出来。
车辆识别问题在今天看来已经被解决了,车辆是一种非常特殊的目标,因为它有着一个独一无二的 ID:车牌号码。合法车牌号码具有唯一性,一旦把车牌号码识别出来整个问题就比较好解决。
从去年开始,车辆大数据产品已被很多厂商推出,未来也会越来越普及。