专题 物联网中智能视频技术的 现状与分析 李万才 摘要:在物联网的前提下,视频信息可以传送和集中的价值并不仅仅是跨越空间距离获取信息,更关键的是在这个基础 上可以扩展各种各样的智能分析应用,这正是物联网之于监控联网的最大好处。本文分析了智能视频监控在物联 网中的应用现状,总结了当前智能视频监控的关键技术,并展望了其发展趋势。 关键词:物联网智能视频安防监控图像识别 一、视频监控是物联网的重要组成部分 的眼睛,而智能视频系统或设备则可以看作人的大脑。视 频监控就是物联网的感知环节少不了的“眼睛”。然而, 视频监控只是安防行业的其中一个重要应用领域,以 监控探头拥有数量和监控数据存储量非常巨大,随之而来 往并没有融入系统、互联这些概念。但是近年来,由于平 的问题是如果完全依靠人工分析和监控,会存在效率低 安工程、电力变电站、银行网点监控联网等对互联网需求 下,识别率不高,以及存储困难等问题,常常不能实时发 的不断增长,打破了传统视频监控的狭窄领域,在物联网 现突发事故的发生情况。随着国内“平安城市、和谐社 的大背景下提出了新的应用需求。我们可以理解为:摄像 会”的迫切需要、城市安防“31 1 1”工程建设的进一步发 头本质就是信息的采集点,编码设备则是信息数字化的变 展,数以万计的摄像监控设备在同时工作,如此庞大的监 换点,它们结合起来共同完成“物联网”的第一步功能, 视系统,需要成千上万的人紧盯着屏幕。仅依靠视频监控 那么随之而来的应该是全面的IT化、互联网化,即lP化之 中的人眼检测,即使是专业操作人员也难以构成真正有效 后的架构、技术和系统。如果说物联网是大趋势,那么 的安全系统。智能视频(rV,IntelligentVideo)源白计算机视 IT和安防的融合就是必然的,所以对于监控而言,联网是 觉(CV,ComputerVision)技术。计算机视觉技术是人工智 不可避免的。这就是三者之间的逻辑关系。如平安城市的 ‘ ̄I(AI,A cl allnle Iligent)研究的分支之一,它能够在图像 联网监控,是将原本各个区域和楼宇分散的监控资源整合 及图像描述之间建立映射关系,从而使计算能够通过数字 成一个地域范围的一体化监控资源,然后再将城域的资源 图像处理和分析来理解视频画面中的内容。视频监控中所 整合成一个广域的资源。在物联网的前提下,信息可以传 提到的智能视频技术主要是指: “自动的分析和抽取视频 送和集中的价值并不仅仅是跨越空间距离获取信息,更关 源中的关键信息。”随着物联网的逐步推广,以及人们对 键的是在这个基础上可以扩展各种各样的智能分析应用, 智能化的强烈要求,智能视频监控迎来巨大的发展机遇,物 这正是物联网之于监控联网的最大好处,如同互联网的价 联网必将对视频监控产生深刻影响,包括其理念、技术、 值,我们得以对大量信息进行处理、加工以及应用。可以 形态和效果。视频监控的智能化给计算机视觉在公共安全 预见的是,随着物联网应用范围的扩大,未来几年,各行 领域中应用提供了广阔的前景,智能视觉监控成为一个逐 各业的视频监控业务发展都将沿着这条路前进。 渐兴起的研究方向。 二、视频监控的智能化是物联网应用的 三、智能视频监控在物联网中的发展现状 必然要求 当前视频监控已全面进入全数字化时代,即网络化视 物联网是指通过射频识别、红外感应器、全球定位系 频监视系统,它基于标准的TCP/IP协议,所以又称为 统等信息传感设备,按约定的协议,把任何物品与互联网 IP监控系统,最早出现于2001年。数字化视频监控的优点 连接起来,进行信息交换和通讯,以实现智能化识别、定 是克服了模拟闭路电视监控的局限性:数字化视频可以在 位、跟踪、监控和管理的一种网络。如果把摄像机看作人 计算机网络上传输图像数据,基本上不受距离限制,信号 物联网技术在警务领域的应用 不易受干扰,可大幅度提高图像品质和稳定性;数字视频 可利用计算机网络联网,网络带宽可复用,无须重复布 线;数字化存储成为可能,经过压缩的视频数据可存储在 磁盘阵列中或保存在光盘中,查询简便快捷。在智能化方 面,当前视频监控系统试图利用计算机视觉技术对摄像机 采集的视频信息进行分析、理解和处理,将无关的信息滤 统计通过的车数、平均车速、是否有非法停靠、是否有故 障车辆等等。 对于智能视频处理的研究,日本、德国和美国等发达 国家早在上世纪六十年代就开始了,但直到上世纪九十年 代后期,随着光电子技术和计算机技术的发展才取得了广 泛的应用,其市场潜力十分巨大。据“视觉系统国际公 一 除,只将提取出的有用的信息报告给监控人员进行处理, 从而实现预警、防范和主动监测的功能,以达到代替人完 成监控任务的目的。一种基本的智能视频系统结构如下图 1所示。 白-阳: 嚣 } 堙也 采船荐 群 图1智能视频监控的基本系统结构 智能视频技术目前已在如下的几个地方得到应用: 1.高级视频移动侦测:在复杂的天气环境中(例如雨 雪、大雾、大风等)精确地侦测和识别单个物体或多个物体 的运动隋况,包括运动方向、运动特征等。 2_物体追踪:侦测到移动物体之后,根据物体的运动 情况,自动发送PTZ控制指令,使摄像机能够自动跟踪物 体,在物体超出该摄像机监控范围之后,自动通知物体所 在区 3人物面部识别:自动识别人物的脸部特征,并通过 与数据库档案进行比较来识别或验证人物的身份。此类应 用又可以细分为“合作型”和“非合作型”两大类。 “合 作型”应用需要被监控者在摄像机前停留一段时间,通常 与门禁系统配合使用; “非合作型”则可以在人群中识别 出特定的个体,此类应用可以在机场、火车站、体育场馆 等安防应用场景中发挥很大的作用。 4.车辆识别:识别车辆的形状、颜色、车牌号码等特 征,并反馈给监控者。此类应用可以用在被盗车辆追踪等 场景中。 5.非法滞留:当一个物体(如箱子、包裹、车辆、人 物等)在敏感区域停留的时间过长,或超过了预定义的时间 长度就产生报瞽。典型应用场景包括机场、火车站、地铁 站等。 6.交通流量控制:用于在公路上监视交通情况,例如 司”的一份调研报告显示:1 999—2004年北美的智能视频 系统市场规模从1c三]一 6.8亿美元增长到1 9亿美元。至于智能摄 像机,NI、SONY、霍尼韦尔、松下等公司的产品占据了 很大的市场。以美国国家仪器有限公司(National Instruments,简称NI)推出的NIl742智能相机为例:NI智能 相机是一种连接了工业控制器和图像传感器的嵌入式装 置,并且集成了Nl视觉软件,可直接在相机上实现图像处 理。NIl742有一个533M HZ的处理器,它们都可专门用于 苛刻的工业环境。运用于这种照相机的单色VGA(640 X 480)图像传感器是一个高质量的Sony电荷藕合器。该相机 还有内置工业l/0,包括两个光隔离数字输人和两个光隔离 数字输出,一个RS232串行端口和两个包括Modbus TCP在内的支持工业协议的千兆以太网端口。另外, NIl742包括正交编码器支持功能和一个以Nl直接驱动光源 技术为特l生的内置控制器。通过正交编码支持功能,工程 师可以轻松地通过线性或旋转驱动系统来实现同步监测。 这些高清晰度的智能摄像机将使监控系统更上一层楼。就 国内来说,随着近十年的学习进步,出现了海康威视、大 华等一些视频监控产品提供商,并都已进入全球前十的行 列,在这个领域做出了很大的贡献。比如海康威视的智能 可控摄像机,运动过程中图像平稳、预置定位精确,还实 现了报警联动、巡航扫描、花样扫描、定时启动、两点扫 描等功能,满足了大多数场合的需要。但是,我们还是必 须看到,国内的产品所使用的机芯大多仍是由SONY等国 外提供是供应的,另外在智能算法方面缺乏专利权,同国 外先进水平仍有相当的差距。 四、智能视频监控的关键技术介绍 智能视频监控技术涉及图像处理、图像分析、机器视 图2智能视频监控主要组成部分 Police Technology 201 0年1 1月 9 一 —专题 觉、模式识别、人工智能等众多研究领域,是一个跨学科 的综合问题。它的主要组威部分如下图2所示。 (一)运动目标检测 运动目标检测,是将目标物体所在区域从视频序列的 图像中分离出来。后续工作中的运动目标提取,以及运动 目标的跟踪和行为理解都是在正确检测识别目标物体的基 础上进行的。运动目标检测是视频监控系统中的前导步 骤。 运动目标检测分背景检测和目标检测,现有的背景检 测方法大致有四种:背景统计法、Surendra背景更新算 法、卡尔曼滤波法以及背景模型法。背景统计法通过在一 段时间内对像素点的灰度统计,取其平均值作为背景点的 灰度估计,滤去变化剧烈的部分;Surendra背景更新算法 通过计算帧差图像得到物体的运动区域,对该区域内的背 景保持不变,对非运动区域的背景点进行加权迭代更新, 得到背景的估计图像;卡尔曼滤波法(Kelman)是将每个像 素点的灰度时间序列视为带有噪声的背景灰度观测值,通 过时域递归低通滤波来估计出缓变的实际背景图像。背景 模型法对每个像素点建立统计模型,认为像素点的灰度分 布符合某种概率分布,如高斯分布模型,混合高斯分布模 型,非参数化模型。 目标检测算法中常用的主要有三种:光流法、帧问差 分法和背景减法。光流法,是采用运动目标随时间变化的 光流特性,通过计算图像序列的光流场提取运动目标。计 算复杂、耗时,难以满足实时『生检测;帧间差分法,通过 比较相邻两帧图像灰度值的不同,来提取运动的目标。计 算简单,对运动变化区域敏感,但是检测出的物体在运动 方向上被拉伸,运动目标位置不精确,部分运动目标信息 被去除,不能完整地提取运动目标;背景减法,是将当前 帧图像和背景帧图像相减,若某点像素差值大于某一阈 值,则判定为出现在运动目标上的点,相减的结果直接给 出了目标的位置、大小和形状等信息。主要涉及背景估计 和更新,定位精确,但对光照和环境变化敏感。 (二)运动目标提取和特征表示 在运动区域中将多个运动目标提取出来,通常使用形 态学操作来进行目标的标记和计数。形态学的基本运算有 四种:膨胀,腐蚀,开运算和闭运算。二值形态学中的运 算对象是集合,通常给出一个图像集合和一个结构元素集 合,利用结构元对图像进行操作。结构元是一个用来定义 形态操作中所用到的邻域的形状和大小的矩阵,该矩阵由 0和1组成,可以有任意的大小和维数,数值1代表邻域内 10匿圜2010年11月 的像素,形态学是对数值为1的区域进行的运算。在对得 到的二值图像消除噪声后,则对图像中的运动区域进行标 记和计数。基于矩阵的标记方法,主要通过对每个像素作 一个标记,使得属于同一个连通组元的像素有相同的标 记,一幅标记图像用一个矩阵表示。提出基于像素标记的 方法,对一幅二值图像从左向右、从上向下进行扫描。标 记当前正被扫描的像素,检查其与之前扫描到的若干个近 邻像素的连通性。将所有等价的标记归入等价组,对每个 组赋一个唯一的标记,然后第二次扫描图像,将每个标记 用它所在等1 目的标记代替。在确定目标区域轮廓时可使 用外接矩形方法,通过提取运动目标外接矩形的特征来表 述物体特征,如外接矩形的重心,面积等。但是会导致得 到物体的特征不准确,如当物体不能充满矩形框的大部分 区域时,则外接矩形面积不能很好地表述物体。 同时,以Marr的计算机视觉理论为基础,出现了很多 图像轮廓计算方法,如经典的边缘检测算子和图像分割算 法等,并且出现了依赖于高层信息的图像分割的新理论。 其中最富有代表陛的是Kass等人提出的基于目标轮廓曲线 能量泛函的Snake模型(或主动轮廓模型),其基本思想是在 图像中找出一条参数化的轮廓曲线,在该曲线处内能 (Internal Energy) ̄[I势 ̄#.(Potential Energy)的加权总和达到 极小值,以精确逼近运动目标的轮廓线。 (三)运动目标跟踪和行为理解 在目标跟踪问题中,典型的跟踪算法包括使用点、线 或者区域等特征对相邻帧进行目标物的匹配问题。跟踪的 分类方法有很多种,如常见的有基于模型的跟踪,基于轮 廓的跟踪,基于特征的跟踪等。Haritaoglu等人在W4系统 中采用目标的灰阶纹理、轮廓形状信息和一个动态模板进 行跟踪。近年来,均值漂移(Mean Shift)算法已广泛应用于 计算机视觉与模式识别等领域,如目标跟踪。CamShift算 法是应用广泛的跟踪方法之一. 五、结束语 物联网通过物物相连的庞大网络实现智能交通、智能 安防、智能监控、智能物流以及家庭电器的智能化控制智 能视频监控作为最早应用物联网的重要技术之一,其发展 必将受到物联网的巨大影响.智能视觉监控技术涉及图像处 理、图像分析、机器视觉、模式识别、人工智能等众多研 究领域,是一个跨学科的综合问题,也是一个极具挑战陛 的前沿课题。目前,相关的研究尚处于探索研究阶段,要 真正实现监控技术的智能化还需要大量的工作。