研究背景:
人群分析是计算机视觉,模式识别领域内一个非常重要的研究方向。以此为基础构建智能化的监控系统和网络,作为安全监控的一种新手段已经得到了高度重视。智能视觉监控的出现使得对人群的监控可以不依赖于人工,而是利用计算机视觉自主分析特定复杂场景下的监控对象的行为。随着公众活动变得频繁,由高密度人群引起的事故越来越多,因此基于视觉计算对人群场景的理解、人群密度估计及异常行为分析已经成为一个非常具有研究意义和实用价值的课题。
研究成果:
提出了基于residual building block 的RBBnet人群计数模型。
图1,RBBnet结构图
人群密度计数普遍采用多列CNN网络。然而,尺寸不同的卷积核对相同的输入表现出非常相似的一致性,多列CNN并不能有效解决尺度不变性的问题,而且无效列的加入会带来大量亢余的参数。基于此,我们以单列CNN为主干,在两个卷积层之间插入跳跃的短线连接(short cut)形成残差单元,构造基于残差单元的卷积神经网络(RBBNet)来提取人群密度特征并回归得到密度图。通过在单列网络中加入残差单元,使得网络参数更加精简,残差的引入使梯度更容易流动,加速了网络的训练过程。对比于现有的网络,我们的RBBNet网络能够有效应对各种复杂的人群密度场景,并在多个主流的数据集上(如ShanghaiTech Part_B)都获得了最好的结果。图2从左到右分别显示了真实场景图片、真实值和预测的密度图,可以看出无论是生成密度图的质量还是统计的人数都十分接近真实值。
图2,RBBNet输出的密度图和性能对比
Jing Li, YaoKai Xue, Weiqun Wang, et al. Cross-Level Parallel Network for Crowd Counting[J]. IEEE Transactions on Industrial Informatics, 2020, 16(1): 566-576.(SCI 1区)
Yaokai Xue and Jing Li, “Crowd Counting Via Residual Building Block Convolutional Neural Network”, The 3rd Int’l Symp. Autonomous Systems, accepted, 2019. (EI)