异常检测概述(二) : Reconstruction Model
发布网友
发布时间:2024-10-24 09:34
我来回答
共1个回答
热心网友
时间:2024-11-01 07:25
视频异常检测,探索方法研究进展
本文专注于视频异常检测领域的最新方法研究,关注于应用方向的深入探索与评判。异常检测从视频数据中发现不寻常之处,根据[5]定义,异常(离群点)是指一个观察结果严重偏离其他观察结果,这可能暗示其生成机制不同。异常在[4]中被解释为不符合预期的模式。预期模式可能源自专家知识、数据驱动,或两者结合的数据和专家知识建模。视频异常检测的目标是识别数据中的异常模式或运动,这些异常模式是罕见或不常见的事件。
本文对现有视频异常检测领域的方法进行了分类整理,并对有监督、半监督方法的假设进行了讨论。方法分类包括重构、时空模型、生成、和其他模型。本文重点介绍重构模型,包括Conv-AutoEncoder(CVPR 2016)、Constractive-AutoEncoder(JMLR 2014)、Adversarial-AutoEncoder、Denoising AutoEncoder、以及Cross-Channels Prediction(CVPR 2017)。
重构模型通过输入帧进行降维,然后恢复维度,以重建的图像与原图像的差异作为异常检测分数和定位依据。Conv-AutoEncoder网络结构使用滑动窗口获取连续帧,输入网络进行重构。不同时间间隔的帧取样方法用于数据增强。Adversarial-AutoEncoder通过GAN方法优化AutoEncoder的隐层表示,与高斯分布相近,改善重构损失。Denoising AutoEncoder在ICML 2008中提出,用于学习补全输入的缺失信息,生成更丰富的数据集表示。Cross-Channels Prediction(CVPR 2017)则将输入图片划分为多类通道,进行跨模态重构。
这些重构模型在不同数据集上的表现各异,Conv-AutoEncoder在CUHK avenue数据集上的AUC能够达到83%~84%。Adversarial-AutoEncoder引入了对抗性学习,生成异常热图。Denoising AutoEncoder在CVPR 2018中衍生为对抗学习单分类器,用于识别数据集的属性。Cross-Channels Prediction在UCSD数据集上表现最好,达到了97.4%的准确率。然而,该方法在UCSD数据集中的局限性在于单个行人所占的面积较小,人与人之间有足够的间隔,这使得行人之间的差异不明显,对于异常检测效果有限。
重构模型在视频异常检测中有广泛应用,为识别不常见事件提供了有效工具。不同方法根据应用场景和数据特点进行选择与优化,以提高异常检测的准确性和效率。希望本文能为视频异常检测领域的研究提供参考与启发。