论文解读 基于强化学习的时间行为检测自适应模型 2018 AAAI (论文解读基于什么理论)

文章编号:43300 资讯动态 2024-12-09 2018AAAI强化学习行为检测

雷锋网 AI 科技评论按 :互联网上以视频形式呈现的内容在日益增多,对视频内容进行高效及时的审核也变得越来越迫切。因此,视频中的行为检测技术也是当下热点研究任务之一。本文主要介绍的就是一种比传统视频行为检测方法更加有效的视频行为检测模型。

在近期雷锋网 GAIR 大讲堂举办的线上公开上,来自北京大学深圳研究生院信息工程学院二年级博士生黄靖佳介绍了他们团队在 AAAI 2018 上投稿的一篇论文,该论文中提出了一种可以自适应调整检测窗口大小及位置的方法,能对视频进行高效的检测。视频回放地址:

黄靖佳,北京大学深圳研究生院信息工程学院二年级博士生。2016 年毕业于华中科技大学计算机学院信息安全专业,获学士学位。现研究方向为计算机视觉、行为检测、增强学习等。

以下是 AI 科技评论对嘉宾分享的内容回顾。

分享主题 :AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

分享提纲:

分享内容:

大家好,我的分享首先是介绍一下行为检测的应用背景,接下来介绍我们团队提出的 SAP 模型,以及模型在实验数据集上的性能,最后是对本次分享的总结。

行为检测任务的介绍

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

但是这种方法在解决任务时存在两个难点。

首先是对于一个没有切割过的视频,比如在图中这个视频中,所需要检测的目标是一个三级跳运动,三级跳在不同的情况下,根据人的不同,所持续的时间也是不同的。

第二个难点是,目标时间出现的位置是在视频中的任意时间点。

所以说用「两阶段方法」进行目标行为预测,会产生非常多不同尺度,不同位置 proposal。最简单的方法是用不同尺度的滑动窗口,从前到后滑动,产生非常多的 proposal,然后再做分类。这种方法虽然行之有效,但时间复杂度和计算复杂度都相当高,使得在完成这项任务时往往需要花费大量的计算资源。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

为了避免这种低效的检测方法,我们提出了一种可以自适应调整检测窗口大小及位置的方法,对视频进行高效的检测。

我们最开始的想法是能不能仅使用一个滑动窗口,只需要从头到尾滑动一遍就完成 proposal 产生过程呢?

这就必须要求窗口能不断地自适应地根据窗口所覆盖的内容,能够不断调节窗口的大小,最终的窗口大小能精确覆盖目标运动,从而得到检测的窗口区间。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

我们使用增强学习作为背后的模型支撑来完成这样的循环过程,达到我们的目的。下面是 SAP 模型的框架图。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

关于 Temporal Pooling Layer

在原有的 C3D 模型中,要求输入的视频帧是固定的,一般是 16 帧或 8 帧。以 16 帧为例,当视频帧多于 16 帧,就需要对视频帧下采样,采样成 16 帧,送到视频中进行处理,这样在采样过程中会丢失非常多细节信息,造成特征表达不准确等问题。

而我们提出的 Temporal Pooling Layer 的输入帧可以是任意长度。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

我们在增强学习中的奖励设置机制。在增强学习中,对于一个 agent,如果 agent 执行了一个动作后,我们认为是执行正确的,就给一个奖励;如果认为是错的,就给一个惩罚。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

SAP 模型的训练过程,可到文末观看嘉宾的视频回放,或关注嘉宾的 GitHub 地址获取相关代码。 AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

SAP 模型的测试

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

实验过程

我们的实验是在 THUMOS'14 数据集展开的,用它的 validation set 训练模型,在 test set 上进行实验评估。我们使用了是以下两个衡量标准。第一个是 recall 值和平均 proposal 数量函数第二个是 recall 和 IoU。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

proposal 做分类后的评判标准是:Average Precison 和 mAP

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

检测性能的结果

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

上图红色圈注的部分比较的是不同的模型,在取相同的 proposal 数量,用同样的分类器做分类,哪个模型的性能会更好。结果发现,在只有 50 个 proposal 的时候,我们的方法表现的最好。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

总结

代码相关资料GitHub地址:

雷锋网GAIR大讲堂视频回放地址:

更多免费直播视频,请关注微信公众号: AI科技评论。

原创文章,未经授权禁止转载。详情见 转载须知 。

AAAI 2018 论文解读:基于强化学习的时间行为检测自适应模型 | 分享总结

全局中部横幅
JSON压缩转义

JSON在线压缩转义工具,非常方便、高质、效率,希望可以为您提供帮助。

多看阅读(duokan.com)

提供精品正版电子书免费下载和购买;多看阅读APP目前支持Android、iPhone、iPad、Kindle等多种设备。多看阅读,享受精品阅读时光。好书,你值得多看。

序多多

序多多,全新的在线网站建设和小程序开发制作的一站式saas平台,颠覆传统建站。已为深圳、广州、北京、上海和全国十万+企业公司提供营销服务.平台致力于网站建设,网站设计,网站制作,网页设计,响应式高端网站开发;系统全面支持微信小程序开发。7*12小时在线售后服务.

知海网

知海网(www.zhwenku.com),海纳百川知识如海水般无边无际,是一个在线资源分享平台,您可以找到教学课件,工作总结,行业资料,模板范文等资源,并提供用户下载获得收益的平台。

哈尔滨展览展示,哈尔滨烤漆展柜定做,哈尔滨展柜厂家,哈尔滨免漆展柜,哈尔滨接待台定制,哈尔滨眼镜展柜定做,哈尔滨华恒展柜厂

哈尔滨华恒展柜有限公司是一家集展示柜设计、制作、生产、销售于一体的综合性专业厂家!专业生产设计哈尔滨展览展示,哈尔滨展柜厂等各类展柜!一流品质欢迎定制。详询:15504628968

华科信息网

华科信息网一个专注于科学信息的综合性门户平台,致力于为科研人员、学生及爱好者提供最新的科研动态、学术资源和专业文献。通过丰富的数据库和高效的搜索功能,用户能够方便地获取相关领域的最新成果和研究进展。我们还鼓励学术交流,提供论坛和互动功能,帮助用户建立联系、分享经验,共同推动科学研究的发展。无论您是科研新手还是资深学者,华科818网都将是您探索知识、拓展视野的重要伙伴。

山东大益生物科技集团有限公司

山东大益生物科技集团有限公司是集生产、研发于一体的微生物饲料添加剂生产厂家和饲料添加剂供应商,生产微生态制剂,猪鸡水产饲料添加剂产品,打造山东微生物饲料添加剂品牌

易展网

易展网推荐优质的展会、展销会、展览会、博览会等信息,是一个展会信息、历届照片、展商的选展定展的公开平台,为参展企业提供网上展厅和展商宣传,为组展机构提供免费会展信息发布平台和展会推广宣传平台。

河池游戏网

河池游戏网是一个集海量游戏攻略、资深玩家社区、安全下载服务、个性化推荐和优质服务于一体的游戏平台。我们专注于为游戏爱好者提供全面、详细的游戏指南,以及安全、便捷的游戏下载服务,让您的游戏体验更加丰富多彩。快来与我们一起探索游戏的无限可能吧!

阳澄湖大闸蟹

阳澄湖莲花岛小宋蟹庄

全局底部横幅