AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别 (aaai2025审稿结果)

文章编号:41838 资讯动态 2024-12-03 AAAI创新奇智人工智能2022

近日,创新奇智关于 双注意力机制少样本学习 的研究论文《Dual Attention Networks for Few-Shot Fine-Grained Recognition》被全球人工智能顶会接收为Main Track论文。

AAAI(The National Conference on Artificial Intelligence)是人工智能领域的主要学术组织之一国际先进人工智能协会(American Association for Artificial Intelligence),主办的A类人工智能学术会议。今年会议共收到9251篇投稿,最终经过大量的筛选,录取率仅为15.0%,创下历史新低。创新奇智投稿的论文脱颖而出,得益于一直以来在计算机视觉领域深厚的创新力。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

概述:

细粒度图像识别是计算机视觉和模式识别领域的基础研究课题,但是大量优质细粒度图像数据的获取和标注需要耗费大量的人力和财力,这为细粒度图像识别的推广和使用带来了巨大的障碍。

少样本学习是目前研究的热门方向之一,能够极大地减少细粒度图像识别对于标注样本的依赖,故少样本的设定下进行细粒度图像识别的相关研究,内容和成果均符合实际应用的需求。

本文通过卷积神经网络与注意力机制提取图像中的部件与全局特征,通过基于图的多示例学习对局部特征进行建模,丰富了细粒度部分的内在结构相关性,通过注意力机制发掘对细粒度图像识别有用的微妙全局信息,从而得到更高的少样本细粒度图像识别的准确率。

主要贡献

1、提出了一种由双注意力流构成的元学习方式的新型少样本细粒度框架,以获取细粒度定制图像嵌入表示。

2、开发了包含硬/软注意力机制的双注意力网络,不仅实现细粒度物体部分间重要关联的显式构建,而且能够隐式获取细微但有辨识性的细节。

3、基于三个常用的细粒度基准数据集进行了综合的实验,本文提出的模型在识别准确性上明显优于其他解决方案。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

这是一种基于双注意力流的少样本细粒度图像识别方法,包括以下步骤:

步骤1: 提取样本的特征图(feature map),生成特征图的空间注意力图(spatial attention map)引导,利用注意力引导机制,生成用于软注意力流的加权特征图,同时筛选出用于硬注意力流的深度描述符(deep descriptor)。

步骤2: 加权特征图使用全局聚合操作得到全局嵌入特征;将一个样本筛选出的所有深度描述符建模为一个多示例学习(multi-instance learning)的包(bag), 使用基于图的多示例学习方法挖掘样本部件之间的关系,得到部件嵌入特征。

步骤3: 将两个注意力流得到的全局嵌入特征和部件嵌入特征拼接得到样本最终的嵌入表示,基于原型表示和最近邻方法进行类别预测和模型训练。

本方法与现有技术相比,其显著优点为:

(1)本方法使用了两个注意力流分别得到了部件级别的关键信息和全局聚合信息,不仅对细粒度图像识别提供了区分新的部件级信息,也补充了对细粒度图像识别有用的微妙全局信息。

(2)对于硬注意力流,使用多示例方法将筛选出的有用深度描述符建模为包,并基于图的方法对包进行编码一体化得到对应细粒度部件的深度描述符的整体表示,丰富了细粒度部分的内在结构相关性。

(3)与基于双线性池的方法相比,我们的方法复杂度更低更加易于训练且有更高的识别效率。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

在三个常用的少样本细粒度图像识别数据集 (CUB Birds,Stanford Dogs和Stanford Cars) 上进行了实验,上图实验结果表明,论文提出的方法几乎在所有数据集上均明显优于其他基准方法。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

上图结果显示出我们的模型对语义簇数的鲁棒性,并且当簇数为3时识别的准确率最高。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

我们提出的基于MIL的聚合方法与原始MIL池化方法的效果,上表结果显示无论是否与全局特征进行连接,我们的方法均表现出较好的效果。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

从上表结果可见,引入本文中考虑细粒度部件间关系的方法会显著提高少样本低粒度识别的准确性。

AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别

最后,我们将实验中一些硬/软注意力样例进行可视化,上图中第一排为输入图像;第二排为硬注意力选取的深度描述符的位置,可见均对应物体的细粒度部分,如头、耳、尾、轮胎等;第三排展示软注意力,更多的细节细粒度模式能够被软注意力关注到。

版权文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
甘肃华鼎环保科技有限公司

甘肃华鼎环保科技有限公司是专业从事环境监测业务的有限责任公司主要开展环境现状(地表水、地下水、生活饮用水、空气、声、土壤、底泥等)检测,环境污染源(废水、废气、固体废物、厂界噪声、设备噪声、建筑施工噪声、交通噪声等)检测,油气回收检测,室内空气检测,以及职业卫生检测等业务。公公司下设办公室、质量控制室、检测分析室、现场室、业务室5个科室,共有员工33人,其中工程师3人,助理工程师4人,其他人员均具有大专以上相关学历。目前所有人员均持证上岗,双人持证项目117项,其中水和废水54项,环境空气和废气35项,土壤和底泥22项,噪声6项。联系电话:0930-6215224

深圳罗湖搬家

深圳鑫大众搬家公司-是专业的深圳搬家公司,在深圳各区都有搬家服务网点,设有深圳罗湖搬家公司,福田搬家公司,布吉搬家公司,南山搬家公司,蛇口搬家公司,宝安搬家公司,龙岗搬家公司等分部,深圳搬家公司电话为0755-25407857。

拉力机

上海和晟仪器科技有限公司创建于2006年,注册资金600W人民币,是一家以从事仪器仪表制造业为主的国家级高新技术企业。公司曾先后获授“创新型中小企业”、“国家高新技术企业”等资质和荣誉;是试验机、环境类仪器、热分析仪设备制造生产商。

山东一诺织品有限公司

山东一诺织品有限公司-山东一诺织品有限公司,专注高端羊毛织物,专业生产羊毛地毯、汽车坐垫,欢迎致电:13475501788

江西省龙华不锈钢有限公司

江西省龙华不锈钢有限公司,自成立以来,一直致力于不锈钢水塔水箱及不锈钢工程的研发与生产,其“龙华牌”不锈钢水箱系列更是享誉业界。这款水箱选用了进口国际通用品级不锈钢SUS304板材制造,这种材料具有优良的耐腐蚀性、抗氧化性和高韧性,保证了水箱在长期使用中不易出现损坏和变形

广州市朗欧企业管理咨询有限公司

广州朗欧咨询,专注于制造型企业精细化管理咨询,提供全天候驻厂辅导、微咨询、企业内训等服务,咨询产品涵盖供应链、精益生产、生产运作、流程落地、战略落地、薪酬绩效等,咨询行业覆盖电子、化工、五金、机械、塑胶等行业。

深圳市智语者科技有限公司

网站制作建设|系统开发|平台开发|APP开发|项目定制

物通网

物通网是集物流查询、物流配货的专业一站式物流货运信息网,是货运物流公司、货车、快递公司、搬家公司、海运公司、空运公司、发货商的汇聚地,是物流货运信息非常全面、社会需求面极广、实用性极强的物流行业网站!

中华泰山网

taishan-中华泰山网由泰安日报社主办,创立于2003年,为泰安地区唯一经国务院新闻办公室批准的新闻信息服务一类资质网站,拥有专属编辑记者80余人,建立起了以中华泰山网为龙头,包括“中华泰山·国际在线”英文频道、“泰山幸福E家园”、《泰安新闻发布》、泰安市文化产业网、泰安文明网、泰安志愿者网、泰安信息化协会网站、泰安房产网、泰安交警网等众多子网在内的泰安最大网站集群。

乐山叉车

乐山杭叉工程机械销售有限公司是一家从事杭州叉车经销、配件销售、维修业务及配套服务的企业,产品覆盖内燃,电动,托盘堆垛车,搬运车,手动液压叉车等类型,欢迎夹江、犍为、马边等各区县及眉山客户来电洽谈。

全局底部横幅