自研AI芯片 AutoML 依图加速行人重识别 ReID 大规模商业化落地 (自研芯片v1)

文章编号:40470 资讯动态 2024-12-03 行人重识别

人脸识别之后的下一个风口是什么?

对于这个问题,业界似乎早已有了共识。从AI的人脸识别能力超越人类以来,学术界和产业界的目光逐渐转向另一个更具科研意义和应用价值的课题——行人重识别(Person Re-identification,ReID)。

近日,依图科技在ReID领域取得新突破,刷新业界三大权威数据集当前最优成绩(SOTA),算法性能达到业界迄今最高标准,极大拓展了算法和应用的边界。

AutoML+自研AI,依图加速行人重识别(ReID)大规模商业化落地

注:YITU算法结果在不利用时空信息,不进行重排再优化(Re-ranking),等限制下取得

还记得2018年底依图进军智能语音,随即在中文语音识别领域创下识别精度的新纪录。2019年5月推出全球首颗云端视觉AI芯片,而且“发布即商用”。似乎无论进入哪个技术领域,依图都能快速将行业整体水平推至新的高点,并加速技术的产业化落地。

这背后的关键是什么?

行人重识别(ReID),人脸识别后的“杀手级应用”

在交通运输、工业制造和城市规划等实际场景下,99%的图像都是不含人脸或人脸部分是极其模糊的,仅有几个像素大小,这时候人脸识别的作用较为有限。

行人重识别(ReID,也称“行人再识别”),是指在多摄像设备网络下对行人进行检索,利用步态动作、身体特征等更为全面的信息来识别人物,无论单独使用还是与人脸识别相结合,都能发挥更大的应用价值。

除了智能零售、智慧交通、智能城市等经常提及的应用场景,ReID技术的应用也将使日常生活更加便捷:游乐园更易寻找走失儿童、宠物/家庭机器人可以凭背影准确识别主人或顾客并提供相应服务。

然而,由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物,而这些摄像机所覆盖的范围彼此并不重叠,导致缺乏连贯的信息,而且不同画面中人物的姿态、行为甚至外观(比如: 正身、侧身、背身)会发生较大变化,不同时间、场景的光照、背景和遮挡物各不相同(背景中常还有体型、衣着相似的其他人物干扰),摄像机的分辨率也有高有低,人物在画面中出现的位置有远有进, 这些都对ReID技术提出了极大的挑战。

深度优化ReID算法框架,AutoML取代人工算法调优

依图科技凭借自身工程与研发实力,深度优化了ReID算法框架,显著提升了算法效率,通过结合AutoML等前沿技术,进一步创新性地实现了模型参数的自动搜索与迭代,突破了依赖算法研究员手工设计与调优的传统算法开发流程,在降低人力成本的同时,使得算法的泛化性能更强。

此次依图自研算法在业界最具影响力的三大ReID数据集Market1501、DukeMTMC-ReID、CUHK03上,将衡量算法性能的两大关键指标“首位命中率”(Rank- 1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)6项数据全部提升,充分显示了依图的技术实力,进一步稳固了中国技术团队在该任务下领跑地位。

需要指出,首位命中率高,只意味着算法能够在众多图像中准确找出最容易识别或者说匹配的那张,并不能反应模型的真实能力,尤其是应对复杂场景的表现。

因此,评价ReID算法性能时需要结合mAP值,它反映的是系统的综合检索性能。mAP值越高,说明系统的实用性越好,既能查得全也能查得准,能够较好地应对多遮挡、光线暗、画面模糊等情况

算法+算力,加速ReID商业化落地加速

面对又一项业界纪录,依图团队却十分平静。依图研发人员表示,这次刷榜只是一次尝试,依图在工业界实战落地的ReID项目,其规模与问题的复杂程度已经远超三大数据集,可以说,学术界现有ReID基准已经无法体现工业界算法的最高水平。

举个例子, Market-1501在清华大学内采集,行人(ID)基本上是穿短袖、短裤和裙装的亚洲人,DukeMTMC-reID在杜克大学内采集,ID主要是身着冬季服饰的欧美人, 这些在特定场景, 特定时间段采集的数据往往与真实世界中的图像分布不一致。在真实场景下ReID算法需要做到在跨时间段, 跨场景, 跨不同成像质量的图像采集设备下进行高精度的快速识别. 其数据分布远远与问题复杂程度远远大于现有的学术数据集。

这些现实因素导致了现有ReID学术界数据集无法有效模拟或者还原实际真实情况。因此,基于现有ReID数据集的基准具有很大的局限性。依图研究人员表示,业界需要更好的ReID数据集,也需要更全面的算法衡量数据集,至少对于商业化落地的算法是如此。

实战场景下的ReID任务,不仅对算法提出更高要求,也需要更高效的芯片提供强大的算力支持,二者缺少任意一个,都会影响ReID的实际应用价值。目前看来,依图是当下同时具备算法和算力能力的公司。依图在2017年投入云端AI芯片QuestCore™(求索)的研发,并于2019年5月“发布即商用”。QuestCore™是全球首颗云端视觉AI芯片,提供强大算力,单路摄像头功耗不到1W。

在ReID实战应用中,依图研发人员针对本次提出的算法做了进一步优化, 依托依图自研AI芯片, 在仅凭穿着、体态特征的条件下,已能将ReID做到2017年~2018年人脸识别的精度。这不仅加速了ReID的大规模商业化落地,更解锁了新的应用场景。

2017年,以苹果FaceID为代表的人脸识别商业化应用开始在全球范围内普及。如今,刷脸支付、刷脸乘车已经渗透到我们的日常生活。有理由相信,世界级的ReID算法,加上自研AI芯片, 业界期待的下一个计算机视觉领域“杀手级应用”已经到来。

版权文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
【手机】报价

天极产品库提供了手机的参数、图片、报价、评测、行情、口碑怎么样、最新价格及图片大全,为您购买手机,提供有价值的参考建议

幼教资源站

幼儿园大班PPT课件,中班PPT课件,小班PPT课件,幼儿园试卷,论文,试题下载

新一站保险

2010年新一站保险由中国银保监会批准设立,对接100多家保险公司的3000余款产品,为家庭和企业提供保险咨询、风险评估、保险规划、投保核保、理赔等一站式新管家保险服务。

绚丽科技

天津绚丽科技有限公司是国内专业利用AI技术服务企业业务创新的高科技企业,获得国内知名风险投资机构投资。我们致力于将AI技术应用于传统商业逻辑中,提升企业关键业务环节的运营效率、降低运营成本、利用数据持续优化运营流程。

厦门运动木地板

厦门富博体育设施工程有限公司是一家专业的体育场地设施工程承建商。公司成立于2006年,厦门运动木地板公司成为独立、。业务范围覆盖室内外各种体育运动场所的地面工程和相关附属设施,包括室内运动木地板、体育馆枫木地板、体育运动木地板、塑胶运动场地、枫木运动木地板、田径赛道、人造草坪等多种类型的体育场地工程。

空气能热泵烘干机厂家

智恩烘干机制造公司是专业生产高温热泵烘干机、空气能热泵烘干房等空气能烘干设备的热泵烘干机厂家。产品有药材烘干机、食用菌烘干机、食品烘干机、金银花烘干机、海产品烘干机、腊肠烘干机、木材烘干机等等。咨询热线:15868141832。

层流手术室净化

四川华锐净化工程有限公司(www.hrjj.cn)具备设计施工总承包资质,总部位于成都市;主要业务有层流手术室装修、手术室净化工程、层流手术室净化、无尘车间装修、实验室净化工程;是专业厂家且拥有15年的设计施工经验!

济南庆典公司

济南庆典公司专业庆典活动策划公司承接:企业开业庆典、晚会活动策划、公司年会策划、周年庆典、会议会务、启动仪式、公关活动、客户答谢会、演出演艺、礼仪模特、庆典礼仪、礼仪庆典设备租赁、庆典摄像服务、庆典设备租赁、灯光音响租赁、舞台搭建等.

在线小学,中学,高中题库

书生题是小学、初中、高中课程和考试培训网站,致力于打造中小学培训的航母。拥有丰富的历年真题、模拟试题、笔记讲义等中小学课程和考试资料,并提供中小学课程和考试的网络课程培训服务。-shusheng.com.cn

坦途教育网

坦途教育网专注于为广大学员提供优质的教育培训课程服务,目前开通了北京站,天津站,上海站,广州站,深圳站,西安站,武汉站,南京站,杭州站,济南站,成都站等。提供中小学,英语,留学,会计,考研,小语种,职业资格,建筑,文体艺术,早教,素质教育,国际学校,公务员等培训课程,致力于服务数万培训机构及数百万学员!

真石漆,山东真石漆,真石漆厂家,真石漆价格

山东新佳涂料(400-699-0737)是主营真石漆,质感涂料,内外墙乳胶漆,水包水多彩漆,是山东真石漆大型生产厂家,了解真石漆、质感涂料施工工艺、质量、价格,欢迎来电咨询。

全局底部横幅