解密科技助实背后的黑科技 ATEC2022出题人分享 (科技助丰年)

文章编号：37290 资讯动态 2024-11-30 ATEC2022 营销数字化产品数字化

ATEC2022比赛背景

【ATEC2022出题人分享】解密科技助实背后的黑科技

科技促进产业数字化，是数字时代经济发展的重要命题。本届ATEC科技精英赛，通过考察选手对 图学习、隐私计算、多模态识别、智能推荐等 核心技术的掌握能力，解决 营销数字化、产品数字化、融资数字化 三大现实问题。帮助企业抵御安全风险、提升数字化运营能力，帮助从一个全新的数据维度来实现农作物的数字化，借助数字化技术提高农村金融的资金匹配效率、极大地助力农业产业的持续发展，做到了“科技助实”。

赛题一——营销数字化

赛题解读

提高中小商家的数字化经营能力，是我国数字经济做强做优做大的关键基础，也是推动数字技术与实体经济深度融合的关键路径之一。中小商家通过数字消费券的配置与分发，为店铺带来了许多潜在的客户，好的数字化运营策略可以帮助中小商家提升用户的留存与消费意愿，同时带来更好的收益与经营效率。本赛题便是围绕营销数字化的主题，考察选手如何从海量的用户线上线下行为中挖掘可帮助中小商家进行数字化营销的有效信息，帮助其提高商品的分发能力。

本赛题会向选手提供一段时间内消费券向用户展示和被用户领取的数据，并要求选手预测在这段时间以后不同用户在多个中小商家的候选商品集合中，更有可能点击哪些商品。除此以外，为了尽可能还原真实的工业数据环境，本赛题还会向选手提供用户和消费券的基础特征、支付宝全域用户行为、实体间关联图谱等数据，同时确保这些数据的采集和构造都是发生在待预测时间段之前。所有的数据都经过了严格的脱敏，以保证用户隐私信息的安全性。

和一般的点击率预估任务不同，我们提供了十倍于私域行为（用户在中小商户内的交互行为）的全域用户行为（例如搜索、账单、足迹等），而比赛又是仅仅只有 9 小时的个人赛，这十分考验选手的基本功，以及选手在如此丰富的数据类型下的模型选型与迭代思路，赛题讲究快、准、稳，稍有迟疑便会落后。为了让训练速度不成为选手快速提分的瓶颈，我们提供了 12C92G + V100 的运行配置。

比赛观察

本次比赛的数据种类多，且时间紧张，选手如何快速的迭代并拿到收益决定着他是否能够晋级并有机会拿到百万大奖。比赛属于个人赛，这非常考验选手的基本功底，但能够从线上赛的选拔中脱颖而出，也说明每一个选手都是有自己突出的优点。

在这些因素的限制下，几乎所有的选手都选择了将树模型作为自己的基线，并通过对数据的一系列特征工程为该基线注入许多新的信息，从而帮助模型更好的预估用户的点击并达到提分的效果。相比于深度学习中模型调参与拟合 label 的过程，树模型有着更方便、快捷、开箱即用的优点，且无需担心像深度学习中由于参数或网络层设计不合理而导致的模型效果差的问题。因此，树模型的热度在竞赛圈也一直是名列前茅的。

在比赛中，更细致更全面的从各个角度来挖掘用户与商品的潜在信息，也决定了该做法能带来的增益大小。高排名的选手有着丰富的竞赛经验，无一例外地为比赛所提供的信息选择了更适合处理它的策略。在实际业务中，不可避免的存在许多经过脱敏、缺失或无意义的信息在内，因此选手的数据素养与特征分析能力对比赛的良性迭代会起到非常关键的作用，高排名选手会在数据分析后通过清洗、去噪、加权等策略帮助模型对有效信息的充分利用。此外，快速的迭代也能够帮助选手更快的找准提分的方向，并为下一阶段的尝试方向做好预估，这也是选手间能够拉开比赛差距的重要原因。

本次比赛采用半封榜的机制，在前期每个选手仅能得知自己的排名是否处于赛道末位的四位，而在后期该信息完全不可知。选手在紧张的氛围下承受着对自身排名不明确的双重压力，这也促使每个人不断地向前。双重压力下，心态好的选手镇定自如，即使处于淘汰边缘也一心做题，而心态差的选手在后续比赛中频繁失误（不论是 bug 出现次数，或者是迭代进展变缓）。这也是每一个竞赛选手必须经历的考验之一，百般磨炼，终能独挡一面。

赛题二——产品数字化

（水稻 or 小麦？从遥感农作物识别到农业金融）

赛题解读

2019年，农业农村部提出数字农业农村发展规划（2019-2025），明确提出以农业数字化为重点发展主线，全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平，以数字化引领驱动农业农村现代化，为实现乡村全面振兴提供有力支撑。这其中对核心主粮作物、经济作物种植区域进行数字化建模是实现农业数字化的基础一环。

依托现代卫星遥感技术，我们可以实现对丰富的农作物信息的识别与提取，例如农田植被状况、土壤湿度、气候变化等。对地物目标进行多光谱、多时段监测，可以获取大量信号特征，同时基于不同农作物对不同波段光谱的特异性反射差异、生长周期特点，可以实现低成本、高精度、大范围的农作物种类识别，为实现农业数字化生产、高效网格化经营提供基础数据，从而应用于农业信贷、农业保险理赔、宏观农业种植监控等领域。

本次赛题的图像数据来自开源多光谱卫星提供的时序多光谱影像，农作物（水稻、玉米、大豆）标签来自田野实地调查获取的数据。主要目的是通过时序多光谱遥感数据序列，设计人工智能算法，识别出对应地点对应时间段的种植农作物种类。对于遥感农作物识别，光谱反射特性以及农作物生长周期特性是两大关键特征。此外，数据中的地表分类层（SCL）字段中还包含了粗分类的标签，包括云层、水体、植被，可以提供有效的先验信息辅助识别。为了帮助选手理解赛题，我们另外提供了基于近红外（NIR）和红光（R），计算植被指数，这也是我们对于选手的“提示”，如何利用农业光谱知识设计特定特征来提升模型识别效果。

比赛观察

这是一道典型的时序预测赛题，比赛中大部分方案是基于先进的Transformer结构（例如BERT、RoBERTa等），训练多个模型，再利用LGBM进行模型集成。另外对数据的处理上不同的选手也有不同的策略，最终结果除了单纯模型因素之外，对数据和赛题的持续探索也起到了关键作用。

1) 时序建模： 处理时序预测的基础是建立一个能对时序数据进行有效建模的模型。在前期尝试了LSTM、MLP、树结构之后，大部分队伍迅速收敛到基于Transformer的模型结构上。Transformer是目前处理序列数据比较成熟的方案，通过将序列中的每个元素看做token，按顺序送入模型中进行self-attention和cross-attention计算，获取有效的时序信息进行任务学习。大部分选手选择BERT或者RoBERTa这类比较成熟的Transformer结构来使用。由于对模型的熟悉程度和具体实现的不同，效果有所差异

2) 特征构建： 遥感领域对大部分选手来说都是首次接触，其具有一定的领域特性。部分选手在前期进行了大量数据分析的工作，并得到了一些有效构建特征的方法。例如本次农作物识别的赛题，时间月份、云雾遮挡都会极大影响识别效果。通过对数据去云处理、构建时间月份相关的learnable embedding都可以有效提升识别效果。此外，遥感相关的一些特征，例如ndvi指数计算等，都可以作为有效的特征使用。

3) 模型集成： 模型集成的方法在比赛中一般被认为是脏活累活，但却是刷点的“神器”。利用LGBM对多个基础模型结果进行集成学习，往往可以得到更好的结果。在比赛的最后3分钟里，依然有选手在尝试各种模型集成的组合和优化方式，并成功在最后时刻实现了反超。

在蚂蚁的真实场景中，多光谱时序数据是农作物识别中最重要的数据源，此外我们还会使用高清影像、SAR雷达影像辅助农作物识别。在赛题中我们也提供了一部分没有标注的影像数据用于无监督预训练基础识别模型。在实际场景中我们拥有海量的无标注影像数据，为预训练提供了广阔空间。在经济作物识别场景，通过预训练可以有效降低对标注数据的需求，并提升模型识别效果。

赛题三——融资数字化

赛题解读

提升乡村普惠金融服务覆盖面和便利性，持续加大对“三农”领域的金融支持力度，是我国全面推进乡村振兴的重点工作之一。在农村振兴相关领域贷款投放方面，金融机构发挥着重要的作用，通过向农村产业链的经营者发放贷款，可以满足乡村振兴生产经营融资需求，缓解“融资难”等问题。

然而涉农经营者信贷风险管理有其特殊性，需根据特定的行业风险点，制定相应的风险评估防范策略，提升智能化风险管理水平。本赛题将探索农村金融中一个基础问题，即如何利用数字化技术来识别农村经营者的经营状况和经营风险，其也是帮助农村经营者进行融资的基础能力之一。

基于这样的背景，我们主要围绕涉农经营者风险评估这一关键问题，考察选手如何利用涉农经营者特征以及非结构化数据，如用户交互关系等，来帮助提高涉农经营者的风险评估模型的精度。

在本次赛题提供的数据中，不仅有部分涉农经营者的风险相关，如信贷行为信息；还提供了用户多源的交互关系，如涉及用户收付款相关的序列行为、用户交互关系等。要求选手预测农村经营者在未来将存在的潜在经营风险。考虑到农村地区数字化程度普遍偏低，其数据基础较薄，特征比较稀疏，因此选手们会如何充分利用非结构化数据做好建模以及提取到有效信息，是本赛题的一个重要考察点。

观察记录

区别于前几道赛题，本题目有几个重要的特点：首先，正如实际业务中的情况，提供的特征数据内容比较稀疏，同时测试集ID不能用来对齐训练和测试数据的，因此基础的特征工程角度提升空间有限。其次，本赛题提供了丰富的用户交易序列数据和交互行为数据，可以使用这些非结构化数据对用户信息进行传递，因而可以考虑使用图神经网络进行建模。

实际上，一些典型的与用户交易关系、操作行为相关的欺诈类风险检测问题，包括和金融相关的风险，都通常可以使用图神经网络进行建模。图神经网络建模，一方面可以充分关系数据构图，使用结构数据刻画用户之间的关系与相似性，此外沿着网络拓扑结构对邻居节点的特征进行传播和聚合，还可以缓解特征缺失的问题，并且高阶的关系数据也是对风险预测有很重要的作用的。

从对选手实际比赛中来看，在时间紧张的情况下，对图神经网络熟悉和结构数据熟悉的队伍会有比较大的优势。并且在实际操作过程中，几乎所有选手都发现了充分利用非结构化数据构图的必要性，但在实现上，两队分别采用了不同的策略，一队能够快速地搭建大规模数据下图神经网络的采样、以及卷积的框架，另一队则是以树模型为主，人工聚合邻居特征为辅的形式来替代图神经网络的卷积过程进行特征提取。

此外，该赛题全过程中采用封榜的机制，每队选手仅能得知对方队伍分数是否有提升，并不知道自己的排名，这为双方选手均带来了一定的心理压力和竞争压力。而对于采用不同策略和方法进行图数据建模的选手，最终谁能够在比赛中获得胜利，也是令人期待的。

版权文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/82dca71b405d711fea6d.html

上一篇：蚂蚁集团WAIC发布大模型密算平台助力大模型

下一篇：山东大学与蚂蚁集团签署校企合作协议隐私计

澳门生活服务网站

澳门生活服务网站排名,根据网站的综合值按照不同的澳门生活服务网站进行筛选排名结果,通过筛选澳门生活服务网站可以看到每个澳门生活服务网站里面的网站排名优质的网站是哪些

网站模板 2024-09-14 22:34:06

乐高游戏,4399乐高小游戏,乐高小游戏大全,4399小游戏

4399乐高小游戏大全收录国内外乐高幻影忍者,乐高蝙蝠侠,乐高积木,乐高星球大战,乐高加勒比海盗,乐高玩具小游戏,乐高系列小游戏。好玩就拉朋友们一起来玩吧！

游戏网游 2024-08-16 23:01:45

中原品牌栏目

河南广播电视台中原品牌栏目是民生频道下属的子栏目，新上线《中原汇》项目，为河南企业助力服务！

社交直播 2024-07-13 23:45:00

岩利基金

岩利通过不断的开拓创新，在股权投资、投资组合、财务咨询和管理咨询等领域已搭建完整的尽调、行研、风控和投管体系。市场板块，岩利依托强大的股东背景和不断的市场拓展努力，致力于向市场提供优质的基金管理和财富管理服务。

商业服务 2024-07-11 13:33:14

中恒塑业（山东）有限公司

中恒塑业（山东）有限公司是一家集研发、生产、销售、服务一体的专业化仓储包装生产企业。公司产品有塑料注塑托盘、吹塑托盘、塑料筐、塑料箱、垃圾桶等各类塑料仓储包装制品。

商业服务 2024-08-17 22:43:34

久顺企管集团

久顺企管集团（中国,英国,爱尔兰）_专业提供医疗器械各类认证,注册咨询,验厂咨询,欧盟授权代表,欧洲注册,MHRA注册,自由销售证书,使馆公证,商会公证,海牙公证,临床试验,管理咨询,认证培训,药品及药包材,欧洲CEP验厂,美国ANDA申请,欧盟CEP/COS申请,欧盟CEP/COS变更和更新,美国DMF制作与归档,欧盟ASMF/EDMF申请,ICH,CTD及eCTD,保健品食品化妆品注册,保健品食品化妆品备案

管理咨询 2024-08-18 13:34:14

传递窗

宏奥传递窗厂家提供不同规格、食品行业的传递窗设备。多年从业经验，可跟需求定制。咨询热线：189-7131-0042~

管理咨询 2024-08-18 13:41:09

宠佳家

宠佳家-行业保险方案解决平台，提供多家全国知名保险公司产品网上投保，包括少儿险，成人险，旅游险，运动险，财产险等保险产品，在线获取保单快速便捷。专业、诚信，是您可以信赖的保险网！

行业信息 2024-11-19 12:56:42

吊车出租,吊车起重机出租,吊车租赁

快捷吊车出租网为人们专业提供：吊车出租、吊车租赁、吊车起重机出租等吊车出租服务，热烈欢迎各位需求吊车业务的用户来电咨询，我们快捷、热诚、上门为您解决吊装难题。

商业服务 2024-11-21 00:21:44

橡胶硫化罐

硫化罐实体制造厂家-山东鑫泰鑫智能装备有限公司,主要产品有巨型硫化罐，橡胶硫化罐，各种一二类压力容器等。同时提供相关产品图片，报价，型号及各种压力容器在使用中的问题解决等,诚挚欢迎新老客户来电咨询。

图片摄影 2024-11-25 14:25:10

西藏塑胶地板

鹏博体育专注于：PVC地板胶、室内外运动地板、西藏拉萨塑胶跑道、室外悬浮地板、楼梯整体踏步、幼儿园软包、水泥自流平、塑胶跑道、人造草坪、硅PU、EPDM。服务热线：136-5899-4889

体育竞技 2024-11-29 13:16:10

池州港华燃气有限公司

电影视频 2024-12-07 00:49:24

第十届国际图象图形学学术会议投稿倒计时7天 2019 征稿进行中 ICIG (第十届国际图像图形学学术会议)

雷锋网AI科技评论消息，第十届国际图象图形学学术会议，ICIG2019，将于2019年8月23，25日在北京友谊宾馆召开，主题为，人工智能时代的图像图形前沿研究，国际图象图形学学术会议，ICIG，是中国图象图形学学会主办的最高级别的系列国际会议，创建于2000年，每两年举办一届，迄今已经成功举办九届，会议征文将于5月20日截止，现面...。

2024-12-09 14:23:16

为何中企只有百度能进第一梯队全球AI公司实力排行 (为何中企只有一家公司)

掐指一算，距离ChatGPT引爆大模型赛道，已经过去将近整整两年了，在这700多天里，AI圈风云际会，谁才是可以领军的，话事人，角色，中国AI第一把交椅，到底该给谁坐，近日，沙利文发布，2024年全球AI生态全景概览，，百度和OpenAI、谷歌一起，成为了全球唯三被该机构承认的，AI原生巨头，，也是中国唯一一个榜上有名的公司，AI实力...。

2024-12-03 18:56:25

创业招商加盟的网站可信吗 (创业招商加盟项目)

相信很多人都有要创业的想法，但是仅凭个人的力量去创业，并不是想象中那样简单的事情，其实很多人想要创业，但是又不知道该从哪里做起，于是在这种情况下想到在一些创业招商加盟网站当中寻找合适的项目来参与其中，那么这种创业招商加盟的网站可信吗?不少有创业想法的人都会对一些创业招商加盟网站表示感兴趣，因为加盟连锁的方式可以避免很多的弯路错路，借助...。

2024-12-02 21:00:21

重新定义小场景效率利器云从科技谛格边缘智能盒 (重新定义小场景的句子)

在人们日常生活场景中，潜藏着众多智能效率提升的需求，不同于需在服务器、云服务上进行集群化部署的大场景，小场景则需要考虑更多的利旧、兼容性，而传统、量产的硬件产品难以覆盖到海量的碎片化小场景升级中，小场景，，智，需求如何满足，云从答案，AI定义设备面对海量的小场景应用需求，云从作为一家AI平台型企业，基于人机协同操作系统，通过规模高效的...。

2024-11-30 22:54:05

清华同方电视通用教程通过U盘安装软件教程

准备工作，清华同方电视、u盘、电脑一、百度搜索，当贝市场，，进入官网下载最新版本apk文件，或点击直接下载，http，dlap1.dbkan.com，update，dangbeimarket.apk，，并拷贝进u盘，附，当贝市场官网，http，www.dangbei.com，二、将U盘插入电视中，打开电视自带的电视应用市场搜索...。

2024-11-25 17:09:06

闹事者已被管理杭州一小型客车连撞多人致1死4伤警方通报

浙江杭州一宝马车路口连撞多人多车致多人受伤杭州市公安局交通警察支队当天颁布警情通报，2024年11月11日18时11分许，杭州市上城区大农港路丁兰路口出现一同交通意外，一辆小型客车与在路口等待的多辆机动车及非机动车、行人出现碰撞，接报警后，公安交警部门赴现场处理，5名伤者第一期间被送往医院救治，其中1人伤势较重，经医院抢救有效死亡，其...。

2024-11-13 02:56:34

各有什么优缺陷公路和越野出口大切诺基和一汽丰田普拉多王道 (波谱仪和能谱仪各有什么优缺)

要回答这个疑问首先要明白两者的区别.大切诺基没大梁.是承载车身.但四驱系统秉承吉普家族一向格调.相对的牢靠.王道只管有大梁，但是自身车是渣滓.面对真正的越野工况就是白给.在个别小状况下，两者不分输赢.大切胜在优秀的四驱系统，王道胜在车身结构.而关于公路.大切完胜.胜在车身结构和完美的底盘.关于大状况，大切稍逊一筹.由于完美的四驱系统关...。

2024-07-07 15:10:26

肝源费卫健委按规则应提供不要钱证实肝移植术前被要求交纳 (肝源需要买吗)

新京报讯，记者刘思想实习生吴依晨，8月15日，中南大学湘雅三医院，以下简称，湘雅三院，医生向肝移植患者家眷收取，肝源费，一事引发网友热议，当事人蒋先生通知新京报记者，2018年8月13日晚，家眷接到湘雅三医院医生电话，称他须要做肝移植手术的父亲婚配到了适合肝源，但要交纳10万元肝源费，缴费后，2018年8月15日，蒋父在湘雅三院器官...。

2024-07-03 15:56:18

轻颜相机PC版下载-轻颜相机电脑版v6.1.2官方最新版

轻颜相机是一款非常受女孩子们欢迎的美颜相机软件，女孩子对美总是特别的在意的，这款软件拥有大量的美颜功能

2023-11-04 19:47:40

暴走英雄坛无名残页有什么用？

暴走英雄坛这款游戏中会获取一些无名残页，那么这些无名残页究竟有什么用呢？下面我游网小编给大家讲一下暴走英雄坛无名残页有什么用？以及常见问题答疑。

2023-09-19 02:08:49

【ESETNOD32Antivirus下载】2022年最新官方正式版ESETNOD32Antivirus收费下载

腾讯软件中心提供2022年最新14.1.20.0官方正式版ESETNOD32Antivirus高速下载，本正式版ESETNOD32Antivirus软件安全认证，收费无插件。

2023-09-19 01:32:05

车臣领导人发长文表忠心：我欠普京一条命，是“普京的步兵”|俄军|卡德罗夫|俄罗斯政府

车臣领导人表忠心：我欠普京一条命

2023-09-02 16:49:44

文章推荐

医疗AI有哪些新故事? 对话商汤副总裁张少霆新基建下 (医疗ai有哪些应用)

在2018年的商汤人工智能峰会上，商汤医疗正式对外亮相，与大多数搭建在已有底层系统的AI公司不同，商汤最大的特点是，平台化，而这种策略，意味着前期更多的资源投入，以及后期更快的成果产出，推出两年多以来，商汤的医疗又有哪些新的故事，这些故事又能为医疗AI行业带来哪些新的气息，以前我们经常讲‘研究推动产品，产品推动商务，，这通常是在一...。

2024-12-03 16:43:27

资讯动态

元宇宙最大的风险是数字安全周鸿祎 (元宇宙最大的公司)

今天就不喷元宇宙了，而是要把元宇宙引导到对国家和产业有利的方向发展，为真实世界服务，三六零，股票代码，601360.SH，以下简称360，创始人周鸿祎在28日举行的，开启数字安全元年——360集团战略发布会，上表示，，元宇宙是在疫情期间‘憋出来，的，是数字化发展到高级阶段的产物，我反对的是脱离现实，沉迷虚拟世界的元宇宙，但是赞成产...。

2024-11-30 22:32:33

资讯动态

智能投影仪怎么使用 (智能投影仪怎么调屏幕大小)

发表在专业问答2020，7，815，37展示机型信息，品牌型号，当贝F3系统版本，当贝OS2.0智能投影仪通电后需要先对遥控器进行配对，然后进行网络连接，联网成功以后选择影视内容进行播放即可使用，智能投影仪怎么使用，以当贝F3为例，1.将当贝F3通电，进行首次开机并配对遥控器，如果是红外遥控就不需要进行配对了；2.进入当贝F3的初次设...。

2024-11-29 01:17:42

网络百科

投影仪必须用幕布吗?投影仪幕布怎么选 (投影仪必须用wifi吗)

发表在综合交流大区2024，7，814，10相信大家在购买投影仪的时候都会犹豫是否要购买幕布，毕竟从小到大用到多媒体教室的时候，投影仪都是要配幕布使用的，所以家用投影仪是否要配幕布，大家还是挺纠结的，那么投影仪必须用幕布吗，下面就来详细了解一下，看看投影仪幕布怎么选，一、投影仪必须用幕布吗投影仪不是必须要幕布的，幕布对于投影仪来说，更...。

2024-11-28 19:21:03

网络百科

做市场需要的特色美食！加盟口水鸡排 (做市场需要的条件)

越来越多的人不再满足于传统的，一般的食品餐品了，而是寻求更特性，更美味，更精致的呈现，吃好喝好，现已逐步成为了现代人的日子常态，所以，关于许多创业人士来说，他们也会挑选更具远景的项目，比方口水鸡排，专心做市场需要的特色美食，值得检验一下，伴随着人们生活水平的日益提高，消费者们肯定是越来越注重消费体验感的，所以口水鸡排深知单一的炸鸡汉堡...。

2024-11-16 16:22:39

创业加盟

解密科技助实背后的黑科技 ATEC2022出题人分享 (科技助丰年)

ATEC2022比赛背景

赛题一——营销数字化

赛题解读

比赛观察

赛题二——产品数字化

（水稻 or 小麦？从遥感农作物识别到农业金融）

赛题解读

比赛观察

赛题三——融资数字化

赛题解读

观察记录

相关文章

文章推荐