货拉拉KDD2021论文详解 MoD系统中信息披露的优化方法 (货拉拉叫车)

文章编号:40713 资讯动态 2024-12-03 货拉拉

近日,国际数据科学和数据挖掘领域的最顶级学术会议KDD入选论文正式揭晓。今年KDD吸引了全球范围内705篇论文投递,仅收录了138篇论文,收录率不足20%。货拉拉论文《Improving the Information Disclosure in Mobility-on-Demand Systems》(《一种MoD系统中信息披露的优化方法》)从705篇论文中脱颖而出成功入选。该论文通过数据建模解决互联网物流智能分单问题,提升互联网物流平台效率,实现业务指标优化。

本文对货拉拉论文《Improving the Information Disclosure in Mobility-on-Demand Systems》进行详细解读。货拉拉技术团队该论文中提出了一种优化信息披露方式的框架,通过建模和求解,通过算法选取最合适的司机进行履约,实现订单的精准推送,实现平台效率、用户体验和司机体验的整体提升。

一、研究背景

当下货拉拉货运采用的订单分配方式为全局广播,即在指定时间/距离 等范围内,将所有订单推送给所有司机,司机通过浏览订单列表的方式,做抉择,选取符合预期的订单进行响应,对于同一订单被多个司机响应的场景,由算法综合考虑平台效率、用户体验、司机体验等因素,选取最合适的司机进行履约。

定义订单推送给司机为一种信息披露,本论文提出的算法便是在订单广播环节提出的改进。

作为司机,处于不同的状态(时空,供需,今日累计工作时长,今日累计收入等),面对不同的选择(订单列表),对收入的期望也会有所差异。

举几个例子:

1) 供给受限的情况,待匹配订单数远远大于运力数

司机相对主动,倾向于接价格更高的订单;

2)需求受限的情况,待匹配订单数远远小于运力数

司机相对被动,倾向于选择不空驶,尽量不计较价格;

3)无限制的播单场景,司机的订单列表里有全城,甚至是全国的订单

司机相对主动,在系统订单过剩时,会选择困难;

4)强限制的派单场景,司机的订单列表里不超过一个订单

司机相对被动,在系统没有派单/派单不满意 时,会有焦虑感;

通过对司机的决策行为进行准确地估计,并通过优化信息披露(哪些订单给哪些司机看)的方式,我们期望实现司机体验、用户体验和平台效率的整体提升。

二、研究价值

1、区别于传统的推荐系统,例如抖音,豆瓣,淘宝等,电商网站的商品,以及短视频等内容,相对来说是一个不受限的资源,即一个商品可以被成百上千个用户购买,一条视频可以被推荐给千千万万的用户。

货拉拉场景:订单因时空问题,会被推送给有限个司机;司机因屏幕问题,只能浏览有限个订单。这一类带资源约束的问题,目前没有成熟有效的解决方案。

2、区别于传统的派单模式,众包业务的播单模式引入了更多的运力保障。

a、引入了更多的复杂度

对于m个司机,n个订单的业务场景

派单解决的是1vs1的匹配问题,播单解决的问题是n vs m的信息披露问题

纯暴力的搜索空间:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

随着问题规模的不断变大,其对应复杂度呈指数增长。

b、引入了更多的司机竞争

不管是供给过剩,还是需求过剩的场景,司机对某一类订单的偏好比较一致,例如高价格、高小费等属性,导致该类订单响应的司机数多,而订单最终只能由一位司机来履约,势必产生很多的无效司机选择,导致平台整体效率降低。

三、算法框架

1、预测

基于业务场景下的条件依赖,我们拓展了Multinormal Logit Model,将司机的决策分两步来估计:

a、司机选择接单,或者不接单

b、司机选择候选列表中的某一订单进行响应

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

通过在历史行为数据上做最大化对数似然估计,我们对模型的参数进行拟合:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

可以逐级来分析建模的合理性:

1)第一级,司机看到某个订单列表,有一定的概率会选择不接单,如果当前的列表他不满意,他会等待,直到在未来的某个时空出现满意的候选订单列表;

2)第二级,司机认为当前订单列表满意

i) 会从中选取最偏好的订单响应;

ii)基于此候选订单列表,如果减少订单o的信息披露,则司机对于其他订单 o'的接单意愿会提升,而司机对于第一级的 不接单的概率也会提升(第一级的满意度降低)

2、规划

a、目标函数

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

b、问题求解

i、全局的信息披露

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

ii、局部的信息披露

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

iii、原始的砍边算法

iv、最小化损失的砍边算法(Minimal Loss Edge Cutting)

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

整体算法如下:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

3、实验

a、离线:

选取货拉拉平台上3个城市的历史数据,训练司机决策预估模型

b、在线:

选取货拉拉平台上3个城市的若干时间段,按照分组轮换做AB实验

A:货拉拉现有的全局信息披露方式

B:基于司机决策预估模型的$$MLEC$$算法框架

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

解整体的局部供需问题

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

《Improving the Information Disclosure in Mobility-on-Demand Systems》论文提出了一种优化信息披露方式的框架,通过建模和求解,实现业务指标的优化。这项研究不仅适用于货拉拉这种互联网物流平台,同样也可应用于带资源约束的推荐系统。

版权文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
百度直播

百度直播是一个即时分享新知、经验、见识,陪伴用户收获与成长的直播平台。目前用户可通过百度百家号开播,百家号是全球最大中文搜索引擎百度为内容创作者提供的内容发布、内容变现和粉丝管理平台。通过百家号开直播功能和第三方推拉流方式,用户可以在百度平台实时分享新知,与世界进行直接对话。百度直播致力于打造成最有价值的泛知识直播平台,帮助用户探索世界,分享乐趣并有所收获。与此同时,百度坚持将直播作为移动生态的基础设施能力,提升获取信息与知识的体验,进一步丰富与完善移动内容生态,继续成为人们获取信息与知识的第一入口。

苏州网站建设推广公司

苏州永阳网络科技有限公司专注网站建设、网站优化推广、网络营销策划.公司已为众多企业建立完善营销系统,是行业内知名的网络服务商,电话:15150127375,QQ:244985371

CNC加工厂家

昆山鼎军机械制造有限公司主营设备有进口数控加工中心及立式加工中心多台、中大型数控车床多台、数控龙门加工中心、车床、铣床、钻床、CNC精密加工、CNC数控加工、数控立车、数控立车加工剪板机、折弯机、并配备多名管理及技术人员。是一家专业生产龙门加工中心厂家,望有意者与我们联系!

北大荒集团黑龙江红卫农场有限公司

北大荒集团黑龙江红卫农场有限公司

天津津门皮肤病医院

天津治疗皮肤病哪里好?天津津门皮肤病医院治疗牛皮癣、白癜风、痤疮、腋臭等各种皮肤病,致力于发展“中西医结合治疗、专科专病建设”两大特色技术,成为天津人的平价医院。

企业库免费B2B网站商业搜索

企业库免费B2B网站商业搜索平台www.qiyeku.com,致力打造全球企业网上贸易网络宣传电子商务的交流平台,本免费B2B平台集合了国外B2B网站,为中国中小企业提供网上推广、网络营销、网上贸易、b2b网站大全即b2b免费商务平台结合了:超级官网、企业级商城、营销型网站、企业免费网站、免费网站模板、b2b网站排名等功能。聪明的老板要建企业官网请选中国企业库https://www.qiyeku.com

亿品说

亿品说-精选商品,买家无忧

物流公司

驹马提倡优质服务理念的物流公司,以香港物流,澳门物流,台湾物流为核心.致力于为客户提供优质高效的仓储物流,仓储配送,第三方仓储物流与仓库托管服务电话4006123466

首页

江南模塑科技股份有限公司

DiLink

比亚迪智慧开放平台

享道出行

享道出行是上汽集团旗下的移动出行战略品牌,整合上汽集团优势资源及强大技术实力,布局专车,出租车,顺风车,个人租车,代驾,企业租车等产品线,专业之上更以人为本,为您提供多元化“一站式”出行服务,想到的地方陪你到。

Https证书

一门SSL(www.yimenssl.net)致力于提供优质的SSL证书服务,一键在线签售SSL证书,为网站的域名实现https加密访问。

全局底部横幅