范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

时效准确率提升之承运商路由网络挖掘得物技术

  1引子
  履约时长是电商的生命线,直接关系到用户的消费体验。新华网[5]2022年双十一的报告显示,37.4%的受访者希望次日达,29.91%希望当日达。相较于其他物品,受访者对手机、电脑、数码产品的物流时效要求更高,更希望当日或1-2天内能收到货。
  得物履约场景中,主要的阶段包括仓库内生产和第三方承运商配送。在用户支付时,得物会根据仓库的生产情况和运配资源,给用户一个承诺时效。 1.1 为什么要预测承运商的线路时效
  在履约过程中,得物需要监控订单的流转,及时的发现可能超时的订单(与和用户承诺时效相比),这里包含仓库生产的监控和三方配送的监控。在实际过程中我们发现:配送节点发生变更时,承运商给的预测偏保守的。下面例子中,到了营业部承运商才给到比较精准的预计送达时间,故在分拣中心使用承运商的预计送达时间容易出现误报。
  下图是承运商接口返回的预计送达时效的宽松指数,可以看到在接近目的地时,承诺时效才比较准确。
  2承运商网络是如何运作的
  在构建承运商网络之前,需要先了解承运商网络是如何工作的。下面是从A网点到E网点的配送示意图,分为以下内容:
  (1)节点,包含的揽收和派送网点以及分拣中心。
  (2)线路,包括干线和支线。例如从网点到分拣中心属于支线,从分拣中心到分拣中心属于干线。
  (3)班次:承运商为了平衡成本和时效,会设置生产班次。到分拣中心之后,需要根据目的地进行分拣,当到达一定量的货物之后,会从分拣中心出发,前往下一个节点。承运商在设置班次的时候,会考虑单量,兼顾运输的成本以及时效。
  上图中:以紫色为例,在A网点,早上8点截单,即8点之前交接给承运商的货物,会在8点20左右完成封车,然后从网点出发,前往B分拣中心,到达B分拣中心的时间是11点40,这个时候赶上了B分拣中心截单时间为12点的班次,B分拣中心会在12:30完成分拣并前往下一个分拣中心,以此类推完成整个配送过程。
  在构建承运商的网络时,需要进行建模。除了节点、线路和班次之外,核心还包括以下两个模型:
  (5)成品线,即从A网点到E网点经过所有节点。上图中:A网点-B分拣中心-C分拣中心-D分拣中心-E网点构成了一条成品线。
  (6)成品线波次:因为节点存在波次,所以成品线也存在波次,实际上成品线波次和第一个节点的波次数一样。 3如何构建承运商网络
  在了解承运商网络如何工作后,需要着手构建承运商的网络。承运商回将轨迹信息推送到得物,内容类似以下的文本。 [     { "code":"180", "desc":"快件到达【xxx营业部】", "location":{ "city":"xxx市", "district":"xxx县", "point":{ "latitude":xxx, "longitude":xxx             }, "province":"xxx"         }, "node":"已揽收", "opeTitle":"站点装箱", "time":"2022-09-04 17:29:27"     },     { "code":"xxx", "desc":"收取快件", "location":{ "city":"xxx", "district":"xxx", "point":{ "latitude":28.65, "longitude":120.07             }, "province":"xx"         }, "node":"已揽收", "opeTitle":"配送员完成揽收", "time":"2022-09-04 17:29:27"     } ]  3.1 结构化清洗
  轨迹的文本,需要经过结构化的清洗之后,才能获取轨迹的含义。对于每一个运单,它的轨迹会经过很多个节点,而每个节点的数据类型如下: 1. waybill_no 表示运单号,同一个运单号会有多条节点记录 2. station_index 表示当前这个节点的下标 3. station_enum 表示这个节点的类型,是分拣中心还是揽派网点 4. station_name 表示节点的名称,例如上面例子里的xxx营业部 5. station_status 表示这个节点的状态,例如是进入还是离开 6. operate_time 表示当前节点的操作时间  3.2 轨迹里面是否真的有班次信息
  承运商网络工作原理提到了承运商会按班次进行生产,从轨迹的结果里面是否能找到班次生产的证据呢。通过分析,我们猜想:相同流向(例如从A分拣中心开往B分拣中心)离开某个分拣中心(例如离开A分拣中心)的时间应该是相对集中的。
  实时上通过一些简单的聚类方法,证实了我们的猜想。下面图中,横轴表示的是出分拣中心的小时,每一个点表示历史上的某一个运单,纵轴没有业务含义,只是为了方便显示。
  绘制上述图时使用的是kmeans聚类算法,kmeans聚类算法需要指定聚类的个数。故需要使用 Knee/Elbow  这类的算法进行聚类数检测,同时它对异常值敏感,故在实现时最终使用的DBSCAN。
  3.3 聚类参数该如何选取
  DBSCAN虽然不需要指定聚类的个数,但是需要指定点之间的距离以及点的密度,通过反复调整,最终确定这两个核心的参数如下:
  clustering = DBSCAN(eps=0.25, min_samples=max(5, int(x.size * 0.02)), metric=metric).fit(x_after_reshape)
  其中eps为0.25,即15分钟。点密度为5和总数的2%的最大值。 3.4 如何解决跨天的问题
  从上面聚类图看,同一个波次的点可能出现跨天的情况,即有些点出分拨中心的时间可能是23:50,有些分拨中心的点可能是00:10。这两个点的欧式距离比较大,故需要重写距离的metrics函数。 ret = abs(x[0] - y[0]) if ret > 12: ret = abs(24 - ret) return ret 3.5 线路是如何串联的
  分析节点的生产班次和线路的班次是不够的,还需要将它们进行串联,得到成品线班次,这样才能在售前或者售中进行应用。这里在处理的时候进行了一些简化,一方面是分拣中心的分拣波次是没有办法识别到的,另外一方面其实可以不用关注分拣中心的分拣波次。
  实际上,串联成品线班次的过程是这样的:
  核心的代码如下:     List next = tmp.getResourceList().get(i)             .getWaveList(); next.sort(Comparator.comparing(NetworkResourceWaveDTO::getOffTime));     boolean match = false; for (NetworkResourceWaveDTO nextWave : next) { if (nextWave.getOffTime() > p.getEndTime()) {             match = true;             duration += nextWave.getDurationDay();             p = nextWave; break;         }     } if (!match) {         duration += next.get(0).getDurationDay() + 1;         p = next.get(0);     }     productLineWave.add(p); }  3.6 四级地址与揽派网点的关系是如何建立的
  从应用的角度,输入条件是买家的四级地址,但承运商网络的终点是派送站点,故需要建立承运商派送站点和四级地址的映射关系。映射关系的建立比较简单,取过去一段时间负责派送该四级地址的站点中,派送该地址单量最多的那个。 4工程落地的挑战
  Part 3更像是一个理论家的滔滔不绝,那如何在工程上进行落地呢?这里面包含了ODPS SQL的开发、UDF的开发以及DDD,总之需要十八般武艺。 4.1 如何在ODPS进行简单的机器学习
  在班次分析的过程中,使用到DBSCAN的聚类算法。如果在odps上使用这些算法呢?实际上python里面已经实现了DBSCAN算法,而odps支持使用python编写UDF。只是目前odps的运行环境并没有安装DBSCAN相关的包,故需要手动进行安装,安装的教程可以参考阿里云的官方文档
  4.2 在线服务化的问题
  上述清洗过程需要每天或者至少一周运行一次,选取过去一个时间窗口的数据进行训练,得到承运商的网络,这样才能及时的感知承运商网络的变化。这意味着会定时的更新成品线、成品线波次以及节点波次的信息,在在线服务化的过程中,我们是直接将数据这些数据存放在redis里面。为了不占用太多的内存,通过使用hash数据结构对内存进行了一些优化,当然hash的一个缺点是无法为field设置超时时间,这意味着某个key的某个field数据实际已经是过期数据了,但是它不会被删除,进而造成泄漏,但这种泄漏可以通过其他技术手段解决。 5进展与规划
  目前我们已经构建了第三方承运商网络,首网点预测的准确率在65%左右,末分拣预测的准确率在85%左右。未来持续优化点包括:班次聚合(对于一些数据比较稀疏线路,需要做班次的聚合)、时间衰减(清洗数据需要选取过去一段时间的数据,对于太久远的数据,应该进行衰减,使得它在结果中的贡献小一些)等,相信准确率能有进一步提升。
  6参考文献
  [1]. Knee/Elbow Point Detection
  [2]. arvkevi/kneed
  [3].https://datascience.stackexchange.com/questions/46106/kmeans-vs-dbscan
  [4]. https://redis.io/docs/management/optimization/memory-optimization/
  [5]. 用户调研:今年11.11消费者最关注"确定性" 京东是八成用户首选-新华每日电讯

这个祛湿名方,可分消三焦湿热!夏天快要到了,你是否会经常感觉到头脑昏沉,胸脘痞闷,食欲减退,四肢倦怠,手脚出汗,神疲乏力,口干舌燥,大便粘腻,小便黄赤,头面油腻,舌苔厚腻等等,这是因为你体内有湿热。很多人认为食垃圾食品第一名,娃却点名要吃,自制其实很简单,吃一次就上瘾!自制大薯棒推荐月龄12M配餐用途零食功效锻炼抓握补维C锻炼咀嚼营养特点周末小零食已经给大家准备好了,是人人都爱的薯条超大版。食材就是最常见的土豆,富含多种维生素和矿物质,维C含量也哪里的沙棘原浆最正宗?在哪里能买到正宗的沙棘原浆?一定要收藏沙棘原浆是一种特殊的饮品,它含有丰富的维生素矿物质和氨基酸。这些营养物质都有助于提高人体免疫力,增强体质,促进健康。那么,怎样才能挑选到一款正宗的沙棘原浆呢?首先,要看其配料表的成降到3。5元的钟薛高,能转型成雪糕侠客?北京日报客户端评论员雨馨近日,钟薛高推出3。5元雪糕的话题引发网友热议。作为新崛起的网红雪糕品牌,钟薛高以高价和高颜值为大众熟知,这两年在销量上也一骑绝尘。但受市场追捧是一回事,其中山石歧地道澳门捞面,咖喱控不能错过在中山石歧有家地道澳门咖喱捞面,咖喱控绝对把持不住,据说这家店仅用了一年多时间就登上了当地的TOP。1。小小的店铺一进门,一片明亮黄映入眼帘,店内摆放着几张客桌,墙上贴着旧海报,霓千岛湖鲜鱼如何成为西餐美味?来看看这场国家级烹饪大赛3月27日29日,在浙江旅游职业学院千岛湖国际酒店管理学院,由中国烹饪协会上海博华国际展览有限公司主办,中国烹饪协会餐饮教育工作委员会浙江旅游职业学院承办的第七届HOTELEX明日你对蜂蜜有哪些误解?顺便推荐3款超家常的蜂蜜美食,超赞!蜂蜜是一种非常受欢迎的天然食品,它是由蜜蜂从花朵中采集花蜜并加工而成的。然而,许多人对蜂蜜存在着一些误解和误区,今天我们一起来探讨下。一普通人对蜂蜜的误区1蜂蜜不会变质实际上,蜂蜜惊喜!烧烤羊肉和麻辣小龙虾的季节来了,分享十余种商用秘制配方今天我分享的内容干货满满,关于商业版和家庭版的烧烤凉拌菜卤肉十三香五香粉等调味品的配方都在这里,这都是商家舍不得公开的配方,有了它们,我们夏季想摆个路边摊都不成问题。看完如果觉得配极简生活,改变我三观的洁面皂和沐浴皂!小时候,家里一块肥皂一个肥皂盒,承担了洗头发沐浴洗脸的全部工作。现在,却越活越累了。专门洗脸的,专门洗手的,专门洗头发的,专门洗澡的,洗漱池和淋浴区的架子上仿佛永远都摆不下。昨天我阿汤哥前妻和闺女最新出街像姐妹!16岁苏瑞完胜妈妈,却没有父爱汤姆克鲁斯已经十多年没有见过自己的女儿苏瑞了,小苏瑞出落成大美女了。当地时间周三,前阿汤嫂和苏瑞一起出街,如今母女俩都像是姐妹了。尤其是小苏瑞,16岁的她马上就要上大学了,时间过得秃然袭击!植发如何拯救头等大事春季脱发的故事又一次上演洗头时一不小心一大把浴室里它和地漏难舍难分地板上随处可见它的踪迹脱发已经成为越来越多人扎心的困扰对于轻度脱发的朋友用药可以得到有效控制而对于脱发已经影响到日
国乒全员送祝福!女乒一姐陈梦打头阵,刘诗雯新年愿望却令人心疼近日,不少运动员都发布了最新动态,而在乒乓球队伍中,14位选手和刘国梁一起为大家送出祝福。其中女乒一姐陈梦打头阵,而刘诗雯的新年愿望令球迷们非常心疼。根据国乒新年祝福的视频来看,国盘点2021国乒马龙宝刀未老,樊振东一骑绝尘,女队三分天下2021年已经过去,崭新的2022年正向我们走来。对中国乒乓球队来说2021年是收获满满的一年。东京奥运会四冠,休斯敦世乒赛四冠,WTT世界杯总决赛双冠。中国乒乓球队在世界乒坛的霸陆续拿下三大争冠豪门,赢辽粤京44分!山西已经成为CBA头号黑马北京时间1月3日,CBA崛起了一匹真正的大黑马球队,就是第二阶段至今为止让所有人意想不到的一支不败豪门,山西队。这支球队可以说是真正的黑马,因为就在此前他们又击溃了北京首钢,大逆转杜峰强势立功!易建联替身找到,19岁小周琦强势归来杜峰强势立功!易建联替身找到,19岁小周琦强势归来亲情提示亲爱的读者,如何能每天能读到这样的体育资讯呢?点击右上角的关注按钮即可,您的关注将是我创作的最大动力!北京时间2022年1NBA季后赛效率值最高的十大球星伦纳德垫底,詹姆斯仅第三每年NBA常规赛结束后都将开始激烈的季后赛,在这里才是检验球员成色的舞台,而效率值则是衡量一个球员在场上的表现的标准,所以本期我们盘点下NBA季后赛效率值最高的十大球星。第十位伦纳美媒晒哈登利拉德吹杨等人罚球次数,明显上涨,已适应版本?近日,美媒ClutchPoints在社媒上晒出了一组数据。美媒的配文是规则又调整了?还是说他们找到了秘诀?图中的数据显示詹姆斯哈登利拉德特雷杨等人在近期的罚球数据明显上涨,而且是大勒布朗詹姆斯北京时间2022年1月3日,刚刚结束的湖人对森林狼的比赛中,湖人以108103战胜森林狼,詹姆斯15投7中砍下26分7板5助3断1帽,三分9中3,罚球12中9常规赛罚球命中数超越大大话西游2新神兽卖20万!六艺家族如今身价大汇总大话西游2六艺新神兽书兰亭诞生,佳期良年的藏宝阁目前已上架了一只,售价高达20个W!售价20个W的兰亭不知会不会有大佬直接点了呢?接下来我们再来看看,之前的几只六艺神兽如今身价如何CBA北京首钢与山西男篮比赛结束后,球迷透露这3人身价有望大涨北京时间1月2日,CBA第17轮迎来一场焦点之战,由北京首钢男篮对阵山西男篮。两支球队实力相当,本赛季均有很大的希望打季后赛,不过这场比赛的结果倒不是球迷真正关心的,而是赛后有球迷玉米这样做太好吃了,不加一滴水,比蛋糕好吃百倍,宝宝超爱吃蛋糕店橱窗里摆放着的精致诱人的蛋糕,别说是宝宝了,我们大人看了也觉得十分诱人,但是外面卖的蛋糕对于宝宝来说都会含糖量过高,对于宝宝的健康生长发育不好,所以建议家长们对于宝宝这方面的4000万欧元签字费,比C罗身价都高?皇马3亿欧元锋线即将出炉2022年的第一天,国际足坛传出重磅消息,西班牙媒体ABC报道,姆巴配将要和皇马签订一份长达6年的合同,届时世界第一身价的年薪将会高达2100万欧元,除此之外皇马更会支付给他400