专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

时效准确率提升之承运商路由网络挖掘得物技术

  1引子
  履约时长是电商的生命线,直接关系到用户的消费体验。新华网〔5〕2022年双十一的报告显示,37。4的受访者希望次日达,29。91希望当日达。相较于其他物品,受访者对手机、电脑、数码产品的物流时效要求更高,更希望当日或12天内能收到货。
  得物履约场景中,主要的阶段包括仓库内生产和第三方承运商配送。在用户支付时,得物会根据仓库的生产情况和运配资源,给用户一个承诺时效。1。1为什么要预测承运商的线路时效
  在履约过程中,得物需要监控订单的流转,及时的发现可能超时的订单(与和用户承诺时效相比),这里包含仓库生产的监控和三方配送的监控。在实际过程中我们发现:配送节点发生变更时,承运商给的预测偏保守的。下面例子中,到了营业部承运商才给到比较精准的预计送达时间,故在分拣中心使用承运商的预计送达时间容易出现误报。
  下图是承运商接口返回的预计送达时效的宽松指数,可以看到在接近目的地时,承诺时效才比较准确。
  2承运商网络是如何运作的
  在构建承运商网络之前,需要先了解承运商网络是如何工作的。下面是从A网点到E网点的配送示意图,分为以下内容:
  (1)节点,包含的揽收和派送网点以及分拣中心。
  (2)线路,包括干线和支线。例如从网点到分拣中心属于支线,从分拣中心到分拣中心属于干线。
  (3)班次:承运商为了平衡成本和时效,会设置生产班次。到分拣中心之后,需要根据目的地进行分拣,当到达一定量的货物之后,会从分拣中心出发,前往下一个节点。承运商在设置班次的时候,会考虑单量,兼顾运输的成本以及时效。
  上图中:以紫色为例,在A网点,早上8点截单,即8点之前交接给承运商的货物,会在8点20左右完成封车,然后从网点出发,前往B分拣中心,到达B分拣中心的时间是11点40,这个时候赶上了B分拣中心截单时间为12点的班次,B分拣中心会在12:30完成分拣并前往下一个分拣中心,以此类推完成整个配送过程。
  在构建承运商的网络时,需要进行建模。除了节点、线路和班次之外,核心还包括以下两个模型:
  (5)成品线,即从A网点到E网点经过所有节点。上图中:A网点B分拣中心C分拣中心D分拣中心E网点构成了一条成品线。
  (6)成品线波次:因为节点存在波次,所以成品线也存在波次,实际上成品线波次和第一个节点的波次数一样。3如何构建承运商网络
  在了解承运商网络如何工作后,需要着手构建承运商的网络。承运商回将轨迹信息推送到得物,内容类似以下的文本。〔{code:180,desc:快件到达【xxx营业部】,location:{city:xxx市,district:xxx县,point:{latitude:xxx,longitude:xxx},province:xxx},node:已揽收,opeTitle:站点装箱,time:2022090417:29:27},{code:xxx,desc:收取快件,location:{city:xxx,district:xxx,point:{latitude:28。65,longitude:120。07},province:xx},node:已揽收,opeTitle:配送员完成揽收,time:2022090417:29:27}〕3。1结构化清洗
  轨迹的文本,需要经过结构化的清洗之后,才能获取轨迹的含义。对于每一个运单,它的轨迹会经过很多个节点,而每个节点的数据类型如下:1。waybillno表示运单号,同一个运单号会有多条节点记录2。stationindex表示当前这个节点的下标3。stationenum表示这个节点的类型,是分拣中心还是揽派网点4。stationname表示节点的名称,例如上面例子里的xxx营业部5。stationstatus表示这个节点的状态,例如是进入还是离开6。operatetime表示当前节点的操作时间3。2轨迹里面是否真的有班次信息
  承运商网络工作原理提到了承运商会按班次进行生产,从轨迹的结果里面是否能找到班次生产的证据呢。通过分析,我们猜想:相同流向(例如从A分拣中心开往B分拣中心)离开某个分拣中心(例如离开A分拣中心)的时间应该是相对集中的。
  实时上通过一些简单的聚类方法,证实了我们的猜想。下面图中,横轴表示的是出分拣中心的小时,每一个点表示历史上的某一个运单,纵轴没有业务含义,只是为了方便显示。
  绘制上述图时使用的是kmeans聚类算法,kmeans聚类算法需要指定聚类的个数。故需要使用KneeElbow这类的算法进行聚类数检测,同时它对异常值敏感,故在实现时最终使用的DBSCAN。
  3。3聚类参数该如何选取
  DBSCAN虽然不需要指定聚类的个数,但是需要指定点之间的距离以及点的密度,通过反复调整,最终确定这两个核心的参数如下:
  clusteringDBSCAN(eps0。25,minsamplesmax(5,int(x。size0。02)),metricmetric)。fit(xafterreshape)
  其中eps为0。25,即15分钟。点密度为5和总数的2的最大值。3。4如何解决跨天的问题
  从上面聚类图看,同一个波次的点可能出现跨天的情况,即有些点出分拨中心的时间可能是23:50,有些分拨中心的点可能是00:10。这两个点的欧式距离比较大,故需要重写距离的metrics函数。retabs(x〔0〕y〔0〕)ifret12:retabs(24ret)returnret3。5线路是如何串联的
  分析节点的生产班次和线路的班次是不够的,还需要将它们进行串联,得到成品线班次,这样才能在售前或者售中进行应用。这里在处理的时候进行了一些简化,一方面是分拣中心的分拣波次是没有办法识别到的,另外一方面其实可以不用关注分拣中心的分拣波次。
  实际上,串联成品线班次的过程是这样的:
  核心的代码如下:ListNetworkResourceWaveDTOnexttmp。getResourceList()。get(i)。getWaveList();next。sort(Comparator。comparing(NetworkResourceWaveDTO::getOffTime));booleanmatchfalse;for(NetworkResourceWaveDTOnextWave:next){if(nextWave。getOffTime()p。getEndTime()){matchtrue;durationnextWave。getDurationDay();pnextWave;break;}}if(!match){durationnext。get(0)。getDurationDay()1;pnext。get(0);}productLineWave。add(p);}3。6四级地址与揽派网点的关系是如何建立的
  从应用的角度,输入条件是买家的四级地址,但承运商网络的终点是派送站点,故需要建立承运商派送站点和四级地址的映射关系。映射关系的建立比较简单,取过去一段时间负责派送该四级地址的站点中,派送该地址单量最多的那个。4工程落地的挑战
  Part3更像是一个理论家的滔滔不绝,那如何在工程上进行落地呢?这里面包含了ODPSSQL的开发、UDF的开发以及DDD,总之需要十八般武艺。4。1如何在ODPS进行简单的机器学习
  在班次分析的过程中,使用到DBSCAN的聚类算法。如果在odps上使用这些算法呢?实际上python里面已经实现了DBSCAN算法,而odps支持使用python编写UDF。只是目前odps的运行环境并没有安装DBSCAN相关的包,故需要手动进行安装,安装的教程可以参考阿里云的官方文档
  4。2在线服务化的问题
  上述清洗过程需要每天或者至少一周运行一次,选取过去一个时间窗口的数据进行训练,得到承运商的网络,这样才能及时的感知承运商网络的变化。这意味着会定时的更新成品线、成品线波次以及节点波次的信息,在在线服务化的过程中,我们是直接将数据这些数据存放在redis里面。为了不占用太多的内存,通过使用hash数据结构对内存进行了一些优化,当然hash的一个缺点是无法为field设置超时时间,这意味着某个key的某个field数据实际已经是过期数据了,但是它不会被删除,进而造成泄漏,但这种泄漏可以通过其他技术手段解决。5进展与规划
  目前我们已经构建了第三方承运商网络,首网点预测的准确率在65左右,末分拣预测的准确率在85左右。未来持续优化点包括:班次聚合(对于一些数据比较稀疏线路,需要做班次的聚合)、时间衰减(清洗数据需要选取过去一段时间的数据,对于太久远的数据,应该进行衰减,使得它在结果中的贡献小一些)等,相信准确率能有进一步提升。
  6参考文献
  〔1〕。KneeElbowPointDetection
  〔2〕。arvkevikneed
  〔3〕。https:datascience。stackexchange。comquestions46106kmeansvsdbscan
  〔4〕。https:redis。iodocsmanagementoptimizationmemoryoptimization
  〔5〕。用户调研:今年11。11消费者最关注确定性京东是八成用户首选新华每日电讯

科莫多巨蜥的毒液到底有多可怕?2009年,一名31岁的渔民安瓦尔,在印尼科莫多岛上采摘水果,结果不小心从水果树上掉了下来,刚好踩到了一只巨型蜥蜴,蜥蜴瞬间就朝他扑了过去,咬住了他的腿,之后又咬住了他的手臂,身体武汉未来的房价会涨到100000元平米吗?这个问题的答案是肯定的!以目前的趋势,未来武汉房价必然达到10万的水平,只是时间长短的问题。2010年至2017年,短短七年间,武汉的房价已经翻了3番,目前,武汉部分高端楼盘如洞庭兰州青白石片区,中央公园怎么样?兰州北拓的黄金区域,目前基础交通还跟不上建设需要,交通滞后可能会成为十四五期间兰州青白石片区发展的的最大障碍!不过就兰州地理位置和城区格局而言,青白石片区是离主城区最近的待开发区域农民为什么不在国家统计失业范围之内?中国有四个儿子,大儿子叫工人,二儿子叫子弟兵,三儿子叫公务员,四儿子叫农民,所以四儿子就没有纳入统计失业包括养老金范围,因为四儿子有金山银山还有三分地。农民有土地,这是农民可以赖以农村成立社区是什么意思?很多农村驻有村委会办公室,同时也驻有社区管理委员会办公室,特别是在城市郊区的农村和街道的农村都同时设立了村委会和社区管理委员会,很多人弄不明白是怎么回事。那农村成立社区是什么意思呢农村里的剩男,为何一剩再剩呢?到底是什么原因?男女比例失调。计划生育只要一个孩子时,受封建思想影响,都拚命要男孩,等他们长大了,很难找到媳妇。一,农村姑娘远嫁,二,女孩见少,三,彩礼高,四,剩男挣钱少。我就一大龄剩男!个人亲身抖音付费直播试水,看直播要给钱了?我们应该如何思考?使劲收,最好是家人们看的话,一分钟100块钱。毕竟粉丝听话的很。毕竟人设都设计好了打PK,卖货摆错价格,怒亏2个亿回馈粉丝。没事就怼工厂,怼员工反正就是赔钱回馈粉丝。赔完还得补交税马上就要退休了,退休工资才3650元太少了,怎么办?3600不少了。我企业工龄32年,退休时退休金只有2200,涨了这么多年还不到3000。知足常乐吧!如果身体不好,这些钱也够生活了,如果身体还可以,就找一些力所能及的工作,打打工补南宁五象新区未来的发展潜力很大吗?五象新区无法成为国家级新区!!!目前看来,五象新区的潜力也就这样了。我们对比一下贵阳的贵安新区,贵安新区的面积是1700平方公里,由贵阳市的郊区和安顺市合并得来。是全国第8个国家级如果把三峡大坝加高10米,截留更多的洪水,可行吗?我国的三峡大坝,作为当今世界上最大的水利枢纽工程,位于湖北省宜昌市上游,距下游葛洲坝水电站38公里,三峡大坝全长2309米高185米,呈梯形形状,集发电旅游航运调控洪水于一身。三峡大家有经历过亲人去世吗?是怎样走出痛苦和想念的?2018年9月1日下午3点8分,我的妻子在医院里停止了呼吸。她的眼睛没有闭上,我流着泪,帮她合上了双眼。我永远失去了我最亲近的爱人,孩子永远的失去了妈妈。一位好妻子,好女儿,好姑妈
ampampquot零卡顿ampampquot千元机,这3款华为手机值得买,最低只要1649!华为畅享50Pro1649元(8128GB)华为畅享50Pro配置了6。7英寸的无界全视屏,只有1。05mm的超窄侧边框,护眼夜光屏,94的屏占比,支持90Hz刷新率,270Hz触夜读一部曾让我崩溃的假手机又到315,又到了打假的时节。相信很多人都有过买到假货的经历,什么康帅傅方便面云碧汽水清场洗发水等等,很多人都见过。但对于我来说,印象最深的一次买假货,是买到一个假手机。那是很多年18岁少年被判枪决,九年后真凶被抓,法院判错案了,赔你210万阅读此文前,麻烦您点击一下关注,既方便您进行讨论与分享,又给您带来不一样的参与感,感谢您的支持。随着我国法制的不断完善,一些被错判的案件,也得到了重新审理,并让很多被冤枉的好人,得手机屏幕越做越大了,这是为啥?内行人给出4个理由如果你不是游戏党也不追剧,应该会喜欢小屏手机吧。跟大屏手机比起来,它占用空间小,更适合携带,能够单手操作,非常方便。也是因为小的原因,不像大屏手机更容易沦为手机控,路上一大片都是低iPhone15ProMax概念图95屏占比8G运存,无可挑剔越是颜值高的旗舰手机,往往就越能吸引消费者的目光,毕竟颜值就是正义。苹果手机是一个手机市场中极具号召力和影响力的手机厂商,是一个硬件设计和软件设计能力非常强的手机厂商,再加上极致的财报恩捷股份2022年营收125。91亿同增57。73现金流净额跌超6成出品丨搜狐汽车汽车咖啡馆3月3日,恩捷股份发布了2022年年度报告。报告期内,公司实现营业收入125。91亿元,同比增长57。73归母净利润达40。00亿元,同比增长47。20。恩首批受惠者已减免税收近3亿元广州市南沙区核心区域明珠湾区。15税率的所得税优惠,在全世界都有很强的竞争力。一家落户南沙20年的跨国企业财务负责人在提及广州南沙深化面向世界的粤港澳全面合作总体方案(简称南沙方案没有收入社保也能办贷款?严打!中新网3月16日电(中新财经记者左宇坤)最近,贷款中介庞玲(化名)听到了一些风声,有的同行公司放假了,微信上认识的业务员说要请几天假,有的公司甚至直接被查了。这些年贷款中介野蛮发展解析乌鲁木齐市统筹招引增量和服务存量,推动产业聚集发展密码以魄力引得来用真情留得住解析乌鲁木齐市统筹招引增量和服务存量,推动产业聚集发展密码新疆网讯(全媒体记者王丽丽)招商引资是经济建设的活力源。如何将招商引资甄选的每一粒种子,在乌鲁木齐西饼店甜蜜创业李莹的店铺每天都吸引了很多顾客。受访者供图广州日报讯(信息时报记者黄丽霞)清晨,当第一缕阳光升起,沉睡的城市开始苏醒。李莹和许多上班族一样,送完孩子上学后,匆匆赶到西饼店开启繁忙的金融冲击将至,13。91万亿城投债券危矣!?硅谷银行48小时迅速破产,在金融市场引发一片恐慌,有人因此联想到国内的城投债券也危险了。别杞人忧天自己吓自己。可以明确告诉你城投债券不仅不会受到冲击,反而会因此更加安全!1美国金融
友情链接:快好知快生活快百科快传网中准网文好找聚热点快软网