范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

如何评估机器学习模型的商业价值

  作者:amitvkulkarni
  CDA数据分析师编译 概述
  对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程。随着工具、算法的进步,以及随着 MLOps 的出现,事情变得容易了很多,而且未来也会继续发展——技术会优化自己。
  业务方面呢?说服客户相信使用先进工具和技术构建的复杂模型的预测能力有多容易?客户是否愿意为项目提供资金并信任我们模型的建议?好吧,不妨试着解释模型的 ROC 曲线,试着用特异性和敏感性指标来说服客户——你会看到的只是眼球在滚动。
  但是,如果我们能够在没有复杂指标和技术术语的情况下回答业务问题呢?那么,我们就可能有机会从业务部门那里获得支持。在本文中,我们将看到一个用例,在该用例中,我们仍将构建我们的模型,但以不同的方式对其进行解释——业务方式。
  使用 ML 模型提取商业价值的方法
  在这篇博客中,我们将探索十分位数的使用,了解各种评估图,如累积增益图和提升图等,以评估 ML 模型的商业价值。该方法将帮助我们解释 ML 模型的预测能力,并使解释模型结果变得很简单。这些图表和指标将使企业能够更有信心地做出明智的决策。
  我们将在本文中探索以下主题。数据探索 数据处理 建立模型 生成十分位数和报告 模型对比 业务场景 结论 入门
  我们将使用来自 UCI 机器学习存储库的公开可用的银行数据 集, zip 文件中有四个数据集,但我们感兴趣的是*bank-additional-full.csv。*所有的属性信息都可以在上面的 URL 中找到。数据来自直接营销电话联系客户,以评估客户是否有兴趣订阅银行定期存款。如果订阅,则为 Yes,否则为 No。本文讨论的是如何评估 ML 模型的商业价值。数据加载和处理:
  让我们加载数据并查看一下以便更好的理解数据。import wget import zipfile import pandas as pd import numpy as np url = "https://archive.ics.uci.edu/ml/machine-learning-databases/00222/bank-additional.zip" wget.download(url)  zf = zipfile.ZipFile("bank-additional.zip") df= pd.read_csv(zf.open("bank-additional/bank-additional-full.csv"), sep=";")
  我们可以进行完整的EDA/特征工程/选择重要变量然后构建模型,但为了简单起见,我们将选择很少的变量进行模型构建。df= df[["y", "duration", "campaign", "pdays", "previous", "euribor3m"]]
  此外,还需要更进一步地探索数据,将目标变量转换为分类变量并对其进行编码。df.y[df.y == "yes"] = "term deposit" df.y = pd.Categorical(df.y) df["y"] = df.y.cat.codes df.info() 输出:RangeIndex: 41188 entries, 0 to 41187  Data columns (total 6 columns):  # Column Non-Null Count Dtype  — —— ————– —–  0 y 41188 non-null int8  1 duration 41188 non-null int64  2 campaign 41188 non-null int64  3 pdays 41188 non-null int64  4 previous 41188 non-null int64  5 euribor3m 41188 non-null float64  dtypes: float64(1), int64(4), int8(1)  memory usage: 1.6 MB df.head()  y duration campaign pdays previous euribor3m  0 261  1  999 0  4.857  0 149  1  999 0  4.857  0 226  1  999 0  4.857  0 151  1  999 0  4.857  0 307  1  999 0  4.857 df.describe()  y duration campaign pdays previous euribor3m count 41188.000000 41188.000000 41188.000000 41188.000000 41188.000000 41188.000000 mean 0.112654 258.285010 2.567593 962.475454 0.172963 3.621291 std 0.316173 259.279249 2.770014 186.910907 0.494901 1.734447 min 0.000000 0.000000 1.000000 0.000000 0.000000 0.634000 25% 0.000000 102.000000 1.000000 999.000000 0.000000 1.344000 50% 0.000000 180.000000 2.000000 999.000000 0.000000 4.857000 75% 0.000000 319.000000 3.000000 999.000000 0.000000 4.961000 max 1.000000 4918.000000 56.000000 999.000000 7.000000 5.045000
  模型构建以提取商业价值 逻辑回归
  Step1: 定义自变量和目标变量y = df.y X = df.drop("y", axis = 1)
  Step2: 将数据集拆分为训练集和测试集,其中测试大小为整个数据集的 20%X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 2021)
  Step3: 建立逻辑回归模型from sklearn.model_selection import train_test_split  from sklearn.linear_model import LogisticRegression  # Logistic regression model  clf_glm = LogisticRegression(multi_class = "multinomial", solver = "newton-cg").fit(X_train, y_train)  prob_glm = clf_glm.predict_proba(X_test)  max_prob_glm = round(pd.DataFrame(np.amax(prob_glm, axis=1), columns = ["prob_glm"]),2)
  至此,我们已经建立了模型,并在测试数据上对其进行了评分(预测),这为我们提供了每个观察结果的预测概率。
  生成十分位数
  简单地说,十分位数把数据进行分箱。所以,我们将所有预测的概率分成十组,并对它们进行排名,这意味着最高的预测概率将在十分之一,最低的设置将在十分之一。我们将使用pandas的 cut() 函数拆分数据。
  下面的代码行创建一个名为Decile_rank_glm的新列, 它保存每个预测记录的排名。max_prob_glm["Decile_rank_glm"] = pd.cut(max_prob_glm["prob_glm"], 10, labels = np.arange(10,0, -1))      prob_glm Decile_rank_glm 0 0.99 1 1 0.59 9 2 0.96 1 3 0.83 4 4 0.85 4 ... ... ... 8233 0.98 1 8234 0.98 1 8235 0.99 1 8236 0.99 1 8237 0.93 2
  注: 0.99 的概率为 1,0.93 为 2,0.85 为 4,0.59 为 9。我们将在后面的部分中看到此结果的可视化。
  模型评估以提取商业价值
  我们构建的任何模型都必须与基线模型进行比较,以评估模型的性能。让我们在下面进一步探讨这一点。随机模型 :基线模型将是一个随机模型,这意味着它与抛硬币一样好,这意味着有 50% 的概率客户的电话是正确的或者客户购买我们的产品。我们的逻辑回归模型的性能显然应该比这更好。向导模型 :这是另一个极端模型,它的预测是完美的,这意味着它几乎以 100% 的准确度进行预测。此模型不应用于生产或任何业务决策,因为很可能会过度拟合。逻辑回归 :我们的模型应该介于这两个极端模型之间,这使我们有足够的信心做出业务决策。
  我们将在累积增益图中可视化上述模型。展现逻辑回归的性能。kds.metrics.plot_cumulative_gain(y_test.to_numpy(), prob_glm[:,1])
  累积增益图 | 商业价值机器学习模型
  到目前为止看起来不错,图在预期线上,逻辑回归模型介于我们讨论的两个极端模型之间。
  累积增益图的见解:如果我们只能选择 前 20% (十分位数 1 和十分位数 2),那么我们就可以覆盖**近 80%**的目标类别。由于这是一个累积图,我们看到**曲线在十分位数 5 之后变平,**这意味着十分位数 6 到 10 要么有最少的记录,要么没有。 向导模型 在十分位数 2 的位置 达到了100% 标记 ——我们已经知道这是一个理想模型,仅供参考。如果我们的模型开始接近或者类似于这两个极端模型中的任何一个,那么需要检查我们的模型。
  到目前为止,我们已经讨论了模型、十分位数及其性能比较。让我们在十分位数级别上进一步探讨这一点,以更清楚地了解发生了什么以及我们如何更好地解释这个过程。我们将在视觉效果的帮助下进行分析,这使它变得更加容易。kds 包有一个非常好的功能,可以在一行代码中生成所有指标报告。kds.metrics.report(y_test, prob_glm[:,1])
  metrics report | Business value ML model
  让我们了解这些情节中的每一个。需要注意的是,所有图的 x 轴都是十分位数。提升图(Lift Plot) :这个图向我们展示了逻辑回归模型与随机模型相比到底有多好。例如:十分位数 2 给了我们几乎 4 倍的提升,这意味着我们可以比随机模型方法做得好 4 倍。当我们进入更高的十分位数时,升力下降并最终满足随机模型线,这是因为所有更高的概率分数值都在我们已经在累积增益图中看到的最高十分位数(1 到 3)中。因此,底部十分位数的概率较低且几乎与随机模型相同。十分位数提升图(Decile-wise Lift Plot) :该图向我们展示了每个十分位数中目标类观察的百分比,我们观察到十分位数 1 具有最大值,随着x轴数值的延伸,十分位数百分比下降,在某个点之后它甚至低于随机模型线。这是因为随机模型具有随机设置的均匀分布的观测值,而我们的模型在较高的十分位数中预测的观测值较少。累积增益图(Cumulative Gain Plot) :在以前的部分中讨论过这个问题,还研究了对图的解释。KS 统计图(KS Statistic Plot) :KS 图评估不同的分布,即事件和非事件,KS 值是分布之间差异最大的点。简而言之,它有助于我们理解 ML 模型区分两个事件的能力。KS 分数大于 40,如果它恰好在前 3 个十分位数中,那么它被认为是好的。在我们的例子中,我们从图中得到了 68.932 和十分位数 3 的分数。
  让我们用随机森林再构建一个模型,看看结果如何。clf_rf = RandomForestClassifier().fit(X_train, y_train) prob_rf = clf_rf.predict_proba(X_test) max_prob_rf = pd.DataFrame(np.amax(prob_rf, axis=1), columns = ["prob_rf"]) max_prob_rf["Decile_rank_rf"] = pd.cut(max_prob_rf["prob_rf"], 10, labels = np.arange(10,0, -1)) kds.metrics.plot_cumulative_gain(y_test.to_numpy(), prob_rf[:,1]) kds.metrics.report(y_test, prob_rf[:,1])
  img
  观察:随机森林模型略好于逻辑回归模型。 十分位数 2 的提升略高,KS 统计数据为 72.18,而logistic统计数据为 68.93
  业务场景
  建议控制:在某些情况下,客户有业务需求,即应始终生成最少 X 条建议。在这种情况下,我们可以通过考虑前 3 个十分位数而不是 2 个十分位数来获得更大的建议,并且还可以对其他记录进行精细控制。
  衡量市场反应:推荐后分析和市场反应很容易衡量。例如,从前一点,我们可以单独跟踪来自十分位数 3 的所有额外推荐的表现。来自十分位数 3 的额外推送是否产生了任何影响(正面或负面)?
  优化营销支出:通过关注前 20-30% 的人群,企业可以节省时间、资源和金钱。以避免这些时间、资源和金钱会花费在无响应者或定位错误客户上。
  结语
  技术有其一席之地,企业也有发言权。归根结底,这一切都与技术带来的商业价值有关。当这些收益用商业术语来解释时,它总是会更有效。它不仅有助于从业务中获得信心,而且还开辟了新的探索机会。
  请注意,我们构建了两个分类模型,但没有研究我们通常为此类模型所做的 ROC 曲线、混淆矩阵、精度、召回率和其他标准指标。强烈建议跟踪和测量这些指标以评估模型的性能,然后遵循此文中的十分位数方法。根据目标受众和目标,使用最适合目标的方法。

深夜休眠无烦恼原系多功能微护器前言向往常一样,做完洗漱工作,换上冰凉凉的睡衣准备入睡,还未盖上被子,微信群聊就响个不停,原来是隔壁邻居被蚊虫叮咬患上了登革热。老实说,这在马来西亚再常见不过了,无非就是发热无力的视频那天之后,我再也没见过学姐。(校园贷款的危害)那天之后,我再也没见过学姐(本内容来源于真实事件,稍加以艺术手法润色,图片均来自今日头条正免费正版图片,并非学姐以及笔者本人)当看到灵犬反低俗挑战这个话题的时候,我实际上心头一紧,星空以下,那个最终成长起来的天子少年历数历史上的那些形形色色的人物,浩渺如同夜空之下的璀璨星河,每一个人物好比就是这河里的星辰,我今天拾起的这颗星,相比起别的星辰来它既不闪耀如昼也绝对谈不上是晦暗无光他的名字,叫做朱弱社交弱PVP的影之刃3回到了一条艰难的路以重复推图为主的游戏设计很容易消耗玩家热情经历影之刃2的口碑暴跌之后,影之刃3选择回归传统的横板动作模式,采用初代经典的技能链设计,让玩家专注于PVE刷图本身。然而在横板动作手游整征服与霸业再谋划一盘棋征服与霸业希望,在棋诞生千年之后,再谋划一盘棋。为什么是棋?即便是线上游戏乱花迷眼的今天,棋类游戏也依然站在好玩的金字塔之巅。去年底,奈飞迷你剧后翼弃兵的大火,勾起了许多人对国际象中视频,斗鱼的二次创业直播取得成功后,斗鱼又开始进入视频领域赶在2020年的最后一天,斗鱼APP迎来了一次重大更新,视频业务成为与直播业务平行的又一重磅板块。而2月初,斗鱼再次做出调整,把社区也提到与视BLGxMG让电竞文化融入年轻世代生活场景电竞的边界可以很远继去年年底平安银行冠名赞助BLG后,哔哩哔哩电竞于今日宣布上汽MG名爵(简称MG)成为BLG平安银行俱乐部(简称BLG)独家汽车合作伙伴。一直以来,MG这个汽车品梦想新大陆不删档首发回合赛道上的社交新玩家以半熟社交为核心跳出模板降低门槛吸引更多年轻用户回合制游戏无论是产品还是用户都需要新的变化。1月27日,梦想新大陆正式上线,继梦幻诛仙之后,祖龙娱乐再战回合制领域,这也是腾讯在回合沸腾的市场疯狂的一月过于扎堆导致在宣发和推广上让部分产品沦为了炮灰临近春节,国内手游市场波澜不断。每年的Q1和Q4历来都是厂商新品高发期,不过今年的竞争有了梦回四五年前手游爆发期的感觉。腾讯和网易在1动画先行三年,姗姗来迟的赛马娘手游首日畅销榜TOP3与文化相结合并非空喊口号拟人化是游戏角色设计的取巧做法,无论是早先的舰娘枪娘战车还是前不久网易幻书启世录参考文学名著幻萌的四叶草剧场魔物娘,这样的设计比比皆是。而在二次元相关人物设玩法没有创新怎么办?扬长避短的尼尔手游当玩法没有足够的创新该怎么办?扬长避短近日,由Applibot开发,CyDesignation负责角色设计,SE负责发行的尼尔系列首款手游NieRReincarnation上线即爆
周朝阳小说连载借钱(一)小文和老公经营着一家快餐店,两年来生意时好时坏。全国疫情有反复,社区工作站那边对社区管理也有要求,一定程度上影响了客流量。收入减少的情况下,还要去聘请一个炒菜师傅,每个月算账时到手周朝阳研究竞争对手,模仿创业项目很多时候计划一个创业项目,可能在当时认为已经想得很全面很完美了,但是一旦实行起来就会碰到这样或那样的问题。你之前认为那些特别重要的部分现实中根本没有太多人关注,而你忽视的那部分往往2022年AIOPS趋势和预测您需要知道的一切企业需要了解的有关2022年AIOps趋势和预测的所有信息。随着人工智能机器学习和自动化等先进技术的出现,前沿业务场景发生了翻天覆地的变化。此类创新改变了当今的应用程序结构和IT运物联网如何改变设施管理流程物联网(IoT)设备可用性的提高使设施管理人员能够实施自动化,这在以前使用传统设施管理系统是不可能的。物联网设备还允许设施管理人员收集丰富的数据集,以便做出更多数据驱动的决策。基于人工智能时代用知识改变人际关系HenryAKissingerEricSchmidt和DanielHuttenlocher撰写的人工智能时代书评。人工智能学会了通过做出人类大师从未想过的动作来赢得国际象棋。另一个智能建筑产业分析成都的巴适超乎想象提及蓉城成都,除了广为人知的天府之国的美誉,本身的硬实力更备受人们瞩目。从体量来说,以2094万的人口总量位居国内7个超大城市之列,如今的成都市,更是被确定为成渝双城经济圈的两个核DALI联盟已将DALI2扩展到应急照明DALI联盟已将其非常成功的DALI2认证计划扩展到包括用于独立应急照明的控制装置。DALI2认证专注于设备互操作性,建立在开放的国际标准之上。DALI应急照明被广泛用作强大而可靠爱立信PowerLight展示全无线5G基站跨国电信公司爱立信(Ericsson)和总部位于西雅图的PowerLightTechnologies报告称,他们成功演示了全无线供电的5G基站。概念验证使用了PowerLight的智能家居和物联网将迎来爆发式增长物联网(IoT)代表着未来的发展趋势。物联网所描述的是我们周围的各种智能设备组成的互连网络。这些物理物体,例如恒温器或门铃,现在都嵌入了传感器处理器,并具有与周围世界互动的能力。比分析师400G数据中心交换机端口今年将超过1000万400GbE数据中心交换机的过渡正在顺利进行,随着客户的广泛采用,容量现在开始向数千万增长,CrehanResearch总裁SeamusCrehan说。CrehanResearch专家视点智慧城市需要实时数据byJoeMcKendrick许多城市可以以新的方式从街道和建筑物的实时信息流中受益。例如,在Covid危机期间,美国查塔努加市的分析师开始分析交通量和模式,以评估通勤人数减少对税