童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AI开发指南:机器学习产品是什么?

2月18日 枯心人投稿
  为什么管理机器学习(ML)产品比一般软件困难?实验是关键!
  关于管理AI产品,我认为最重要的几件事:
  机器学习(ML)产品管理比一般软件更具挑战性,因为它涉及更多的不确定性。不仅需要技术上的改变,还需要组织上的改变。
  ML最适合做出决策或预测。
  ML产品经理最重要的工作:明确定义问题,确定需求,设定衡量成功的标准,并为ML工程师提供足够的空间和时间探索解决方案。
  从第一天就开始计划数据策略(DataStrategy)。
  构建ML产品是跨领域的,不只是数据科学。
  在《AI重新定义机器人》文章中,我提到了ML带来的最大不同是:
  让机器从依赖人工编写程序,转向真正的自主学习。
  机器不需要人工指示,而是自行根据数据中识别出的模式,进行预测和改进。这就是为什么ML特别适用于那些,以往难以明确解释定义的问题。这也代表ML可以使你的产品更个人化,更自动化,和更精确。
  先进的算法,大数据,和硬件价格下降,成为ML成长的主要驱动力。
  AI已在各个领域逐渐被采用。麦肯锡(Mckinsey)最近的报告中显示,近一半的公司在其研发流程中整合了AI,另外有30的公司正在试验AI项目。
  不难看出为什么,许多人预期ML将比移动技术带来更巨大的产业变革。但是,与此同时,公司引进ML的难度,也可能比当年采用移动技术更高数倍以上。为什么呢?在讨论具体原因之前,让我们先一起聊聊什么是ML。
  机器学习(ML)三大类型:监督学习、无监督学习、强化学习
  AI人工智能并没有一个普遍被认同的定义,而且它的定义不断在改变。一旦某项任务能够成功被机器执行,该任务就不再属于AI的范围。
  ML是AI的一部分。CarnegieMellon大学教授汤姆米切尔(TomM。Mitchell)将机器学习定义为对一种,允许程序根据经验自动进行改进的算法。
  机器学习有三种主要类型:
  监督学习(SupervisedLearning):最常见和最被广泛使用的类型。这些算法从被事先标记好的数据(labeleddata)中学习,大多时候被用以预测结果。例如,给予机器大量标记好的动物图片,让机器学习判断猫和狗。
  无监督学习(UnsupervisedLearning):无监督学习算法不需要事先标示,而是直接从数据学习判读模式。它可以用于聚类(clustering),关联(association)和异常检测(anomalydetection)问题。另外还有半监督学习,是监督学习与非监督学习之间的混合体。
  强化学习(ReinforcementLearning):算法藉由得到环境中的反馈而学习。RL通常用于机器人技术,或自动驾驶汽车等控制领域。例如将目标函数(ObjectiveFuncion)设定为成功从A点移动到B点,每次机器人成功到达B点,就会得到正面响应(reward),一直到重复直到机器人学会执行这项任务为止。
  机器学习产品的类型
  根据产品的类型和核心价值的来源,你将需要不同技能,并且专注于产品的不同面向。
  用户是企业,还是一般消费者?
  像Alexa或GoogleAssistant这样的消费性ML产品,具有更强的社交互动成分。因此,用户体验(UserExperience)在设计消费类ML产品中扮演着极关键的角色,而ML技术则往往是达成更好用户体验的方式之一。
  例如,NLP(自然语言处理)被用于达成Alexa及用户之间更自然的沟通。另一方面,B2B的ML产品对应的是企业,甚至是工业用户(例如用于预测工厂仪器维护时程的算法),其核心价值往往来自预测的准确性,而非UX。
  这并不是说UX对面向企业的ML产品不重要。而是,当你的资源有限,并且需要集中精力优化产品的某些部分时,就需要考虑这个问题。
  你要设计的是ML产品?或是将ML应用到你的产品中?
  如果你产品的核心价值来自ML模型,那么你很可能正在设计一个ML产品。相反的,如果ML仅用于增强产品的用户体验或部分性能,那么你很可能正在将ML应用于产品上。
  在第二种情况下,身为产品经理,你不应该花太多时间顾虑技术细节;像是ML模型是以CNN(卷积神经网络)还是RCNN为基础,而是应该花时间了解模型的输入(input)和输出(output)。
  举例来说,你要使用的这个ML模型,采用用户的人口统计数据(input)来预测用户在平台上的每月支出(output)?另一方面,设计ML产品通常需要PM具备更高的技术能力,以帮助团队确定关键决策和权衡取舍。
  产品类型也会影响组织结构。对于研发机器学习产品的公司,或像Facebook和Google这类在ML上投入大量资金的的大型公司,通常会雇用机器学习研究人员或数据科学家,并将他们与机器学习工程师组成团队。
  相反的,对于想将ML应用于其产品的公司,或资源有限的小型公司,最好的策略是雇用跨领域的ML工程师,或培训软件工程师学习ML,而不是雇用ML研究人员。
  构建ML产品通常是跨领域的
  研发机器学习产品很少会只涉及ML。它通常是跨领域的,不仅涉及ML模型设计及训练,还涉及软件工程,后端结构,数据分析,UXUI设计,甚至是软硬件整合等等。
  产品经理需要能够管理跨职能的团队,并处理团队之间的相互依赖和潜在冲突。ML从根本上不同于其他学科,这点会在下一段进一步说明。如果你要设计和现实世界互动的ML产品(例如机器人技术或自动驾驶汽车),情况将变得更加复杂。
  PM需要知道使用ML可以做什么,和不能做什么,何时应该使用ML和何时不应该使用ML。
  其他需要理解的关键ML概念
  过拟合(Overfit)
  是一种常见的错误类型,当机器学习模型过于匹配特定的数据集时发生。可靠的ML模型不仅在训练数据集(trainingdataset),也在验证数据集(validationdataset)上表现良好。但是,在过拟合的情况下,训练数据的表现会变好,但对于没有看过的,验证数据的表现却反而会变差。
  深度学习(DeepLearning)
  主要用于图像分类。DL使用深度神经网络,并以卷标图像作为输入。神经网络的每一层,都会将输入转换为稍微抽象和复合的表示形式。最终,模型将能学会识别图像中的内容。
  自然语言处理(NaturalLanguageProcessing)
  这是计算机科学中的一个领域,目的是使机器可以理解人类语言,但不一定涉及ML。NLP通常用于聊天机器人、语音助手、或是预处理数据。
  管理机器学习产品的挑战
  实验是机器学习的关键部分
  ML也会用到程序代码和数据,但若因此就认为ML与软件工程本质相同,那就大错特错了。
  与软件工程不同,开发ML产品需要进行更多的实验,涉及更多的不确定性和可变性。软件工程是一个为机器编写规则的确定性过程,而机器学习则具有更高的机率性,因为它可以自行学习,而不需要我们来编写规则。
  例如,如果你想教机器识别猫。透过软件工程,你可能会想出一只猫有四只腿和两个尖尖的耳朵这样的明确规则。
  但如果使用深度学习,要做的就不是提供明确的规则。
  而是为机器提供一堆猫的照片(事先标记好这些是猫的图像),然后让机器自行学习,摸索出规则。
  你和你的团队要做的是:定义问题,准备数据,建立机器学习模型,测试和迭代,直到你拥有可以提供所需结果的模型为止。
  这就是为什么在开发ML产品时通常需要承担更多的风险。对于产品经理而言,重要的是要帮团队建立正确的期望,以避免团队之间可能发生的冲突。
  例如,软件工程师可能会觉得,ML团队没有给他们足够明确的需求。但这并不一定是ML团队的问题,在实验阶段,就连ML团队也很难预测最后模型的表现是好是坏。这时让其他团队了解ML产品的实验本质就很重要。
  让工程师与研究人员,数据科学家紧密合作也很重要,这样他们才能彼此平衡,不让产品研究失焦。更重要的是,最好早点开发出可供测试的产品,定期测试,以确保ML团队所用的算法与产品目标一致。
  开发ML是一个高度迭代的(iterative)过程
  正如前面提到的,ML非常适合解决人类无法明确定义的复杂问题。模型需要训练,测试和调整。通常,数据科学家在选择令人满意的方法之前,必须先测试好几种方法。这就是为什么通常很难定义ML产品的里程碑和时间表。
  也因此,对于产品经理来说,明确定义需求,设定产品成功标准,并确保团队经常根据所需标准来测试ML模型,都是相当重要的。
  除技术挑战外,还有更多的组织结构挑战
  因为ML与软件工程本质截然不同,所以更需要进行一些根本性的组织变革:例如尊重实验文化,数据分析驱动的思维方式,以及对不确定性的包容。
  如果将机器学习视为纯粹的技术问题,而忽略了相关的组织变革,公司很可能会面临所谓创新者的困境(TheInnovator’sDilemma)。这对机器人制造商等硬件公司来说尤其具有挑战,因为它们对于过去一直追求高精度,然而,ML虽然会随着数据增加而进步,却通常无法在一开始就达到100精准。此外,机器学习产品需要大量的数据,所以业者必须建立自己的数据管道和基础架构,以支持ML产品的扩展。对大多数的公司来说,这也是一个全新的课题。
  机器学习仍然是一个新领域,并且会不断发展
  软件工程一词最早于1965年出现,也就是程序语言出现15年后。大约20年后,软件工程学院才成立,以管理软件工程开发流程。今天,我们已经找到了软件工程的最佳实践(bestpractice)。
  反观机器学习,在1990年才开始作为一个单独的领域而蓬勃发展。深度学习是ML的一部分,它在图像识别和NLP等领域创造了新的记录,但直到2012年AlexNet出现之后,才被大众广泛讨论。
  与软件工程相比,ML仍处于起步阶段,因此仍缺乏行业标准,衡量指针,基础架构和开发工具。因此,相关企业仍在探索最佳作法和热门应用。
  机器学习产品的可解释性和透明度
  机器学习算法就像一个黑盒子,它接受输入(例如图像)并输出预测(例如图像中的人物是什么)。这使得产品经理很难解释ML模型是如何运作的,也很难从用户和相关单位得到全面支持。
  尤其是在医疗保健等关键领域,责任归属和信息透明度至关重要。在没有清楚地了解算法实际工作原理的情况下,确保ML模型与产品目标之间的一致性是一项艰巨的挑战。
  面对这些挑战,我们应该如何管理机器学习产品?在第二部分中,我将分享我所学习到的最佳作法。
投诉 评论

德州扑克:AI打牌也能完胜人类了笔者从完美信息博弈类游戏的理论出发,分析了AI打德州扑克为何能打赢人类?前段时间,受周围朋友的影响,喜欢上了德州扑克,享受和牌友心理博弈的过程,也享受“赌博”带来的快感。……如何评测一个智能对话系统(二)本章我们介绍了目前业界比较流行的智能对话评测方法,包括人工评测和自动评测。阐述了不同评测方法的优势与不足,并解释了人工评测在智能对话评测任务中的重要性和必要性。enjoy……对话机器人的个性设计指南本文讨论了对话机器人的个性设计为何如此重要,以及如何定义角色个性、展示角色个性。单曲循环着呆在客厅,在夜深的时候开始码字。上海是真的入冬了,想到去年十二月初的时候还下起了……如何让AI机器人的对话更加自然?本文翻译了国外作者AnnaPrist在Medium发布的《HowtomakeyourChatbotSoundNatural》,提炼了设计机器人对话的注意点。并结合译者的体验分析……机器人技术Robotics2。0(1):AI重新定义机器人本文将揭开新世代AI机器人的神秘面纱,并分析AI机器人将如何影响我们的未来。人工智能开启了新一代机器人技术Robotics2。0,最大改变是从原先人工编写程序而来的自动化……AI识别技术,在改变全球流媒体文章从AI识别技术出发,对其应用进行了分析探究。AI识别技术的商业应用以视频推荐和广告投放为主,作者对其未来发展进行了展望,与大家分享。话说,最近这高质量网综也太多了吧,……2020,AI算法市场能火起来吗?对于AI算法市场来说,2020年,它将在探索中等待,也在等待中探索。2019的存量只剩一个多月,各种年度总结即将蜂拥而至。回头看看这一年的AI发展,或许八个字的总结十分合……如何设计和管理AI产品?什么是AI和ML?为什么AI产品管理比一般软件更困难?在《AI开发指南:机器学习产品是什么?》文章当中,我们讨论了管理AI产品所需要的基础认识和挑战。对产品经理(P……微软的傲慢与偏见Cortana小娜失败根源本文介绍了微软语言交互产品Cortana的发展历程以及逐渐消弭背后,微软的傲慢与偏见。“Hi,Siri,给我讲个笑话”“天猫精灵,今天天气怎样”“小度,为我导……AI开发指南:机器学习产品是什么?为什么管理机器学习(ML)产品比一般软件困难?实验是关键!关于管理AI产品,我认为最重要的几件事:机器学习(ML)产品管理比一般软件更具挑战性,因为它涉及更多的不确……机器的深度学习究竟有多“深”?每次提起深度学习,没有接触过的人会处于一种模糊臆想状态,认为其遥不可及。本文旨在摘下深度学习“高大上”的面纱,用一些简化的模型和通俗的比喻阐述其中的概念。深度学习由来……AI为什么解不了“原创保护”这道综合题?原创保护是所有文字从业者都越来越重视的一个问题,但由于诸多因素,原创保护一直是处在雷声大雨点小的阶段,观众们议论纷纷,但是实际举证上却艰难重重。在AI技术越来越发达的今天,原创……
车载应用付费下载,你动了谁的奶酪?当车主花费不菲买了一台互联网新车,却发现里头的应用要另外付费再花几元到几十元不等才能下载使用。车主该不该掏这笔钱?车企,应用,消费者在这个模式里,到底是谁动了谁的奶……2020年,中国互联网半坡起步美国著名作家马尔科姆格拉德威尔曾说,1955年前后正是计算机革命时期,出生太早,无法拥有个人电脑;而出生太晚,计算机革命的时机又被别人占去。因此,那些奇才异类得感谢机遇的眷顾。……生鲜电商“寒潮”,少数派生存本文综合分析了生鲜电商的格局与发展,剖析了生鲜电商行业的三大阵痛点,“少数派”存活的原因,以及行业可以进一步优化的点是什么。前不久,我厨的前COO夏荷在朋友圈写下:“虽两……2019产品经理生存报告2019年已经过去,这一年,我们都不容易。这一年,外部环境变得格外激烈:ofo散场,P2P暴雷,冰冷的情绪仍在传递。而产品经理们不仅要认真改进人们每天使用的数字产品,还要……影流之主与B站英雄联盟宇宙土味如同物种入侵一般越来越多,这个物种自身也在进化。如果你是一位经常在bilibili看英雄联盟视频的玩家,那么你多半曾在相关推荐里看到过一个视频,它除了标题“影流之主”……2019,突围;2020,潜行2020年,依然充满变化,“树”欲静而“风”不止。有人问我,2019即将过去,2020会有什么变化?我说,2019年的关键词是“突围”;2020年的关键词,是“潜行……UGC社区的5大规律本文是作者在观察、使用、检索、研究了国内若干个大小社区类产品后,总结了5条关于UGC社区的建设的规律。enjoy这次要聊的内容是UGC社区建设规律。准确的说,是我个人在观……阿里社交再布局:“图钉”上线,对标美图秀秀绝不放弃,阿里巴巴的社交梦能实现吗?2013年11月21日晚上10点39分,马云(ID为风清扬)在来往上发布了一条语音时长为36秒的内容,连续8天,马云都在来往上进行了打……短视频2020:风继续吹,竞争还没有结束短视频的风口还远远没有过去,2020年,竞争才刚开始。回顾过去的2019年,整个移动互联网大盘增长在进一步放缓,3月份同比增速更是首次跌破了4。但短视频依然是移动互……谁在需求匿名社交?2019年,匿名社交,引得企业纷纷下水,连坐拥微信和QQ的腾讯都推出了五款社交软件,用以巩固护城河。但是,匿名社交虽然旺旺增长迅速,却总是不可避免走向滑铁卢。产品经理想要破解匿……实例解析:实体零售的单店模型和连锁模型本文结合作者的从业经历,和近几年对新零售企业的观察和研究,详细拆解和分析了实体零售的单店模型和连锁模型。enjoy经营线下实体店和电商的最大不同,需要先算清楚“单店模型”……互联网流量大迁徙互联网的流量战争就像是一场雾里看花的游戏,看似找不着门道,杂乱无章,但又存在某种必然。万物生长基于能源供给。工业时代,商业的能源是石油,煤铁,天然气。互联网时代,商……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界