童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

一文了解AI商品模型训练平台

7月27日 阴阳狱投稿
  AI平台的初衷永远是提高开发效率,加快算法迭代周期。通过产品化AI技术,让运营人员能够更贴近技术,更好地指导赋能业务场景,给客户带来更好的技术体验和产品体验。
  本文是2020年的正式第一文,介绍了人工智能领域深度学习平台的相关信息,内容包括:AI平台的基本介绍、系统架构、实现难点和相关能力。
  接下来,围绕着作者自身搭建商品模型训练平台案例,分享相关设计经验,内容包括:业务场景、训练平台系统架构的规划、数据和模型中心、投产比问题和相关总结。
  一、关于AI平台
  1。1AI平台介绍
  AI模型训练平台,基于核心模块和应用场景不同,又可以称作深度学习平台、机器学习平台、人工智能平台(以下统称做AI平台)。
  AI平台提供业务到产品、数据到模型、端到端,线上化的人工智能应用解决方案。
  用户在AI平台能够使用不同的深度学习框架进行大规模的训练,对数据集和模型进行管理和迭代,同时通过API和本地部署等方式接入到具体业务场景中使用。
  简单理解,AI平台AISAAS(PAAS)(IAAS)。
  以下是腾讯DIX和阿里PAI平台的介绍:
  DIX(DataIntelligenceX)是基于腾讯云强大计算能力的一站式深度学习平台。它通过可视化的拖拽布局,组合各种数据源、组件、算法、模型和评估模块,让算法工程师和数据科学家在其之上,方便地进行模型训练、评估及预测。
  阿里云机器学习平台PAI(PlatformofArtificialIntelligence),为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。
  使用AI平台,能够简化开发人员对数据预处理和管理、模型训练和部署等繁琐的代码操作,加快算法开发效率,提高产品的迭代周期;并且通过AI平台能整合计算资源、数据资源、模型资源,使用者能对不同资源进行复用和调度。
  开放AI平台后,也能有效进行商业化,对企业所处领域的AI业务生态环境有一定的推动和反馈。
  国内外相关的AI平台有:
  国内:
  华为ModelArts
  阿里云PAI
  百度PaddlePaddle
  腾讯DIX深度学习平台
  金山云人工智能平台
  qingcloud人工智能平台
  京东JDAINeuFoundry
  小米Cloudml平台
  国外:
  MicrosoftAzureMachineLearning
  AWSMachineLearning
  GoogleCloudPlatform
  1。2AI平台系统架构
  基于一个企业整体系统的架构来看,AI平台可视为业务的技术支撑中台之一(平行于数据中台),起到承上启下(承载业务,对接技术底层)的作用。
  若一个企业当前已有数据中台,则可将数据中台作为AI中台的数据输入和数据输出系统对象,AI中台作为业务前台的模型和算法供给平台。若业务前台有AI需求(如图像识别、语义识别、商品推荐等),算法运营团队则通过在AI平台对模型的训练迭代以支持。
  根据企业不同的规模、资源和业务场景,其AI平台会有不一样的定位。
  例如AI和数据可同为一个中台、AI平台可视为业务中台一部分、AI平台整合进技术中台或后台等。规模较小、资源有限的企业通常会选择使用第三方AI平台对业务进行服务,而非自建AI平台。
  企业架构示例:AI平台作为AI中台
  关于AI平台自身的架构设计,各第三方平台都大同小异,主要是技术架构上的不同,暂时没有必要去深入研究。
  这里以京东NeuFoundry神铸项目系统架构为例,初探一二:
  NeuFoundry平台架构图
  NeuFoundry基础设施层采用Docker容器进行算力资源的池化,通过Kubernetes进行整体的资源管理、资源分配、任务运行、状态监控等,平台集成了MySQL、Redis、MQ等多种中间件服务,通过数据标注、模型训练、模型发布,生成自定义的AI能力,为各行各业的业务服务提供有力的支撑。
  1。3AI平台实现难点
  1)大数据处理问题
  在当前阶段,AI底层技术原理决定了“有多少数据,模型能力就有多好”的情况。同时,企业在日常业务运行中会不断产生新数据。
  当数据需求和客观数据量都很大,大数据的管理和处理能力对于一个AI平台来说是最基础的能力,开发人员需要结合AI模型训练任务的制定合理的数据调度方案,同时对数据进行生命周期的管理(如定期的删除冗余数据、不规则数据)。
  2)分布式计算
  大数据的处理、模型的训练都十分消耗资源。如果业务场景复杂,模型训练时间长或者样本规模大,超过单台服务器能力时,需要支持分布式训练。
  微博深度学习训练集群的解决方式是:
  以TensorFlow分布式运行方式为例进行说明,如图5所示。
  一个TensorFlow分布式程序对应一个抽象的集群,集群(cluster)由工作节点(worker)和参数服务器(parameterserver)组成。工作节点(worker)承担矩阵乘、向量加等具体计算任务,计算出相应参数(weight和bias),并把参数汇总到参数服务器;参数服务器(parameterserver)把从众多工作节点收集参数汇总并计算,并传递给相应工作节点,由工作节点进行下一轮计算,如此循环往复。
  3)AI平台实现的最大瓶颈
  在于企业对AI平台投产比的权衡(顶层、中层、执行层对AI平台的价值认知),这一点会在下文重点说明。
  1。4AI平台相关能力
  AI平台不仅需要提供AI开发流程所需基础技能,还需针对不同的用户(产品经理、运营人员、算法工程师)、不同的客户(大企业、中小企业、传统企业、科技企业)提供对应所需服务。
  我将AI平台能力分为以下五类:
  数据能力:数据获取、数据预处理(ETL)、数据集管理、数据标注、数据增强
  模型能力:模型管理、模型训练、模型验证、模型部署、模型处理、模型详情
  算法能力:支持各种算法、深度学习、数据运算处理框架、预置模型、算法调用、对算法组合操作
  部署能力:多重部署方式、在线部署、私有化部署、边缘端部署、灰度增量全量部署
  其他能力:AI服务市场、工单客服、权限管理、工作流可视化
  华为ModelArts平台技能
  二、AI商品模型训练平台设计经验分享
  2。1业务场景
  在日常经营的过程中,每个新的商品都需要进行数据采集、标注,随后将数据扔进对应模型文件进行训练,其中涉及非常多重复且繁琐的工作问题。
  将数据采集处理到模型训练部署的流程平台化,能够极大提升开发效率,让运营人员和算法人员更好地分别针对场景和模型进行管理。
  而且,数据、模型(可线上使用)对于企业来说是最核心的技术资源,不过初期一直处在黑匣子状态,只有算法人员可接触和查看。所以在业务发展到达一定的阶段时,就需要开始对其进行有效管理。
  本文的AI平台,主要服务零售行业商品模型训练的业务场景,故称作AI商品模型训练平台。
  2。2系统架构
  综合资源、场景、服务效率、商业化等多个维度去考量,作者设计的商品模型训练平台主要以数据中心和模型中心两大核心子系统组成,一方面可以以最小的开发资源实现涵盖了当前业务所需要的核心流程和个性化流程,另一方面也有利于平台后续的能力拓展和进行商业化。
  AI商品模型训练平台
  数据中心主要服务3点数据管理业务需求:数据获取、数据处理、数据评估。其中涉及能力有数据集获取、数据集管理、数据增强、增强策略配置、数据标注、标注任务系统、半自动标注等。
  模型中心主要服务3点模型管理业务需求:模型训练和验证、模型管理、模型部署。其中涉及能力有模型训练、参数配置、训练任务管理、训练状态可视化、模型文件管理、模型版本管理、模型状态管理、模型操作、模型处理、模型处理策略管理、模型部署、部署业务管理等。
  接下来,针对核心的业务需求逐一说明解决方案。
  2。3数据中心
  2。3。1数据获取
  AI模型训练的第一步是对数据的获取(此处的数据都为图片数据)。
  数据的采集可以通过线下构建对应业务场景需要的环境进行拍摄采集,也可以通过平台内已有数据(线上数据、旧数据)、第三方数据(通过开源、付费购买、爬虫爬取多多种形式)获取。
  线上数据集的处理:多采用badcase,重新标注、增强。
  爬取数据集:爬取公开渠道如百度图片的对应label数据集,并区分可用不可用。
  因数据集都为图片数据,并且模型是基于深度学习技术构建,故涉及到数据ETL、特征工程等一些处理暂时不需要,后续可根据业务场景和应用技术的拓展,在技术架构和平台架构补充上对应的能力。
  数据集获取完成后,可以将数据按照不同的类型存放,通过数据集管理页面进管理。
  数据类型可以按照不同的维度区分:
  1)以标品和非标品区分
  标品数据:标品静态状态数据、标品动态状态数据;
  非标品数据:标品多角度数据、标品静态状数据、标品动态状态数据、其他异常情况数据。
  2)以数据来源渠道区分
  线下:构建不同的场景(静态动态)进行拍摄采集;
  线上:平台内已有数据(线上数据、旧数据)、第三方数据(开源数据集、付费数据集、爬取数据集)。
  3)以数据格式区分
  图片、视频、其他格式(2d、3d)。
  4)以数据使用性区分
  基本数据集、训练数据集(含标注)、验证数据集、异常数据集、自定义数据集。
  数据集应当有生命周期的管理和备注信息,以免在运营一段时间后数据量杂乱冗余。
  2。3。2数据处理
  部分场景的模型训练前,需要对数据进行不同程度、不同方案的增强。运营人员或算法人员可以在数据增强的页面上,选择对应的数据集和数据增强策略,对数据进行增强,增强后的数据集将会同步以原数据的子文件形式,在数据集管理中以“增强数据集”类型展示。
  同时,为适应多种业务场景和加快数据增强实验的有效性,可利用已实现的数据增强技术,配置出多重数据增强方案。如:
  旋转:90。
  左右镜像。
  增亮2倍。
  对比度1。25倍。
  数据模糊3倍。
  在数据集资源管理整合完成后,则可以在平台上对数据进行标注。运营人员可以对平台上已有数据集进行标注,也可以导入新的数据集文件进行标注。
  通常标注工作有:
  对基本数据集(没有标注过的)进行标注或者半标注(半自动标注:利用少量数据集生成的模型进行自动标注,减少人工标注的工作量);
  对异常数据集进行重新标准;
  对自定义数据集进行标注。
  标注方式支持图像分类标注、方形框标注、圆形框标注、多边形标注、语义分割标注、3d标注。标注内容有标品和非标品,也有其他需要标注的内容信息如手、人脸。
  2。3。3数据评估
  数据评估工作贯穿数据获取到数据处理整个过程,其操作质量和流程严密程度直接决定了数据质量的好坏,间接决定了模型表现效果的好坏。
  在获取数据以及对数据进行增强时,运营人员根据通用规则和经验进行数据评估是否可用,不确定的情况下需询问算法。但一般界定不确定的数据规则根据商品、当前模型、当前需求、算法认知和经验等多个因素确定,不确定性比较大,现实中还是多以“个人经验”为准则。这一部分随着相关员工经验和认知的增长,一定存在比较大的优化空间。
  日常需要对已有的数据集进行定期检查、定量检查,对数据质量和标注质量有一定的回归验证。同样,标注任务流程化(包括标注任务指派、标注任务完成的多重审核、标注人员的任务完成度和错误数据统计以及对应的奖惩机制)也是数据质量保证的重要环节。
  2。4模型中心
  2。4。1模型训练和验证
  确保数据提供到位后,运营人员或者算法人员可以在模型训练的页面上,选择模型,选择对应的数据集和对应的训练参数(如AI算法以及网络深度、训练step)即可开始进行增量或全量的模型训练。
  如果涉及GPU服务器运算量等考量,还可选择对应训练GPU服务器。训练过程中训练状态的可视化的展示可帮助运营人员对当前训练任务的进度有所了解,以便对损失度停止下降或者其他异常等不符合预期的模型训练任务进行暂停、取消等操作,解放算法人员的生产力。
  TensorBoard界面
  模型训练完成后,可以对训练集的数据进行,得出模型MAP、精确率、召回率等指标,评估模型效果和质量;也可以选取未标注的验证数据集用模型进行识别,对模型的质量进行验证。
  2。4。2模型管理
  初始的模型资源可通过外部文件导入,或者直接新增训练任务生成。
  通常来说,模型大部分时间处于“使用”的状态(线上的使用和更新的使用),故模型的管理主要针对模型的版本、模型的各种状态(服务状态、训练状态)、模型的操作记录、模型的详细参数等四个方面进行。
  在模型有优化更新、替代、异常等情况下,通过“模型管理“:可以对模型进行操作,如暂停服务,复制模型、上线模型、删除模型等操作。
  有一些模型可能需要在比较特殊的业务场景下运行(例如边缘端、硬件资源有限、网络延迟较高)进行,所以针对该种情况,也需要设计对模型进行压缩、调优等傻瓜式一键式处理方案,目的也是减少开发在繁琐工程上的工作量。
  2。4。3模型部署
  在完成模型的训练生成模型,并且对模型进行一定验证后,可在”模型部署”对模型进行部署上线,部署流程通常为灰度部署过渡到全量部署。
  在边缘端应用场景下,也可以通过边缘端定期请求拉取最新模型文件或者通过边缘节点实现边缘端部署。
  2。5AI平台投产比权衡
  上文提到,AI平台实现的最大瓶颈,其实在于企业对平台投产比的权衡。
  作者团队内部经过多次沟通考量,集中回答了以下三个问题,最终才决定对平台进行1。0的初步开发(主要也是先验证效用为主)。
  AI平台是否真的能支持业务,整体效率(开发效率、业务效率)能有多大提升?是否有潜在的实现后的未知成本(如算法人员需要花费大量时间教育运营人员使用某些模型训练功能)?能否使用数字对价值进行量化?就算能量化,是否又额外需要开发和沟通成本?
  现有的第三方AI平台已支持大部分业务,是否能先使用第三方AI平台进行业务链条的孵化?个性化的数据处理和训练业务是否可依旧可通过开发手动处理?
  AI平台的商业化价值短期能否提现(因为其他企业因数据安全问题不会安心使用,同时也极度依赖企业的知名度)?若短期无法体现,在什么阶段可以体现?
  关于价值权衡考量的问题没有标准化答案,每个企业都以自身的资源、业务等多个因素综合去考量,相关决策者和执行者对AI平台也有不一样的认知,故主要是看不同企业各自最终讨论出的最优投产比是否能大于投入成本后决定是否开发AI平台。
  总结
  不管是针对任何业务场景,AI平台的初衷永远是提高开发效率,加快算法迭代周期。通过产品化AI技术,让运营人员能够更贴近技术,更好地指导赋能业务场景,给客户带来更好的技术体验和产品体验。
  不仅如此,企业从内部服务起完善AI平台,逐渐开放平台并对平台进行商业化,服务原来没有足够资源和资金撬动AI技术的外部客户,为互联网AI生态的发展也起到了推动的作用。
  AI平台的发展和使用也是AI技术应用层面发展的重要节点,代表了AI技术开始产品化,更加落地,更加贴近业务层,也代表了企业有了更高效率的运用AI技术的方式。
投诉 评论

OCR在NLP场景中的应用在NLP的产品体系中,OCR是关于文档、文件处理的基础步骤,是无法回避和绕开的。关于OCR的基础知识,也就成了NLP产品经理必不可少的知识储备了只有产品详细地了解了关于O……一天做100张图?只有AI能做到!“一天做100张图”的过分要求,激起了设计师对于甲方的愤怒。在探究这个要求为何如此过分的同时,或许也可以看看是否还有其他人可以担任如此“重任”。还记得叫员工“一天出100……一文了解AI商品模型训练平台AI平台的初衷永远是提高开发效率,加快算法迭代周期。通过产品化AI技术,让运营人员能够更贴近技术,更好地指导赋能业务场景,给客户带来更好的技术体验和产品体验。本文是202……2019产业AI速写:城市篇2020年,城市AI命题显然会有一定的进展。但客观来说,这个进展将主要来自于云服务市场更深度走向城市场景和政府市场,为此提供更多专业化、针对化的AI整体解决方案。要说起A……从5个热搜出发,看2019全球AI发展这一年回顾2019年,AI技术的发展正在改变世界科技走向。2019这一年,作为“第四次工业革命”技术核心之一的AI,依然是全球科技热点,而且似乎更热了。你看,在刚刚过去的……案例解析:AI产品设计,怎么在不同情况下做出判断?独立思考,实事求是,锲而不舍,以勤补拙。一颗西蓝花一、从AI技术说起什么是机器学习?TomMichell给出定义:对于某类任务T和性能度量P,如果一个计……2019产业AI速写:农业篇农业AI正在稳步前进中,开始从设想逐渐进入田间地头。文章对AI在农业中的应用进行了梳理,并对未来进行了展望。过去一年,“AI”已经深入到了中国产业的方方面面,从工业质检到……2019产业AI速写:金融篇本文盘点了AI在金融行业中的应用、以及它对行业产生了什么样的助力效果。2019年对于中国金融来说,是一个相当不平静的年份从1月份由专项小组发布“175号文”,正式开……基于运营商NLP模型,做好AI智能化落地5G及AI的发展给通信行业带来了新的变化和挑战,各大运营商在都希望能结合新的技术为客户提供更好的服务。运营上如何打好AI这副牌,做好智能化落地,文章对此进行了分析探究。随……人体辅助,AI落地的另一种可能想要实现残障人士的“残而不障”,人体辅助是一条被忽略的垂直赛道,这也是AI落地的一种可行方式。(说明:本文并非创业报道,而是对具体场景的需求分析。为避免产生相关误解,已将……一文了解智能钢琴系统:介绍与分析本文对市面上的钢琴进行介绍,并对其中一类智能钢琴的软件设计的实现方式展开分析。下一文将会对智能钢琴在教学中的应用以及智能钢琴未来的发展进行阐述分析。智能钢琴,是互联网时代……智能语音机器人如何理解一句话?具体流程是什么?文章以机器人的口吻出发,简述了身为智能语音机器人的“我”是如何理解一句话的,具体又分为哪几个步骤,一起来看看自我介绍哈喽~我是人工智能语音机器人,今天想给大家说说我……
手游为何能长江后浪推前浪?继乐逗游戏赴美上市之后,飞鱼科技也正式在港交所递交IPO申请,拟在港交所主板上市。由此看来,随着手游和页游的持续火热,会有越来越多的企业投入游戏行业,同时,游戏企业的连续上市,……直播大战进入尾声,谁才是老大?直播大战进入了下半场,谁来坐稳头把交椅?2016年普遍认为都是直播元年,根据市场数据显示,中国市场在最多的时候拥有超过200家的直播平台。那么,这场战争什么时候才是头,而大风之……iOS8正式版评测:iOS开放性终于快赶上安卓了在视觉设计方面,去年的iOS7在很多人看来是苹果改变最大的一次iOS更新。而今年的iOS8,苹果则在提高系统开放性方面做出了很多的努力。当然,和每年的iOS更新一样,iOS8也……产品经理日报第876期微软翻译App更新,扫个码可让不同语言相约七点半,产品经理日报继续为您带来今日最新的资讯:微软要让不同语言面对面聊天更容易,扫个码就行;一直播回应软件下架,称技术问题已经解决,很快上线;搜狐否认裁撤内容部不设编辑传……如何轻松减龄变少女?一件美萌背带裙搞定!美萌美萌的背带裙一直都是街拍达人们减龄,扮嫩的必备单品,无论是在秋冬季还是春夏季出镜率都十分高,在最近的欧美街拍更甚。如此好物,小编怎么会放过?今天,小编就带大家一起看看关于背……霸道总裁是怎样炼成的美国东部时间9月19号上午,北京时间夜间,223岁的纽交所将迎来史上最大的一单IPO。一家主营业务远在中国的企业将会在这里募集至少210亿美元,至多260亿美元资金。它的名字将……儿童为何越来越早熟,如何预防儿童性早熟?“最近,天热了,门诊中性早熟的患儿几乎天天都能碰上!”昨天,宁波市医疗中心李惠利东部医院儿科副主任医师朱廷富联系上记者,提醒家长们要提高警惕,不要由着孩子挑食偏食,结果让孩子发……iOS8更新引发的“空间争夺战”:游戏删易再安难今日凌晨1点,苹果向中国用户推送了iOS8正式版更新。据游戏陀螺的观察,9月16日,苹果就已经开始着手准备更新工作,为此还对AppStore进行了几个小时的锁榜处理。(百……交互实战覆盖层设计:对话框浮层(上)什么是覆盖层?从本文的角度来讲,覆盖层指在当前页面上打开的临时界面。这些临时界面能够完成提示性的或上下文相关的任务,它们的打断性较弱,为用户保持较为连贯的使用体验。我们日常会见……知乎Live诞生记从零开始,打造一个新产品。本文讲述知乎live诞生的整个过程,与大家分享。24岁的高伟想在本命年结束之前完成一趟日本之旅,这是他第一次去日本。以往,为了一趟远行,他……在线旅游巨头们,你们都被美团给涮了笔者与其说自己是互联网资深从业者,不如说是资深消费者,最近在出差的过程中,发现了一个有趣的现象。今年以来一直看到各种报道,一会是去哪儿抗“美”大战,一会是在线酒店预订业务……流量后时代,用户质量比数量更重要伴随着智能手机出货量的放缓,中国的移动用户流量增长红利期已经结束。来自国内知名第三方研究机构QuestMobile发布的《应用商店行业观察》报告显示,截至2016年第三季度,中……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界