范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

小样本AutoML,改变算法生产的核武器?

  数据、算法、算力,被称为AI的三驾马车。
  其中,数据对于算法模型的效果至关重要:以深度学习为核心的AI,为了避免发生过拟合或欠拟合的情况,需要使用大量数据来进行模型训练,从而使模型达到更好的拟合优度,这对于解决场景问题无疑大有裨益。
  不过,通过大量数据来训练算法,从理论上看无懈可击,但当AI走向落地场景,就不那么容易了。
  以数据问题为例:
  对于碎片化场景,数据成了老大难。1、很多场景不具备数据采集的条件,或者说采集数据成本太高;
  2、数据是否有效,无效的数据除了百无一用之外,还会形成噪声干扰,处理起来也费时;
  3、一些场景数据量不够大,很难做到大样本。
  没有足够量的数据,就难以训练出好的算法模型,解决场景问题也就无从谈起。
  这实际上是产业数字化转型面临的重大难题之一:以人工智能为核心的数字化转型,在实际场景落地时,由于技术使用的先决条件存在短板,很难释放对产业转型的推力。
  "从成本收益上看,在一些场景下,AI形如鸡肋,无法解决实际问题,更无法降本增效。"
  中科智云CEO兼首席科学家魏宏峰告诉AI掘金志,数字化转型趋势下,隔行如隔山,整个市场需求都是碎片化的,这对AI而言提出了两大挑战:要么做场景定制化;要么改变现在的算法生产模式。
  但这两种方式都逃不开前面提到的数据问题。
  对于一些封闭场景,比如园区物流,通过场景定制化方案可以实现全自动化流程,然而这并不适用于碎片化的开放场景;此外,定制化成本过高,单独开发算法则会面对投入产出比严重不匹配的问题。
  因而,比较合适的解决方法,是改变现有的算法生产模式。
  这也是小样本学习(FSL)和AutoML(自动机器学习)火热的根本原因。
  FSL与AutoML
  小样本学习属于机器学习下的一个分支,诞生于碎片化场景很难获取足够有效的数据这一背景下,旨在通过较少的数据量或样本,来训练算法模型。
  与传统机器学习相比,小样本学习的优势在于,不需要大量数据支撑,但这同样也带来问题:数据量太少导致经验风险最小化不可靠。
  所谓经验风险,是指模型关于训练样本集的平均损失。通常情况下,样本容量足够大(传统机器学习),经验风险最小化能保证有很好的学习效果;反之,样本量太小,经验风险最小化学习的效果就难以保证。
  举个例子:
  假设以小孩子为算法模型,汉字为样本数据,目标任务是认识汉字"我"。当小孩子抄写"我"的次数足够多,那么小孩子的学习效果就更好;反之,如果只抄写了数次,那么小孩子可能认识"我",也可能不认识,经验风险是不可靠的。(案例并不严谨,仅供参考)
  目前行业内已经开始通过数据增强、模型约束空间、搜索算法等方式来解决小样本学习存在的问题。
  "如果模型能力足够强,对样本的需求并不一定要非常大。"魏宏峰表示,一个好的模型,可通过小样本学习来形成自我训练,从而提高算法精度与适应性。
  而建立好的算法模型,与AutoML(自动机器学习)密切相关。
  在传统AI算法开发流程中,从业务和问题定义,到数据采集和标注、存储管理、数据分析和可视化,再到模型结构设计、优化......最后到应用开发,需要经历大概十三个环节,其时间成本、开发成本处于高位。
  对于没有算法开发能力,但有算法应用需求的企业而言,这个流程非常"复杂",且成本较高,难以承受。
  因而只专注于算法选取和神经网络架构搜索的传统AutoML是无法满足现实需求的,涵盖算法研发全流程的AutoML应运而生,从特征工程、模型构建、超参选择,优化方法四方面实现自动化,其优势在于:既减少了算法生产成本,又提高效率,并且降低了算法生产门槛。
  比如,传统AI算法生产流程中,需要对数据进行人工标注,并且花大量时间处理数据;可以通过自动标注,结合人工复检,来提高数据标注效率。
  在业界,已经有许多较为成熟的AutoML平台,国外如FeatureLab(自动进行特征工程)、Google Cloud Vertex AI NAS;国内则有第四范式的AI Prophet AutoML等等。
  除此之外,还有一些AI公司,比如中科智云,也在做相应的类似的平台(X-Brain)。
  作为一家聚焦安全治理的AI公司,中科智云主要以X-Brain AI主动学习平台,融合小样本学习框架、多源融合感知计算等技术,为行业提供AI 安全治理服务。
  "X-Brain 的核心是一套主动学习算法框架,应用自研的主动学习(Active Learning)技术,改变了监督学习的被动接受人工标注样本的模式。"
  魏宏峰告诉AI掘金志,该平台可通过AI主动判断样本是否需要算法工程师的参与,通过只让算法工程师参与部分困难样本的确认,形成人在回路(Human-in-the-Loop)模式,主动训练模型,形成模型自动迭代。
  前面提到,小样本学习是为了解决碎片化场景无法获取大量数据训练模型的问题,而AutoML是在传统算法模式下,通过主动学习来提高算法生产效率,解放人力成本。
  换句话说,小样本学习解决数据难题,AutoML则是提高算法生产效率的新方法,两者互相结合,或能解决小样本学习存在的算法精度问题。
  不可能三角?
  "小样本是低成本的基础,因为样本量小,训练模型不需要高算力硬件设备。"魏宏峰表示,如何让小样本学习达到商用精度,是一个巨大挑战。
  因为,小样本学习存在经验风险最小化不可靠这一问题,也就是学习效果不确定,可通俗理解为算法精度可能高,也可能低。
  "在一些场景中,小样本训练出来的精度,在初期很难达到商用水平。但可以通过AutoML来缩短从初期模型到商用这个过程。"
  魏宏峰介绍道,X-Brain在采集样本之后,通过特征提取自动标注,并自动训练模型,由具体的业务人员来进行评价,查看是否发生误报,并调整参数。
  基于这些调整,该平台的自动训练机制,将已标注完的数据放入重新训练......通过这种循环训练,来提高算法精度。
  在这个过程中,样本量小,模型也不大,通过主动训练来提高精度,从而实现低成本使用。
  所以,小样本、低成本和高精度之间,并非存在一个"不可能三角"。
  仍以之前的小孩子识字为例:小孩子只抄写数次"我",其结果是可能认识"我",也可能不认识。如果引入老师进行引导、校正,那么即便抄写次数较少,其认识汉字"我"的可能更大。
  这个案例中,老师扮演了业务人员的角色,小孩子就是算法模型。算法(小孩子)在自动学习过程中,需要由业务人员(老师)来调整参数(引导),学习效果也就更好。
  其优势在于,给小孩子减负(减少抄写次数)的同时,提高学习效率(算法精度);从整个学习过程看,老师(业务人员)也无需全程监督,从而减少成本。
  这实际上改变了以往的算法生产模式,将算法生产带入"平民化""低成本"时代。
  AI与场景融合
  AI从上半场进入下半场,实际上是从拼技术到拼场景的转变:AI只有在实际场景中落地才能产生价值。
  在产业数字化转型中,各种碎片化场景,对算法的精度要求也比较高。如果按照传统的算法生产模式,成本降不下来,加上中小企业购买力弱,传统企业数字化转型必然难产。
  而多样化场景中,也很难以通用算法来"一口多吃"。
  "不同的场景需要不同的数据样本,训练出来的模型也不一样,通用算法模型并不适用,精度会大打折扣。"
  魏宏峰表示,小样本学习和AutoML从技术上解决算法生产难题,但如何让技术更好地服务于企业,解决实际场景问题,就需要把具体场景痛点拆解之后,融入到整个算法生产过程中,从业务和问题定义开始,到模型调优,最后到算法交付,都要"让懂业务的人参与"。
  这主要体现在两个方面:一是让企业在平台上进行实验,也就是业务试错;二是与企业加强交互,让懂业务的人员参与到算法训练中来。
  "客户并不追求百分百的精度,能够接受误报,但不能接受试错成本太高,带来总成本上升。"魏宏峰认为,AI下半场由场景驱动,其实也是客户驱动,核心是解决客户(企业)在生产过程中遇到的问题。而AI公司要做好场景,最好的方式是直接与熟悉场景的业务人员交互,而不是AI公司本身去理解行业,否则成本会很高。
  对于企业而言,考虑成本收益是其购买技术服务的出发点,成本(包括试错、时间、人力等多个方面)则是第一要素,其次才考虑技术带来的收益问题。
  魏宏峰表示,企业购买技术服务之后,只有在降本增效方面取得实际效果,复购率才会提高,AI公司才能形成正向的业务闭环。
  "AI只有靠业务,而不是资本推动,才能走出困局,改变行业。"而做好业务的首要前提是:结合场景。
  不论是小样本学习还是机器学习,都只是生产算法的"术",结合场景解决产业数字化转型过程中的痛点,才是AI的"康庄大道"。雷峰网雷峰网

久违啦!ROG龙骑士2分离式无线双模键盘来啦各位小伙们好,5月的ROG新品发布会上,ROG经典分离式键盘的最新一代龙骑士2无线双模分离式键盘终于现真身了,虽然我们的中国区总经理俞元麟(Tony)先生(B站普普通通TONY大叔MSI,热血未凉灌篮高手里热血的台词很多。最热血的莫过于樱木跟安西教练的对话。老爹,你最辉煌的时候是什么?是全日本时代吗?而我就是现在。在今年的MSI,半决赛四支队伍都迎来了自己最辉煌的时刻。有刚特斯拉涨价了,你还说割韭菜吗?这不就是最近那什么捂脸。没事镇定一下,别怕咱们目前没涨价,只是漂亮国涨了,而且不止一次涨价,据说这是最近第二次涨价了!至于为什么涨价,特斯拉没细说,其实压根没提涨价的原因。捂脸关于由场景到生态,乐信新消费战略完成进化瞬息万变的商业世界中,在某一领域建立起完整生态,是提升企业自身价值最好的办法。过去,在这方面做得做好的是,小米和美团。当小米手机被市场认可后,以手机为核心,逐步外延至手机周边智能硬特斯拉0首付购车,看完你就懂了,不要盲目跟风11月1日,特斯拉官网上线了新的金融产品,消费者可以通过零首付的特斯拉融资租赁模式购买车辆。按照方案规划,消费者零首付签订合同后,15年内属于租赁期,采用每月分期支付租金的模式使用东鹏特饮难成农夫山泉,更像养元饮品商场如战场,哪有什么你好我好大家好。一旦对手出现错误,陷入困境,就要揪着不放,这样才能反向巩固自己的势力。两年多前,滴滴深陷顺风车危机,业务下线整改,高德出行嘀答马不停蹄上线顺风车苹果12细节爆料爆料人士MaxWeinbach今天通过他的Twitter账号PineLeaks分享了关于即将到来的iPhone12的最终确定和修改的新信息。Weinbach表示,关于新iPhone比亚迪电池厂落户济南,特斯拉会不会也落户济南?据说特斯拉正在全国范围内选择第二座超级工厂。据说有多个城市正在争取有济南,青岛,杭州和沈阳。听到这个消息后山东的网友,表示坐不住了。网友表示,应该主动对接特斯拉,让特斯拉来济南黄河你名下有几张电话卡?全都能查到想知道你名下到底绑定了多少张电话卡?有没有被冒用?现在不需要跑营业厅就可以查询了,下面分享几个线上查询方法,如果觉得有用的话,记得收藏哦!网页查询全国移动电话卡一证通查业务网页端目英雄联盟手游国服上线,ROG游戏手机5s助你畅快上分毫无疑问,最近热度最高的游戏莫过于英雄联盟手游了。随着10月8日,英雄联盟手游官方宣布开启不限号不删档测试,玩家们已经可以前往各大应用商店下载最新客户端,让喜欢LOL的朋友们可以在如果让笔记本也拥有四季变换,你会更喜欢哪个季节呢?一年最近几日的大幅度降温,打了小R一个措手不及。急急忙忙从衣柜底掏出长衣长裤,夏天祛暑的风扇也被嫌弃的丢在角落里但似乎也正是这种时候,也更加感慨一年四季时节变换的绮幻与美妙。所谓春
10大最累最易发胖的职业出炉,你上榜了没?2019年还剩四个多月这大半年来你遭受过多少直击灵魂的拷问?被质疑被嘲笑,却从未解释还在努力地做一个快乐的社畜青年今天咱们来讨论一个有趣的话题自从工作以来,你胖了多少斤?(欢迎大家CSGO职业哥新宠,他用这只鼠标打出了正面无敌的战绩今年里约之路北美区5月份有一场比赛,Liquid以20的成绩轻松战胜Yeah,这个成绩并不意外,但其中有这么一段赛后数据总结Twistzz拿到了100的KAST,可谓是正面无敌。在鲍威尔的预言走向失败,全球通胀失控,货币政策大转向暴露风险美联储主席杰罗姆鲍威尔在8月在杰克逊霍尔年度研讨会上发表讲话时,提出了五个理由来支持他的观点,即当前的高通胀将消失。到目前为止,他们的表现并不好。在杰克逊霍尔,鲍威尔在题为COVI天然气期货价格暴涨,全球最大的大宗商品交易商面临爆仓风险全球最大的大宗商品交易商,总部位于迈阿密的StatarCapital失去了今年早些时候的巨额收益,在天然气市场动荡中陷入亏损,而且,它不会是在这段混乱时期发生重大亏损的最后一家。这有一种鱿鱼游戏加密货币过去24小时内上涨了近2,400鱿鱼游戏现在是2。22美元,在过去24小时内上涨了近2,400,其市值超过1。74亿美元。鱿鱼游戏代币作为SquidGame项目(一个加密游戏赚取平台)的独家代币推出。Netfli就问你牛逼吗?小米之家又在欧洲开了一家新店,这规模不得了众所周知,最初的手机市场一直都是被国外品牌所占领,但是自从这几年国产机的崛起,让无数消费者见识到了国产机的多功能和黑科技。而小米被誉为国产之光,自然也是行业中的翘楚,就拿今年全球Q十年前国产手机都没敢尝试的互联网销售,给小米带来了什么好处?十年前,国产手机大牌没敢尝试的互联网销售,给小米带来什么好处?经历过诺基亚王朝摩托罗拉拳打天下时期的人都知道,十年前的中国手机市场,贴个牌就可以吆喝叫卖了。基本上北京中关村柜台里的十年前高安锦江河边的人物纪实锦江河上高安大桥桥头文物古玩摊高安大桥底骑三轮的老人高安大桥底看相的老人高安大桥底骑过的摩托车锦江河边开菜园的老人天气太热,锦江河里盥洗的老人锦江河里洗衣服的人们锦江河边的垂钓者锦这是一台28年前的古董掌机GameBoy在1989年4月6日问世,距今已经有28年历史了。S君有幸收藏了一部1989年生产的初版GameBoy,来看看来自1989年的古董是怎么样的。正面是经典的十字按键,选三星GalaxyS4简评,4年前的旗舰前言在前两个月,三星发布了S8S8两部旗舰,屏占比十分的惊人,性能也很强大。在迎接新型号的同时,S君也把于2013年3月发布的三星S4从远古召唤了回来,体验一下三星4年前的旗舰到今这波操作6!iQOO7现身KPL总决赛,宋紫薇大美女也来了12月19日,备受期待的KPL秋季赛总决赛在重庆华熙文体中心举行,虽然大家现在知道了DYG赢得了最终的胜利,但是还有一个令大家颇为兴奋的热点,那就是这次最美iQOO产品经理宋紫薇代