郭朝晖回答工业大数据建模的两个灵魂拷问
图片来源:CEChina
伴随着工业企业对数字化应用需求的日益高涨,基于工业大数据建模,已成为行业内的热议话题。然而在这一过程中,人们常常过度强调数据算法,却忽视业务相关的知识,这给工业模型的实用性和可靠性带来了重重挑战。
为什么工业大数据的数据建模如此重要?在建模过程中,企业首要考虑的因素有哪些?又该如何搭建一个符合自身实际需求的模型呢?
请看原宝钢首席研究员、工业大数据资深专家郭朝辉博士,在2022(第十一届)全球自动化和制造主题峰会上的演讲。
视频加载中。。。
郭朝晖演讲内容梗概工业大数据建模:两个灵魂拷问
Q1为什么有了理论模型,还要数据建模?
任何一个理论模型都需要参数,牛顿定律也不例外,更何况对于复杂的工业系统,若干个子系统都需要各自的参数。但这些参数往往是吃不准,或者有很大误差,或者没法测量,在这个情况下,机理模型不是没有,而是没有用的条件。
工业中有大量知识,这些知识的特点是都可以用物理学原理推导出来。即使算不出来也没关系,把它记录下来下次就会有标准和依据。它也不是理论推导不出来,而是不方便推导,在应用过程中,直接用实际的结果来算就完事了。
Q2很多工业关键知识都实现了标准化,为什么还要建模?
标准往往都是固定的,所以应对不稳定的生产过程,标准是需要修改的。静态的标准往往不成,我们需要用动态标准来以变应变,这就需要用模型来帮助我们制定标准,所以模型其实也是有用的。
解决完这两个问题,我们要知道标准从何而来。在工业大数据时代,有一种很好的办法历史上这样发生过,下次再出现问题,就让计算机跟着学(NN、KNN、CBR)。我们不用把它想的太复杂,比如深度学习、神经元等,在多数情况下都没那么复杂。
然而,在数据不多的时候,能跟着谁去学呢?过去,对一台设备的故障进行诊断,数据记住后,故障如果十年发生一次,再过10年设备就报废了,有了数据也没机会学。而工业互联网,可以把成千上万台类似的设备放在一起,发生一次故障就可以作为一个知识记下来,这也是工业大数据真正的意义所在。
常见的模型:基准选择矫正
至于如何提高模型精度,由于生产过程参数在不断变化,一竿进洞往往很难达到,这就需要我们分步走,即首先跟着成功案例,选择一个基准来学习,再根据差别进行补缺和调整,以获得更高的精度。当然,现实中调整是需要数据来提供支持的。
比如说X测不到,但你知道变量Z,就可以根据它的变动来做调整。在工业大数据的背景下,数据条件也会越来越好,跟X接近的变量会越来越多,模型也会越来越好。然而,这个过程中也会产生新的问题。过去是Yf(X,C),用了Z后真正的数据模型就是YH(Z,C),选不同的Z,H就会不一样。所以工业过程由于缺少数据,由于变量不同,数据模型的结果可能也完全不一样。
现实数据模型和理论模型不一样
那么,工业建模在数据不完整的情况下,如何选择变量?我们需要明确一点,精度并不代表一切,应用价值好才是最终目的。这看似不能接受,但哪怕是微积分在内也是这样。数据建模和机理模型往往是不一样的,但是在一定的范围内有用就行了。
正确认识现实的模型:对错与实用是两码事
当然,在工业大数据的基础上,我们有机会在保障精度的同时追求真实性,这就是所谓的第四范式。但这个事情非常难,可能需要一二十年的功夫,因此多数企业在做选择时要慎重。精度、正确性和它的应用范围,有可能是存在矛盾的,要根据实际的需求来决定。理解实用的模型:精度与可靠性
实用模型的关键有三点:精度、应用范围,以及二者是否是可知和稳定。众所周知,工业领域对于稳定性的要求非常高,模型正确的时候能带来好处,但错误的时候同样会带来坏处。人们常说的平均精度高,就是需要在过程稳定的时候高,而稳定可能占了99的情况,但人们往往是在过程不稳定的时候需要模型。
传统模型往往只适合特殊情况,因此,如果精度不能持续,精度再高都没用。工业大数据之所以能适合于各种各样的场景,是因为它能拿到对象方方面面的属性,且提供了更多角度来识别场景,以便在具体场景下,也能做识别和精度调整。
此外,很多人对机器学习也有理解偏差。首先,机器学习并不意味着要做多么复杂的模型;另外,智能化时代的模型往往针对大系统,而大系统的参数本身是不断漂移的,如果没有跟着漂移的机制,模型用几天就慢慢不能用了,所以针对生产过程的模型,机器学习就是来应对模型参数漂移的。
此外,只要是基于数据的定量模型,几乎都会有误差,当然有的逻辑模型可能没有误差,或者有的能知道有多大误差等。因此,我们就要考虑误差和应用场景需求的匹配,这非常重要。实用模型的背后:数据质量是关键
模型使用的根本是高质量的数据。当建立数学模型的时候,人们总希望它的稳定度高,而现实中不稳定是一种常态,对同一对象,这个月和下个月建出的模型,它的数据参数会相差很远。
有一个重要的原因是,我们建模总会在一个工作点,或者特定的场景附近,这样做测量的时候,它的波动相当大的一部分,不是对象参数的波动,而是由于测量过程的干扰。测量精度决定了控制精度,测量误差和实际波动,往往是处在一个数量级上的。
此外,在建模的时候,输入误差不可忽略,这就会导致有偏估计,即误差最小的模型往往是错的,因为输入是错的,误差小是错错得对引发的。任何一种方程或是建模方法,只要你追求的是误差最小,其实它都会偏离真实的问题。
因此,在模型精度不高时,首先应该关注的不是算法,而是数据质量。宝钢信息技术的奠基人何麟生先生曾提过数据不落地,即为了保证数据的真实性,数据的产生和存储过程不经过人。因为很多数据,不是为了建模而产生的,它的质量往往不能达到要求。这涉及到了数据采集过程的标准化,只有解决数据的质量问题,才能把数据建模做好。
工业大数据的意义在于促进智能化
除此之外,数据建模的基本条件,是要让数据的因果关系能对应得上。这听起来简单,但做起来难。数据质量不仅是数据精度的问题,更重要的是数据对应关系,这与采样频度等因素息息相关。我们要知道,工业大数据并不等同于互联网大数据。工业大数据数据大,并不能保证做的好,但是数据大能为提高数据质量创造条件,并为后期数据建模、根因分析铺平道路。软件角度看模型:关键还是可靠
现代工业,尤其是自动化程度很高的行业,执行工艺都会让计算机执行,所以现代化工业知识和诀窍,也都写在计算机里面。因此如果不懂计算机软件,是把握不住工艺的细节的,学习知识就会面对天花板。
从工业软件的角度认识模型
早在20多年前,当时本人建议宝钢公司重视数学模型,领导也给予了充分重视。通过知识和数学模型计算的融合,宝钢经过10多年的努力,全部掌握了引进技术,彻底解决了这类问题,中国钢铁行业再也不会被卡脖子了。
那么,工艺的数学模型是什么?举个例子,工业生产的过程中,在各种事件和场景变化下,我们想要控制某个参数,比如一个钢胚的表面温度,这和传统控制的固定工作点做自动控制是不一样的,需要计算和数学模型两者间进行融合。
有一种计算机概念叫自动机,而工业界所说的数学模型,其实就是一种工业APP。要在工业场景不断变化的过程中执行任务,完成控制靠自动化能力,而感知场景的不断变化,则需要通过信息系统,因此,信息系统和控制系统的集成至关重要。
现如今,模型开发80的时间都会花在保障可靠性上,这也是难点所在。比如要考虑模型运行是否会出现意外、歧义和异常,处理异常的方法是否完备等,为了稳定可靠性,模型的编程方式也会不一样。
软件开发追求的重点不是效率、新颖,而是稳定结语
我个人认为,软件编程开发适合有罪推定原则,即如果你不能证明你的代码是正确的,你就要拿回去重写。因为现场无小事,无论是软件开发还是建模的过程,开发效率高、模型精度高都是次要的,安全稳定性才是最重要的,只有这个问题解决了,模型的实用性才能得到保障。
空腹血糖为12。5应该服用什么降糖药好?看这位朋友的问题,看来是刚发现自己空腹血糖高到了12。5,还没有开始用药物控制的情况。但空腹血糖12。5,是一个很高的数值了。一般正常人的空腹血糖应该不超过6。1,如果超过6。1,
企业的交叉持股是不是抵挡外资控股控制的最有效手段呢?一我们在国际社会经常听到美国和欧洲大的企业经常出现并购或者合并,尤其在欧洲经常都是跨国间的收购,但是我们却很少听到德国和日本的企业参与,被收购的消息,当然也不是说绝对没有只是相对很
母亲被十几岁的女儿当众打骂,教育失败的后果有多可怕?宠溺孩子,自己管不了,还舍不得老师管,整天和老师对着干,把老师当假想敌,都是这结果!搬石头砸自己的脚,十几年后就知道痛了!不值得同情!母亲被十几岁的女儿当众打骂,教育失败的后果有多
Dota2的sylar天梯排名好几百都能进一线队,为何排名前几的超越大神却进不了?Sylar被誉为黄金一代最后一名Carry,职业生涯的前中期一直都是顶级C的表现,当然了,也有玩家调侃他为41C,不过自从加入茶队之后,他的风评都不太好了,比如塞老师课堂讲故事,还
有没有一款技能体系大的单机rpg游戏推荐?一款游戏如果能够有着丰富的技能体系,无疑会使得游戏体验大幅增强,接下来棒棒堂就给大家推荐几个吧,都是绝对的佳作。神界原罪2这是一款相当精良的时序制战斗的rpg游戏,宏大的背景故事,
助听器的频谱重组技术是什么?您好,频谱重组主要是针对于高频损失严重无法补偿或补偿效果不理想的用户,助听器有了这个功能会将用户的高频部分声音移动压缩至用户可听见的中频区域。目前有两种压缩方式叠加和压缩,希望我的
怎么才能防止脸部氧化?怎样才能防止脸部氧化?以下有六点建议1多吃蛋白质,按正常情况每位女性朋友每天都应该保证46克的蛋白质,如果是怀孕或者母乳的话,这种情况下相对还要多点。要每天都能达到身体所需的蛋白质
雷达表怎么样?属于什么档次?和浪琴梅花天梭美度比,有什么优势和劣势?雷达表也是斯沃琪集团品牌。在斯沃琪主打的几个品牌中(过去是欧米茄,浪琴,雷达,天梭。后来加上美度等)雷达曾经风光了很多年,价位上与浪琴差不多,所用机芯也基本相同。如果说欧米茄是参与
你愿意为了编制去其他省的小县城工作吗,为什么?我是一名省直机关公务员,个人的建议一定要充分考虑个人的实际情况,不要为了编制盲目作出选择。我有个同学是江西赣州人,2010年大学毕业,行政管理专业,公务员考试考了很多年都没考上,2
常州是在地震带上吗?常州是在地震带上吗?常州在地震带上吗?这个问题的答案是,也在,也不在。在,是因为从溧阳段开始,向东这段都是一个地震带。但是,又不是很大的地震带,会有地震。但不会有大地震。因此,从7
渣土车司机都是什么人?我作为一个开了十几年渣土车的老司机讲一些心里话。1。真的很累,绝大多数都是无奈的心酸那种。2。没有一个驾驶员想多拉的,油耗高,磨损大,风险大,谁想多装?可市场行情不是一个小小驾驶员
盐吃多了会怎样?盐的作用不仅仅是让您的食物味道更美味它对您的身体正常运作很重要。钠是食盐的主要成分之一,可调节血流量和压力,并有助于在神经和肌肉纤维之间传递信息。氯化物是食盐中的另一种化学物质,有
逍遥丸巧搭配,不仅治疗肝郁脾虚,还可治这7种病,建议收藏说起逍遥丸,很多人都觉得它是妇科圣药,能够达到疏肝解郁,补脾养血的效果,也可以帮助女性朋友养血调经。其实逍遥丸这个方剂的前身是医圣张仲景的名方四逆散,而后在他的基础上加减而成,并且
明明睡眠时间够长了,但还是睡不够,推荐4个方法,或能帮你缓解对于现代人群来说,很容易出现一些睡眠问题,比如失眠或者是睡不踏实多梦等。但在日常生活当中,有不少人群会出现总是睡不够的情况。并且还会伴有白天精神萎靡不振,甚至还伴有身体过度乏力心慌
肾虚夜尿多,脾虚尿意频,肝郁尿不出,5个中成药,补肾健脾疏肝肾虚夜尿多,脾虚尿意频,肝郁尿不出。大家好,我是刘医生。夜尿次数频繁,一晚上要上67次厕所,觉都睡不好,白天昏昏沉沉的,没有一点精神。去了厕所,明明没有多少小便,但每次都是一有尿意
中国网友前往朝鲜旅游,讲述沿途的所见所闻到朝鲜旅行报的是四天三夜的团,但实际上在朝鲜只玩了两整天。因为有很多时间是在火车上度过的。从朝鲜新义州乘坐朝鲜的绿皮火车出发,目的地是朝鲜平壤。两百多公里的路程,穿越了朝鲜广大的农
神舟十五号3位航天员正式亮相,只有默默奋斗努力,才能收获惊喜文艾小贝爱教育大家所期待的神舟十五号,终于公布了。对于各位学生而言,最稳妥的成长方式,自然是通过读书来进行实现了,特别是对于来自寒门家庭的大部分学生来说,学生想要改变自己未来的生活
BTCETH和MATIC的价格暴跌随着DOGE多头继续上涨,比特币以太币和MATIC的多头疲倦了。技术迹象表明空头将继续统治BTCETH和MATIC。面对市场危机,DOGE多头会继续上涨吗?在过去的一天里,比特币(
夜读心语微声养成路上与青春共舞三号院有一条养成路,我们曾在那里见证了春的生机夏的火热秋的肃穆冬的寂寞,而它也见证了我们的成长蜕变,在我们热烈的青春里镌刻了无痕的印章。记得我的新训班长曾说,我们之于养成路,好比一
什么是信仰人所追求的思想理念宗旨,灵魂向往的归宿。受人仰慕青昧而崇拜的思想和主义。比如,政派,宗教。人追求信仰,也是选择人生向往乃至人生终极灵魂之归宿,然而把信仰为使命,为理想,为奋斗宗旨。
你猜1,我猜1有句话,不要当作儿戏,意思是儿戏,儿童嬉戏,不作数之解。然,世事总有例外,那些处在漩涡当中的小民,你会如何承受其之重?网络空间不是法外之地,倡导诚实共知,也是社会和谐发展的一种趋势
一个家庭最可怕的不是贫穷,而是内耗作家王海鸰说世上最难经营的公司,是家庭,是难相处的关系,是夫妻。人与人之间,关系越亲密就越毫无保留,缺点和矛盾都随之浮出水面。日常生活中,磕磕碰碰在所难免,有些只是生活调味剂,有些