范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

秒秒钟揪出张量形状错误,这个工具能防止ML模型训练白忙一场

  模型吭哧吭哧训练了半天,结果发现张量形状定义错了,这一定没少让你抓狂吧。那么针对这种情况,是否存在较好的解决方法呢?
  这不最近,韩国首尔大学的研究者就开发出了一款"利器"—— PyTea。
  据研究人员介绍,它在训练模型前,能几秒内帮助你静态分析潜在的张量形状错误 。
  那么 PyTea 是如何做到的,到底靠不靠谱,让我们一探究竟吧。PyTea 的出场方式
  为什么张量形状错误这么重要?
  神经网络涉及到一系列的矩阵计算,前面矩阵的列数必需匹配后面矩阵的行数,如果维度不匹配,那后面的运算就都无法运行了。
  上图代码就是一个典型的张量形状错误,[B x 120] * [80 x 10] 无法进行矩阵运算。
  无论是 PyTorch,TensorFlow 还是 Keras 在进行神经网络的训练时,大多都遵循图上的流程。
  首先定义一系列神经网络层(也就是矩阵),然后合成神经网络模块……
  那么为什么需要 PyTea 呢?
  以往我们都是在模型读取大量数据,开始训练,代码运行到错误张量处,才可以发现张量形状定义错误。
  由于模型可能十分复杂,训练数据非常庞大,所以发现错误的时间成本会很高,有时候代码放在后台训练,出了问题都不知道……
  PyTea 就可以有效帮我们避免这个问题,因为它能在运行模型代码之前,就帮我们分析出形状错误。
  网友们已经在热烈讨论了。
  PyTea 是如何运作的,它能否有效地检查出错误呢?
  受各种约束条件的影响,代码可能的运行路径有很多,不同的数据会走向不同的路径。
  所以 PyTea 需要静态扫描所有可能的运行路径,跟踪张量变化,推断出每个张量形状精确而保守的范围。
  上图就是 PyTea 的整体架构,一共分为翻译语言,收集约束条件,求解器判断和给出反馈四步。
  首先 PyTea 将原始的 Python 代码翻译成一种内核语言。PyTea 内部表示法(PyTea IR)。
  接着 PyTea 追踪 PyTea IR 每个可能的执行路径,并收集有关张量形状的约束条件。
  判断约束条件是否被满足,分为线上分析和离线分析两步 :
  线上分析 node.js(TypeScript / JavaScript):查找张量形状数值上的不匹配和误用 API 函数的情况。如果 PyTea 发现问题,就会停止在当前位置,然后给用户报错。
  离线分析 Z3 / Python:如果线上分析没有问题,PyTea 将收集到的约束条件传给 SMT(Satisfiability Modulo Theories)求解器 Z3,求解器负责查看每条路径的约束条件是否都能被满足,如果不能,返回给用户第一条出错路径的约束条件。
  如果求解器过久没有反应,PyTea 会返回不知道是否存在问题。
  然而追踪所有可能的路径是指数级别的任务,对于复杂的神经网络来说,一定会发生路径爆炸这个问题。
  比如说在这个例子中,网络的最终结构是由 24 个相同模块块构成的(第 17 行),那么可能的路径就有 16M 之多。
  所以路径爆炸是一定要处理的,PyTea 是怎么做的?
  PyTea 选择保守的地对路径剪枝和超时判断来处理这种路径爆炸。
  什么样的路径可以被剪枝?
  PyTea 给出的答案是,如果该前馈函数不改变全局值,并且它的输出值不受分支条件影响,对于每条路径都是相等的,我们就可以忽略许多完全一致的路径,来节约计算资源。
  如果路径剪枝还是不行,那么就只能按超时处理了。
  原理就介绍这么多了,感觉还是值得一试的,现在代码已经在 GitHub 上面开源了,快去看看吧!使用方法
  依赖库:
  安装方法:
  运行命令:
  参考链接:
  [1]https://github.com/ropas/pytea
  [2]https://arxiv.org/abs/2112.09037

视觉中国整改上线举报功能,邀请第三方参与测试监督感谢IT之家网友学士的线索投递!IT之家4月26日消息人类第一次拍到的黑洞照片引起了一场版权风波,视觉中国可以说处在其中心位置。4月11日晚,视觉中国宣布暂停网站运营,开展自查和整每卖一部Xperia手机都亏钱,索尼是如何从移动市场获利的1月5日消息,据国外媒体报道,索尼的智能手机业务对公司来说就是一个资金陷阱。其Xperia在全球智能手机市场的份额约为1,而且每售出一部手机都在赔钱。上个季度,随着运营亏损扩大,索中国铁路连镇高铁全线开通在即,设计时速250公里IT之家12月4日消息据中国铁路发布,近日,连镇高铁淮镇段通过中国国家铁路集团有限公司初步验收,标志着连镇高铁淮镇段即将具备开通运营条件。IT之家获悉,连镇高铁位于江苏省中北部,北中国铁路京张高铁延庆线正式开通运营,设计时速160公里IT之家12月2日消息据中国铁路发布,12月1日6时,G8881次列车从清河站始发,开往延庆站,标志着北京2022年冬奥会重点配套交通基建工程京张高铁延庆线正式开通运营。IT之家获苹果FB谷歌和微软总部是怎样成为旅游景点的据CNBC北京时间11月4日报道,许多享誉全球的科技公司,它们的公司总部本身,也成为了建筑学的奇观。即使是建筑物本身并不出色的公司,也吸引了全球各地游客的兴趣。它们的吸引力不仅仅来乔布斯签名Macworld杂志拍出近4。8万美元北京时间12月15日上午消息,据RRAuction上的信息,苹果联合创始人史蒂夫乔布斯(SteveJobs)签名的一本Macworld杂志在周四晚上的拍卖价达到47775美元。这本比尔183盖茨为创造人类的就业岗位,将推进对机器人征税北京时间11月7日晚间消息,微软创始人现通过基金会投身慈善事业的比尔盖茨日前接受了日本经济新闻的采访,在以人工智能(AI)为代表的技术进步日益加速的背景下,盖茨预测称为了创造人类的盖茨基金会将与中国药监局合作,推动新药审核加快IT之家11月5日消息据澎湃新闻消息,在今日开幕的中国国际进口博览会上,微软公司创始人比尔盖茨现身展会,并发表了演讲。盖茨盛赞了中国脱贫方面的成果,表示中国能成为消除贫困的重要力量雷军因为小米便宜就觉得质量有问题,我气得半死IT之家1月10日消息今天,小米在北京举行了红米Redmi新品发布会,正式发布了旗下首款独立红米品牌手机Redmi红米Note7,并预告了一波Redmi红米Note7Pro。Red雷军谈红米独立给小米手机卸包袱,冲刺中高端1月10日消息,生死看淡,不服来干,本来不想回应友商的雷军,最终还是回应了,而且表现得很强硬小米不挑事,也不怕事。今天下午,小米在北京召开发布会宣布红米品牌独立,并发布999元起4华为终端有限公司新增医疗器械销售等业务IT之家3月25日消息工商数据显示,华为终端有限公司于3月21日进行了经营范围变更,新增销售医疗器械(第二类医疗器械)增值电信业务经营佣金代理,以及货物或技术进出口等业务。国家相关
韩国5G用户在5月底已超过690万,年底有望达到1000万据国外媒体报道,随着5G网络覆盖范围的扩大和5G智能手机的增多,5G用户数量也在不断增加,全球首个推出5G商用服务的韩国,5G用户就一直在稳步增加。外媒的报道显示,韩国科学和信息通消息称特斯拉增加订单,LG化学拟在韩国为其生产电池7月3日消息,据国外媒体报道,知情人士周五称,由于需求增加,特斯拉也向LG化学(LGChem)增加了订单,LG化学拟在韩国为其生产电池。知情人士称,特斯拉电动汽车销售状况很好,特斯蔚来中国正式获六家银行104亿元综合授信感谢IT之家网友dhuliang的线索投递!IT之家7月10日消息IT之家从蔚来获悉,今日上午,蔚来中国与中国建设银行安徽省分行等六家银行举行了蔚来中国银企战略合作签约仪式。图源蔚蔚来汽车将获得6家银行超百亿元授信额度IT之家7月9日消息据科创板日报报道,蔚来汽车将获得来自6家银行的超百亿元授信额度。另悉,蔚来汽车BaaS(后端即服务)体系细节将于三季度公布。对此,蔚来回应称以我们正式发布为准,蔚来汽车涨逾26。65,股价突破11美元关口IT之家7月6日消息7月6日晚间消息,蔚来汽车二季度交付了10331辆汽车,超出了此前预期上限。受此影响,蔚来涨幅扩大至26。65,报11。88美元。当前市值为139。29亿美元。蔚来汽车二季度交付量超预期10331台,单季度首次破万IT之家7月3日消息蔚来汽车在6月交付3740台,交付数同比增长179,蔚来汽车二季度交付10331台,首次实现单季交付数破万。数据显示,蔚来汽车45月交付量分别为3155辆343蔚来汽车合肥购买蔚来可享10万元补贴为假消息IT之家6月30日消息今日有微博用户曝出在合肥购买且办理合肥车牌的前10000名蔚来用户,可获得每台车10万元现金购车补贴的消息。对此,蔚来汽车官方微博回应称此消息系假消息。另据财腾讯买入蔚来168万股美国存托股,持股比例增至15。1IT之家6月20日消息美国证券交易委员会19日披露,腾讯通过全资子公司黄河投资有限公司买入蔚来汽车168万股美国存托股(ADS),相当于168万股A类普通股,耗资1000万美元。I时隔24年,迪迦183奥特曼数码修复版上线腾讯视频IT之家7月10日消息随着技术的飞速发展,不少流媒体平台纷纷推出了各种早年视频的修复版本。就在6月下旬,A站便推出了阿基拉4K修复版。IT之家了解到,今日上午,腾讯视频通过社交媒体腾讯宣布进军AI新药研发助力攻克无药可治的疾病IT之家7月9日消息据有关统计传统药物研发耗时耗力,一般需要超过15年,耗资30多亿美元,但每年上市的原创新药仅十几种。目前,已知的4000多种疾病中90尚无药可治。如何加速新药研中国移动高同庆AI已成为5G和6G核心技术之一7月10日下午消息,在2020年世界人工智能大会AI新基建,5G新机遇主题论坛上,中国移动副总经理高同庆发表主题演讲。他表示,5G和AI的典型应用场景中超过80是重叠的,两者已经深