范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

Batch大小不一定是2的n次幂!ML资深学者最新结论

  羿阁 编译整理
  量子位 | 公众号 QbitAI
  Batch大小不一定是2的n次幂?
  是否选择2的n次幂在运行速度上竟然也相差无几?
  有没有感觉常识被颠覆?
  这是威斯康星大学麦迪逊分校助理教授Sebastian Raschka(以下简称R教授) 的最新结论。
  在神经网络训练中,2的n次幂作为Batch大小已经成为一个标准惯例,即64、128、256、512、1024等。
  一直有种说法,是这样有助于提高训练效率。
  但R教授做了一番研究之后,发现并非如此。
  在介绍他的试验方法之前,首先来回顾一下这个惯例究竟是怎么来的?2的n次幂从何而来?
  一个可能的答案是:因为CPU和GPU的内存架构都是由2的n次幂构成的。
  或者更准确地说,根据内存对齐规则,cpu在读取内存时是一块一块进行读取的,块的大小可以是2,4,8,16(总之是2的倍数) 。
  因此,选取2的n次幂作为batch大小,主要是为了将一个或多个批次整齐地安装在一个页面上,以帮助GPU并行处理。
  其次,矩阵乘法和GPU计算效率之间也存在一定的联系。
  假设我们在矩阵之间有以下矩阵乘法A和B:
  当A的行数等于B的列数的时候,两个矩阵才能相乘。
  其实就是矩阵A的第一行每个元素分别与B的第一列相乘再求和,得到C矩阵的第一个数,然后A矩阵的第一行再与B矩阵的第二列相乘,得到第二个数,然后是A矩阵的第二行与B矩阵的第一列……
  因此,如上图所示,我们拥有2×M×N×K个每秒浮点运算次数(FLOPS) 。
  现在,如果我们使用带有Tensor Cores的GPU,例如V100时,当矩阵尺寸(M,N以及K) 与16字节的倍数对齐,在FP16混合精度训练中,8的倍数的运算效率最为理想。
  因此,假设在理论上,batch大小为8倍数时,对于具有Tensor Cores和FP16混合精度训练的GPU最有效,那么让我们调查一下这一说法在实践中是否也成立。不用2的n次幂也不影响速度
  为了了解不同的batch数值对训练速度的影响,R教授在CIFAR-10上运行了一个简单的基准测试训练——MobileNetV3(大) ——图像的大小为224×224,以便达到适当的GPU利用率。
  R教授用16位自动混合精度训练在V100卡上运行训练,该训练能更高效地使用GPU的Tensor Cores。
  如果你想自己运行,该代码可在此GitHub存储库中找到(链接附在文末) 。
  该测试共分为以下三部分:小批量训练
  从上图可以看出,以样本数量128为参考点,将样本数量减少1(127) 或增加1(129) ,的确会导致训练速度略慢,但这种差异几乎可以忽略不计。
  而将样本数量减少28(100) 会导致训练速度明显放缓,这可能是因为模型现在需要处理的批次比以前更多(50,000/100=500与50,000/128= 390) 。
  同样的原理,当我们将样本数量增加28(156) 时,运行速度明显变快了。最大批量训练
  鉴于MobileNetV3架构和输入映像大小,上一轮中样本数量相对较小,因此GPU利用率约为70%。
  为了调查GPU满载时的训练速度,本轮把样本数量增加到512,使GPU的计算利用率接近100%。
  △由于GPU内存限制,无法使用大于515的样本数量
  可以看出,跟上一轮结果一样,不管样本数量是否是2的n次幂,训练速度的差异几乎可以忽略不计。多GPU训练
  基于前两轮测试评估的都是单个GPU的训练性能,而如今多个GPU上的深度神经网络训练更常见。为此,这轮进行的是多GPU培训。
  正如我们看到的,2的n次幂(256) 的运行速度并不比255差太多。测试注意事项
  在上述3个基准测试中,需要特别声明的是:
  所有基准测试的每个设置都只运行过一次,理想情况下当然是重复运行次数越多越好,最好还能生成平均和标准偏差,但这并不会影响到上述结论。
  此外,虽然R教授是在同一台机器上运行的所有基准测试,但两次运营之间没有特意相隔很长时间,因此,这可能意味着前后两次运行之间的GPU基本温度可能不同,并可能稍微影响到运算时间。结论
  可以看出,选择2的n次幂或8的倍数作为batch大小在实践中不会产生明显差异。
  然而,由于在实际使用中已成为约定俗成,选择2的n次幂作为batch大小,的确可以帮助运算更简单并且易于管理。
  此外,如果你有兴趣发表学术研究论文,选择2的n次幂将使你的论文看上去不那么主观。
  尽管如此,R教授仍然认为,batch的最佳大小在很大程度上取决于神经网络架构和损失函数。
  例如,在最近使用相同ResNet架构的研究项目中,他发现batch的最佳大小可以在16到256之间,具体取决于损失函数。
  因此,R教授建议始终把调整batch大小,作为超参数优化的一部分。
  但是,如果你由于内存限制而无法使用512作为batch大小,那么则不必降到256,首先考虑500即可。作者Sebastian Raschka
  Sebastian Raschka,是一名机器学习和 AI 研究员。
  他在UW-Madison(威斯康星大学麦迪逊分校) 担任统计学助理教授,专注于深度学习和机器学习研究,同时也是Lightning AI的首席 AI 教育家。
  另外他还写过一系列用Python和Scikit-learn做机器学习的教材。
  基准测试代码链接:
  https://github.com/rasbt/b3-basic-batchsize-benchmark
  参考链接:
  https://sebastianraschka.com/blog/2022/batch-size-2.html
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

广西马山绿水青山换新颜环境好了,才有游客。古零镇乔老村党总支部书记潘海崇曾亲眼见证了流经该村的乔老河从泛滥成灾污水横流到现如今水清岸绿的变化。现在,保护生态已成为乔老河沿岸村民的共识,乔老村入选全国文明生态护林员俄日项欠守护好家乡的绿水青山视频加载中46岁的俄日项欠是青海省海南藏族自治州贵德县河东乡查达村村民,七年前他成为贵德县东山林场的一名生态护林员,并主动要求到林区地形复杂条件艰苦的责任区负责相关工作。俄日项欠和又见野蛮霸权,史无前例的半导体制裁,我们的中国芯怎么办?就在中国人民举国欢庆的时候,美国对中国发起了一次史上最严厉的制裁,这一次的制裁打击的对象主要是我们的整个半导体产业。所以这两天整个半导体板块出现了连续的暴跌,这次制裁的力度超过了对绿水青山新钱景浙江村民家门口眺望诗和远方施金生(左一)正给动物喂食姚玲利摄摄中新网湖州10月11日电(施紫楠姚玲利)每天7点半,施金生来到动物园做的第一件事,就是去动物检疫场转一圈,看看动物的健康面貌,再去袋鼠的馆舍打扫这些秋日里细碎的美景,就是生活最好的解药这个世界充满了喧嚣和纷乱,我们每个人的天空也常有阴霾飘过,但是那些秋日里的点滴美景,就是生活里细碎的喜悦和温馨,让我们享受到了生命的快乐与美好,给我们心底注入了活力和希望。秋天的大圣卓奏响秋日运动之歌运动,点燃青春激情这个深秋,唯运动不可辜负!圣卓校园里人声鼎沸青春气息扑面而来我们迎来了一年一度的体育美食节今天小编先带大家看一下圣卓的体育节本次体育美食节秉承提高身体素质,感悟美兰州最西端永登县连城镇东河沿村吐鲁沟秋景林间溪流吐鲁沟奇峰来积梅正在挖羌活兰州最西端为东河沿村,位于永登县连城镇,和武威市天祝县接壤。这里最大的特色体现在名字里,河为大通河。有河,便有山。这里的山被村民称作沟,秋日限定款美食美景!这个网红小城从未让人失望江门的秋天是什么滋味?是近日刷屏的粉色浪漫?还是唇齿留香的陈皮宴?是闲适畅快地在恩平泡温泉?还是品尝鲜甜美味的台山青蟹?江门秋日限定都在这里啦秋日限定美食礼乐腊味AUTUMN秋风起二十大代表风采让优质服务从我走向我们二十大代表风采原标题李鹏扎根金融一线,真情服务32载(引题)让优质服务从我走向我们(主题)工人日报中工网记者北梦原通讯员张姮作为一名银行工作者,党的二十大代表中国工商银行新疆乌鲁木84次中央政治局集体学习锚定国之大者党的十八大以来,以习近平同志为核心的党中央,面对世情国情党情的深刻变化,始终以身作则抓好自身学习,致力于建设马克思主义学习型政党,将中共中央政治局集体学习这一项重要学习制度长期坚持美国男子光膀子在球场求婚,大屏幕转播万人欢呼,女友拒绝后跑了一段拍摄于当地时间10月13日晚间的短视频,正在社交媒体上广为流传着,同时也引发了人们的热议。当天在位于纽约埃尔蒙特的瑞银竞技场(UBSArena)里,进行着一场冰球比赛,纽约岛人
巅峰姚明真的很强吗?巅峰姚明是真的很强。作为一个黄皮肤的中国运动员,姚明在NBA是受尽歧视和质疑的,正是靠着实力表现,姚明才赢得了奥尼尔这种殿堂级中锋发自内心的尊重。姚明的NBA生涯可以说是短暂而辉煌作为八一名将,退役的刘国梁是什么级别?具体的待遇如何?这个歪着脑袋挺着肚子的中年人最近再一次频繁出现在东京奥运会的转播画面上,大家总是调侃他为不懂球的胖子。其实谁都知道他就是现任乒协主席国家乒乓球队领队,曾经的国乒总教练刘国梁。少年成普拉蒂尼和齐达内,谁是法国足球第一人?1986年以前几年全世界第一,马拉多纳佩服的球员,中场指挥家,任意球之王,更牛的是意甲的射手王,欧洲杯的射手王,许多前锋甘败下峰,只是没有世界杯,八十年代最伟大的巨星,和老马一档,TCLS12金标剧院电视音质好吗?楼主说的TCLS12金标剧院电视就是近期要上市的那款具备金标安桥音响的高色域电视吧,据了解这款电视各方面表现都是相当出色的。TCLS12金标剧院电视是一款高色域电视,具备持久的色彩请问switch上有没有一款类似怪物猎人,塞尔达这种靠刷的游戏大作?谢邀!我是灵药,一名游戏创作者,首先,很荣幸能为你回答此类问题。希望我的回答你个能够喜欢。1。深渊狂猎说到switch靠刷刷刷的游戏大作首先我要提的就是深渊狂猎这款日本出品非常有趣请教一个我百思不得其解的问题,为什么我家的俩孩子都特别不听话?听你话了以后能超过你么?首先恭喜你有二个可爱的宝贝。二个宝贝如果年龄相差不大,而且如果是二个男孩或者二个女孩,就是有点不听指挥,这时候就是考验爸爸妈妈爷爷奶奶外公外婆的时候了,可以小孩老流鼻血是什么原因引起的?该怎么办?秋冬季节来临,耳鼻喉科门诊鼻出血的小孩明显增多,有些只是偶尔出血,有些却到反反复复出血。很多家长看到小孩鼻出血都心急如焚,不知所措。小孩的鼻腔黏膜特别薄,只有成人的十分之一,所以较小孩高热惊厥,有必要做脑电图,脑核磁检查吗?我儿子惊厥过的,进了病房该做什么就做什么,听医生的,不要擅自作主,也不要乱在网上查。以后发热的时候一定要吃医院配的抗惊厥药,因为惊厥过一次,以后特别容易再次发作,有惊厥史,打疫苗的75岁老妈帮我照看孩子,孩子发烧,老公埋怨我妈没看好,该咋办?你老公不应该埋怨你妈妈,孩子发烧生病很正常啊,让你老公在家带孩子,也避免不了啊。要是他妈妈来看孩子生病了,他就不会埋怨他妈妈了。你老公不太懂事。也有可能你老公不愿意让你妈妈照顾孩子高考结束后,为何监考老师一定要收回草稿纸?而不让考生拿走?自从上班以后,我参加过很多次高考监考,次数多得我自己都记不清楚了!但是,11年的监考我记忆犹新。那一次我是在其他学校监考,第一科监考的是语文。我们按照学校规定的高考监考程序,把答题孩子突然说不想去学校。给我请一天假。这是厌学。该怎么办?不想去学校的原因很多,学习压力大师生关系差同学有霸凌心里憋着话找不到具体原因,咋办都是瞎办!不知是不是孩子不愿意跟您说心里话,所以跑头条请教来了。这事还得跟孩子聊,别着急,别上火,