范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

零代码改动,静态编译让太乙StableDiffusion推理速度翻倍

  作者|梁德澎
  AI 作图领域的工具一直不尽如人意,直到去年 8 月 Stable Diffusion 开源,成为AI 图像生成领域无可争辩的划时代模型。
  为了提升其推理效率,OneFlow 首度将 Stable Diffusion 模型加速至"一秒出图"时代,极大提升了文生图的速度,在AIGC领域引发巨大反响,并得到了 Stability.ai 官方的支持。至今,OneFlow 还在不断刷新 SOTA 纪录。
  不过,由于目前大部分团队主要是基于翻译 API + 英文 Stable Diffusion 模型进行开发,所以在使用中文独特的叙事和表达时,英文版模型就很难给出正确匹配的图片内容,这对部分国内用户来说不太方便。
  为了解决这一问题,国内的IDEA 研究院认知计算与自然语言研究中心(IDEA CCNL)也开源了第一个中文版本的"太乙 Stable Diffusion",基于0.2亿筛选过的中文图文对训练。上个月,太乙 Stable Diffusion 在 HuggingFace 上有近 15 万下载量,是下载量最大的中文 Stable Diffusion。
  近期,OneFlow 团队为太乙 Stable Diffusion 适配了 OneFlow 后端,大大提升了推理性能,也可以做到一秒出图。不少开发者好奇OneFlow使用了哪些优化"秘笈",后文将进行简要解读。
  欢迎Star、运行 OneFlow 版太乙 Stable Diffusion:
  https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker
  1、对比 PyTorch,OneFlow 将"太乙 Stable Diffusion"推理速度提升1倍以上
  下面的图表分别展示了在 A100 (PCIe 40GB / SXM 80GB),V100 ( SXM2 32GB ), RTX 2080,RTX 3080 Ti,RTX 3090, 和 T4 不同类型的 GPU 硬件上分别使用 PyTorch, 和 OneFlow对 太乙 Stable Diffusion 进行推理的性能表现。
  可以看到,对于 A100 显卡,无论是 PCIe 40GB 的配置还是 SXM 80GB 的配置,OneFlow 的性能相比 PyTorch 能提升 1 倍以上,推理速度达到了 50it/s 以上,生成一张图片所需要的时间在 1 秒以内。
  其他硬件数据:
  注:3090上的AIT数据由 IDEA 研究院提供
  综上,在各种硬件的对比中,对比 PyTorch, OneFlow 能将太乙 Stable Diffusion 的推理性能提升 1 倍多。
  2、生成图片展示
  滔滔江水, 连绵不绝, 唯美, 插画
  长城, 清晨, 朦胧, 唯美, 插画
  梦回江南,中国古代小镇,唯美,插画
  中国的未来城市, 科幻插画
  古代建筑, 白雪纷飞
  螺蛳粉
  注:上述图片均基于 OneFlow 版太乙 Stable Diffusion 生成
  3、无缝兼容 PyTorch 生态
  想体验 OneFlow 版的太乙 Stable Diffusion?只需要修改两行代码:
  之所以能这么轻松迁移模型,是因为 OneFlow Stable Diffusion 有两个出色的特性: OneFlowStableDiffusionPipeline.from_pretrained 能够直接使用 PyTorch 权重。 OneFlow 本身的 API 和 PyTorch 对齐,因此 import oneflow as torch 之后,torch.autocast、torch.float16 等表达式完全不需要修改。
  上述特性使得 OneFlow 兼容了 PyTorch 的生态,这不仅在 OneFlow 对 太乙 Stable Diffusion 的迁移中发挥了作用,也大大加速了 OneFlow 用户迁移其它许多模型,比如在和 torchvision 对标的 flowvision 中,许多模型只需通过在 torchvision 模型文件中加入 import oneflow as torch 即可得到。
  此外,OneFlow 还提供全局 "mock torch" 功能,在命令行运行 eval $(oneflow-mock-torch) 就可以让接下来运行的所有 Python 脚本里的 import torch 都自动指向 oneflow。
  4、动静一体的编程体验
  深度学习算法原型开发阶段需要快速修改和调试,动态图执行(Eager mode, define by run)最优。但在部署阶段,模型已经固定下来,计算效率变得更重要,静态图执行(Lazy mode,define and run)可以借助编译器做静态优化来获得更好的性能。因此,推理阶段主要使用静态图模式。
  最近,PyTorch 升级到2.0引入了compile()这个API,可以把一个模型或一个Module从动态图执行变成静态图执行。OneFlow里也有一个类似的机制,不过接口名是nn.Graph(),它可以把传入Module转成静态图执行模式。
  不仅如此,OneFlow的nn.Graph模式基于MLIR实现了一系列计算图的图层优化,譬如内存布局、算子融合等。
  这不仅使得计算图表示的深度学习模型可以在各种硬件上达到最高性能,更重要的是,使得深度学习框架导入的计算图更方便地在不同硬件之间实现迁移,有助于克服国产硬件软件生态薄弱的问题。未来,我们将发布更多内容来揭示OneFlow深度学习编译器的设计和实现。
  欢迎Star、运行 OneFlow 版太乙 Stable Diffusion:
  https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker
  OneFlow 地址:https://github.com/Oneflow-Inc/oneflow/
  欢迎 Star、试用 OneFlow 最新版本: https://github.com/Oneflow-Inc/oneflow/

江阴老牌企业江苏阳光二代接班,其父已被终身市场禁入作者深水财经社何离又一家江阴家族企业二代接班。江阴老牌纺织企业江苏阳光(600220)3月13日晚上发布公告,公司第八届董事会第十八次会议选举陆宇为公司董事长,聘任高青化先生为公司韩城明星企业夹缝求生?从韩城起家的明星企业陕西黑猫(601015。SH),也曾躺在风口之上赚钱。然三十年河东,三十年河西,如今原料价格高企焦炭产能过剩等因素,导致这家独立焦化企业,夹在煤炭和钢铁之间,日OECD发布征管指南支柱二进入立法关键期本报记者杜丽娟北京报道在财政部对支柱二立法模板公开向社会征求意见后,围绕全球最低税规则合规和管理方面的一系列问题,成为企业需要关注的领域。多位税务人士表示,目前包容性框架已收集到企亚洲硅业易主追踪浙江水泥大王章小华掌舵21世纪经济报道记者曹恩惠上海报道由光伏教父施正荣创立的亚洲硅业(青海)股份有限公司(下称亚洲硅业),自2022年闯关科创板IPO未果后,该公司的资本征途何去何从颇受业内关注。去年美国经济现状连银行都开始了暴雷?硅谷银行(SVB)1983年成立于美国,是硅谷银行金融集团的子公司,资产达到50亿美元,并通过位于美国的27家办事处,3家国际分公司以及在亚洲欧洲印度和以色列的广泛商业关系网,为风当BIM碰上Web3,美好的事情即将发生Web3是指下一代的互联网,也被称为去中心化互联网,它与传统互联网不同的地方在于更加关注个人数据隐私和拥有数据的主权,用户可以通过自己的私钥来控制自己的数字身份和交易,从而实现更加最新!嘉定再次拓展自动驾驶车辆应用新场景清晨的博园路上,9辆来自酷哇科技的自动驾驶清扫车,加入了测试示范的大家庭。当未来科技走进当下日常生活2022年12月,自动驾驶的清扫车驶出实验室在上海国际汽车城区域内的13。97公同在巅峰期,艾弗森能打爆韦德吗?生涯2项数据对比,悬殊比较大两位都是喜欢的球星,巅峰都无人可挡,但我认为艾打其他球星都很简单,唯独对上韦德不容易,韦德进攻无解,防守他和基德是能防吨位的后卫也能防速度后卫,基于韦德的力量和弹跳,我觉得韦德能赢全家合体辟谣!吴奇隆携4岁儿子包场为刘诗诗庆生,甜蜜画面曝光刘诗诗跟吴奇隆多次传出婚变,二人被指已经秘密签下离婚协议书,只因涉及儿子的抚养权问题才没有公布。此前,刘诗诗与朋友开生日派对,她手上不见婚戒,老公吴奇隆不见人影也没有留言祝福,令其平台个性化推荐怎么关?上海市消保委评测十大头部平台关闭最多需7步近年来,平台个性化推荐成为消费者快速了解消费趋势便捷购物的重要渠道。个性化推荐的精准高效离不开对用户的跟踪识别和对个人信息的收集处理,因此,引发了很多消费者对个人信息保护的担忧。多有裸替,也有CG!黑暗荣耀崔惠廷扮演者车珠英真实访谈演员车珠英对黑暗荣耀第二部中引发话题的裸露场面进行了解释。据韩国媒体报道本月15日,演员车珠英在首尔三清洞某处进行的Netflix原创电视剧黑暗荣耀相关采访中解释了剧中裸露画面的相
从你的全世界路过张嘉佳摘抄我不知道,难道一个人好不好看,不是由自己决定的吗?对她来说,或许这只是一个来南京的借口,花掉并不算多的生活费。然而见不到一面,安静的等待天亮。我一直想,如果这世界是所学校的话,慧子匆匆那年累了倦了,停下来,聆听这首歌背后的故事。匆匆那年,灿烂阳光下稚嫩的青春却是那么坚定。懵懂的少年却是那么勇敢。爽朗的笑涩涩的痛,流不尽的泪水难以磨灭的痕迹。你会忘了我吗?不会。你喜欢国际护肤品牌维密莎有点抢眼,创新引领消费趋势不管是那个年龄阶层和消费阶层,对于护肤品都有着执着的青睐,不过根据一分钱一分货的原则,高端国际品牌总是效果更好一点,这是事实。护肤品牌维密莎在这其中可以说是佼佼者了,拥有着先进的科时尚休闲风,中性色搭配绝了中性色单品的设计款,也算是穿搭中高级又很难踩雷的单品。简洁的中性色,有趣的设计,这两者都会让看起来帅气质感。牛仔中混入热辣的拽酷,就有了不同质感的辣妹风格。清爽的米色系总会让人身心我国牵头的首个自动驾驶测试场景国际标准发布视频加载中据工信部网站13日消息,2022年10月,由我国牵头制定的首个自动驾驶测试场景领域国际标准ISO34501道路车辆自动驾驶系统测试场景词汇正式发布。该标准作为自动驾驶系统多边央行数字货币桥完成首次测试数字人民币跨境结算将加速落地从深圳市地方金融监督管理局获悉,近期,多边央行数字货币桥(mCBDCBridge)平台成功完成了基于四个国家或地区数字货币的首次真实交易试点测试。中国内地5家试点银行在深分支机构均小涨!10月13日有色金属价格行情长江现货1铜6410064140元吨,涨260元。A00铝1846018500元吨,涨120元。1铅1520015300元吨,平。0锌2553025630元吨,涨70元。1锌254性能评测影驰RTX4090金属大师系列显卡正式发售未来已至,影驰RTX4090金属大师系列显卡正式上线!前不久,影驰RTX4090星曜金属大师系列显卡跨时代亮相,见证新一次历史变革,如今,它来了。新一代RTX40系列显卡采用NVI公安部刑侦局提示00或400951069开头的电话短信慎接慎点!多为冒充电商客服的诈骗21世纪经济报道见习记者王巍北京报道日前,多地反诈中心披露信息显示,全国各地均有市民报警称,接到冒充电商客服要求转账的事件。90后的李女士曾因为相信所谓电商客服的话术,在一天内被骗年金保险的概念功能优势及六种运用场景很多购买了重疾险和医疗保险的客户,感觉保障已经足够之后,手里面会有一些闲钱,不知道该如何使用。买股票风险太大买理财产品收益又太高P2P产品容易跑路,存银行收益更低。那么购买年金保险奇怪知识了解下为什么可爱的女生更爱穿纯白色袜子天气渐冷又到换季的时候!!!走到大街上发现都开始流行卖袜子了。侵删日常穿的袜子我主要分为两大类,一是功能性,比如防臭脚,各种黑科技的另一类就是装饰性侵删袜子真的是灵魂所在,穿一双舒