童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

实测腾讯AI文生图!王者荣耀画风一键直出,小程序就能玩

11月11日 寒霜坞投稿
  鹅厂大模型,又有新玩法!
  发布不到两个月,腾讯混元大模型就速通了一个新版本,除了语言模型升级以外,还悄悄上线了AIGC最火热的功能
  文生图。
  和语言模型一样,文生图同样可以通过微信小程序直接体验。
  不过与Midjourney独立出图不同,混元的文生图和对话功能“互不耽误”,可以边聊边画,与DALLE3体验相似。
  之前已经申请测试通过的,可以立刻冲了
  还在排队中的也别急,我们已经快速实测了一波热图,这就先放出来给大伙儿看看。
  混元文生图上手实测
  根据腾讯介绍,混元大模型文生图最大的优势在三处:真实感、中文理解、风格多样。
  接下来就挨个试试它做到了什么程度。
  先来画人,复刻一波之前爆火过的Midjourney“写实90年代北京情侣”看看。
  可以看出,写实风格的人像还是很拿手的,人物姿态合理,画亚洲人脸与国外AI相也比较自然。
  注意这里有个小技巧,想要写实风格的话最好用“生成一张”来触发,如果用“画一张”大概率会得到插画风格。
  写实风格的人像可以,再看看画风景如何。
  除了一般的风景描述,混元大模型支持指定一个真实存在的景点,比如“桂林山水”或“长城”。
  毕竟是AI生成,和真实景观不会完全一样,但感觉还是到位了。
  接下来要上难度了,把这两个场景“组合”起来:
  这么离谱的需求都画出来了,甚至水面还有水波,看来不是简单地重现训练数据,而是对概念有一些自己的理解。
  那么更复杂的概念如何?
  曾经,AI因不理解中文菜名闹过一波笑话。
  经过这半年的发展,“红烧狮子头”里不会出现狮子的头,“夫妻肺片”里也不会变成恐怖片了,甚至看着还挺香。
  要说比菜名更有挑战的,就到了古诗词,正好写实风格也看腻了也可以换换口味。
  总得来说还不错,美中不足之处在于一张图没有“舟”,还有一张舟上坐了两个“翁”,就没有孤独的意境了。
  看来诗词这种过于凝练的还是有难度。
  But,别忘了混元助手同时拥有聊天对话能力,还支持多轮对话。
  借助强大的语言模型部分,我们也找出解决办法。
  接下来只需用“这些要求”、“上述要求”来指代上面的回答,就可以让两个功能联动起来了。
  再画就会更稳定,而且增加了雪花飘落的细节。
  记住这个小技巧,接下来还会用到。
  其实在腾讯混元助手中,专门准备了这样一个存为指令的功能。
  存好后就可以从对话框右边的魔法棒图标处快速调用了,只需要更改要描述的内容即可。
  还可以方便地一键分享到微信,4张图一次分享让好友帮忙选,不用来回截图了。
  直接打开分享链接,就可以放大查看四张图,还可以开始新对话!
  了解过混元大模型的中文理解能力,再来试试最后一个特点风格多样性。
  既然是腾讯出品,游戏插画肯定少不了,比如正火的赛博朋克风。
  有点感觉了,但总觉得还差点意思。
  可以用上面的技巧来,联动语言模型来明确赛博朋克风格的特点。
  再手动加亿点点料,就更对味了。
  不同游戏的画风差距极大,测试下来混元助手确实能hold住不少,从3D到2D甚至像素都没问题。
  即使是同一话题和风格限定,也能展现出不同的画风,Furry控狂喜(doge)
  其实腾讯透露,内部多个场景已经用上了混元大模型文生图能力。
  虽然还不知道具体怎么使用,但是我们测试了一下用《王者荣耀》来当风格限定词,混元也能理解。
  除了游戏之外还有广告场景,前面提到的混元大模型文生图真实感的优势就能发挥出来。
  也别忘了腾讯还有一大块内容业务,来个玄幻小说插图也没问题。
  这样的文生图效果,背后究竟是通过什么原理实现的?
  在此之前,业界其实已经有不少文生图的开源模型。
  腾讯是基于其中某种方案打造,还是重新进行的自研?
  带着种种问题,我们和腾讯混元大模型文生图技术负责人芦清林聊了聊,了解了一下背后的技术细节。
  模型全自研,用20亿图文对炼成
  “从算法、数据系统到工程平台,都是从0到1自研。”
  芦清林表示,这也算是腾讯混元大模型文生图功能的优势,这样从生成自由度到数据安全性,就都能完全把控,也让生成的图像“更符合用户需求”。
  首先是在算法这一块。
  当前文生图模型普遍存在三个难点,语义理解差、构图不合理、画面细节无质感。
  语义理解差,就是模型听不懂人话,尤其是中英文夹杂的人话。
  当前业界普遍采用的是开源的CLIP算法,然而它一来没有建模中文语言,输入中文只能靠翻译,会出现红烧狮子头真的生成狮子的问题(doge);另一个是训练时图文对齐能力不行。
  构图不合理,指的是生成的人体结构、画面结构有问题,直接“生异形”。
  如果直接基于业界已有的开源扩散模型生成图像,就容易出现这个问题,像是出现“三只手”或者各种奇怪的画面结构。
  画面细节无质感,就是生成图像清晰度差。当前不少数据集图像分辨率和质量不高,容易导致训练出来的开源模型质量也不高。
  为了解决这三个难点,腾讯混元团队在算法阶段,特意用了三类模型组合来“逐个击破”。
  语义理解上,腾讯自研了跨模态预训练大模型,不仅让它同时学会建模中英文,而且强化文本和图像细粒度特征的联系,简单来说就是中文、英文、图像三者的“跨模态对齐”。
  生成构图上,腾讯自研了一种扩散模型和Transformer混合的架构,尤其是将Transformer当前大火的旋转位置编码研究给用上了。
  旋转位置编码通常被用于增加大模型的上下文长度,不过在这里被腾讯巧妙地用于刻画人体结构,让模型既能掌握全局信息(人体骨架)又能理解局部信息(脸部细节)。
  最后是在画面细节上,腾讯自研了超分辨率模型,与此同时还结合了多种算法,针对图像不同的细节进行优化,让最后生成的图像进一步“耐看”。
  这样做出来的模型架构,不仅能生成质量更高的图片(分辨率10241024),而且只需要微调一下架构,就能变成图生图、甚至是文生视频模型。
  接下来,就是关键的数据部分了。
  对于文生图而言,生成图像的质量,很大程度上取决于数据的质量,OpenAI在DALLE3论文中,通篇都在强调数据对于指令跟随的重要性。
  腾讯也非常重视数据对模型的重要性,并同样自研了三方面的技术。
  在数据质量上,由于互联网上扒下来的数据集,往往存在文字描述简洁、和生成内容不完全匹配的问题,因此团队通过改善图文对数据集中的“文”部分,也就是细化中文的文本描述,来提升图文数据的相关性;
  在数据效果上,团队针对训练数据进行了“金银铜”分层分级,等级越高,意味着数据清洗程度越精细。
  其中,20亿未清洗的“青铜数据”,用来对所有模型进行“粗加工”,也就是预训练;
  6亿“白银数据”,用来对生成模型进一步加工,提升生成质量;
  1。12亿精心清洗的“黄金数据”,则用来对模型进行“精加工”,也就是精调突击训练,确保训练出来的模型质量更优秀。
  在数据效率上,为了加快训练速度,尤其是针对用户反馈对模型进行优化的速度,腾讯也建立了数据飞轮,自动化构建训练数据并加快模型迭代,让模型生成准确率进一步提升。
  据芦清林透露,数据飞轮这个技术,也正是解决数据长尾场景难题的关键。
  由于我们的生活中总是在出现一些潮流新词,例如“玲娜贝儿”等,这种名词往往在数据集中不常见,而用户又会在输入时使用,因此往往需要第一时间更新进训练数据中。
  有了数据飞轮,就能将这个过程效率进一步提升,避免模型在见识到新词后,依旧长时间无法生成对应的图像。
  最后,有了算法和数据,还得有个工程平台,来把它们组合起来快速训练。
  为此,腾讯自研了Angel机器学习平台,包括训练框架AngelPTM和推理框架AngelHCF。
  训练上,大模型最重要的就是并行能力。为此,腾讯基于4D并行ZeROCache机制,实现了千亿参数混元大模型的快速训练。
  直观来看,AngelPTM训练框架相比业界主流框架DeepSpeedChat速度提升了1倍以上。
  推理上,AngelHCF则实现了支持多种并行能力、支持服务部署及管理、以及自研模型无损量化三大功能,相比业界主流框架提升了1。3倍以上。
  值得一提的是,在Angel机器学习框架和平台的支持下,腾讯混元的语言模型也进行了一轮升级,尤其是代码能力有不小的提升。
  我们也简单测了测腾讯混元大模型更新后的代码能力。
  首先试试写代码,以帮老师写一个“随机点名程序”为例(手动狗头)。
  混元大模型很快生成了一段带注释的完整代码:
  importrandom假设班级里有50个学生,这里是他们的学号studentids〔001,002,003,004,005,006,007,008,009,010,011,012,013,014,015,016,017,018,019,020,021,022,023,024,025,026,027,028,029,030,031,032,033,034,035,036,037,038,039,040,041,042,043,044,045,046,047,048,049,050〕使用random。choice()函数从学生学号列表中随机选择一个学生randomstudentidrandom。choice(studentids)打印随机选中的学生学号print(随机抽取的学生学号是:,randomstudentid)
  实测可以丝滑运行,每次都能抽到不同的幸(dao)运(mei)儿(dan)起来回答问题:
  然后我们还发现,混元大模型竟然还能帮忙查代码bug,属实是程序员省心利器了。
  当然,无论是文生图还是代码能力,现在都已经可以在腾讯混元助手中体验。
  (举报)
投诉 评论

B站全年AIGC相关视频播放量90亿站长之家(ChinaZ。com)10月31日消息:近日,哔哩哔哩公布了“五大科学焦点榜单”,主要涉及站内有关“AIGC、室温超导、脑机接口、黑洞、可控核聚变”等关键词的视频数据……李佳琦回应直播间低价争夺除了价格提供有用的内容也很重要近日,李佳琦在接受专访时谈到了直播带货的发展和他个人的变化。他指出,虽然价格在双11大促期间是一个重要因素,但并不是唯一因素,而直播间的核心价值在于为用户提供有用的内容,包括产……创造新纪录,他们打响抖音电商“双11”第一枪“有多少人是冲着胶原棒来到直播间的?”“今天下午3点,我们已经打破了次抛的吉尼斯世界销售记录!”“从它默默无闻,到现在大火,我一直在推荐,感谢品牌今天愿意给我地板价……45岁洁柔的霸总私域路线“你们有看到今天私域运营中一些新的玩法,新的趋势吗?”“其实我们就在试图探索一条不止于GMV的路,试图去赶上新的趋势。”谈到私域运营的未来,中顺洁柔集团副总裁兼首席……美中宜和开测私域非营销玩法去年开做医疗私域的美中宜和如今发展的如何了?见实再次与美中宜和会员中心负责人郑珣连线,能够发现的是高端医疗行业做私域具有巨大的潜力。美中宜和医疗集团在不到一年的时间……小游戏转战App闯入畅销榜前三、接棒产品退场,这家公司还能引去年《咸鱼之王》突然发力,把小游戏的高光成绩带到了App端上来,一跃进入到iOS畅销榜TOP50。这个成绩一直维持至今,甚至在前不久两周年庆节点时再度抬高了收入天花板,最高排到……实测腾讯AI文生图!王者荣耀画风一键直出,小程序就能玩鹅厂大模型,又有新玩法!发布不到两个月,腾讯混元大模型就速通了一个新版本,除了语言模型升级以外,还悄悄上线了AIGC最火热的功能文生图。和语言模型一样,文生图……小红书旗下电商平台小绿洲正式关闭:微信小程序已注销快科技10月31日消息,9月初,小红书旗下电商平台小绿洲突然发布告别信。信中说明,因业务调整,计划2023年10月1日停止运营,商品停止销售,2023年10月31日正式关……Nightshade工具助力创作者保护版权对抗AI训练数据的站长之家(ChinaZ。com)10月26日消息:随着人工智能(AI)技术的快速发展,其训练数据的获取和使用变得日益重要,但也出现了滥用现象。为了抵御这种滥用,一款名为Nigh……活跃在小红书的“知乎倒爷”如果内容生产也可以分为“贸工技”三个阶段,当机构媒体和自媒体们,纷纷走向后两个者,那么“搬运工”们毫无疑问停留在前者。小红书,移动互联网最后的应许之地。就像当年的微……流水3亿,3天涨粉100万,短剧让用户重新爱上抖音“好虐啊!好虐啊!男主到底什么时候追妻火葬场?”“男主什么时候才能复仇成功?”“死渣男!女主到底什么时候发现他出轨?”喜欢看剧的你,是否有过类似的吐槽?……靠家长里短爆红的视频号博主,百万流量源自何方据《中国互联网络发展状况统计报告》显示,截至2022年12月,短视频用户规模首次突破十亿,用户使用率高达94。8。而2022年末,全国人口数约为14。12亿人。在抖音、快手、视……
贾乃亮以1。56亿GMV居上周抖音直播带货榜榜首8月23日消息,日前,新腕统计了上周(8月15日至8月21日)抖音直播带货榜单排名。数据显示,在上周达人带货榜中,有5位主播直播带货GMV过亿,分别是贾乃亮、东方甄选、大狼狗郑……直播间场观3000人如何达到?分享留人技巧!直播间留不住人,是很多抖音商家的痛点。直播间有流量、能留住人是有很多要点的。短鱼儿来分享一些直播间的留人技巧!主要从三个点出发:场景、产品、活动!01:……网红手机NothingPhone1迟迟不更新安卓13:高管含Nothing由前一加联合创始人CarlPei创办,这家公司在7月份推出了旗下第一款新品NothingPhone1。该机在未发布之前就引发极高的关注,酷安网上Nothin……企业做私域会员的“通病”某种程度上,私域运营等同于会员运营。实际执行中,我们又往往会陷入为了做会员而做会员,为了做私域而做私域的恶性循环中,却忽略了生意的本质依旧是做好“人货场”的分配与布局,还要为产……8000万私域用户,会员贡献超6成,良品铺子私域全拆解零食行业实际上是非常适合做私域的行业。单品价值低、客单价低、用户复购率高、用户覆盖广。但也正因为用户数量庞大,很多品牌想做私域,却不知从何下手。良品铺子作为行业头部企业,……私域可以抗得住周期风险!在私域2。0时代,如何进行全域流量布局,打通线上线下流量、打通公私域流量等,是不同品牌需要共同探索的话题。在前几天的见实全域向前线上峰会,我们邀请了来自茶饮、宠物、花店等……微信团队推小程序代码加固功能降低代码泄漏风险站长之家(ChinaZ。com)8月23日消息:微信方面宣布,为了提高微信生态安全性,微信团队推出小程序代码加固功能,协助开发者保护小程序安全,更好的避免代码被反编译、算法被二……知识区UP主再出黑马,99年实习律师B站单月涨粉百万当一个人集罗翔(千万法律UP主)、张国伟(被跳高耽误的搞笑博主)和张伟(爱情公寓里的“废材律师”)的特点于一身,会发生什么?答案是在一个月里全网涨粉超过200万。这……直播电商的流量天花板与规模测算直播电商的天花板已经清晰可见。根据抖音官方数据,2019年1月,抖音日活跃用户超2。5亿,7月日活跃用户超3。2亿;2020年1月,日活跃用户超4亿,8月突破6亿;202……用好这3种小红书的内容模式,提高爆文可控率!以90后、95后为主的小红书用户,开始成为宝爸宝妈群体的主流,他们既是消费者也是小红书用户,这让小红书成为了母婴品牌做营销推广的重要阵地。在小红书平台搜索母婴关键词,会跳……白杨SEO:怎样做好视频号?垂直公众号怎么涨粉?免费到付费注前言:为什么分享这个?昨天下午直播了一个小时分享了,因为语速偏快,再加上有很多人没看到,所以写出来下。希望对没看过有些帮助。本文大纲:1、怎样做好视频号?2、……爆款预定!曝华为Mate50系列将推出素皮橙配色今日,数码博主旺仔百事通爆料,Mate50系列将会有一个类似Mate30系列的素皮橙配色。值得注意的是,这一配色在Mate30时期就非常受消费者青睐,如果这一消息属实,那么这一……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界