2022年度盘点更成熟的AI,更破圈的技术狂欢
内容一览:2022 年 AI 领域发展不断提速,新技术成果纷纷落地,模型迭代加速升级。本文总结了 2022 年 AI 领域各大公司的技术成就。
关键词:年终盘点 大厂 技术创新
2022 年在此起彼伏的咳嗽声中接近尾声,这一年,AIGC 成为人工智能领域最大黑马,ScienceAI 有了更多实际落地的应用,这一年我们经历了各大厂商缩减预算、裁撤员工,也体验了绝处逢生的技术狂欢……
今天,我们将通过这篇文章,与各位同行共同回顾 2022 年那些人工智能领域具有突破性意义的研发成果。
data2vec
语音、视觉及文本自监督学习的通用框架
发布机构:Meta AI
发布时间:2022 年 1 月
项目地址:
https://github.com/facebookresearch/fairseq/tree/main/examples/data2vec
data2vec 是一个大一统的多模态自监督学习模型,可以以较高的性能处理图像、文本、语音等任务。
12 月 16 日 data2vec 2.0 发布,与现有的计算机视觉自监督算法相比,相同精度下速度快了 16 倍。
data2vec 2.0 原理简介
AlphaCode
竞赛级别代码生成 AI
发布机构:DeepMind
发布时间:2022 年 2 月
项目地址:
https://github.com/deepmind/code_contests
AlphaCode 借助大型语言模型,依据问题的语言描述构建代码。在 Codeforces 挑战赛中,AlphaCode 击败了 46% 的参赛者。该研究不仅登上了 Science 封面,还被该杂志评入年度十大科学突破。
AlphaCode 概览
Dall·E 2
文本到图像的生成工具
发布机构:OpenAI
发布时间:2022 年 4 月
项目地址:https://openai.com/dall-e-2/
Dall·E 2 依据文本描述,可以创建更加具有现实主义色彩的艺术图像。与 OpenAI 2021 年发布的 Dall·E 相比,Dall·E 2 可以生成更真实、更准确的图像,且分辨率提高了 4 倍。
An astronaut riding a horse in a photorealistic styleDall·E 2 生成的图像示例
Gato
全能型智能体
发布机构:DeepMind
发布时间:2022 年 5 月
项目地址:
https://www.deepmind.com/blog/a-generalist-agent
Gato 是一个全能型智能体,可以玩雅达利游戏、对图像进行描述、聊天以及根据上下文决定输出文本、关节扭力或其他 token。
这种通用模型解决所有任务类似人工智能,最终或超过特定于专门领域的模型。
ESM Fold
蛋白质结构预测模型
发布机构:Meta AI
发布时间:2022 年 7 月
项目地址:
https://github.com/facebookresearch/esm
ESM Fold 是一个预测蛋白质序列的模型,能够直接进行高准确度、端对端、原子层级结构预测。它仅使用单个输入序列,只需查看单个蛋白质序列,这极大加快了推理速度。
用 ESM Fold 进行单序列结构预测
Make-A-Video
依据文本生成视频的 AI 系统
发布机构:MetaAI
发布时间:2022 年 9 月
项目地址:https://makeavideo.studio/
Make-A-Video 是一个文本-视频生成模型,它通过带有文字描述的图像,来学习常用的描述方式,同时使用无标签视频,了解和学习移动方式。
Make-A-Video 生成的视频风格多样,对文本还原度高,是生成短视频方面的 SOTA 模型。
依据文本描述生成视频的部分示例
改进矩阵乘法,提升计算速度
发布机构:DeepMind
发布时间:2022 年 10 月
项目地址:
https://github.com/deepmind/alphatensor
AlphaTensor 改进了目前最优的 4*4 矩阵乘法,并且进一步提升了其他 70 余种不同大小矩阵乘法计算速度。该成果登上了 Nature 封面,被 Scinece 杂志评入年度十大科学突破。
AlphaTensor 架构一览
Magic 3D
text-to-3D content 创建工具
发布机构:NVIDIA
发布时间:2022 年 11 月
项目地址:
https://deepimagination.cc/Magic3D/
NVIDIA 入局 AIGC,凭文字描述就可生成 3D Mesh 模型。它结合 image conditioning 技术以及基于文本提示的编辑方法,提供了一个控制 3D 合成的新思路,使得创建高质量 3D Mesh 模型成为可能。
Magic 3D 通过两个阶段创建 text-to-3D content
ChatGPT
超级对话模型
发布机构:OpenAI
发布时间:2022 年 11 月
项目地址:
https://openai.com/blog/chatgpt/
ChatGPT 的训练使用了 RLHF (Reinforcement Learning from Human Feedback),与 InstructGPT 使用的方法相同,仅在数据收集设置上有细微差别。
ChatGPT 可以像人类一样聊天交流,完成撰写邮件、视频脚本、文案、翻译及代码等任务。自上线以来,引起了海内外无数开发者的争相试用和热烈讨论,堪称 2022 年开发人员参与度最高的技术项目。
ChatGPT 训练过程概览
Point·E
依据文本描述生成 3D 点云
发布机构:OpenAI
发布时间:2022 年 12 月
项目地址:
https://github.com/openai/point-e
用 Point·E 依据文本提示生成 3D 点云的过程分为三个步骤:
1、依据文本提示,生成一个合成视图 (synthetic view)
2、依据合成视图,生成 coarse point cloud (1024 point)
3、基于低分辨率点云和合成视图,生成 fine point cloud (4096 Point)
利用 Point·E 单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力消耗时代。
冬去春来,畅想 2023
2022 即将画上句点,2023 注定是充满未知的一年,AIGC 领域会有哪些新成果?ScienceAI 将如何应对基础科学与 AI 交叉带来的挑战?芯片研发、国产操作系统,又会产生哪些新突破?
你对 2023 年人工智能领域的技术和应用有哪些预判,欢迎留言交流讨论~
老Z日志一晨诵燕草如碧丝,秦桑低绿枝当君怀归日,是妾肠断时春风不相识,何事入罗帷二从这两张照片中,看到了区别于皮囊的内心强大的美。三作家吴晓波说过每一件与众不同的绝世好东西,都是以无比的勤
又有多个省市公布养老金计发基数,补发养老金在即继黑龙江(5865元)上海(11396元)新疆(7089元)西藏(9900元)贵州(6798元)山西(6695元)河南(6355元)北京(11082元)山东(7183元)等省市公布
公众人物言行必须立法管理公众人物是指一定范围内拥有一定的社会地位,具有重要影响,为人们所广泛知晓和关注,并与社会公共利益密切相关的人物如领导人(高级官员)企业家科学家社会活动家影视明星体育明星高校教授各行
公众场合喂奶我错了吗实在忍不住说这些话,公众场合喂奶,为什么就会有这么多异样的眼光呢?!我小宝几个月,外出的时候,小宝宝饿了,没有哺乳间,我就找角落给宝宝喂奶,基本上都是拿一件外套遮住的,但是来来往往
侯耀华绯闻女徒弟现身爆料,与李易峰私交甚密,两人相约中秋后见饿了吗?戳右边关注我们,每天给您送上最新出炉的娱乐硬核大餐!9月15日,李易峰事件仍未平息,在这个节骨眼上,侯耀华的女徒弟安娜金现身爆料,言语中不难看出她与李易峰私交甚密。据悉,某
湾湾的巅峰对决blase湾湾爆料H湾ONE报警近日,随着李易峰被实锤,一个湾的网红出现在大家的视线中。这个叫湾的网红出现了很多个版本,有Blase湾湾湾Oneby湾blase湾湾等,随着吃瓜群众的加入,知名博主H湾成为了众矢之
深圳西部新一轮爆发来了,最大受益者是谁?原创刘博团队前两天,粤港澳大湾区又登上人民日报头版,内文特别提及,粤港澳大湾区以不到1的国土面积创造出全国12的经济总量。落实到具体数据,去年粤港澳大湾区实现经济总量约12。6万亿
高瓴A股900亿持仓曝光光伏龙头成心头好随着上市公司半年报收官,高瓴资本在A股的持仓也逐渐浮出水面。Wind数据显示,高瓴资本及其旗下子公司合计持股达179。43亿股,期末合计持仓市值超900亿元。中新经纬根据Wind不
再现暴跌,加仓应该怎么加?别怀疑,底部区域的暴跌,向来是加仓的好时机。目前的市场位置,不比2018年的大底,但也算是阶段的底部区域,有钱就加仓,没钱就继续抗。除了房地产银行酿酒煤炭等板块强势红盘外,个股跌多
三年挣了200万,副业赚钱有窍门本文首发每课小金库(IDmeike5678)关注我,学习更多理财技巧每课,伴您省心理财前几天,小每吃了一对网红夫妻的瓜。漂在北京的一位外卖小哥,经常通过短视频账号记录一些场景,如因
现在黄金还可以买?这就告诉你答案赠人玫瑰,手有余香,不管行情好坏,只需要简单的陪伴!个人风格偏稳健,不会重仓或者单押个别板块。且非常注重低吸布局,不会轻易追涨杀跌。目前在蚂蚁理财六年有余,如果觉得我的内容还不错,