从神经网络到天体物理,还有什么是AI做不到的
如今,物理学、天文学实验所产生的海量信息是人类团队难以企及的。一些实验每天记录万亿字节的数据,并且不断累积增加。世界最大的射电望远镜项目SquareKilmeterArray预计在2020年开启,它每年产生的数据量将相当于整个互联网的总量。
爆发式的数据让科学家不得不求助AI。在人类输入最少的情况下,AI系统(比如人工神经网络,模仿大脑功能的计算机模拟神经元网络)可以挖掘海量数据、突出异常现象,并检测出人力永远无法发现的东西。
计算机应用于科学研究已经有75年历史,人类对自然数据的观察研究更是伴随着人类的发展史。但是,随着机器学习和AI的发展,科学研究的方法已经发生彻底的革新。其中一种方法称为生成模型(GenerativeModeling),对于观测数据的不同解释,它可以仅仅基于数据就辨别出最可信的理论。更重要的是,它不需要关于物理过程的预编程知识。生成模型的支持者认为它非常新颖,可以被视作研究宇宙的第三类方式。
传统上,人类通过观察来了解自然。想想十六世纪天文学家约翰尼斯开普勒正在仔细研究另一位同时期天文学家第谷布拉赫的行星位置图,开普勒最终推断出行星在椭圆轨道上运动。科学通过模拟而进步。天文学家模拟银河系及其邻近星系仙女座的运动,并预测它们将在几十亿年后发生碰撞。观察和模拟都有助于科学家产生假说,再通过进一步的观察来验证这些假说。但是,生成模型既不是观察也不是模拟。
从神经网络到天体物理,还有什么是AI做不到的?
天体物理学家KevinSchawinski(供职于苏黎世联邦理工学院)是生成模型的积极倡导者,他说:这是介于观察和模拟之间的第三类方法,是解决问题的另一种方式。
虽然一些科学家仍然把生成模型和其它新技术简单地看作是传统科学的补充工具。但大多数人都同意AI正在产生巨大的影响,它在科学研究中的作用必然会越来越大。费米实验室的天体物理学家BrianNord使用人工神经网络研究宇宙,他担心人类科学家所做的任何事情都可能实现计算机自动化这有点让人不寒而栗。
生成模型带来的发现
研究生时代,Schawinski就因数据驱动领域的成就而闻名。攻读博士期间,他需要根据星系的外观对它们进行分类。由于没有现成的软件可用,所以GalaxyZoo众包科学项目诞生了。从2007年开始,普通计算机用户通过猜测记录星系分类来帮助天文学家,服从多数原则一般可以得出正确的分类结果。这个项目无疑是成功的,只不过今时今日的AI技术使它显得过时了。现在,一个有机器学习和云计算背景的优秀科学家可以在一个下午就完成以上任务。
Schawinski在2016年转向强大的生成模型工具。本质上,在给定条件X的情况下,生成模型会询问观察到结果Y的可能性有多大。这种方法已被证明是非常有效且具有通用性。举个例子,假设你提供一组人脸图像给生成模型,并逐一标注年龄。当计算机程序梳理这些训练数据时,会把年长者面部和皱纹增加联系起来。最终,计算机可以根据面部判断年龄,也就是说,它可以通过给定的面部预测其经历的物理变化。
这些人脸都不是真的。A行和B列的人脸都是由GAN使用真实面部搭建元素来构建的。然后,GAN结合A行脸部的基本特征(包括性别、年龄、脸形)和B列更精细的脸部特征(例如发色、眼睛颜色),创造出上图中其它的人脸图像。
最著名的生成模型系统是生成式对抗网络(GAN)。在充分地暴露于训练数据之后,GAN可以修复已损坏或丢失像素的图像,它也可以使模糊的照片变得清晰。GAN通过博弈(术语称作对抗)来学习推断丢失的信息:网络的一部分(称为生成器)生成伪数据,而第二部分(判别器)试图对真伪数据进行区分。随着程序的运行,两个部分都逐渐演化提升。对于最近出现的一些超现实的、GAN制作的人脸,有文章评价道:这些计算机创造的诡异假脸跟真人没有分别。
更广泛地说,生成模型采用数据集(通常是图像),并将每个数据集分解为一组基本的抽象构建模块,科学家将其称为数据的隐空间。隐空间的概念是抽象的,很难将其视觉化,粗略地类比一下,当你试图确定人脸的性别时,想想你的大脑可能是怎么思考的,也许你会注意到发型、鼻子形状等等,还有的判断模式可能很难用文字表达。相似地,计算机程序也是在数据中寻找突出的特征:虽然它不知道什么是胡子,什么是性别,但如果它接受过数据集的训练,其中一些图像被贴上男人或女人的标签,一些图像被贴上胡子的标签,计算机会很快推演出它们之间的联系。
在与同事合著的一篇论文中,Schawinski利用生成模型研究了星系在演化过程中所经历的物理变化。模型创建了人工数据集,以此作为检验物理过程假设的方式。例如,恒星猝熄(恒星形成速度急剧下降)如何与星系环境密度增加相关联。
关键问题在于:有多少关于恒星和银河系的信息可以单独从数据中提取出来。Schawinski说:让我们抹掉所有关于天体物理学固有的知识。然后仅仅利用数据本身,能在多大程度上重新认知宇宙?
首先,星系图像被缩小到隐空间,然后,Schawinski可以调整空间的一个元素,使其对应星系环境的特定变化(比如周围的密度)。然后他可以重新生成星系,看看会有什么不同。Schawinski解释说:所以现在我有了一个假说生成机器。通过这个过程,我可以让原本处于低密度环境中的一整束星系看起来像处于高密度环境中。研究者发现,随着星系从低密度变为高密度环境,它们的颜色变得更红,恒星分布更集中。这与现有的星系观测结果相吻合。问题是为什么会这样。
对于这个过程,有两种可能的解释:也许星系在高密度环境中颜色更红,因为它们含有更多的尘埃,又或者是因为其范围内的恒星趋于衰退。有了生成模型,这两个想法都可以进行测试:改变隐空间中有关尘埃和恒星形成速率的元素,然后观察星系颜色的变化。结论很清楚,星系颜色更红的地方是恒星形成速率下降的地方,而不是尘埃发生改变的地方。
通过生成模型,天体物理学家可以研究星系从宇宙的低密度区域到高密度区域是如何变化的,以及是什么物理过程导致了这些变化。
该方法与传统的模拟有关,但存在关键差别。Schawinski说,模拟本质上是假设驱动的,对于某种宇宙现象,我首先假设一个可以解释它的物理原则,比如说我们对于暗物质、对于恒星形成都有一套理论假设,然后对照假设运行模拟操作,接着再思考:模拟是否符合现实?但是生成模型则不同,某种意义上来说,它与模拟完全相反。我们什么都不知道也不想做任何假设,只是让数据告诉我们可能会发生什么。
生成模型的成功应用当然不意味着天文学家要失业,但这也确实让我们思考,天体物理学研究多大程度上可以由智能系统完成。Schawinski表示,这不是完全自动化的科学,但它表明我们至少能够部分地构建工具使科学过程自动化。
生成模型显然是强大的,但它是否真正代表了一种新的科学方法仍有待商榷。DavidHogg是纽约大学的宇宙学家,它认为,这仍然只是从数据中抓取模型,数个世纪以来天文学家都是这样进行工作的,只不过如今的技术相当强大。换句话说,生成模型是一种先进的观察加分析的方式。Hogg自己的工作也严重依赖AI。他使用神经网络根据恒星的光谱对它们进行分类,并使用数据驱动模型来推断恒星的其它物理属性。但他不认为生成模型是另类方法。他说:只是科学家在如何使用数据方面变得更加老练了。特别是在比较数据方面比以前进步很多。但在我看来,我的工作仍处于观察模式。
勤劳的助手
无可否认,AI和神经网络显然已经在当代天文学和物理学研究中发挥了关键作用。海德堡理论研究所的物理学家KaiPolsterer领导着一个天文信息学小组,专注于以数据为中心的天体物理学新研究方法。最近,他们在使用机器学习算法从星系数据集中提取红移信息,这在以前是很艰巨的任务。
Polsterer将这些基于AI的新系统看作是勤劳的助手可以连续几个小时梳理数据,而不会感到厌烦或抱怨工作条件。他说,这些系统可以完成所有乏味的繁重工作,让你有时间进行有趣的科学研究。
但它们并不完美。特别是算法只能做受过训练的事情。系统对于输入信息是不可测的。给它一个星系,这个软件就可以估计它的红移和年龄,但是给它一个自拍照片,或者一张腐烂的鱼的照片,它也会输出一个(非常错误的)年龄。最后,人类科学家的监督仍然是至关重要的。于是问题最终还是回归研究人员你才是负责解读机器的人。
费米实验室的Nord警告说:神经网络输出的结果也会有误差。在科学上,如果你进行一项测量,却不报告误差估计,结果就没有意义。和许多AI研究者一样,Nord也关注神经网络输出结果的不可穿透性。通常情况下,系统会给出一个答案,但并不清楚该结果是如何获得的。然而,并非所有人都认为这是一个问题。法国CEASaclay理论物理研究所的研究员LenkaZdeborov指出,人类的直觉往往同样难以理解。你看着照片立刻认出了一只猫但你不知道自己是怎么知道的。从某种意义上说,人类大脑就是一个黑匣子。
不仅天体物理学家和宇宙学家正在向AI驱动、数据驱动的科学靠拢。滑铁卢大学的量子物理学家RogerMelko也利用神经网络解决了领域中一些最棘手、最重要的问题,比如:如何表示描述多粒子系统的波函数。Melko称AI是维度的指数诅咒,即波函数形式的可能性随着系统中粒子的数量呈指数增长。困难类似于尝试在国际象棋或围棋中下一步最好的棋:你试着下一步棋,想象你的对手会怎么下,然后选择最好的应对方式,但是每走一步,可能性的数量就会激增。
当然,AI系统已经掌握了这两种棋类游戏。20年前的国际象棋人类就输给了计算机;2016年,AI系统AlphaGo击败了顶尖的人类围棋手。Melko认为这种情况同样适用于量子物理中的问题。
机器的思维
对于AI系统,Schawinski认为这是第三类科学研究方法,Hogg则认为不过是传统观察分析法的高级版本,不管你支持哪种观点,有一点是肯定的,AI正在加速改变科学发现的概念。AI革命在科学领域能走多远?
偶尔,人们会对机器人科学家的成就大加赞扬。十年前,一位名叫Adam的AI机器人化学家研究了面包酵母的基因组,找出了哪些基因负责制造某些氨基酸。当时的新闻标题是:机器人独自做出科学发现。
最近,格拉斯哥大学化学家LeeCronin在用机器人随机混合化学物质,看看会形成什么样的新化合物。通过质谱仪、核磁共振仪和红外光谱仪实时监测反应,系统最终学会了预测哪种组合反应性最强。Cronin说,即使这不会带来进一步的发现,机器人系统也能让化学家们将研究速度提高约90。
去年,苏黎世理工的另一个科学家小组使用神经网络从数据集中推导出物理定律。他们的系统是一款机器人开普勒系统,从太阳和火星的位置记录中重新发现了太阳系的日心模型,并通过观察碰撞球发现了动量守恒定律。由于物理定律通常可以用不止一种方式来表达,研究人员想知道系统是否可以提供新的方式(也许是更简单的方式)来思考已知的定律。
这些都是AI启动科学发现过程的例子,虽然不同案例中AI的作用影响各有不同。也许最具争议的问题是,在数据爆炸的今天,单从数据中能收集到多少信息。计算机科学家JudeaPearl和科学作家DanaMackenzie断言,数据是极其愚蠢的。因果关系的问题永远不能单靠数据来回答。Schawinski也支持这种立场,他从未声称数据可以推演因果关系,而只是认为,我们可以比以往更多地利用数据。
另一个经常听到的论点是,科学需要创造力,而且至少到目前为止,我们不知道如何将创造力编程到机器中。物理学家KaiPolsterer说:除了理论和推理,我们还需要创造力只有人类才具有这项能力。创造力从何而来?Polsterer怀疑这与无聊有关,机器不会感到无聊。要想有创意,你必须讨厌无聊的感觉。另一方面,像创意和灵感这样的词经常被用来形容DeepBlue(战胜人类象棋手的计算机)和AlphaGo这样的智能程序。我们在试图描述计算机思想的时候,实际上是对自己大脑的映射。
Schawinski最近离开学术界去了私营部门。他现在经营着一家名为Modulos的创企,公司雇佣了一些ETH科学家,据其网站称,公司处在AI和机器学习发展的风口浪尖。不管当前AI技术和成熟的人工智慧之间存在什么障碍,Schawinski和同事们都认为机器已经可以接替越来越多人类科学家的工作。
Schawinski说:在可预见的未来,是否有可能利用生物硬件建造一台机器,它可以完成人类无法独立完成的物理、数学任务?科学的未来最终会不会因为计算机才达到人类难以企及的高度?我不知道。但这是个好问题。
放飞风筝,放飞梦想小学作文古诗云:草长莺飞二月天,拂堤杨柳醉春烟。儿童放学归来早,忙趁东风放纸鸢。是啊,春天阳光明媚,微风习习,是最适合放风筝的季节。不知何故,自小我就对放风筝没什么兴趣,其实原因……
有关中秋节的月亮作文600字4篇在日常的学习、工作、生活中,大家或多或少都会接触过作文吧,借助作文人们可以实现文化交流的目的。为了让您在写作文时更加简单方便,下面是小编为大家收集的中秋节的月亮作文600字4篇……
2021小学生下雪了日记200字范文下雪了日记(一)早晨醒来一看,外面的车和电话亭上面积满了雪,而地上却没有。还记的昨天牛耀威说:下雪了!其实昨天并没有下雪,只是他骗我们的,而今天却下雪了,他真是一位预言大……
我的健康暑假作文在平凡的学习、工作、生活中,大家都尝试过写作文吧,写作文是培养人们的观察力、联想力、想象力、思考力和记忆力的重要手段。你知道作文怎样才能写的好吗?下面是小编收集整理的我的健康暑……
有些人只能缅怀,有些事只能回忆恋人之间总会说很多无聊话,做一些无聊事,幸福就是有一个人陪你无聊,难得是你们两个都不觉得无聊。我不想要什么礼物,只是想,当我需要你时,你能在身边,当我说话时,你能用心听,……
有关母爱的记叙文500字爱,要学会回报:母爱是伟大的,母爱让我们有了生命,母爱让我们有的自信。下面是小编给大家带来的有关母爱的作文的内容,欢迎大家查看。篇一:妈妈是我最伟大的老师,一个充满慈爱和……
由一张老照片想到的五年级作文1937年8月28日,上海火车南站人头攒动,人们都拎着很多行李往火车站赶,都想快点上火车离开上海,躲到别的地方去。因为再过几个小时,日本鬼子的飞机就要来了!在避难的队伍中……
小学生我爱家乡的桃子作文1、我爱家乡的桃子我的家乡在湖北武汉,我更爱家乡的桃子。阳春三月,万物复苏了,桃树也不甘示弱,贪婪地吮吸着春天那清新、甜润的甘露,慢慢地长出一条条嫩嫰的枝条儿,露出……
整理我的家作文整理我的家作文1在一个星期六的下午,我写完作业,看到乱糟糟的家,心想这么乱的家,还不如猪圈!我应该打扫一下。首先,我把扫把拿来,从这个家的,扫到那个家,扫来扫去,扫……
火星发现的生命是由美国带上去的?据一位常青藤盟校的科学家称,美国宇航局可能已经用生命污染了火星。在这颗红色星球上发现的生命可能起源于美国宇航局的实验室,克里斯托弗梅森说。他在BBC的一篇文章中写道,当微生物到……
人类文明能持续多久?人类的命运掌握在谁的手里?世界上没有什么是永恒的。6600万年前,统治地球长达1。6亿年的恐龙灭绝,彻底消失在了地球上。当初这个种族占据了地球几乎每一个角落,可如今呢,它们早已经变成了一具具化石,……
中国的沙漠陨石在哪里?陨石种类有多少?一般来讲,陨石最容易出现在沙漠地区,像是我国的科研工作者就在中国北部和西部的沙漠地区发现了大量的陨石,而这些在沙漠中收集到的陨石有很大的研究价值。目前在我国沙漠陨石主要集……
3太阳系的诞生太阳系年龄大约是46亿年。通过观察衰变产物与仍然存在的初始物质比率,可以确定自天体形成以来已经过去了多少时间。为此最可靠的元素是铀和钍。对于铀来说,它的两种自然存在的主要……
初中作文人走茶凉六月十四日,考完后的天空亮了。从六月十二日起,备战了两天半,尽管我一再地暗示自己我能行,但心里仍充满了压抑。六月十四日上午十一点一过,考场热闹起来,毕竟,我们解放了。走进……
坚持到底,挑战自我作文无论是身处学校还是步入社会,大家一定都接触过作文吧,根据写作命题的特点,作文可以分为命题作文和非命题作文。那么你知道一篇好的作文该怎么写吗?以下是小编整理的坚持到底,挑战自我作……
我国又一颗新卫星成功升空,美专家中国已经成为了科技大国图为我国中星9B卫星发射画面据国内媒体报道,我国成功发射中星9B卫星,卫星现已经顺利进入预定轨道,卫星发射任务圆满成功。我国这些年发射卫星的速度越来越快,隔三差五地……
父爱是一本厚重的书作文父爱是一本厚重的书,承载着岁月的沧桑之痕。父爱是一条涓涓的细流,流转着自然的百转千回。父爱是我们生命中的启明星,永远照耀我们前进的道路,永远鞭策着我们要奋斗不息。然而我的父亲也……
逃离优秀作文800字篇一:逃离喧嚣生在尘世,生存,像一场紧盯着地面的捕食,盯久了,目光便会像鸡一样短浅、黏稠。当你的灵魂和体态因贪婪而臃肿丑陋时,是时候来一场逃离了,逃出这枷锁、这喧嚣。……
这颗奇怪的骨头状小行星可能诞生了它自己的卫星并非所有的小行星都是一样的。然而,有些人是如此不同,以至于他们已经正式越过界线,变得非常奇怪。一颗名为Kleopatra的小行星就是这种情况,否则通常会在火星和木星之间的……
卫星产业方兴未艾万亿太空经济中最亮的星卫星产业方兴未艾万亿太空经济中最亮的星科技创新世界潮本报记者刘霞美国卫星工业协会的最新报告称,2010年至2020年间,绕地球运行的卫星数量从958颗激……
一路上有你陪伴作文4篇篇一:一路上有你陪伴古人云:知书而达理。书不是一部交响乐,而只是一个音符。我看到了沧海桑田,风云变幻。,耄耋之年,读到的是豁达自然,年少之际,读到的是奋发向上。你就……
人生如树作文对于生于农村、长于农村的我来说,树木是最司空见惯的一种景物了。每家每户的房前屋后,街道两旁,农田周围,沁河堤上hellip;hellip;都种着许多不同种类的树。在乡村学……
寻找宜居星球,认准水沝淼周一知古通今周二牧夫专栏周三视频天象周四观测指南周五深空探测周六茶余星话周日太空探索翻译:王婧彧校对:韩佳安张砚斌审阅:涂天宇美编:杨伯顺……
中国诺奖揭晓4位科学家获奖发现SARS病原体以及由动物到人的传染链,为人类应对MERS和COVID19冠状病毒引起的传染病产生了重大影响;通过调控激光与物质相互作用产生精确可控的超短脉冲快电子束,并将其……