一名多伦多大学的本科生在国际研究团队中充分运用深度学习寻找地外文明。 AI如今也加入到了寻找地外生命的行列。 研究人员已经开发出一种比寻找外星信号的传统方法更好的AI系统。从中得到的初步结果耐人寻味,吸引科学家们回到射电望远镜前再次观测。 这项近日发表于《自然天文学》上的研究介绍了AI技术在长期寻找地外智慧生物方面能发挥的关键作用。 该研究团队训练了一个AI来识别自然天体物理过程无法产生的信号。研究团队为它提供了一个由全球最大射电望远镜之一绿岸望远镜所采集的超大型数据集,该数据集的大小超过150TB。 该AI标记了2万多个相关信号,其中8个显示出被科学家称之为技术签名的迹象特征,例如可能向科学家提示存在另一个文明的射电信号。 面对越来越多来自射电望远镜的数据,必须有一种快速、有效的手段来整理这些数据。 而这正是该AI系统的用武之地。 这套系统由多伦多大学的本科生PeterMa创建。他与来自多伦多大学、加州大学伯克利分校和BreakthroughListen的专家组联合撰写了这篇论文,并且是该论文的主要作者之一。BreakthroughListen是一个寻找外星文明迹象的国际项目,于2015年启动。 自学编程的Ma在高中时开始对计算机科学产生兴趣。于是,他开始了一项大工程使用开源数据并解决包含未解之谜的大数据问题,尤其是机器学习领域。 Ma表示:我想要解决一个包含开源数据和许多未解之谜的大型科学问题,比如寻找外星人。 尽管最初面临着老师们的一些困惑和怀疑,但Ma在整个高中阶段和大一都致力于他的研究项目。在此过程中,他开始向其他人求助,并在识别地外文明信号方面得到了多伦多大学、加州大学伯克利分校和BreakthroughListen研究人员的帮助。 论文中描述的AI方法分为两步,可将信号分类为无线电干扰或潜在技术信号。 第一步是使用一个自动编码器来识别数据中的突出特征。该系统使用TensorFlowAPI构建,由加州大学伯克利分校的四颗NVIDIATITANXGPU加速。 第二步是将这些特征反馈给随机森林分类器,由该分类器决定一个信号是值得关注还是只是干扰。 该AI系统特别擅长识别存在非零漂移率的窄带信号。这些信号比自然现象更加集中和具体,表明它们的来源可能十分遥远。 另外,这些信号只出现在对天空某些区域的观测中,进一步证明了它们来自天体。 为了训练这个AI系统,Ma在实际数据中插入了模拟信号,让自动编码器学会它需要寻找什么。然后,研究人员向AI提供了150多TB来自绿岸望远镜480个观测小时的数据。 该AI识别了20515个相关信号,研究人员不得不人工检查这些信号。最终在这些信号中确定了8个具有技术签名、无法归入无线电干扰的信号。 研究人员随后再次用望远镜查看发出这8个信号的系,但却一无所获。 Ma表示:这8个信号看起来非常可疑,但我们用望远镜再次观察时没能再看到这些目标。自从开始采集数据以来,已经过去了差不多五到六年,但我们仍没有再次看到这些信号。所以我们只好随它去了。 由于没有真正来自地外文明的信号数据,研究人员不得不依靠模拟信号来训练他们的模型。他们表示,这可能导致该AI系统学习到根本不存在的人工信号。 尽管如此,该论文的共同作者之一CherryNg表示,研究团队非常清楚他们要寻找什么。 研究快速射电暴和脉冲星的Ng表示:我们已经在太空中检测到了像旅行者号这样的人类技术。Ng目前隶属于法国国家科学研究中心(CNRS)。 她表示:Peter的机器学习算法能够生成这些信号,但我们无法确定外星人是否可能发送过这些信号。 虽然还没有发现外星人,但这项研究显示了AI在SETI研究中的潜力以及分析大量数据的重要性。 Ma联想到这些成果可以让AI推动许多其他领域的进步:我们希望将这个搜索能力和算法扩展到其他类型的望远镜中。 这样就会有很多机会来了解AI能做什么。 Ng认为,尽管人类从1960年代就开始寻找外星人,但目前依然只有极小部分的银河系恒星被监测到。随着科技的进步,天文学家现在能够同时进行更多的观测并最大程度地提高他们的科学产出。 Ng解释说,即使是像绿岸数据这些已经采集到的数据,也还没有被完全检索过。 随着MeerKAT、甚大天线阵(VLA)、平方千米阵和新一代甚大天线阵(ngVLA)等新一代射电望远镜在寻找地外智慧生物的过程中采集到大量数据,使用AI克服巨大数据量所带来的种种挑战将变得越来越重要。 那么,我们会发现什么吗? Ma表示:我对人类在宇宙中是孤独的这一说法持怀疑态度。他指出,过去十年的研究突破表明我们的星球并不像我们曾经认为的那样独一无二。我们能否发现什么得靠科学和运气来验证,但我认为‘我们是孤独的’这种想法是非常天真的。 图片来源:美国国家航空和航天局、加州理工学院喷气推进实验室、SusanStolovy(SSC加州理工学院)等。