范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

小乐数学科普大数据如何将图论带入新维度译自量子杂志

  作者:Stephen Ornes 2021-8-19 译者:zzllrr小乐 2021-8-20
  研究人员正在转向高阶相互作用的数学,以更好地模拟数据中的复杂连接。
  图论是不足够的。
  讨论连接的数学语言通常取决于网络——顶点(点)和边(连接它们的线)——至少自 18 世纪以来一直是模拟现实世界现象的宝贵方法。但几十年前,巨大数据集的出现迫使研究人员扩展他们的工具箱,同时也为他们提供了广阔的沙盒,可以在其中应用新的数学见解。科罗拉多大学博尔德分校的计算机科学家 Josh Grochow 说,从那时起,随着研究人员开发了新型网络模型,可以在大数据的噪声中找到复杂的结构和信号,经历了一个令人兴奋的快速增长时期。
  Grochow 是越来越多的研究人员之一,他们指出在大数据中寻找联系时,图论有其局限性。图将每一种关系表示为二元组或成对的交互。然而,许多复杂的系统不能单独用二元连接来表示。该领域的最新进展显示了如何向前发展。
  考虑尝试建立一个育儿网络模型。显然,每个父母都与孩子有联系,但养育关系不仅仅是这两个联系的总和,因为图论可能会对其进行建模。尝试模拟同行压力等现象也是如此。
  "有很多直观的模型。德国亚琛工业大学(RWTH Aachen University)的 Leonie Neuhäuser 说,只有当你的数据中已经有群体时,才能捕捉到同行压力对社会动态的影响。但是二元网络不能捕捉群体影响。
  数学家和计算机科学家使用术语"高阶相互作用"(higher-order interactions) 来描述这些复杂的方式,即群体动力学而不是二元联系可以影响个体行为。从量子力学中的纠缠相互作用到疾病在人群中传播的轨迹,这些数学现象无处不在。例如,如果药理学家想要模拟药物相互作用,图论可能会显示两种药物如何相互反应——但三种药物呢?或四个呢?
  虽然探索这些相互作用的工具并不新鲜,但直到最近几年,高维数据集才成为探索的引擎,为数学家和网络理论家提供了新的思路。这些努力已经产生了关于图的限制和扩展的可能性的有趣结果。
  "现在我们知道网络只是事物的影子,"Grochow 说。如果数据集具有复杂的底层结构,那么将其建模为图形可能只能揭示整个故事的有限投影。
  太平洋西北国家实验室的 Emilie Purvine 对超图等工具在绘制数据点之间更微妙的联系方面的强大功能感到兴奋。
  太平洋西北国家实验室的数学家 Emilie Purvine 说:"我们已经意识到,我们用来研究事物的数据结构,从数学的角度来看,并不完全符合我们在数据中看到的情况。"
  这就是为什么数学家、计算机科学家和其他研究人员越来越关注如何推广图论——以它的多种形式——来探索高阶现象。过去几年提出了大量建议的方法来表征这些相互作用,并在高维数据集中用数学方法验证它们。
  对于 Purvine 来说,高阶相互作用的数学探索就像是新维度的映射。 "将图视为二维土地的基础,"她说。可以登上顶部的三维建筑可能会有很大差异。 "当你在地面上时,它们看起来是一样的,但你在上面建造的东西却不同。"
  进入超图
  寻找那些更高维的结构是数学变得特别模糊和有趣的地方。例如,图的高阶类似物称为超图,它具有"超边"而不是边。这些可以连接多个节点,这意味着它可以表示多路(或多线性)关系。超边可能会被视为一个表面,而不是一条线,就像在三个或更多地方固定的防水布一样。
  这很好,但我们仍然不知道这些结构与传统结构的关系。数学家目前正在研究哪些图论规则也适用于高阶交互,这表明了新的探索领域。
  为了说明超图可以从大数据集(而普通图不能)中梳理出的关系类型,Purvine 举了一个身边的简单例子,即科学出版界。想象两个数据集,每个数据集包含最多由三位数学家共同撰写的论文;为简单起见,我们将它们命名为 A、B 和 C。 一个数据集包含六篇论文,三个不同的两人组(AB、AC 和 BC)各有两篇论文。另一个数据集总共只包含两篇论文,每篇论文都由三位数学家 (ABC) 共同撰写。
  来自任一数据集的共同作者的图形表示可能看起来像一个三角形,表明每个数学家(三个节点)都与其他两个(三个链接)合作过。 Purvine 说,如果你唯一的问题是谁与谁合作,那么你就不需要超图了
  但是如果你有一个超图,你也可以回答关于不太明显的结构的问题。例如,第一个数据集的超图(有六篇论文)可以包括显示每个数学家贡献四篇论文的超边。两个数据集的超图的比较表明,论文的作者在第一个数据集中不同,但在第二个数据集中相同。
  野外的超图
  这种高阶方法已经被证明在应用研究中很有用,例如当生态学家展示了 1990 年代将狼重新引入黄石国家公园时,如何引发生物多样性和食物链结构的变化。在最近的一篇论文中,Purvine 和她的同事分析了一个对病毒感染的生物学反应的数据库,使用超图来识别所涉及的最关键的基因。他们还展示了图论提供的通常的成对分析是如何忽略这些相互作用的。
  "这就是我们从超图中看到的那种超越图形的力量,"Purvine 说。
  康奈尔大学的Austin Benson
  最近,康奈尔大学的Austin Benson 使用高阶马尔可夫链和张量帮助模拟了纽约市的出租车行程。 结果比传统的马尔可夫链好,但仍可改进。
  然而,从图泛化到超图很快变得复杂。说明这一点的一种方法是考虑图论中的规范切割问题,该问题询问:给定图上的两个不同节点,完全切断两者之间的所有连接,你可以切割的最小边数是多少?许多算法可以很容易地找到给定图的最佳切割次数。
  但是如何切割超图呢?康奈尔大学的数学家 Austin Benson 说:"有很多方法可以将这种切割概念推广到超图。"但是没有一个明确的解决方案,他说,因为可以通过各种方式切断超边,从而创建新的节点组。
  Benson 最近与两位同事一起尝试将分割超图的所有不同方法形式化。他们的发现暗示了各种计算复杂性:在某些情况下,问题很容易在多项式时间内解决,这基本上意味着计算机可以在合理的时间内处理解决方案。但对其他人来说,这个问题基本上是无法解决的——根本不可能确定是否存在解决方案。
  "那里仍有许多悬而未决的问题,"Benson 说。 "其中一些不可能的结果很有趣,因为你不可能将它们简化为图。在理论方面,如果你还没有把它简化成你可以用图找到的东西,它就会向你表明那里有一些新东西。"
  数学三明治
  但是超图并不是探索高阶交互的唯一方法。拓扑——对在拉伸、压缩或以其他方式变换对象时不会改变的几何属性的数学研究——提供了一种更直观的方法。当拓扑学家研究网络时,他们会寻找形状、表面和尺寸。他们可能会注意到连接两个节点的边是一维的,并询问不同网络中一维对象的属性。或者他们可能会看到由三个节点连接而成的二维三角形表面并提出类似的问题。
  拓扑学家称这些结构为单(纯)复形(simplicial complexes)。这些实际上是通过拓扑框架查看的超图。神经网络属于机器学习的一般类别,提供了一个很有说服力的例子。它们由旨在模拟我们大脑神经元如何处理信息的算法驱动。图神经网络 (GNN) 将事物之间的连接建模为成对连接,擅长推断大型数据集中缺失的数据,但与其他应用程序一样,它们可能会错过仅由三个或更多组产生的交互。近年来,计算机科学家开发了单纯神经网络(simplicial neural networks),它使用高阶复数推广 GNN 的方法来探索这些影响。
  单纯复形将拓扑学与图论联系起来,并且像超图一样,它们提出了令人信服的数学问题,这将推动未来的研究。例如,在拓扑学中,单纯复形的特殊子集本身也是单纯复形,因此具有相同的性质。如果超图也是如此,则子集将包括其中的所有超边——包括所有嵌入的双向边。
  但情况并非总是如此。 "我们现在看到的是,数据落入了这个中间地带,在这个中间地带,并非每个超边,不是每个复杂的交互,都与其他所有交互的大小相同,"Purvine 说。 "你可以进行三向交互,但不能进行成对交互。"大数据集清楚地表明,无论是在生物信号网络中还是在同行压力等社会行为中,群体影响力往往远远超过个人的影响力。
  Purvine 将数据描述为一种数学三明治的中间填充,上面受这些拓扑思想的约束,下面受图的限制。网络理论家现在面临着寻找高阶相互作用的新规则的挑战。她说,对于数学家来说,"还有发挥的空间。"
  随机游走和矩阵
  这种创造性的"游戏"感也延伸到其他工具。 Benson 说,图和其他用于描述数据的工具之间存在着各种美妙的联系。 "但是一旦你进入更高阶的设置,这些联系就更难获得了。"
  他说,当你尝试考虑马尔可夫链的高维版本时,这一点尤其明显。马尔可夫链描述了一个多阶段过程,其中下一阶段仅取决于元素的当前位置;研究人员使用马尔可夫模型来描述信息、能量甚至资金等事物如何在系统中流动。也许马尔可夫链最著名的例子是随机游走,它描述了一条路径,其中每一步都是从前一步随机确定的。随机游走也是一个特定的图:沿着图的任何游走都可以显示为沿着链接从一个节点移动到另一个节点的序列。
  但是如何扩大像散步这样简单的事情呢?研究人员转向高阶马尔可夫链,它不仅取决于当前位置,还可以考虑许多以前的状态。事实证明,这种方法可用于对网络浏览行为和机场交通流量等系统进行建模。 Benson 有其他扩展方法的想法:他和他的同事最近描述了一种用于随机或随机过程的新模型,该模型将高阶马尔可夫链与另一种称为张量的工具相结合。他们针对纽约市的出租车乘坐数据集对其进行了测试,以了解其预测轨迹的能力。结果喜忧参半:他们的模型比通常的马尔可夫链更好地预测了出租车的运动,但两种模型都不太可靠。
  张量(Tensor)本身代表了另一种研究近年来已经出现的高阶相互作用的工具。要理解张量,首先要考虑矩阵,它将数据组织成行和列的数组。现在想象一下由矩阵组成的矩阵,或者矩阵不仅具有行和列,还具有数据的深度或其他维度。这些是张量。如果每个矩阵都对应于一个音乐二重奏,那么张量将包括所有可能的乐器配置。
  张量对物理学家来说并不是什么新鲜事,他们长期以来一直使用它们来描述例如粒子的不同可能量子态,但网络理论家采用这种工具来扩展矩阵在高维数据集中的能力。数学家们正在使用它们来解决新的问题。 Grochow 使用张量来研究同构问题,它本质上是问你如何知道两个对象在某种程度上是否相同。他最近与乔有明(Youming Qiao)的合作产生了一种新方法来识别可能难以或不可能解决的复杂问题。
  如何负责任地做超图
  Benson 不确定的出租车模型提出了一个普遍的问题:研究人员何时真正需要像超图这样的工具?在许多情况下,在合适的条件下,超图将提供与图完全相同类型的预测和分析。 "如果某些东西已经封装在网络中,那么真的有必要将系统建模为高阶吗?"亚琛工业大学的 Michael Schaub 问道​。
  他说,这取决于数据集。 "图是社交网络的一个很好的抽象,但社交网络远不止这些。对于高阶系统,有更多的建模方法。"例如,图论可能会显示个人之间的联系,但无法捕捉社交媒体上的朋友群如何影响彼此的行为。
  不会在每个数据集中都出现相同的高阶相互作用,所以奇怪的是,新理论是由数据驱动的——这挑战了最初将 Purvine 吸引到该领域的潜在逻辑意义。 "我喜欢数学的地方在于它以逻辑为基础,如果你遵循正确的方向,你就会得到正确的答案。 但有时,当你定义全新的数学领域时,正确的做法是主观的,"她说。 "如果你不承认有多种方法可以做到这一点,你可能会把社区推向错误的方向。"
  Grochow 说,最终,这些工具代表了一种自由,不仅能让研究人员更好地理解他们的数据,还能让数学家和计算机科学家探索新的可能性世界。 "有无穷无尽的东西可以探索。 它既有趣又美丽,并且是许多重要问题的来源。"

火星上发现液态湖泊,有望从中找到外星生物7月5日,美国科学家发表了关于火星的最新研究成果。他们用火星卫星的雷达,在火星南极地下发现了几十个疑似液态水的湖泊。尽管早在2018年7月25日,人们就首次发现了火星南极可能存在着浅谈阴阳五行今天讲讲中医理论的核心阴阳五行,理解阴阳五行说容易也容易,说难也难。重点在哪?重点在一定要明白气为何物,一定要明白生命高于物质,一定要了解生命的象征气的存在。这个气现代人西化教育下天降祥瑞,南京济南多地出现并蒂莲奇观近日,南京下马坊遗址公园发现了一株并蒂睡莲,引得市民们纷纷围观于此同时,济南大明湖雨荷厅也出现了珍稀的并蒂莲。并蒂莲,一蒂两花,自古被视作祥瑞之兆,浪漫的古人曾用青荷盖绿水,芙蓉披天安门放飞10万只和平鸽,关于它们的知识全在这里7月1日上午,庆祝中国共产党成立100周年大会在天安门广场隆重举行。这次庆典的其中一个流程,放飞10万只象征着和平的白鸽,着实吸引人眼球。在我国的重大庆典上,放飞和平鸽是一项常见的为什么在太空行走前,要进行肺功能测试还要吸入几小时纯氧?7月4日,中国航天员刘伯明汤洪波成功完成了长达7小时的出舱任务,实现了我国航天史上又一次壮举。其中,刘伯明在出舱前参加肺部能力测试的视频,引起了人们的热议。很多人好奇,为什么航天员一场颜值的胜利大熊猫如何从濒危到易危7月7日上午,生态环境部自然生态保护司司长崔书红在介绍我国生态保护成就时称,我国野外大熊猫的数量已经超过1800只,受威胁的程度已经由濒危降级为易危。其实这不算什么新闻,早在201英国陆军将于2027年推出升级主战坦克莱茵梅塔尔BAE系统公司(RBSL)从国防部获得了8亿GB(11亿美元)的合同,将英国陆军的148辆挑战者2主战坦克升级为挑战者3规格。工程将于今年开始,升级后的坦克预计将于202中资收购英国最大晶圆制造商交易面临审查英国首相鲍里斯约翰逊(BorisJohnson)周三表示,英国政府将以国家安全为由,对一家中资所有的公司收购英国最大硅晶圆制造商的交易进行调查。英国政府一直在设法阻止中资公司获取英芯片制造商被我国收购,英国却未曾阻拦,只因现在干预不适合?因为美国的打压,我国芯片正面临卡脖子情况,不仅无法从国外进口先进芯片,就连光刻机都求购无门,因为美方在全球都下达了禁令。为此我国只能靠自己研发,但因为没有足够的技术经验,再加上光刻你见过在海面悬浮的船吗?30张罕见的趣图让人大开眼界大卫莫里斯在康沃尔郡法尔茅斯附近散步时拍了一张浮船的照片。这种罕见的现象是海市蜃楼,当冷空气位于暖空气之上并将光线向下弯曲时就会发生。大自然惊人的伪装不是每天都能看到山猫带着鲨鱼离美国海军将放弃研究电磁轨道炮美国海军推动制造价值5亿美元的电磁轨道炮武器能够以高超音速投掷射弹似乎已经结束。该服务正在结束对轨道炮的资助,电磁轨道炮明显不同于传统的火炮大炮和榴弹炮。普通枪支利用点燃的火药装药
作家莫言我和同学老师饿了吃煤块,越咀嚼越香我在发表了看了莫言的演讲,我有点不屑活该被骂一文后,网友思考着思考着给我写信,他自称余汉国,是莫言的高密同乡,生于1948年,比莫言还大上几岁。余汉国说我也是从那个年代过来的,是有郑军难以置信,科幻正在走向反科学思潮1,作为科幻作家,您从小就喜欢写作吗?为什么选择这一领域作为写作内容?郑军答我从初中就开始写,但都没写完,弄个开头就放下了。真正从头到尾完成一部作品还是256岁的事。至于为什么选择我打算改网名为怀疑探索者莫言看见收到那个东西,我被吓坏了。中午时分突噩耗,陈年老贴已化烟。个人抒发胸中意,原来文艺也堪险。巨头大脸如满月,区区小民胆惊颤。不言默语最适宜,点头哈腰抱大腕。睁眼下午一点半,肚子饿张文宏是网红医生,却从来没有带过货张文宏医生最近遇上了大麻烦。这可能导致他全面的隐退。就在昨天,主流媒体的一位负责人在群里面转发了一则消息,对张文宏极为不利。那就是1998年他的博士论文出现了三处重叠。该结论还没有心理医生邪教给人洗脑分六个步骤笔者是医院的一名心理医生,也是反邪教协会的心理顾问,长期在基层为那些被邪教蛊惑人员进行心理治疗,帮助他们摆脱邪教的心理阴影。第一步制造亲密关系第二步勾起内心的欲望第三步造神第四步输喜爱宇宙和航天的普通人,可以考虑加入这些太空组织理论派和器材党科学爱好者中很少有对宇宙和天文学不感兴趣的。对宇宙和天文学感兴趣的人,主要分为两派一派为理论派,一派为器材党。理论派,主要是没有经常使用天文望远镜直接观察星空。当然,提醒请勿将我的文章转载到公众号再擅自转载,请支付律师费。我不会让您赔偿我一分钱,但律师费您得出。这些年来,不经过我本人的同意,有很多朋友将我的文章转载到公众号。结果就是每当我发送自己的文章时,已经加不了原创。我民科丢的是中国人的脸?近日,李子丰事件又上了热搜。不出所料的是,很多网民几乎一面倒的对李子丰表达了同情,国民科学素养确实让人忧心忡忡。这个李子丰是一混迹各大论坛的著名民科,曾经在几年前威震相对论学术研讨中国人的审美观为啥认为黑人不漂亮?看完涨知识了本人尊重世界上所有的人,认为人格都是平等的,品质没有优劣之分。仅从生物科学的角度解释,不涉及其他社会因素。大体而言,在中国人的审美观里面,无论是以男子或者女子的审美眼光来看,第一喜四大发明虽诞生在中国,但最大受益者却不是中国人(作者刘亚东,科技日报总编辑,范长江新闻奖获得者。本文为节选。)而事实上,更值得我们关注和研讨的是,四大发明虽然诞生在中国,但其最直接和最大的受益者却不是中国人!活字印刷拿活字印刷盘点吴京三部最能打的动作片,第三部直接成就了吴京吴京现在作为华语娱乐圈的领军人物,已经成为了票房保证,一部战狼2直接奠定了他人民艺术家的历史地位。而吴京就是以动作片起家的,本身是有功夫傍身的。那么今天小编就给大家盘点一下,吴京三