范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

深度剖析基于LAMOST数据与机器学习方法测定大样本恒星年龄

  引 言
  星系 是构成宇宙的基本单元, 银河系 是我们目前唯一能进行详细解剖的星系。 对银河系结构和形成历史的研究是我们理解星系的基础。年龄是研究银河系目前结构和形成历史最重要的基本参数之一。  对银河系目前结构和形成历史的描述,需要对分布在整个银河系的大量恒星样本进行准确的质量和年龄估计。
  通过恒星的光谱,我们可以得到恒星的视向速度和一些恒星参数。但是恒星的年龄一般难以通过直接测量的方法得到,通常采用观测得到的数据与恒星演化模型进行匹配的方式得到,例如 等年龄线方法 。等年龄线方法对于星团可以获得较高精度的年龄,但是对于场星 通常还需要距离、红化等参数 ,其获得的年龄精度较低。也有人发现 碳和氮的丰度与巨星的年龄 之间存在一定的联系,并尝试用其来预测巨星的年龄,但是结果不确定性依然较高。 星震学目前是预测恒星质量和年龄的有效方法,  对单颗恒星进行预测的精度很高,但需要高精度长时间的测光观测,因此目前样本较少,导致该方法难以广泛适用。还有人发现类太阳恒星的年龄与其表面自转具有相关性,并用星震学数据对其进行了详细研究。
  目前虽然对恒星年龄进行预测的方法有很多,但其精度和效率 仍有待提高 ,因此还需要利用大数据获取更多的样本,尝试更多的方法来 提高恒星年龄预测的精度和效率  ,从而更有效地探索银河系的动力学演化。
  1 数 据1.1 交叉匹配
  Xiang等提供了LAMOST巡天数据中8,162,566颗带有化学丰度的恒星,其化学丰度由DD-Payne模型导出。在我们的实验中通过这个星表来获取恒星的化学丰度。
  Ting 等筛选出了LAMOST巡天数据中的175,202颗红团簇星,并且还附带了 P和 ν这两个星震学参数,其通过恒星光谱获得。我们通过这个星表来获取红团簇星样本,并再通过新方法测定年龄。
  Pinsonneault等提供了6,676颗恒星的年龄,其年龄使用质量、半径、[Fe/H]和[α/Fe]这4个参数从模型中导出,我们用这个星表中的年龄作为参考年龄来训练自己的模型。
  通过上述的三个星表来进行交叉匹配,在删除掉具有空缺值的样本之后,一共获得了1,806颗具有化学丰度、星震学参数以及年龄信息的红团簇星。
  1.2 样本筛选
  将交叉匹配得到的这批样本按照顺序进行轮流放回抽样,每次抽出一颗恒星,然后使用随机森林(Random Forest)将化学丰度和星震学参数作为输入参数对未被抽到的所有恒星进行模型训练,接着对被抽中的恒星进行一次年龄预测,如果其预测的绝对误差小于3 Gyr并且相对误差小于40%,则将其挑选出来。在经过上述过程之后一共筛选出了1,384颗红团簇星作为高质量训练样本。
  2 方 法
  本文所使用的机器学习方法源于Scikit-learn,Scikit-learn也简称sklearn,是机器学习领域当中知名的Python模块之一。它所包含的机器学习方法主要可以分为六大类: 分类(Classification)、回归(Regression)、聚类(Clustering)、数据降维(Dimensionality Reduction)、模型选择(Model Selection)、数据预处理(Preprocessing) 。
  2.1 训练集和测试集
  在正式开始对恒星年龄进行预测之前,首先将筛选出来1,384颗红团簇星分为训练集和测试集, 训练集用于训练模型,测试集用于进行对照验证 ,由此来对我们所构建模型的预测性能进行评估。对于划分的方案我们进行过多种考虑,虽然随机取样不失为一种便捷的好方法,但是鉴于其具有一定的不确定性,为了保证训练集和测试集各个参数的均匀分布,我们最终决定采用以下的方法来对训练集与测试集进行划分: 筛选出来的样本中包含恒星年龄和其他19个恒星参数,首先对第一个参数进行从小到大的排序,然后将其按照恒星的数目尽量等分为34个网格,然后取出每个网格中当前所排序的那个参数所对应数值最小的红团簇星,将其加入测试集。接着再对下一个参数进行同样的操作,直到对20个参数都完成了抽样。所有被抽到的红团簇星作为测试集,没有被抽到的作为训练集  。
  这种取样方法可以保证训练集与测试集样本数量尽量均分,更重要的是它保证了训练集和测试集所有参数在数值上分布均匀,这种合理分配数据的方法有利于提高机器学习的精确性,便于我们在科学研究中对模型的训练。
  2.2 训练模型
  在划分完训练集和测试集后,我们尝试使用核主成分分析(KPCA)结合随机森林的方法来对训练集训练模型,然后使用训练的模型对测试集的恒星年龄进行预测,通过比较预测值与参考值的拟合程度,我们将从众多模型中挑选出一个较好的来作为我们的最终预测模型。
  首先将19个恒星参数作为输入参数,为了消除不同恒星参数之间的量纲差异我们对其进行了标准化,然后再将核主成分分析所导出的主成分作为随机森林的输入参数来对恒星年龄进行拟合。在这里主要探究核主成分分析所导出的主成分数与模型的预测精度之间的关系。
  从中可以发现一个规律:当主成分数较少时,训练集和测试集的平均相对误差都随着主成分数的增加而降低;在当主成分数达到4之后,其平均相对误差的值基本上均趋于稳定。
  3 结 果
  首先,针对于测试集的预测值与原有的星震学样本的数值,对最终模型的预测结果进行分析。 展示了对恒星年龄的预测值与原来的数值之间的差异,弥散为0.72,其较好的拟合程度对我们所构建模型的正确性提供了支撑;可以看出绝对误差随着年龄的增大而逐渐增大,但绝大部分都处于1 Gyr以下。
  其次,我们将Xiang 等的星表与Ting 等的星表进行交叉匹配,获得了163,105颗具有化学丰度和星震学参数但是没有年龄标签的红团簇星,我们把之前经过样本筛选的1,384颗红团簇星用来训练我们的最终预测模型,然后对这163,105颗红团簇星进行了年龄预测,并描绘出了它们在银河系上的分布 ,可以明显地看出年轻的恒星主要都分布在低银纬地区,这也比较符我们的预期,因为银河因为银河系盘附近是主要的恒星形成区 。
  4 结论
  年龄是研究银河系结构与演化历史基本参数。在这篇文章中,我们使用了核主成分分析结合随机森林的机器学习方法对163,105颗红团簇星进行了恒星年龄预测。在训练模型的过程中,我们探究了核主成分分析所导出的主成分数与模型预测精度的关系。 我们发现当主成分数到达4之后,模型的预测性能开始趋于稳定;测试集显示年龄预测的弥散为0.72;绝对误差的平均值为0.46 Gyr,中位值为0.25 Gyr;相对误差的平均值为13%,中位值为8% 。之后,我们绘制了163,105颗红团簇星在银河系上的分布, 发现年轻的恒星主要分布在低银纬地区,这与当前银河系结构图像一致。
  这篇文章是我们针对大样本恒星年龄测定,在技术与方法论上的一次探索。将来我们会进一步改进方法如 :尝试对与恒星质量和年龄具有高度相关性的恒星参数进行提取,探究多种机器学习方法的预测性能,以及凸包算法的参与, 但不会使用核主成分分析,因为经过核主成分分析之后的数据我们无法进行物理解释。在之后的工作中我们还将尝试更多的机器学习方法来对各种类型的恒星进行测试,包括恒星类型的分类,恒星参数的测定以及恒星质量和恒星年龄的预测等,期待我们未来会有更多的工作展示。
  参考文献
  [1] WANG H F, LIU C, XU Y, et al. Mapping the Milky Way with LAMOST -III. Complicated spatial structure in the outer disc[J]. Monthly Notices of the Royal Astronomical Society, 2018, 478(3):3367-3379.
  [2] ZHANG B, LI J, YANG F, et al. Self-consistent stellar radial velocities from LAMOST Medium-resolution Survey DR7[J]. The Astrophysical Journal Supplement Series, 2021, 256(1):14.
  [3] ZHANG B, LIU C, DENG L C. Deriving the stellar labels of LAMOST spectra with Stellar LAbel Machine (SLAM)[J]. The Astrophysical Journal Supplement Series, 2020, 246(1):9.
  [4] SODERBLOM D R. The ages of stars[J]. Annual Reviews of Astronomy & Astrophysics, 2010, 48(1):581-629.
  [5] XIANG M S, LIU X W, SHI J R, et al. Ages and masses of million Galactic disk main sequence turn-off and sub-giant stars from the LAMOST Galactic spectroscopic surveys[J]. The Astrophysical Journal Supplement Series, 2017, 232(1):2.

贾静雯别再卖少女人设了,离了滤镜,蜡黄的皮肤和皱纹出卖了她滤镜不断都是一个十分神奇的东西。如今很多人拍照根本上都要靠美颜相机或者是滤镜才行呢,由于它会给人自动补妆看起来十分的有气色,有时分你不化装用一个美颜相机看起来就和化了妆一样的。但是OK组合VS艾弗森的总冠军赛季,科比奥尼尔旗鼓相当?用事实说话提到NBA历史上最强二人组,OK组合应该排名前列。OK组合获得过三连冠,这期间的大鲨鱼正处于个人最巅峰时刻,所展现的统治力是历史级别的,而科比则快速成长,在争冠中同样发挥了巨大的作曾凡博出场时间创新高得5分4篮板2助攻点燃队三分险胜国王北京时间11月29日0600,20212022赛季NBA发展联盟常规赛,点燃队114111战胜斯托克顿国王队。中国球员曾凡博出场19分钟创个人出场时间新高,得到5分4个篮板,还有2通过这7个步骤,来实现一次完美的背包旅行背包客必备知识每一个背包客最初的徒步准备工作都不会很完美,几乎都是犯了所有可能犯的错误。但随着时间的推移,活动次数的增加,徒步计划技能都会提高,会不断增加旅行的安全度,提高旅行的质量,并积累更多恒大新帅带队中超首秀时间敲定,曾被三顾茅庐邀请,如今终于如愿日前,中国足协官宣确认中超第二阶段联赛,将在12月12日开打。其中广州队将在12月13日,迎来北京国安的挑战。届时不出意外的话,广州队对阵国安的比赛,就将成为新帅郑智带队正赛首秀。广东男篮拜年!赵睿正式亮相,外援狂飙中文,阿联压轴出场北京时间1月31日,除夕至,新春到!广东东莞大益男篮全体将士给各位拜年视频,吸引众多媒体和球迷的关注。主教练杜锋祝广东的球迷朋友,虎虎生威,心想事成。总经理朱芳雨大家好,在这里祝福6位有望夺冠的冬奥明星谷爱凌身价攀升,羽生结弦热衷整理国旗冬奥明星私下萌点武大靖胆小不敢蹦极,羽生结弦金博洋惺惺相惜引言。冰雪2022北京冬奥会开幕在即,观众们都在期待自己喜欢的运动员能否如愿拿到奖牌。在这些参加北京冬奥会的运动员中,有6保罗狂轰20819无缘今日最佳球员?因为唐斯打出赛季最佳一战今天是中国的除夕大年夜,NBA也有多场精彩的比赛,东契奇蒙克特雷杨约基奇保罗康宁汉姆布克等人打出了精彩的表现,但是要评选今日最佳球员的话,还是毫无悬念的。我们一起来看一下具体情况吧宝藏男孩宁忠岩,打破场地纪录夺冠,期待首次北京冬奥之旅2019年12月,相信全中国的速滑迷们都不会忘记这个日子。速度滑冰世界杯的金牌,阔别数年,重新回到了中国。时隔56年,中国战士重回战场。而摘取这块金牌的中国小将惊艳了赛场的所有人。北京冬奥会舒心连心安心美英冰壶运动员北京冬奥会初印象来源新华社新华社北京1月30日电(记者谭畅张悦姗)冰壶是北京冬奥会首个开赛项目,近日陆续有冰壶运动队入住冬奥村,走进国家游泳中心冰立方探馆。饮食起居舒心文化交流连心防疫举措安心,这寒冷干燥的冬季总感觉喉咙痛,不要病急乱投医,学会4点或许有用随着冬季气温的逐渐下降,当人们外出时,很容易受到外界冷空气的干扰,导致我们的喉咙出现一些炎症,这时我们就会感觉到喉咙部位又干又痛。在寒冷的北方由于气温比较低,所以很多家庭都会使用一
适合女生一个人去的旅行清单,这20个地方余生定要一个个走遍女孩子们!!!现在阳光明媚微风正好你们有没有突然很想去旅行的冲动!其实女生旅游最大的乐趣无非是穿上一身美美哒衣服拍一张惊艳的照片让自己的旅行记忆定格停留在最美的照片上所以小编帮你们大爆冷!中国小将35落后,奋起直追65逆转绝杀希金斯2021年斯诺克英锦赛开始第三轮比赛争夺,继首轮肖恩墨菲第二轮马克威廉姆斯和塞尔比三位世界冠军出局之后,第三轮首日比赛再爆大冷门,四届世锦赛冠军得主巫师希金斯和2015年世锦赛冠军美国是真的慌了,出手干预极紫外光刻机进入中国,美国在怕什么?吃饭要一口一口吃,路要一步一步走,不要嫌慢,有时候慢就是快,最重要的是在稳健中求得发展。前几日,比亚迪集团董事长兼总裁王传福在2021广州车展开幕式上说,在半导体领域,电动车对半导狂言君约基齐南征,全怂了火箭克雷霆,又赢了万众瞩目的热矿自由搏击争霸赛第二回合,在南海岸打响。伴随着约大哥与约二哥亲赴前线亲口询问约不约,机智的吉米果断表示约JB。事实上除吉米外,首回合跳的最欢,叫的最响的几位,如莫大,哈西部变天!7胜1负,西部大黑马超级崛起,力压湖人掘金开拓者森林狼又赢了!10098力克步行者。最近8场比赛,森林狼的战绩是7胜1负。在最新的积分榜上,森林狼11胜10负排名西部第六,和第四的独行侠(10胜9负)胜场差是0。按照森林狼最近的乒坛腿精袁嘉楠被大魔王初代激励,帅气老公竟是亚洲冠军世乒赛不仅是国球扬威的舞台,同时也是广大球迷了解乒坛动向认识各国球星的好机会。不久前在东京奥运会上凭借健美且修长的双腿走红的袁嘉楠,就再次吸引了大家的注意。能时隔3个月再次领略到这我国17岁体操冠军退役后,被老外哄到美国,如今过着啃老生活随着东京奥运会的举办,今年全世界范围内都掀起了一股体育热。我们国内同样如此,还造就一大批明星运动员10米台跳水冠军全红婵10米气步枪冠军杨倩等等。这些选手除了体育上的成就外,还顺利NBA13名殿堂级球员投票的历史最佳阵容,乔丹奥尼尔在列NBA每个时代都会有不同的超级球星主宰着这个联盟,以前的乔丹科比,后来的詹姆斯杜兰特库里,这些球星个人的成功不仅让他们赢得了当下的荣誉,更是让他们进入了历史级别的讨论,等他们退役之本赛季至今尚未上过场的10名球员,组个队能夺冠吗?NBA202122赛季已经进行了四分之一,这个赛季缺阵的球星比较多,并且原因也各种各样,当然,对于NBA球员来说,缺阵比赛的基本都是伤病,除了欧文和西蒙斯,一个不愿意打疫苗,要为社好消息,全能3号位复出!他三分命中率4成,湖人终于不愁锋线失守本赛季湖人队的状态饱受挣扎,在今夏引进14名新球员之后,湖人至今还在探索磨合之路,不过近来他们也有好消息,随着伤兵们逐渐回归,或许湖人队的整体表现会更加出色!根据今天训练赛后沃格尔乖乖!现役得分榜前十湖网有7人,赛季末詹皇升历史第二库里2万分分数是篮球运动取胜最关键的数据,只有总体得分最高的那支球队才能取胜。衡量一个球员能否成为球星,最关键的能力就是他的得分能力,其次才是影响比赛的其它数据。纵观整个NBA历史,有很多巨