发新帖

开源用于寻找系外行星的代码

[复制链接]
334 6

快来加入 TensorFlowers 大家庭!

您需要 登录 才可以下载或查看,没有帐号?加入社区

x
本帖最后由 TF小白 于 2018-4-13 20:30 编辑

发布人:Google Brain 团队高级软件工程师 Chris Shallue

最近,通过训练神经网络分析 NASA 开普勒太空望远镜的数据和准确识别最有希望的行星信号,我们发现了两颗系外行星。尽管这期间仅对大约 700 颗恒星进行了初始分析,我们仍然认为这个结果成功地证明了可以使用机器学习发现系外行星,更概括地讲,这是能够使用机器学习在各个科学领域(例如,医疗保健、量子化学和核聚变研究)取得富有意义的收获的另一个佐证。我们高兴地发布用于处理开普勒数据、训练神经网络模型和根据新候选行星信号进行预测的代码。我们希望这次发布成为一个良好的开端,激励大家为 NASA 的其他任务(例如,K2(开普勒的第二个任务)和即将开展的凌日系外行星巡天测量卫星任务)开发类似模型。伴随着代码的发布,我们也希望借此机会深入介绍一下我们使用的模型的工作方式。

发现行星的引子
首先,我们考虑一下如何使用开普勒望远镜收集的数据检测是否存在行星。下图称为光变曲线,它显示了恒星在一段时间内的亮度(由开普勒的光度计测得)。当行星经过恒星前方时,它会短暂地阻挡一些光线,这会导致测量亮度下降,然后在很短的时间内再次上升,从而在光变曲线中形成“U”形下沉。
螢幕快照 2018-04-13 下午8.26.27.png


不过,其他天文和仪器现象也可能导致恒星的测量亮度下降,包括联星系统、星斑、宇宙射线击中开普勒光度计,以及仪器噪声。
为了在开普勒数据中搜索行星,科学家们使用自动化软件(例如开普勒数据处理管道)检测可能由行星引起的信号,然后手动跟进,确定每个信号是一颗行星,还是误报。为了避免因为信号过多超出其控制范围而无从应对,科学家们对自动检测施加了一个限制:高于固定阈值的信噪比将被视为值得进行跟进分析,而低于该阈值的所有侦测结果都会被舍弃。即使施加了此限制,侦测结果的数量仍然令人生畏:截至目前,我们手动检查了超过 30,000 个开普勒侦测信号,其中的大约 2500 个已被验证为是真正的行星!

您可能会想:信噪比限制是否会遗漏一些真正行星信号?答案是肯定的!但是,如果天文学家需要手动跟进每一个侦测结果,那就没必要降低阈值,因为随着阈值的减小,误报侦测结果的比率会迅速增大,真正行星侦测结果将变得越来越少。不过,存在一种诱人的激励:一些像地球一样的潜在宜居行星可能就隐藏在传统检测阈值之下,这些行星相对较小,并且围绕相对较暗的恒星旋转 - 开普勒数据中可能存在未被发现的隐藏宝藏!

螢幕快照 2018-04-13 下午8.26.39.png


机器学习方法
Google Brain 团队将机器学习应用到各类数据中,从人类基因组到简笔画,再到形式数理逻辑。考虑到开普勒望远镜收集的数据量非常大,我们想知道如果使用机器学习分析一些之前未探索的开普勒数据,我们能够发现什么。为此,我们与德克萨斯大学奥斯汀分校的 Andrew Vanderburg 合作开发了一个神经网络,帮助搜索低信噪比侦测结果中有无行星。

幸运的是,我们拥有 30,000 个已经由人类手动检查和分类的开普勒信号。我们使用了其中大约 15,000 个信号(3,500 个是确认行星或者强力候选行星)训练我们的神经网络区分行星与误报。我们网络的输入是相同光变曲线的两个不同视图:广角视图让模型可以检查光变曲线上其他地方的信号(例如,由联星引起的第二信号),放大视图则让模型能够仔细检查所检测信号的形状(例如,区分“U”形信号与“V”形信号)。

完成模型的训练后,我们研究了它学到的光变曲线特征,看看这些特征是否符合我们的预期。我们使用的一种技术(在这篇论文中首次提出)是有系统地挡住输入光变曲线的小部分区域,并查看模型的输出是否变化。如果被挡住,对模型决策尤为重要的区域将改变输出预测,但是,挡住不重要的区域不会产生显著的影响。下面是联星产生的一条光变曲线,我们的模型正确地预测出这不是一颗行星。用绿色突出显示的点是在被挡住时将显著改变模型输出预测的点,这些点与指示联星系统的第二个“下沉”准确对应。在这些点被挡住时,模型的输出预测将从约为 0% 的可能性是行星变成大约 40% 的可能性是行星。因此,这些点是导致模型丢弃此光变曲线的部分原因,但是,模型还使用了其他证据 - 例如,放大中心的主要下沉显示,它实际上是“V”形,这也是联星的迹象。

内容详见:谷歌开发者中文博客




本楼点评(0) 收起

精彩评论6

TheAntBully  TF荚荚  发表于 2018-4-13 23:36:32 | 显示全部楼层
厉害了, 有种GG强势归来的感觉
本楼点评(0) 收起
smile  TF豆豆  发表于 2018-4-14 09:29:48 | 显示全部楼层
好多好玩的应用呀
本楼点评(0) 收起
wuxun90  TF荚荚  发表于 2018-4-17 13:47:45 | 显示全部楼层
中文博客的链接点不开。。。
本楼点评(0) 收起
ves  TF荚荚  发表于 2018-7-4 19:48:24 | 显示全部楼层
AI +  DSP
本楼点评(0) 收起
zhouquan03  TF荚荚  发表于 2018-7-5 12:41:58 | 显示全部楼层
点赞。训练样本看起来不好获取。
本楼点评(0) 收起
ViolinSolo  TF芽芽  发表于 2018-7-5 13:03:14 | 显示全部楼层
哎?这个好哈哈哈
本楼点评(0) 收起
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

主题

帖子

6

积分
快速回复 返回顶部 返回列表