当前位置: X-MOL 学术Astrophys. J.  › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Cycle-StarNet: Bridging the Gap between Theory and Data by Leveraging Large Data Sets
The Astrophysical Journal ( IF 4.9 ) Pub Date : 2021-01-18 , DOI: 10.3847/1538-4357/abca96
Teaghan O’Briain 1 , Yuan-Sen Ting 2, 3, 4, 5 , Sbastien Fabbro 1, 6 , Kwang M. Yi 7 , Kim Venn 1 , Spencer Bialek 1
Affiliation  

The advancements in stellar spectroscopy data acquisition have made it necessary to accomplish similar improvements in efficient data analysis techniques. Current automated methods for analyzing spectra are either (a) data-driven, which requires prior knowledge of stellar parameters and elemental abundances, or (b) based on theoretical synthetic models that are susceptible to the gap between theory and practice. In this study, we present a hybrid generative domain adaptation method that turns simulated stellar spectra into realistic spectra by applying unsupervised learning to large spectroscopic surveys. We apply our technique to the APOGEE H-band spectra at R=22,500 and the Kurucz synthetic models. As a proof of concept, two case studies are presented. The first of which is the calibration of synthetic data to become consistent with observations. To accomplish this, synthetic models are morphed into spectra that resemble observations, thereby reducing the gap between theory and observations. Fitting the observed spectra shows an improved average reduced $\chi_R^2$ from 1.97 to 1.22, along with a reduced mean residual from 0.16 to -0.01 in normalized flux. The second case study is the identification of the elemental source of missing spectral lines in the synthetic modelling. A mock dataset is used to show that absorption lines can be recovered when they are absent in one of the domains. This method can be applied to other fields, which use large data sets and are currently limited by modelling accuracy. The code used in this study is made publicly available on github.

中文翻译:

Cycle-StarNet:利用大数据集弥合理论和数据之间的差距

恒星光谱数据采集的进步使得有必要在有效的数据分析技术方面实现类似的改进。当前用于分析光谱的自动化方法要么是(a)数据驱动的,这需要先验了解恒星参数和元素丰度,要么(b)基于理论合成模型,这些模型容易受到理论与实践之间的差距的影响。在这项研究中,我们提出了一种混合生成域适应方法,通过将无监督学习应用于大型光谱调查,将模拟的恒星光谱转换为现实光谱。我们将我们的技术应用于 R=22,500 的 APOGEE H 波段光谱和 Kurucz 合成模型。作为概念证明,提供了两个案例研究。第一个是校准合成数据,使其与观察结果一致。为了实现这一点,合成模型被转化为类似于观测的光谱,从而缩小理论与观测之间的差距。拟合观察到的光谱表明,标准化通量的平均残差从 1.97 减少到 1.22,平均残差从 0.16 减少到 -0.01。第二个案例研究是识别合成建模中缺失谱线的元素来源。模拟数据集用于显示吸收线在其中一个域中不存在时可以恢复。该方法可以应用于其他使用大数据集且目前受建模精度限制的领域。本研究中使用的代码已在 github 上公开提供。从而减少理论和观察之间的差距。拟合观察到的光谱表明,标准化通量的平均残差从 1.97 减少到 1.22,平均残差从 0.16 减少到 -0.01。第二个案例研究是识别合成建模中缺失谱线的元素来源。模拟数据集用于显示吸收线在其中一个域中不存在时可以恢复。该方法可以应用于其他使用大数据集且目前受建模精度限制的领域。本研究中使用的代码已在 github 上公开提供。从而减少理论和观察之间的差距。拟合观察到的光谱表明,标准化通量的平均残差从 1.97 减少到 1.22,平均残差从 0.16 减少到 -0.01。第二个案例研究是识别合成建模中缺失谱线的元素来源。模拟数据集用于显示吸收线在其中一个域中不存在时可以恢复。该方法可以应用于其他使用大数据集且目前受建模精度限制的领域。本研究中使用的代码已在 github 上公开提供。第二个案例研究是识别合成建模中缺失谱线的元素来源。模拟数据集用于显示吸收线在其中一个域中不存在时可以恢复。该方法可以应用于其他使用大数据集且目前受建模精度限制的领域。本研究中使用的代码已在 github 上公开提供。第二个案例研究是识别合成建模中缺失谱线的元素来源。模拟数据集用于显示吸收线在其中一个域中不存在时可以恢复。该方法可以应用于其他使用大数据集且目前受建模精度限制的领域。本研究中使用的代码已在 github 上公开提供。
更新日期:2021-01-18
down
wechat
bug