Análise de curvas de luz obtidas com o Transiting Exoplanet Survey Satellite com técnicas de machine learning
Abstract
Neste trabalho apresentamos um estudo de classificação de fenômenos que causam variações luminosas em estrelas através de técnicas de machine learning. O projeto tem como objetivo elaborar um pipeline para a aquisição, tratamento e análise de curvas de luz obtidas pelo Transiting Exoplanet Survey Satellite (TESS). Primeiramente, desenvolvemos um algoritmo de web scraping (código para coleta de dados da internet) para obter os dados a partir do banco de dados público do satélite TESS. Posteriormente, os dados foram filtrados utilizando o filtro de Butterworth, analisados através do algoritmo de machine learning e, finalmente, classificados em três categorias: curvas com eclipses causados por binárias eclipsantes, curvas com eclipses causados por exoplanetas e curvas de luz sem eclipses. A filtragem de ruídos de alta frequência resultou em uma melhora nos resultados em todos os casos testados. As técnicas de aprendizagem de máquina que forneceram os melhores resultados foram Random Forest e Gradient boosted decision trees, com taxas de assertividade de até 95%.