Se está utilizando la inteligencia artificial para descubrir la naturaleza de la materia oscura

Investigadores chinos han creado un modelo de inteligencia artificial capaz de encontrar patrones en los datos y describir la materia oscura.

La dinámica de un cúmulo de galaxias viene determinada por la materia oscura, que representa la mayor parte de la masa, y ahora un modelo de IA es capaz de comprender sus propiedades analizando los datos de los cúmulos. Crédito: NASA
La dinámica de un cúmulo de galaxias viene determinada por la materia oscura, que representa la mayor parte de la masa. Ahora, un modelo de IA es capaz de comprender sus propiedades analizando los datos de los cúmulos. Crédito: NASA

Una forma de estudiar la materia oscura es mediante el análisis de datos de cúmulos de galaxias. La materia oscura desempeña un papel importante en los cúmulos de galaxias, ya que representa la mayor parte de su masa. En los últimos años, se han utilizado modelos de inteligencia artificial para encontrar patrones en estos datos observacionales, y se han empleado simulaciones para encontrar patrones y obtener información. Sin embargo, la mayoría de estos modelos tienen una interpretación física deficiente, lo que dificulta la extracción de información.

Para sortear este problema, físicos y astrónomos han buscado modelos interpretables para aprender representaciones que puedan analizarse y relacionarse directamente con estructuras matemáticas o físicas conocidas. Una estrategia consiste en arquitecturas en las que las funciones de activación no son fijas, sino que se aprenden a partir de los datos. Esto facilita la identificación de dependencias entre magnitudes físicas en los datos y permite una comparación más directa con los modelos teóricos.

Un grupo de investigadores chinos ha desarrollado un nuevo modelo denominado Convolutional Kolmogorov–Arnold Network (CKAN). El modelo se entrenó utilizando datos de simulación de cúmulos de galaxias con información sobre la distribución de masa y la emisión de rayos X para comprender el comportamiento de la materia oscura. CKAN permite a los investigadores estudiar la relación entre las estructuras observables y la distribución de la materia oscura.

Materia oscura

La materia oscura es un componente del universo que representa aproximadamente el 85 % de la materia total. No interactúa con la luz ni con ninguna otra interacción, salvo la gravitacional. Por ello, solo puede observarse indirectamente a través de las curvas de rotación de las galaxias, la dinámica de los cúmulos, el efecto de lente gravitacional y las anisotropías de la radiación cósmica de fondo de microondas. A pesar de ello, la naturaleza microscópica de la materia oscura sigue siendo un misterio en la astrofísica.

La naturaleza de la materia oscura aún es desconocida, es decir, aún se desconoce qué partículas la componen, cómo se formaron o si interactúan más allá de la gravedad.

El modelo estándar asume materia oscura fría y sin interacción, lo cual describe con precisión la estructura a gran escala, pero no explica algunos fenómenos a menor escala. Una alternativa es la hipótesis de la materia oscura autointeractuante (SIDM), según la cual las partículas de materia oscura interactúan entre sí con secciones transversales pequeñas. Estas interacciones pueden redistribuir la energía y el momento dentro de los halos galácticos y explicar algunas observaciones de galaxias y cúmulos.

Redes neuronales interpretables

Las redes neuronales se utilizan en astronomía y física para resolver problemas como la clasificación, la regresión y el reconocimiento de patrones. Sin embargo, comprender por qué una red tomó una decisión específica que resultó en un resultado específico es una limitación. En el ámbito científico, esta falta de interpretabilidad dificulta el hallazgo de relaciones físicas y la validación de hipótesis. En campos como la astronomía, donde los datos son complejos, los modelos no proporcionan información sobre los mecanismos físicos reales que rigen los fenómenos observados.

Debido a esta limitación, cada vez más investigadores buscan crear redes neuronales interpretables que incorporen estructuras, restricciones o representaciones que les permitan extraer significado físico de los modelos. Algunos ejemplos incluyen arquitecturas con funciones de activación aprendidas, redes inspiradas en leyes de conservación y modelos híbridos. Estos enfoques permiten no solo predecir propiedades, sino también identificar qué variables dominan el comportamiento observado.

Nuevo modelo

Investigadores chinos han desarrollado un nuevo modelo de inteligencia artificial interpretable denominado Convolutional Kolmogorov–Arnold Network (CKAN). CKAN se desarrolló para superar las limitaciones de las redes convolucionales tradicionales. En esta arquitectura, las funciones de activación fijas se sustituyen por funciones de activación entrenables. Esta característica permite al modelo aprender representaciones más flexibles y físicamente interpretables.

El modelo presentado en el artículo de Huang et al. 2025 muestra la arquitectura CKAN que utiliza funciones entrenables durante el proceso. Crédito: Huang et al. 2025
El modelo presentado en el artículo de Huang et al. 2025 muestra la arquitectura CKAN que utiliza funciones entrenables durante el proceso. Crédito: Huang et al. 2025

El modelo se entrenó con datos de simulaciones cosmológicas de cúmulos de galaxias, incluyendo diferentes hipótesis sobre la materia oscura. Las entradas del modelo consisten en imágenes con tres canales: distribución de masa total, masa estelar y emisión de rayos X. Además de clasificar los diferentes modelos físicos, se puede obtener la estructura interna de CKAN y reescribirla en forma simbólica. Los resultados ayudaron a los investigadores a identificar las características espaciales y físicas más relevantes para distinguir los escenarios de materia oscura.

Resultados obtenidos

El análisis de la representación de CKAN reveló que la red neuronal ha llegado a detectar magnitudes físicas como el desplazamiento entre el centro del halo de materia oscura y el centro del cúmulo de galaxias. Estos patrones extraídos automáticamente son consistentes con las predicciones teóricas, lo que indica que el modelo no solo clasifica los datos correctamente, sino que también comprende las relaciones físicas reales.

Al combinar las métricas de error con los diagnósticos de interpretabilidad, los investigadores obtuvieron un resultado interesante. Descubrieron que, a escala de cúmulo de galaxias, la hipótesis SIDM requiere una sección transversal mínima del orden de 0,1-0,3 cm²/g. Este límite es consistente con las estimaciones basadas en simulaciones cosmológicas recientes. Además, al incluir el ruido observacional, CKAN mantuvo su capacidad y logró mantener los errores dentro del mismo rango.

Referencia de la noticia

Huang et al. 2025 An Interpretable AI Framework to Disentangle Self-interacting and Cold Dark Matter in Galaxy Clusters: The CKAN Approach The Astronomical Journal