Los avances recientes en capacidad computacional y disponibilidad de datos han transformado fundamentalmente el panorama de la investigación científica. Ha emergido un paradigma impulsado por datos, en el cual conjuntos extensos se procesan a través de modelos de aprendizaje automático—predominantemente redes neuronales artificiales—para pronosticar fenómenos naturales y comportamiento físico. Entre los logros más destacados de esta metodología se encuentra el sistema AlphaFold, que revolucionó la predicción de la formación de estructuras proteicas. Sin embargo, este enfoque centrado en datos presenta una limitación significativa: los modelos funcionan como «cajas negras», haciendo opaco su proceso de toma de decisiones para la comprensión humana. Además, incorporar conocimiento de dominio establecido en estos sistemas sigue siendo problemático dentro del marco impulsado por datos. Investigadores del MIT, liderados por Ziming Liu, han desarrollado una metodología innovadora de aprendizaje automático capaz de extraer leyes físicas simples e interpretables directamente de datos empíricos, lo que representa un avance sustancial hacia la resolución de estas limitaciones y potencialmente permite el descubrimiento sistemático de leyes que rigen diversos sistemas naturales.
Desde la Revolución Científica, el fundamento del avance científico ha descansado en la identificación de principios sencillos y comprensibles que caracterizan fenómenos naturales. Las leyes de Newton sobre el movimiento, los principios de la mecánica cuántica y las teorías de la relatividad de Einstein ejemplifican tales comprensiones fundamentales. A través de estos principios elegantes, los investigadores construyen representaciones matemáticas de procesos naturales subyacentes. Cuando se resuelven mediante métodos analíticos o computacionales, estos modelos generan predicciones comprobables y respaldan aplicaciones tecnológicas posteriores. El enfoque contemporáneo impulsado por datos diverge notablemente de esta metodología científica centrada en principios.
El concepto de extraer leyes físicas de información empírica no es sin precedentes. Las técnicas tradicionales de optimización que emplean regularización promotora de escasez desde la detección comprimida han servido previamente para este propósito. Más recientemente, las redes neuronales informadas por física, o PINN, han logrado un éxito considerable codificando simultáneamente restricciones físicas como ecuaciones diferenciales en arquitecturas de redes neuronales mientras aprenden modelos basados en ecuaciones a partir de datos observacionales. La contribución distintiva del trabajo reciente de Liu implica introducir un diseño arquitectónico novedoso que mejora significativamente la interpretabilidad del modelo.
Esta arquitectura innovadora, designada redes de Kolmogórov-Arnold o KAN, deriva de fundamentos matemáticos que abordan el decimotercer problema de Hilbert—una investigación clásica sobre si funciones multivariables arbitrarias pueden expresarse mediante combinaciones de funciones univariables y operaciones de suma. Andréi Kolmogórov y Vladímir Arnold resolvieron famosamente esta cuestión afirmativamente. Las KAN contemporáneas emplean este principio matemático parametrizando funciones multivariables como composiciones de funciones univariables, que el sistema aprende de conjuntos de datos de entrenamiento. Crucialmente, como el componente aprendido consiste en funciones univariables, los investigadores pueden examinar estas funciones individuales después del entrenamiento para comprender qué ha adquirido la KAN. Esta característica mejora sustancialmente la interpretabilidad en relación con arquitecturas convencionales de redes neuronales.
En su investigación, Liu y colegas aplicaron la arquitectura KAN a datos de sistemas dinámicos sin procesar en múltiples escenarios de prueba. La red identificó exitosamente cantidades conservadas de energía y momento angular dentro de un sistema de oscilador armónico bidimensional. Para una configuración de péndulo simple, el sistema determinó la formulación lagrangiana apropiada. Similarmente, la arquitectura descubrió el lagrangiano para una masa relativista sometida a fuerza externa constante, identificó la transformación matemática que expone propiedades de simetría ocultas de un agujero negro no rotatorio, y caracterizó relaciones tensión-deformación en materiales sólidos neo-Hookeanos. A lo largo de estas demostraciones, las KAN operaron sinérgicamente con conocimiento específico del dominio, que guió la estructura probable de leyes físicas, facilitando la extracción de principios físicos de observaciones empíricas.
Estas aplicaciones iniciales constituyen necesariamente experimentos controlados utilizando sistemas cuyas soluciones correctas están predeterminadas. El verdadero mérito científico emergirá mediante aplicación a problemas abiertos de significancia científica genuina, donde las leyes físicas que rigen permanecen indeterminadas. Cuando se dirige hacia tales aplicaciones, esta metodología posee potencial sustancial para acelerar dramáticamente el progreso científico. Las proyecciones sugieren que en las próximas décadas, la integración de técnicas de aprendizaje automático, incluyendo KAN, en la metodología científica catalizará descubrimientos de otro modo inalcanzables mediante enfoques convencionales. Esta estrategia demuestra promesa particular para dominios incluyendo sistemas cuánticos complejos que involucran múltiples cuerpos, investigación química y ciencia de materiales—campos caracterizados por disponibilidad abundante de datos pero donde la complejidad computacional hace que los cálculos convencionales de primeros principios sean impracticables o computacionalmente prohibitivos.
Marco de inteligencia artificial interpretable del Observatorio Xinjiang de China apunta a desmitificar la materia oscura
Cuando investigadores de la Academia China de Ciencias en el Observatorio Astronómico de Xinjiang presentaron su nuevo marco «CKAN» el 18 de diciembre de 2025, afirmaron un avance significativo en la búsqueda por comprender la materia oscura: una arquitectura de red neuronal que explica su propio razonamiento mientras analiza la sustancia más esquiva del universo, según un informe en Phys.org.
El proyecto responde las preguntas perennes que rodean cada avance: quién está involucrado, qué se logró, dónde y cuándo sucedió, por qué importa y cómo funciona. Un equipo interdisciplinario de astrofísicos e informáticos en Xinjiang desarrolló CKAN—abreviatura de Red de Kolmogórov-Arnold aplicada a cosmología—para extraer patrones de distribución de materia oscura de datos astronómicos. El software aprovecha el teorema de representación de Kolmogórov-Arnold, de más de cien años, para reorganizar relaciones complejas en sumas y composiciones de funciones de una variable, haciendo su lógica interna transparente para revisores humanos.
Científicos e ingenieros han elogiado durante mucho tiempo al aprendizaje automático por detectar relaciones que eluyen la estadística convencional, pero las redes neuronales también introducen un dilema: su potencia predictiva frecuentemente viene al costo de la interpretabilidad. CKAN, sostiene el equipo de Xinjiang, ofrece una salida de esa caja negra, permitiendo a los cosmólogos rastrear cada predicción hasta una función matemática inteligible. Si el marco se amplía, podría abrir una nueva ventana observacional al 85 por ciento de la materia en el universo que no emite ni absorbe luz.
Resultados técnicos y primeros hallazgos
Según el resumen en Phys.org del estudio revisado por pares, CKAN combina capas de aprendizaje profundo estándar con una representación de Kolmogórov-Arnold, traduciendo efectivamente correlaciones multidimensionales en datos de telescopio en un conjunto de ecuaciones más simples que los científicos pueden inspeccionar. Ese enfoque distingue a CKAN de la mayoría de modelos convolucionales o transformadores ahora comunes en astrofísica. Mientras que los sistemas convencionales producen solo un mapa de probabilidad de dónde podría encontrarse la masa invisible, CKAN también produce un conjunto de funciones unidimensionales que revelan por qué el algoritmo llegó a cada conclusión.
El equipo de Xinjiang probó el marco en halos de materia oscura simulados y catálogos observacionales reales, una estrategia de dos pasos diseñada para validar CKAN bajo condiciones controladas y luego naturales. Las métricas de desempeño—descritas en el artículo de Phys.org pero no divulgadas en detalle—mostraron precisión comparable con modelos de caja negra de vanguardia mientras proporcionaban capas explicativas adicionales. Esa paridad, argumentan los investigadores, demuestra que la transparencia no necesita socavar el poder predictivo, un compromiso que ha obstaculizado intentos anteriores de inteligencia artificial de «caja blanca».
Cómo las matemáticas de Kolmogórov-Arnold ayudan
El teorema de representación de Kolmogórov-Arnold, probado a mediados del siglo XX, resuelve una pregunta clásica sobre si cualquier función multivariable puede descomponerse en funciones de una variable más adición. CKAN incorpora esa idea constriñendo cada capa intermedia para aprender solo transformaciones univariables. La restricción simplifica los paisajes de gradiente y expone las reglas aprendidas: en lugar de inspeccionar millones de pesos opacos, los astrónomos pueden trazar cada curva unidimensional y relacionarla con un parámetro físico como corrimiento al rojo o masa bariónica.
Una corriente de investigación paralela en el Instituto Tecnológico de Massachusetts ofrece contexto. A principios de esta década, un grupo liderado por el físico computacional Ziming Liu introdujo Redes de Kolmogórov-Arnold (KAN) para descubrir ecuaciones que rigen directamente a partir de datos en sistemas clásicos como péndulos y osciladores armónicos. En esas demostraciones, la arquitectura recuperó cantidades conservadas como energía y momento que las redes neuronales tradicionales raramente revelan. El CKAN de Xinjiang extiende la lógica a la cosmología, plantando la técnica en un campo donde las verdades fundamentales son menos accesibles pero desesperadamente necesarias.
Conectando dos culturas científicas
CKAN surge en un momento en que la astrofísica y el aprendizaje automático convergen en desafíos metodológicos compartidos: conjuntos de datos masivos y de alta dimensionalidad, y una escasez de teorías de forma cerrada que los expliquen. La investigación de materia oscura encarna el problema. Mientras que las encuestas astronómicas han mapeado anomalías gravitacionales que insinúan masa invisible, los modelos teóricos compiten sobre su carácter fundamental—ya sean partículas masivas débilmente interactuantes, axiones o algo más extraño. Las redes neuronales pueden señalar correlaciones en ese mar de mediciones, pero sin interpretabilidad, luchan por cambiar mentes teóricas o guiar nuevas observaciones.
Al incorporar interpretabilidad desde el inicio, CKAN aborda el escepticismo dentro de la comunidad de física de que los descubrimientos «impulsados por datos» equivalen a ajustar curvas. Cada función unidimensional dentro de la red puede representarse gráficamente, diferenciarse y compararse con leyes gravitacionales establecidas, dando a los teóricos un artefacto concreto para probar. El equipo de Xinjiang sostiene que esta transparencia podría agudizar debates sobre candidatos competidores de materia oscura y priorizar tiempo de telescopio en galaxias o cúmulos donde el modelo predice firmas distintivas.
Comparación con enfoques convencionales
Las simulaciones cosmológicas tradicionales, como modelos de N-cuerpos ejecutados en supercomputadoras, calculan interacciones de partículas desde primeros principios pero consumen enormes recursos computacionales. Conversamente, sustitutos de aprendizaje profundo comprimen esas interacciones en mapeos estadísticos aprendidos de salidas de simulación, intercambiando interpretabilidad por velocidad. CKAN busca el camino intermedio: inferencia rápida más lógica rastreable. La arquitectura así se sitúa entre redes neuronales informadas por física—donde ecuaciones se cuecen en funciones de pérdida—y modelos genéricos de caja negra que aprenden lo que sea que minimice error, independientemente de plausibilidad física.
Implicaciones para descubrimiento científico más amplio
Fuera de la astronomía, la filosofía CKAN se alinea con una tendencia más amplia hacia combinar razonamiento simbólico con optimización basada en gradiente. Campos que van desde química cuántica a ingeniería de materiales enfrentan incógnitas de forma cerrada y excedentes de datos. Si las descomposiciones de Kolmogórov-Arnold pueden agilizar el descubrimiento en cosmología, la misma estrategia podría revelar vías de reacción en moléculas complejas o leyes tensión-deformación en aleaciones avanzadas—áreas ya exploradas por el trabajo KAN del MIT.
Algunos obstáculos permanecen. Las estructuras interpretables frecuentemente imponen rigidez que puede limitar expresividad cuando los fenómenos se desvían de suposiciones simplificadas. Además, el salto de datos simulados a ruido observacional presenta un desafío persistente; las mediciones reales de telescopio incluyen sesgos instrumentales y varianza cósmica que pueden desencaminar incluso modelos transparentes. El grupo de Xinjiang reconoce esos obstáculos y llama a evaluación comparativa colaborativa contra otros marcos interpretables.
Análisis: lo que la transparencia podría cambiar
La interpretabilidad hace más que satisfacer curiosidad intelectual; puede reconfigurar flujos de trabajo científicos. Si los observadores confían en las explicaciones de CKAN, pueden diseñar encuestas dirigidas en lugar de escaneos amplios, reduciendo costos y huellas de carbono para observatorios de gran escala. La inteligencia artificial transparente también podría acelerar revisión por pares: las revistas podrían exigir que los estudios de aprendizaje automático incluyan funciones descompuestas como material complementario, permitiendo a los árbitros replicar y criticar descubrimientos.
Desde una perspectiva filosófica, CKAN desafía la noción de que la complejidad creciente de datos inevitablemente obliga a la ciencia hacia la opacidad. Al invocar un teorema fundamentado en matemáticas de principios del siglo XX, los investigadores demuestran que herramientas conceptuales más antiguas pueden combinarse con hardware moderno para mantener la investigación empírica inteligible. Si esta síntesis se amplía a fenómenos tan intrincados como la formación de galaxias—o a los acertijos aún más complicados de la gravedad cuántica—sigue siendo una pregunta abierta, pero CKAN proporciona una prueba tangible del concepto.
Perspectivas futuras
El equipo de Xinjiang planea integrar CKAN con próximas encuestas de cielo que catalogarán miles de millones de galaxias, una escala impensable para análisis manual. Si el marco mantiene su precisión y transparencia bajo esa inundación de datos, podría convertirse en un componente estándar en el conjunto de herramientas del cosmólogo, mucho como las redes convolucionales ahora dominan el reconocimiento de imágenes. El éxito también podría presionar a laboratorios de inteligencia artificial propietarios para exponer su propio razonamiento de modelos, impulsando la industria más amplia hacia apertura.
Por ahora, el desarrollo marca un paso adelante en astrofísica y apren
Fuentes
- https://phys.org/news/2025-12-neural-networks-reveal-nature-dark.html
