Introducción a las redes neuronales informadas por la física (PINN)

Las redes neuronales informadas por la física (PINN) son redes neuronales que incorporan leyes físicas descritas por ecuaciones diferenciales en sus funciones de pérdida para guiar el proceso de aprendizaje hacia soluciones que sean más acordes con la física subyacente. Las redes neuronales informadas por la física se pueden emplear para:

Aproximar soluciones de ecuaciones diferenciales parciales (EDP) y ecuaciones diferenciales ordinarias (EDO).
Resolver problemas inversos, como estimar parámetros de modelos a partir de datos limitados.

Con Deep Learning Toolbox™, puede crear y entrenar PINN, lo que permite análisis predictivo rápido. Puede integrar las PINN con MATLAB^® y Simulink^® para simulación en nivel de sistema, diseño de control y optimización de diseños.

Diagrama que muestra cómo se combinan Deep Learning y conocimientos de física para formar las PINN. — Las redes neuronales informadas por la física (PINN) incluyen leyes físicas rectoras en el entrenamiento de modelos de Deep Learning, lo que permite la predicción y modelado de fenómenos complejos al tiempo que respetan los principios físicos fundamentales.

Ventajas de las redes neuronales informadas por la física

Las PINN son una clase de métodos de Machine Learning informados por la física que integran fácilmente conocimientos de física con datos. Las PINN se suelen comparar con métodos puramente basados en datos y métodos numéricos tradicionales para resolver problemas de EDP y EDO.

A diferencia de los enfoques puramente basados en datos, que aprenden relaciones matemáticas únicamente a partir de datos de entrada y salida, las PINN:

Utilizan conocimientos de física previos.
Realizan predicciones más precisas fuera del conjunto de datos de entrenamiento.
Son más eficaces con datos de entrenamiento limitados o con ruido.

A diferencia de los métodos numéricos tradicionales para resolver ecuaciones diferenciales, como el análisis de elementos finitos para EDP, las PINN:

No tienen malla.
Pueden aproximar soluciones de EDP de alta dimensionalidad.
Encuentran soluciones de parámetros de modelos ausentes, como coeficientes de EDP o EDO desconocidos.
Resuelven problemas mal condicionados donde no existen datos de límites.
Incorporan fácilmente mediciones dispersas o con ruido.

Si bien las PINN ofrecen ventajas potenciales en comparación con métodos puramente basados en datos y métodos numéricos tradicionales, también presentan algunas limitaciones y desafíos, tales como:

Teoría de convergencia limitada
Falta de estrategias de entrenamiento unificadas
Carga computacional del cálculo de derivadas de orden superior
Dificultad para aprender componentes de alta frecuencia y multiescala de soluciones de EDP

No obstante, las PINN constituyen un área de investigación dinámica, y se espera que los avances continuos aborden y superen estos desafíos y limitaciones actuales.

La opción de utilizar PINN, enfoques basados en datos o métodos numéricos tradicionales depende de la aplicación. La siguiente tabla resume las ventajas y limitaciones de cada método.

Características de PINN comparadas con enfoques puramente basados en datos, que aprenden relaciones matemáticas únicamente a partir de datos de E/S, y métodos numéricos tradicionales, como FEA para aproximar soluciones de EDP.
	Enfoques puramente basados en datos	Métodos numéricos tradicionales	PINN
Incorporan física conocida
Generalizan bien con datos de entrenamiento limitados o con ruido
Resuelven problemas directos e inversos simultáneamente
Resuelven EDP de alta dimensionalidad
Permiten predicción “online” rápida
No tienen malla
Cuentan con una teoría de convergencia bien comprendida
Se escalan bien a EDP de alta frecuencia y multiescala

Diferencia entre redes neuronales informadas por la física y redes neuronales tradicionales

Las PINN se diferencian de las redes neuronales tradicionales por su capacidad de incorporar el conocimiento del dominio preexistente en forma de ecuaciones diferenciales. Esta información adicional permite a las PINN realizar predicciones más precisas fuera de los datos de medición proporcionados. Además, los conocimientos físicos adicionales regularizan la solución prevista en presencia de datos de medición con ruido, lo que permite a las PINN aprender la verdadera señal subyacente en lugar de sobreajustar los datos con ruido.

Por ejemplo, tomemos un escenario donde se han recopilado las mediciones de ruido, \( θ_{meas} \), de un sistema de interés, y el objetivo es predecir valores futuros del sistema, \( θ_{pred} \), con una red neuronal artificial de tipo feedforward. La red, entrenada con las mediciones disponibles, se utilizará para predecir valores futuros no vistos. Entrenar una red neuronal de regresión generalmente implica reducir el error cuadrático medio entre las predicciones de la red neuronal y las mediciones proporcionadas.

Gráfica de una red neuronal que representa datos medidos y ground-truth, y una función de pérdida de error cuadrático medio. — Las redes neuronales tradicionales ajustan sus parámetros para reducir el error entre la predicción de la red y las mediciones observadas.

La red neuronal tiene dificultades para predecir con precisión valores del sistema fuera de los datos de entrenamiento.

Una red neuronal ingenua, entrenada con la función trainnet en Deep Learning Toolbox, sobreajusta mediciones con ruido y ofrece un rendimiento deficiente para t fuera del rango disponible. (Ver código de MATLAB)

Capturar más datos podría mejorar las predicciones, pero este enfoque puede tener un coste prohibitivo o ser imposible para muchas aplicaciones. No obstante, a menudo la persona experta en el dominio posee un conocimiento más profundo sobre el proceso físico subyacente que rige el sistema de interés. En este escenario concretamente, las mediciones representan el ángulo de desplazamiento desde la vertical de la carga que se balancea desde una grúa. Este proceso se puede representar de manera simplificada con un péndulo amortiguado, que se puede modelar aproximadamente para ángulos pequeños con una ecuación diferencial lineal de segundo orden:

\( θ^{''}(t)+2βθ^{′}(t)+ω^{2}_{0}θ(t)=0 \)

En lugar de ignorar este conocimiento, las redes PINN incorporan la ecuación diferencial como un término adicional informado por la física en la función de pérdida. Las PINN evalúan el residuo de la ecuación diferencial en puntos adicionales del dominio, lo que ofrece más información sin necesidad de realizar más mediciones. Si bien este ejemplo inventado se puede resolver analíticamente, sirve para ilustrar los conceptos en los que se basan las PINN.

Diagrama de una red neuronal informada por la física, ecuaciones diferenciales de un péndulo, y gráfica de datos medidos y ground-truth. — Las PINN, disponibles en Deep Learning Toolbox, ajustan sus parámetros para equilibrar la reducción del error entre la predicción de la red, las mediciones observadas y la pérdida física.

Durante el entrenamiento, las PINN buscan un equilibrio entre el ajuste de las mediciones proporcionadas y el proceso físico subyacente.

Una PINN creada y entrenada con Deep Learning Toolbox realiza mejores predicciones fuera de los datos de medición y es más resistente al ruido que la red neuronal tradicional. (Ver código de MATLAB)

Las redes PINN pueden superar a las redes neuronales tradicionales mediante la incorporación de un término de pérdida física adicional, lo que mejora sus predicciones en presencia de mediciones con ruido y en regímenes de datos sin mediciones.

Cómo funcionan las redes neuronales informadas por la física

Las PINN utilizan algoritmos de optimización para actualizar iterativamente los parámetros de una red neuronal hasta que el valor de una función de pérdida informada por la física especificada se reduce hasta un nivel aceptable, lo que empuja a la red hacia una solución de la ecuación diferencial.

Diagrama de red neuronal informada por la física con ecuaciones de entrenamiento para péndulo, condiciones iniciales, datos de medición adicionales y función de pérdida. — Cuando se entrenan las PINN para una EDO como la ecuación del péndulo, un algoritmo de optimización ajusta los parámetros de la red neuronal para reducir una función de pérdida, que comprende el residuo de la ecuación diferencial de la diferenciación automática (AD), condiciones de límites e iniciales, y, opcionalmente, otros datos etiquetados, hasta un nivel aceptable.

Las PINN tienen funciones de pérdida, \( L \), que constan de varios términos: el término de pérdida informado por la física, \( L_{Physics} \), y, opcionalmente, términos que evalúan el error entre los valores previstos por la red y otro valor prescrito por datos iniciales o de límites, \( L_{Conds} \), y otras mediciones adicionales, \( L_{Data} \). El término de pérdida informado por la física evalúa el residuo de la ecuación diferencial en puntos del dominio empleando diferenciación automática (AD) u otras técnicas de diferenciación numérica. Dado que el término informado por la física no calcula el error entre una predicción y un valor objetivo, este término se puede considerar como término de pérdida no supervisada, lo que significa que la red se puede entrenar con cualquier punto del dominio, incluso sin mediciones en estos puntos.

Las PINN aparecieron en 2017, y actualmente tienen muchas variaciones, como las siguientes:

PINN bayesianas (BPINN), que utilizan el marco bayesiano para permitir la cuantificación de la incertidumbre
PINN variacionales (VPINN), que incorporan la formulación débil de una EDP en la función de pérdida
PINN formuladas de primer orden (FO-PINN), que pueden ser más rápidas y precisas para resolver EDP de orden superior que las PINN estándar

Además, las PINN se pueden utilizar con diferentes arquitecturas de redes neuronales, como redes neuronales gráficas (GNN), operadores neuronales de Fourier (FNO) y redes de operadores profundos (DeepONets), entre otras, para generar versiones informadas por la física de estas arquitecturas.

MATLAB y Deep Learning Toolbox ofrecen un soporte integral para el desarrollo de las PINN, desde creación o importación de diversas arquitecturas de redes neuronales, definición de funciones de pérdida informadas por la física personalizadas con AD y entrenamiento con algoritmos de optimización basados en gradientes como Adam o L-BFGS, hasta visualización de soluciones con gráficas avanzadas de MATLAB.

Aplicaciones para redes neuronales informadas por la física

Las PINN aprovechan la potencia de Deep Learning al tiempo que mejoran el cumplimiento de leyes físicas, lo que las convierte en una herramienta versátil para aplicaciones donde la física se conoce total o parcialmente, como en el caso de una EDP o EDO con coeficientes desconocidos. Entre las aplicaciones de PINN se incluyen las siguientes:

Transferencia de calor, concretamente para modelar procesos de distribución y transferencia de calor. Las PINN pueden incorporar las ecuaciones rectoras que modelan procesos térmicos en materiales y sistemas, como la ecuación de calor, en la función de pérdida. Este enfoque garantiza que las soluciones cumplan con estas leyes físicas, lo que se traduce en predicciones físicamente posibles. Además, las PINN pueden reemplazar costosas simulaciones numéricas para aproximar rápidamente distribuciones de temperatura sobre geometrías parametrizadas en aplicaciones de optimización de diseños. Asimismo, las PINN se pueden utilizar en problemas inversos para identificar propiedades de materiales desconocidas, como conductividad térmica.
Dinámica de fluidos computacional (CFD), concretamente para aproximar campos de velocidad, presión y temperatura de fluidos incorporando las ecuaciones de Navier-Stokes en la función de pérdida. Las PINN se pueden usar en simulaciones directas sin malla para predecir con precisión estas cantidades, o bien en problemas inversos donde el objetivo es inferir entradas o parámetros desconocidos, como condiciones límite, términos de origen o propiedades de fluidos, a partir de datos observados.
Mecánica estructural, para resolver problemas directos e inversos incorporando las leyes físicas rectoras, como ecuaciones de elasticidad y dinámica estructural, directamente en la función de pérdida. Esta integración permite a las PINN predecir respuestas estructurales con precisión, como deformaciones, presiones y tensiones bajo diversas cargas y condiciones, e identificar propiedades de materiales o cargas externas desconocidas a partir de datos observados. Las PINN son especialmente útiles en escenarios donde las soluciones analíticas tradicionales no son viables o los datos son escasos, y reducen la dependencia de conjuntos de datos extensos, ya que aprovechan los principios físicos para guiar el proceso de aprendizaje. Por su flexibilidad, las PINN pueden gestionar problemas complejos, como comportamiento de materiales no lineales y modelado multifísico.

Una vez creadas y entrenadas con Deep Learning Toolbox, las PINN pueden integrarse fácilmente con Optimization Toolbox™ para optimizar diseños, conectarse a Simulink para simular en nivel de sistema, y emplearse en muchas otras aplicaciones.

Ejemplos y procedimientos

Referencias de software

dlgradient: Calcula gradientes para bucles de entrenamiento personalizados con diferenciación automática - Función
dlnetwork: Red neuronal de Deep Learning - Objeto
Bucles de entrenamiento personalizados - Documentación
adamupdate: Actualiza parámetros con estimación adaptativa de momentos (Adam) - Función
lbfgsupdate: Actualiza parámetros con BFGS de memoria limitada (L-BFGS) - Función

También puede consultar estos temas: Deep Learning Toolbox, Partial Differential Equation Toolbox, Análisis de elementos finitos, Modelado de orden reducido, Red neuronal hamiltoniana, Modelado dinámico de sistemas con EDO neuronales, Deep Learning, Redes neuronales convolucionales (CNN), Redes generativas antagónicas (GAN), Redes de memoria a corto-largo plazo (LSTM), Redes neuronales recurrentes (RNN), Redes neuronales