Deep Reinforcement Learning es una rama de Machine Learning que permite implementar controladores y algoritmos de toma de decisiones en aplicaciones complejas de robótica y sistemas autónomos. Deep Reinforcement Learning permite entrenar redes neuronales para que aprendan comportamientos complejos con datos generados dinámicamente a partir de sistemas simulados o físicos.
Con MATLAB, Simulink y Reinforcement Learning Toolbox, puede ejecutar el flujo de trabajo completo para diseñar y desplegar un sistema de Deep Reinforcement Learning. Puede hacer lo siguiente:
- Alternar, evaluar y comparar algoritmos de Deep Reinforcement Learning populares
- Entrenar políticas de manera interactiva con la app Reinforcement Learning Designer
- Modelar el entorno de entrenamiento en MATLAB y Simulink para reducir el riesgo de dañar hardware
- Utilizar redes neuronales para crear políticas de Deep Reinforcement Learning de manera interactiva o programática
- Desplegar políticas de Deep Reinforcement Learning en dispositivos integrados o la nube
Uso de MATLAB y Simulink para Deep Reinforcement Learning
Flujo de trabajo interactivo y visual con Reinforcement Learning Designer
Cree, entrene y simule agentes de Deep Reinforcement Learning de manera interactiva con la app Reinforcement Learning Designer. Aproveche el entorno interactivo de la aplicación para identificar el tipo de agente ideal. Seleccione entre algoritmos de Deep Reinforcement Learning populares, disponibles y listos para usar, como gradiente de política determinística profunda (DDPG), actor-crítico suave (SAC) y optimización de políticas próximas (PPO).
Entrenamiento, pruebas en nivel de sistema y despliegue con diseño basado en modelos
Modele el entorno de entrenamiento en Simulink, o MATLAB, para reducir el riesgo de dañar hardware. Integre modelos de entorno con agentes de Deep Reinforcement Learning fácilmente utilizando el bloque RL Agent. Entrene políticas en serie o en paralelo, y verifíquelas mediante simulaciones (en nivel de sistema) y pruebas de software-in-the-loop (SIL)/hardware-in-the-loop (HIL). Despliegue políticas entrenadas en dispositivos integrados o en la nube.
Creación automatizada e interactiva de políticas de redes neuronales
Utilice arquitecturas de redes neuronales autogeneradas y específicas para cierto tipo de problema, para crear agentes de Deep Reinforcement Learning sin necesidad de ser especialista en diseño de políticas de redes neuronales. Use la arquitectura de red neuronal sugerida tal cual, o bien adáptela con la app Deep Network Designer (enfoque interactivo) o capas de Deep Learning Toolbox (enfoque programático). Aplique funcionalidades de importación y exportación para interoperar con representaciones de redes neuronales en marcos de terceros.
Ejemplos y aplicaciones de referencia
Iníciese en Deep Reinforcement Learning diseñando controladores y algoritmos de toma de decisiones para aplicaciones de robótica, conducción autónoma, calibración y planificación, entre otras. Consulte nuestros ejemplos de referencia y experimente con entrenamiento monoagente y multiagente, aprendizaje online y sin conexión, métodos con y sin modelos, y estrategias de aprendizaje evolutivas y basadas en gradientes.