El aprendizaje supervisado es un tipo de técnica de Machine Learning que utiliza datos etiquetados para entrenar modelos y realizar predicciones. En el aprendizaje supervisado, un modelo aprende a realizar una tarea de clasificación o regresión empleando un conjunto conocido de datos de entrada y respuestas.
Cómo funciona el aprendizaje supervisado
El aprendizaje supervisado es el tipo más común de Machine Learning. Utiliza un conjunto de datos conocidos, denominado conjunto de datos de entrenamiento, para entrenar un algoritmo con un conjunto conocido de datos de entrada, denominados características, y respuestas conocidas. El conjunto de datos de entrenamiento abarca datos de entrada etiquetados que se corresponden con salidas o valores de respuesta deseados. Con este conjunto de datos, el algoritmo de aprendizaje supervisado crea un modelo a partir de relaciones entre las características y los datos de salida, y luego realiza predicciones de los valores de respuesta con un nuevo conjunto de datos.
El aprendizaje supervisado puede utilizarse en varios campos científicos y de ingeniería para desarrollar modelos que resuelvan problemas del mundo real. Por ejemplo, supongamos que profesionales clínicos disponen de datos de pacientes sobre edad, peso, altura y presión arterial, así como infartos de miocardio, y desean predecir si un paciente nuevo corre riesgo de sufrir un infarto. En este caso, pueden servirse de aprendizaje supervisado para modelar los datos existentes.
Fases de entrenamiento e inferencia del aprendizaje supervisado.
Un flujo de aprendizaje supervisado típico comprende preparación de datos, selección de algoritmos, entrenamiento del modelo y evaluación del modelo. Dado que el aprendizaje supervisado se basa en datos etiquetados, es fundamental que los datos de entrenamiento sean reales. Por ejemplo, si el modelo se va a utilizar en un entorno con ruido, los datos de entrenamiento deben incluir niveles de ruido reales. La validación es otro paso importante del aprendizaje supervisado, para garantizar que el modelo generaliza correctamente datos no vistos anteriormente y evitar el sobreajuste.
Ajuste de modelos de aprendizaje supervisado
Aumentar la precisión y capacidad de predicción de un modelo de aprendizaje supervisado requiere ingeniería de características y ajuste de hiperparámetros. La ingeniería de características consiste en convertir datos no procesados en características que se pueden utilizar como entradas de un modelo de Machine Learning. El ajuste de hiperparámetros implica identificar el conjunto de parámetros que genera el mejor modelo.
Uso de ingeniería de características y ajuste de hiperparámetros para mejorar el rendimiento de un modelo de aprendizaje supervisado.
La ingeniería de características implica selección de características y transformación de características. En la selección de características, se identifican las variables o características más relevantes que ofrecen la mejor capacidad de predicción cuando se modelan los datos. Durante la transformación de características, las características existentes se convierten en otras nuevas empleando análisis de componentes principales, factorización de matrices no negativa, análisis factorial y otras técnicas.
El ajuste de hiperparámetros busca la configuración óptima de los parámetros que controlan el proceso de aprendizaje, como tasa de aprendizaje, tamaño del lote y número de épocas.
Aprendizaje supervisado y Aprendizaje no supervisado
El aprendizaje supervisado y el aprendizaje no supervisado son tipos de Machine Learning.
Dos tipos de Machine Learning: aprendizaje supervisado y aprendizaje no supervisado.
La principal diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado es que el aprendizaje supervisado necesita datos de entrenamiento etiquetados para entrenar un modelo de Machine Learning. En cambio, el aprendizaje no supervisado utiliza datos no etiquetados para descubrir relaciones ocultas sin intervención humana. Los resultados del aprendizaje supervisado pueden ser más precisos que los del aprendizaje no supervisado, debido a la presencia de datos etiquetados. No obstante, capturar datos etiquetados suele requerir intervención humana y puede demandar mucho tiempo, además de resultar costoso y poco práctico en ciertos casos.
En ocasiones, antes de utilizar el aprendizaje supervisado, se recurre al aprendizaje no supervisado para descubrir patrones en los datos de entrada e identificar características para el aprendizaje supervisado. Además de identificar características, es necesario determinar la categoría o respuesta correcta para todas las observaciones del conjunto de entrenamiento. El aprendizaje semisupervisado, que es también una técnica de Machine Learning, permite entrenar modelos con menos datos etiquetados, lo que reduce el esfuerzo de etiquetado.
Tipos de aprendizaje supervisado
Los principales tipos de modelos de Machine Learning creados por algoritmos de aprendizaje supervisado son los modelos de clasificación y regresión. En cada tipo de tarea, clasificación o regresión, pueden emplearse distintos algoritmos para modelar los datos.
Tipos de algoritmos de aprendizaje supervisado.
Aprendizaje supervisado para clasificación
En el aprendizaje supervisado, la clasificación consiste en separar los datos en clases o categorías específicas. El objetivo es asignar una clase, o etiqueta, de un conjunto de clases finito a una observación. Es decir, las respuestas de un modelo de clasificación son variables categóricas.
Entre sus aplicaciones típicas se incluyen captura de imágenes médicas, reconocimiento de voz y puntuación crediticia. Algunos ejemplos son determinar si un email es auténtico o spam, y si las piezas de un equipo son defectuosas o aptas.
| Regresión logística: Ajusta un modelo que puede predecir la probabilidad de que una respuesta binaria pertenezca a una clase u otra. | Análisis discriminante: Clasifica los datos buscando combinaciones lineales de características y presupone que diferentes clases generan datos basados en distribuciones gaussianas. | k vecino más cercanos (kNN): Categoriza los objetos según las clases de sus vecinos más cercanos en el conjunto de datos. Las predicciones de kNN presuponen que los objetos cercanos entre sí son similares. | Clasificadores Naive Bayes: Presuponen que la presencia de una característica en una clase es independiente de otras características. Clasifican datos nuevos en base a la mayor probabilidad de que pertenezcan a una determinada clase. |
|
|
|
|
|
Aprendizaje supervisado para regresión
Puede utilizar técnicas de regresión en aprendizaje supervisado para comprender la relación entre respuestas y variables de entrada. Resultan útiles para conjuntos de datos con un rango de valores o cuando la respuesta es un número real, como temperatura o tiempo hasta el fallo de un equipo. Es decir, los modelos de regresión predicen respuestas continuas. Algunas de sus aplicaciones típicas son predicción de carga eléctrica, predicción del ciclo de vida restante de baterías, trading algorítmico, incidencia de enfermedades, proyección de cotización de acciones y procesamiento de señales acústicas.
| Regresión lineal: Técnica de modelado estadístico para describir una variable de respuesta continua como función lineal de una o varias variables de predicción. Dado que los modelos de regresión lineal son sencillos de interpretar y fáciles de entrenar, suelen ser el primer modelo que se ajusta a un conjunto de datos nuevo. | Regresión no lineal: Técnica de modelado estadístico que ayuda a describir relaciones no lineales entre datos experimentales. Los modelos de regresión no lineal se suelen considerar paramétricos, es decir, se describen como ecuaciones no lineales. | Una clase especial de modelos no lineales, los modelos lineales generalizados, utilizan métodos lineales. Su enfoque implica ajustar una combinación lineal de las entradas a una función no lineal, la función de enlace, de las salidas. |
|
|
|
Aprendizaje supervisado para clasificación o regresión
Se pueden utilizar varios algoritmos de aprendizaje supervisado, tanto para tareas de clasificación como regresión.
| Árboles de decisión: Permiten predecir las respuestas a datos siguiendo el árbol de decisión desde la raíz (inicio) hasta un nodo hoja. Un árbol de decisión consta de condiciones de ramificación en las que el valor de una variable de predicción se compara con un peso entrenado. El número de ramas y los valores de los pesos se determinan durante el entrenamiento. | Support Vector Machines (SVM): Clasifican los datos buscando el hiperplano que mejor separa todos los puntos de datos de una clase de los de la otra clase. En la regresión con SVM, en lugar de buscar un hiperplano que separe los datos, los algoritmos buscan un modelo que se desvíe de los datos medidos por un valor no superior a una pequeña cantidad, con valores de parámetros lo más pequeños posible para reducir la sensibilidad al error. | Redes neuronales: Sistemas adaptativos que aprenden empleando neuronas o nodos interconectados en una estructura en capas que se asemeja al cerebro humano. Una red neuronal puede aprender a partir de datos; por lo tanto, puede entrenarse para reconocer patrones, clasificar datos y predecir eventos futuros. El comportamiento de una red neuronal está definido por la forma en que se conectan sus elementos individuales y la fortaleza, o pesos, de esas conexiones. Estos pesos se ajustan automáticamente durante el entrenamiento. |
|
|
|
Deep Learning es una forma especializada de Machine Learning que utiliza redes neuronales profundas para gestionar tareas más complejas y conjuntos de datos de mayor tamaño. Algoritmos de Deep Learning populares, como redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y redes de memoria a corto-largo plazo (LSTM), suelen ser supervisados.
Elección del algoritmo de aprendizaje supervisado adecuado
A la hora de elegir un algoritmo de aprendizaje supervisado, se deben considerar tradeoffs como requisitos computacionales y de memoria, precisión de predicción e interpretabilidad de los distintos algoritmos. Este proceso puede requerir prueba y error, y se puede simplificar aplicando Machine Learning automatizado (AutoML).
Tradeoff entre capacidad de predicción e interpretabilidad de varios algoritmos de aprendizaje supervisado.
Relevancia del aprendizaje supervisado
El aprendizaje supervisado es una de las principales áreas de Machine Learning e inteligencia artificial. Profesionales de ingeniería y ciencias utilizan el aprendizaje supervisado para crear modelos de IA que resuelven problemas del mundo real. Por ejemplo, en el modelado de sensores virtuales, los modelos de IA que se emplean para desarrollar esos sensores se entrenan con algoritmos de aprendizaje supervisado. Algunas de las áreas de aplicación del aprendizaje supervisado son:
- Bioinformática y dispositivos médicos: Las técnicas de aprendizaje supervisado se utilizan ampliamente en atención médica para captura de imágenes médicas, detección de tumores y descubrimiento de fármacos. El aprendizaje supervisado también se puede aplicar en tareas basadas en señales, como clasificación de datos de ECG para distinguir entre arritmia, insuficiencia cardíaca congestiva y ritmo sinusal normal.
- Producción de energía: Con aprendizaje supervisado aplicado a regresión, los equipos de ingeniería pueden proyectar tarifas energéticas, predecir carga eléctrica y crear modelos para diversas aplicaciones de energías renovables.
- Automatización industrial: El aprendizaje supervisado se puede emplear para desarrollar modelos de predicción para detección de anomalías, diagnóstico y detección de fallos.
- Finanzas cuantitativas y evaluación de riesgos: Los algoritmos de aprendizaje supervisado se utilizan para puntuación crediticia, trading algorítmico, predicción de cotización de acciones y clasificación de bonos.
Ejemplo de aprendizaje supervisado del mundo real
El estado de carga (SOC) es el nivel de carga de una batería eléctrica respecto a su capacidad expresado como porcentaje. El SOC debe estimarse con precisión en muchas aplicaciones, particularmente con vehículos eléctricos. Estimar el SOC de iones de litio con un enfoque de modelado basado en la física resulta muy complejo, debido a las condiciones de funcionamiento cambiantes y la significativa variabilidad de los dispositivos, incluso con baterías del mismo fabricante.
Recurrir al aprendizaje supervisado para crear un modelo de predicción para la estimación del SOC es un enfoque basado en datos que puede ayudar a afrontar estos desafíos. El modelo puede predecir el estado de carga de la batería de iones de litio de un vehículo a partir de datos de series temporales que representan diversas mediciones de la batería, como tensión, corriente y temperatura, y características derivadas, como la tensión y corriente promedio. Más información sobre este ejemplo.
SOC real y previsto empleando un modelo de regresión de proceso gaussiano en Statistics and Machine Learning Toolbox. (Ver código).
Aprendizaje supervisado con MATLAB
MATLAB® permite aplicar aprendizaje supervisado y crear modelos de predicción. Puede entrenar, validar y ajustar modelos de aprendizaje supervisado con Statistics and Machine Learning Toolbox™ y Deep Learning Toolbox™. Puede combinar herramientas de Machine Learning y Deep Learning con otras toolboxes de MATLAB para ejecutar flujos de trabajo específicos de cada sector. Sirviéndose de funciones integradas y apps interactivas, puede procesar y etiquetar datos, entrenar modelos, visualizar rendimiento de modelos y ajustar hiperparámetros para mejorar el rendimiento de modelos.
Preparación de datos
MATLAB admite datos de señales, visuales y de texto. Puede acceder a los datos y explorarlos desde la línea de comandos o bien de manera interactiva con apps de low-code:
- Seleccione una app de etiquetado de validación ground truth para validar o entrenar algoritmos de aprendizaje supervisado como clasificadores de imágenes, detectores de objetos, redes de segmentación semántica y aplicaciones de Deep Learning.
- Utilice la app Data Cleaner y la tarea de preprocesamiento de datos de Live Editor para preprocesar datos.
Pasos de preprocesamiento de datos con la app Data Cleaner en MATLAB. (Consulte la documentación).
En cuanto a ingeniería de características, MATLAB dispone de herramientas integradas para la mayoría de los métodos de extracción de características y selección de características.
Modelado con IA con apps de low-code
Las apps Classification Learner y Regression Learner ayudan a aplicar aprendizaje supervisado al diseño, ajuste, evaluación y optimización de modelos de Machine Learning para clasificación y regresión, respectivamente. Con estas apps de Machine Learning, puede:
- Entrenar modelos con distintos algoritmos de Machine Learning.
- Visualizar resultados y evaluar el rendimiento de modelos.
- Comparar el rendimiento de múltiples modelos.
- Generar código automáticamente para un modelo entrenado.
- Exportar un modelo entrenado al área de trabajo, Simulink® y MATLAB Production Server™.
App Classification Learner
App Regression Learner
Con la app Deep Network Designer, puede diseñar, analizar y modificar redes de Deep Learning de manera interactiva. También puede cargar redes previamente entrenadas o importar redes desde PyTorch® y TensorFlow™.
Diseño de una red neuronal profunda con la app Deep Network Designer en MATLAB. (Consulte la documentación).
Además de modelado con IA, la app Experiment Manager permite importar y gestionar múltiples experimentos de Machine Learning y Deep Learning, realizar un seguimiento de parámetros de entrenamiento, ajustar hiperparámetros, analizar resultados y comparar código de distintos experimentos.
Aprendizaje supervisado e IA embebida
Con MATLAB y Simulink, puede diseñar, simular, probar, verificar y desplegar modelos de IA, creados con aprendizaje supervisado, para optimizar el rendimiento y funcionalidad de sistemas embebidos complejos. Utilice bloques de Simulink dedicados para simular y probar la integración de modelos de IA en sistemas complejos. Genere automáticamente código optimizado para su despliegue en objetivos con recursos limitados.
Recursos
Amplíe sus conocimientos con documentación, ejemplos, vídeos y mucho más.
Documentación
Más información
- IA con MATLAB: Tutoriales y ejemplos
- Cursos a su ritmo sobre IA
- IA para procesamiento de señales
- IA para visión artificial
- Mantenimiento predictivo: Machine Learning supervisado y no supervisado (57:25) - Vídeo
- Deep Learning para ingeniería (5 vídeos) - Serie de vídeos
- Introducción a las proyecciones de series temporales (6:41) - Vídeo
Temas relacionados
Explore áreas temáticas similares comúnmente asociadas con productos de MATLAB y Simulink.
Prueba gratuita
Comience ahoraSeleccione un país/idioma
Seleccione un país/idioma para obtener contenido traducido, si está disponible, y ver eventos y ofertas de productos y servicios locales. Según su ubicación geográfica, recomendamos que seleccione: .
También puede seleccionar uno de estos países/idiomas:
Cómo obtener el mejor rendimiento
Seleccione China (en idioma chino o inglés) para obtener el mejor rendimiento. Los sitios web de otros países no están optimizados para ser accedidos desde su ubicación geográfica.
América
- América Latina (Español)
- Canada (English)
- United States (English)
Europa
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)