Aprendizaje supervisado

Introducción al aprendizaje supervisado

El aprendizaje supervisado es un tipo de técnica de Machine Learning que utiliza datos etiquetados para entrenar modelos y realizar predicciones. En el aprendizaje supervisado, un modelo aprende a realizar una tarea de clasificación o regresión empleando un conjunto conocido de datos de entrada y respuestas.

Cómo funciona el aprendizaje supervisado

El aprendizaje supervisado es el tipo más común de Machine Learning. Utiliza un conjunto de datos conocidos, denominado conjunto de datos de entrenamiento, para entrenar un algoritmo con un conjunto conocido de datos de entrada, denominados características, y respuestas conocidas. El conjunto de datos de entrenamiento abarca datos de entrada etiquetados que se corresponden con salidas o valores de respuesta deseados. Con este conjunto de datos, el algoritmo de aprendizaje supervisado crea un modelo a partir de relaciones entre las características y los datos de salida, y luego realiza predicciones de los valores de respuesta con un nuevo conjunto de datos.

El aprendizaje supervisado puede utilizarse en varios campos científicos y de ingeniería para desarrollar modelos que resuelvan problemas del mundo real. Por ejemplo, supongamos que profesionales clínicos disponen de datos de pacientes sobre edad, peso, altura y presión arterial, así como infartos de miocardio, y desean predecir si un paciente nuevo corre riesgo de sufrir un infarto. En este caso, pueden servirse de aprendizaje supervisado para modelar los datos existentes.

Flujo de trabajo simplificado de aprendizaje supervisado que muestra datos y etiquetas como entradas en la fase de entrenamiento, y datos nuevos con una respuesta predecible en la fase de inferencia. — Fases de entrenamiento e inferencia del aprendizaje supervisado.

Un flujo de aprendizaje supervisado típico comprende preparación de datos, selección de algoritmos, entrenamiento del modelo y evaluación del modelo. Dado que el aprendizaje supervisado se basa en datos etiquetados, es fundamental que los datos de entrenamiento sean reales. Por ejemplo, si el modelo se va a utilizar en un entorno con ruido, los datos de entrenamiento deben incluir niveles de ruido reales. La validación es otro paso importante del aprendizaje supervisado, para garantizar que el modelo generaliza correctamente datos no vistos anteriormente y evitar el sobreajuste.

Ajuste de modelos de aprendizaje supervisado

Aumentar la precisión y capacidad de predicción de un modelo de aprendizaje supervisado requiere ingeniería de características y ajuste de hiperparámetros. La ingeniería de características consiste en convertir datos no procesados en características que se pueden utilizar como entradas de un modelo de Machine Learning. El ajuste de hiperparámetros implica identificar el conjunto de parámetros que genera el mejor modelo.

Diagrama de flujo para ajustar un modelo de aprendizaje supervisado. Después de la selección y transformación de características, el modelo se entrena y ajusta de forma iterativa. — Uso de ingeniería de características y ajuste de hiperparámetros para mejorar el rendimiento de un modelo de aprendizaje supervisado.

La ingeniería de características implica selección de características y transformación de características. En la selección de características, se identifican las variables o características más relevantes que ofrecen la mejor capacidad de predicción cuando se modelan los datos. Durante la transformación de características, las características existentes se convierten en otras nuevas empleando análisis de componentes principales, factorización de matrices no negativa, análisis factorial y otras técnicas.

El ajuste de hiperparámetros busca la configuración óptima de los parámetros que controlan el proceso de aprendizaje, como tasa de aprendizaje, tamaño del lote y número de épocas.

Aprendizaje supervisado y Aprendizaje no supervisado

El aprendizaje supervisado y el aprendizaje no supervisado son tipos de Machine Learning.

El aprendizaje supervisado abarca tareas de clasificación y regresión, mientras que el aprendizaje no supervisado se emplea en tareas de clustering. — Dos tipos de Machine Learning: aprendizaje supervisado y aprendizaje no supervisado.

La principal diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado es que el aprendizaje supervisado necesita datos de entrenamiento etiquetados para entrenar un modelo de Machine Learning. En cambio, el aprendizaje no supervisado utiliza datos no etiquetados para descubrir relaciones ocultas sin intervención humana. Los resultados del aprendizaje supervisado pueden ser más precisos que los del aprendizaje no supervisado, debido a la presencia de datos etiquetados. No obstante, capturar datos etiquetados suele requerir intervención humana y puede demandar mucho tiempo, además de resultar costoso y poco práctico en ciertos casos.

En ocasiones, antes de utilizar el aprendizaje supervisado, se recurre al aprendizaje no supervisado para descubrir patrones en los datos de entrada e identificar características para el aprendizaje supervisado. Además de identificar características, es necesario determinar la categoría o respuesta correcta para todas las observaciones del conjunto de entrenamiento. El aprendizaje semisupervisado, que es también una técnica de Machine Learning, permite entrenar modelos con menos datos etiquetados, lo que reduce el esfuerzo de etiquetado.

Más información

Introducción al aprendizaje supervisado en Machine Learning (4:35)

Flujo de trabajo y algoritmos de aprendizaje supervisado

Conceptos básicos | Machine Learning simplificado (7:07)

Tipos de aprendizaje supervisado

Los principales tipos de modelos de Machine Learning creados por algoritmos de aprendizaje supervisado son los modelos de clasificación y regresión. En cada tipo de tarea, clasificación o regresión, pueden emplearse distintos algoritmos para modelar los datos.

Entre los algoritmos de aprendizaje supervisado para modelos de clasificación se encuentran Naive Bayes, vecino más cercano y análisis discriminante. Entre los algoritmos para modelos de regresión se encuentran regresión lineal, modelos lineales generalizados y proceso gaussiano. Las Support Vector Machines (SVM), árboles de decisión, métodos de ensemble y redes neuronales pueden utilizarse tanto para clasificación como para regresión. — Tipos de algoritmos de aprendizaje supervisado.

Aprendizaje supervisado para clasificación

En el aprendizaje supervisado, la clasificación consiste en separar los datos en clases o categorías específicas. El objetivo es asignar una clase, o etiqueta, de un conjunto de clases finito a una observación. Es decir, las respuestas de un modelo de clasificación son variables categóricas.

Entre sus aplicaciones típicas se incluyen captura de imágenes médicas, reconocimiento de voz y puntuación crediticia. Algunos ejemplos son determinar si un email es auténtico o spam, y si las piezas de un equipo son defectuosas o aptas.

Modelos de aprendizaje supervisado populares para tareas de clasificación
Regresión logística: Ajusta un modelo que puede predecir la probabilidad de que una respuesta binaria pertenezca a una clase u otra.	Análisis discriminante: Clasifica los datos buscando combinaciones lineales de características y presupone que diferentes clases generan datos basados en distribuciones gaussianas.	k vecino más cercanos (kNN): Categoriza los objetos según las clases de sus vecinos más cercanos en el conjunto de datos. Las predicciones de kNN presuponen que los objetos cercanos entre sí son similares.	Clasificadores Naive Bayes: Presuponen que la presencia de una característica en una clase es independiente de otras características. Clasifican datos nuevos en base a la mayor probabilidad de que pertenezcan a una determinada clase.

Aprendizaje supervisado para regresión

Puede utilizar técnicas de regresión en aprendizaje supervisado para comprender la relación entre respuestas y variables de entrada. Resultan útiles para conjuntos de datos con un rango de valores o cuando la respuesta es un número real, como temperatura o tiempo hasta el fallo de un equipo. Es decir, los modelos de regresión predicen respuestas continuas. Algunas de sus aplicaciones típicas son predicción de carga eléctrica, predicción del ciclo de vida restante de baterías, trading algorítmico, incidencia de enfermedades, proyección de cotización de acciones y procesamiento de señales acústicas.

Algoritmos de aprendizaje supervisado populares para tareas de regresión
Regresión lineal: Técnica de modelado estadístico para describir una variable de respuesta continua como función lineal de una o varias variables de predicción. Dado que los modelos de regresión lineal son sencillos de interpretar y fáciles de entrenar, suelen ser el primer modelo que se ajusta a un conjunto de datos nuevo.	Regresión no lineal: Técnica de modelado estadístico que ayuda a describir relaciones no lineales entre datos experimentales. Los modelos de regresión no lineal se suelen considerar paramétricos, es decir, se describen como ecuaciones no lineales.	Una clase especial de modelos no lineales, los modelos lineales generalizados, utilizan métodos lineales. Su enfoque implica ajustar una combinación lineal de las entradas a una función no lineal, la función de enlace, de las salidas.

Aprendizaje supervisado para clasificación o regresión

Se pueden utilizar varios algoritmos de aprendizaje supervisado, tanto para tareas de clasificación como regresión.

Algoritmos de aprendizaje supervisado populares tanto para tareas de clasificación como regresión
Árboles de decisión: Permiten predecir las respuestas a datos siguiendo el árbol de decisión desde la raíz (inicio) hasta un nodo hoja. Un árbol de decisión consta de condiciones de ramificación en las que el valor de una variable de predicción se compara con un peso entrenado. El número de ramas y los valores de los pesos se determinan durante el entrenamiento.	Support Vector Machines (SVM): Clasifican los datos buscando el hiperplano que mejor separa todos los puntos de datos de una clase de los de la otra clase. En la regresión con SVM, en lugar de buscar un hiperplano que separe los datos, los algoritmos buscan un modelo que se desvíe de los datos medidos por un valor no superior a una pequeña cantidad, con valores de parámetros lo más pequeños posible para reducir la sensibilidad al error.	Redes neuronales: Sistemas adaptativos que aprenden empleando neuronas o nodos interconectados en una estructura en capas que se asemeja al cerebro humano. Una red neuronal puede aprender a partir de datos; por lo tanto, puede entrenarse para reconocer patrones, clasificar datos y predecir eventos futuros. El comportamiento de una red neuronal está definido por la forma en que se conectan sus elementos individuales y la fortaleza, o pesos, de esas conexiones. Estos pesos se ajustan automáticamente durante el entrenamiento.

Deep Learning es una forma especializada de Machine Learning que utiliza redes neuronales profundas para gestionar tareas más complejas y conjuntos de datos de mayor tamaño. Algoritmos de Deep Learning populares, como redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y redes de memoria a corto-largo plazo (LSTM), suelen ser supervisados.

Elección del algoritmo de aprendizaje supervisado adecuado

A la hora de elegir un algoritmo de aprendizaje supervisado, se deben considerar tradeoffs como requisitos computacionales y de memoria, precisión de predicción e interpretabilidad de los distintos algoritmos. Este proceso puede requerir prueba y error, y se puede simplificar aplicando Machine Learning automatizado (AutoML).

Gráfica que muestra algoritmos de aprendizaje supervisado representados con interpretabilidad en el eje x, y capacidad de predicción en el eje y. — Tradeoff entre capacidad de predicción e interpretabilidad de varios algoritmos de aprendizaje supervisado.

Más información

Automatización de la elección de modelos en aprendizaje supervisado mediante optimización bayesiana

Proyección de series temporales con Deep Learning

Machine Learning supervisado y no supervisado en MATLAB

Relevancia del aprendizaje supervisado

El aprendizaje supervisado es una de las principales áreas de Machine Learning e inteligencia artificial. Profesionales de ingeniería y ciencias utilizan el aprendizaje supervisado para crear modelos de IA que resuelven problemas del mundo real. Por ejemplo, en el modelado de sensores virtuales, los modelos de IA que se emplean para desarrollar esos sensores se entrenan con algoritmos de aprendizaje supervisado. Algunas de las áreas de aplicación del aprendizaje supervisado son:

Bioinformática y dispositivos médicos: Las técnicas de aprendizaje supervisado se utilizan ampliamente en atención médica para captura de imágenes médicas, detección de tumores y descubrimiento de fármacos. El aprendizaje supervisado también se puede aplicar en tareas basadas en señales, como clasificación de datos de ECG para distinguir entre arritmia, insuficiencia cardíaca congestiva y ritmo sinusal normal.
Producción de energía: Con aprendizaje supervisado aplicado a regresión, los equipos de ingeniería pueden proyectar tarifas energéticas, predecir carga eléctrica y crear modelos para diversas aplicaciones de energías renovables.
Automatización industrial: El aprendizaje supervisado se puede emplear para desarrollar modelos de predicción para detección de anomalías, diagnóstico y detección de fallos.
Finanzas cuantitativas y evaluación de riesgos: Los algoritmos de aprendizaje supervisado se utilizan para puntuación crediticia, trading algorítmico, predicción de cotización de acciones y clasificación de bonos.

Ejemplo de aprendizaje supervisado del mundo real

El estado de carga (SOC) es el nivel de carga de una batería eléctrica respecto a su capacidad expresado como porcentaje. El SOC debe estimarse con precisión en muchas aplicaciones, particularmente con vehículos eléctricos. Estimar el SOC de iones de litio con un enfoque de modelado basado en la física resulta muy complejo, debido a las condiciones de funcionamiento cambiantes y la significativa variabilidad de los dispositivos, incluso con baterías del mismo fabricante.

Recurrir al aprendizaje supervisado para crear un modelo de predicción para la estimación del SOC es un enfoque basado en datos que puede ayudar a afrontar estos desafíos. El modelo puede predecir el estado de carga de la batería de iones de litio de un vehículo a partir de datos de series temporales que representan diversas mediciones de la batería, como tensión, corriente y temperatura, y características derivadas, como la tensión y corriente promedio. Más información sobre este ejemplo.

Cinco gráficas de líneas que muestran SOC real y el previsto utilizando aprendizaje supervisado; el primero corresponde a los datos de entrenamiento, los otros cuatro muestran datos de prueba representados a diferentes temperaturas. — SOC real y previsto empleando un modelo de regresión de proceso gaussiano en Statistics and Machine Learning Toolbox. (Ver código).

Más información

Generación de un modelo de condición para maquinaria industrial y procesos de fabricación

Desarrollo de una herramienta de calificación crediticia automatizada con árboles de decisión

Nokia crea un sistema de Machine Learning para optimizar las pruebas de diseño de hardware

Aprendizaje supervisado con MATLAB

MATLAB^® permite aplicar aprendizaje supervisado y crear modelos de predicción. Puede entrenar, validar y ajustar modelos de aprendizaje supervisado con Statistics and Machine Learning Toolbox^™ y Deep Learning Toolbox^™. Puede combinar herramientas de Machine Learning y Deep Learning con otras toolboxes de MATLAB para ejecutar flujos de trabajo específicos de cada sector. Sirviéndose de funciones integradas y apps interactivas, puede procesar y etiquetar datos, entrenar modelos, visualizar rendimiento de modelos y ajustar hiperparámetros para mejorar el rendimiento de modelos.

Preparación de datos

MATLAB admite datos de señales, visuales y de texto. Puede acceder a los datos y explorarlos desde la línea de comandos o bien de manera interactiva con apps de low-code:

Seleccione una app de etiquetado de validación ground truth para validar o entrenar algoritmos de aprendizaje supervisado como clasificadores de imágenes, detectores de objetos, redes de segmentación semántica y aplicaciones de Deep Learning.
Utilice la app Data Cleaner y la tarea de preprocesamiento de datos de Live Editor para preprocesar datos.

App Data Cleaner empleada para gestionar valores atípicos en aprendizaje supervisado. — Pasos de preprocesamiento de datos con la app Data Cleaner en MATLAB. (Consulte la documentación).

En cuanto a ingeniería de características, MATLAB dispone de herramientas integradas para la mayoría de los métodos de extracción de características y selección de características.

Modelado con IA con apps de low-code

Las apps Classification Learner y Regression Learner ayudan a aplicar aprendizaje supervisado al diseño, ajuste, evaluación y optimización de modelos de Machine Learning para clasificación y regresión, respectivamente. Con estas apps de Machine Learning, puede:

Entrenar modelos con distintos algoritmos de Machine Learning.
Visualizar resultados y evaluar el rendimiento de modelos.
Comparar el rendimiento de múltiples modelos.
Generar código automáticamente para un modelo entrenado.
Exportar un modelo entrenado al área de trabajo, Simulink^® y MATLAB Production Server™.

App Classification Learner

App Regression Learner

Con la app Deep Network Designer, puede diseñar, analizar y modificar redes de Deep Learning de manera interactiva. También puede cargar redes previamente entrenadas o importar redes desde PyTorch^® y TensorFlow^™.

Red neuronal profunda para aprendizaje supervisado creada en MATLAB para aprendizaje supervisado. — Diseño de una red neuronal profunda con la app Deep Network Designer en MATLAB. (Consulte la documentación).

Además de modelado con IA, la app Experiment Manager permite importar y gestionar múltiples experimentos de Machine Learning y Deep Learning, realizar un seguimiento de parámetros de entrenamiento, ajustar hiperparámetros, analizar resultados y comparar código de distintos experimentos.

Aprendizaje supervisado e IA embebida

Con MATLAB y Simulink, puede diseñar, simular, probar, verificar y desplegar modelos de IA, creados con aprendizaje supervisado, para optimizar el rendimiento y funcionalidad de sistemas embebidos complejos. Utilice bloques de Simulink dedicados para simular y probar la integración de modelos de IA en sistemas complejos. Genere automáticamente código optimizado para su despliegue en objetivos con recursos limitados.

Más información

Clasificación de datos con la app Classification Learner (4:34)

Generación de un modelo de Simulink de reconocimiento de actividad de personas para su despliegue en un smartphone

Detección de sobreviraje en automóviles BMW con Machine Learning

Recursos

Amplíe sus conocimientos con documentación, ejemplos, vídeos y mucho más.

Documentación

Más información

Temas relacionados

Explore áreas temáticas similares comúnmente asociadas con productos de MATLAB y Simulink.

Prueba gratuita

Comience ahora