Capítulo 4
Aplicación del aprendizaje supervisado
Cuándo utilizar aprendizaje supervisado
Un algoritmo de aprendizaje supervisado toma un conjunto conocido de datos de entrada (el conjunto de entrenamiento) y respuestas conocidas sobre esos datos (salidas), y entrena un modelo para generar predicciones razonables como respuesta a datos de entrada nuevos. Utilice aprendizaje supervisado si dispone de datos existentes para la salida que desea predecir.
Todas las técnicas de aprendizaje supervisado son básicamente una forma de clasificación o regresión.
Las técnicas de clasificación predicen respuestas discretas; por ejemplo, si un email es genuino o spam, o si un tumor es pequeño, mediano o grande. Los modelos de clasificación se entrenan para clasificar datos en categorías. Entre sus aplicaciones se incluyen captura de imágenes médicas, reconocimiento del habla y puntuación crediticia.
Las técnicas de regresión predicen respuestas continuas; por ejemplo, cambios de temperatura o fluctuaciones en el consumo de electricidad. Entre sus aplicaciones se incluyen predicción de cotización de acciones, reconocimiento de escritura manuscrita y procesamiento de señales acústicas.
Cómo seleccionar el algoritmo adecuado
Como vimos en el capítulo 1, seleccionar un algoritmo de Machine Learning es un proceso de ensayo y error. Además, es un tradeoff entre características específicas de los algoritmos, tales como:
- Rapidez del entrenamiento
- Uso de memoria
- Precisión predictiva con datos nuevos
- Transparencia o interpretabilidad (con qué facilidad se pueden comprender los motivos por los que un algoritmo efectúa predicciones)