Main Content

Seleccionar datos para regresión o abrir una sesión guardada en la app

Cuando abre por primera vez la app Regression Learner, puede elegir si desea importar datos o abrir una sesión de la app previamente guardada. Para importar datos, consulte Seleccionar datos desde el espacio de trabajo y Importar datos desde un archivo. Para abrir una sesión guardada, consulte Guardar y abrir una sesión en la app.

Seleccionar datos desde el espacio de trabajo

Sugerencia

En Regression Learner, las tablas son la forma más fácil de trabajar con los datos, ya que pueden contener datos numéricos y de etiquetas. Utilice Import Tool para importar los datos al espacio de trabajo de MATLAB® como tabla o utilice las funciones de la tabla para crear una función table a partir de las variables del espacio de trabajo. Consulte Tablas.

  1. Cargue los datos en el espacio de trabajo de MATLAB.

    Las variables predictoras pueden ser vectores numéricos, categóricos, de cadenas o lógicos, arreglos de celdas de vectores de caracteres o arreglos de caracteres. La variable de respuesta debe ser un vector de punto flotante (precisión simple o doble).

    Combine los datos de los predictores en una variable, ya sea una tabla o una matriz. También puede combinar los datos de los predictores y la variable de respuesta, o puede mantenerlos separados.

    Para ver conjuntos de datos de ejemplo, consulte Datos de ejemplo para regresión.

  2. En la pestaña Apps, haga clic en Regression Learner para abrir la app.

  3. En la pestaña Learn, de la sección File, haga clic en New Session > From Workspace.

  4. En el cuadro de diálogo New Session from Workspace, en Data Set Variable, seleccione una tabla o una matriz de las variables del espacio de trabajo.

    Si selecciona una matriz, elija si desea utilizar filas o columnas para las observaciones haciendo clic en los botones de las opciones.

  5. En Response, observe la variable de respuesta predeterminada. La app intenta seleccionar una variable de respuesta adecuada de la variable del conjunto de datos y trata todas las demás variables como predictores.

    Si desea utilizar una variable de respuesta distinta, puede:

    • Utilizar la lista para seleccionar otra variable de la variable del conjunto de datos.

    • Seleccionar una variable independiente del espacio de trabajo haciendo clic en el botón de opción From workspace y, a continuación, seleccionando una variable de la lista.

  6. En Predictors, añada o elimine predictores utilizando las casillas. Añada o elimine todos los predictores haciendo clic en Add All o Remove All. También puede añadir o eliminar varios predictores seleccionándolos en la tabla y, a continuación, haciendo clic en Add N o Remove N, donde N es el número de predictores seleccionados. Los botones Add All y Remove All cambian a Add N y Remove N cuando selecciona varios predictores.

  7. Haga clic en Start Session para aceptar el esquema de validación predeterminado y continuar. La opción de validación predeterminada es la validación cruzada de 5 particiones, que protege del sobreajuste.

    Sugerencia

    Si tiene un conjunto de datos grande, puede que desee cambiar a la validación por retención. Para obtener más información, consulte Elegir esquema de validación.

Nota

Si prefiere cargar datos en la app directamente desde la línea de comandos, puede especificar los datos predictores, la variable de respuesta y el tipo de validación que utilizar en Regression Learner en la llamada de la línea de comandos a regressionLearner. Para obtener más información, consulte Regression Learner.

Para ver los siguientes pasos, consulte Train Regression Models in Regression Learner App.

Importar datos desde un archivo

  1. En la pestaña Learn, en la sección File, seleccione New Session > From File.

  2. Seleccione un tipo de archivo de la lista, como hojas de cálculo, archivos de texto o archivos de valores separados por comas (.csv), o seleccione All Files para examinar otros tipos de archivos como los .dat.

Datos de ejemplo para regresión

Para empezar a utilizar Regression Learner, pruebe estos conjuntos de datos de ejemplo.

NombreTamañoDescripción
CochesNúmero de predictores: 7
Número de observaciones: 406
Respuesta: MPG (millas por galón)

Datos sobre diferentes modelos de coche, 1970-1982. Prediga el ahorro de combustible (en millas por galón) o una de las otras características.

Para ver un ejemplo paso a paso, consulte Train Regression Trees Using Regression Learner App.

Cree una tabla a partir de las variables del conjunto de datos carbig.

load carbig
cartable = table(Acceleration,Cylinders,Displacement, ...
    Horsepower,Model_Year,Weight,Origin,MPG);

HospitalNúmero de predictores: 5
Número de observaciones: 100
Respuesta: Diastolic

Datos hospitalarios simulados. Prediga la presión arterial diastólica de los pacientes.

Cree una tabla a partir de las variables del conjunto de datos patients.

load patients
hospitaltable = table(Gender,Age,Weight,Smoker,Systolic, ...
    Diastolic);

Elegir esquema de validación

Elija un método de validación para examinar la precisión predictiva de los modelos ajustados. La validación calcula el rendimiento del modelo en nuevos datos y ayuda a elegir el mejor modelo. La validación protege del sobreajuste. Un modelo que es demasiado flexible y padece sobreajuste tiene una peor precisión de validación. Elija un esquema de validación antes de entrenar un modelo, para poder comparar todos los modelos de su sesión usando el mismo esquema de validación.

Sugerencia

Pruebe el esquema de validación predeterminado y haga clic en Start Session para continuar. La opción predeterminada es la validación cruzada de 5 particiones, que protege del sobreajuste.

Si tiene un conjunto de datos grande y a los modelos de entrenamiento les lleva demasiado tiempo usar la validación cruzada, vuelva a importar los datos y, en su lugar, pruebe con la validación por retención, que es más rápida.

Supongamos que no se reservan datos para las pruebas, lo cual es verdadero de forma predeterminada.

  • Cross-Validation: Seleccione el número de particiones (o divisiones) para dividir el conjunto de datos.

    Si elige k particiones, la app:

    1. Divide los datos en k conjuntos o particiones inconexas

    2. Para cada partición de validación:

      1. Entrena un modelo utilizando las observaciones de la partición de entrenamiento (observaciones que no están en la partición de validación)

      2. Evalúa el rendimiento del modelo utilizando datos de la partición de validación

    3. Calcula el error de validación medio de todas las particiones

    Este método ofrece una buena estimación de la precisión predictiva del modelo final entrenado con el conjunto de datos completo. Requiere varios ajustes, pero usa todos los datos de forma eficiente, por lo que funciona bien para conjuntos de datos pequeños.

  • Holdout Validation: seleccione un porcentaje de los datos para utilizar como conjunto de validación. La app entrena un modelo en el conjunto de entrenamiento y evalúa su rendimiento con el conjunto de validación. El modelo usado para la validación se basa solo en una parte de los datos, por lo que la validación por retención es adecuada solo para conjuntos de datos grandes. El modelo final se entrena usando el conjunto de datos completo.

  • Resubstitution Validation: no protege del sobreajuste. La app utiliza todos los datos para el entrenamiento y calcula la tasa de error sobre los mismos datos. Sin datos de validación independientes, obtiene una estimación poco realista del rendimiento del modelo con nuevos datos. Es decir, es probable que la precisión de ejemplo del entrenamiento sea muy poco realista y que la precisión predictiva sea inferior.

    Para ayudarle a evitar el sobreajuste en los datos de entrenamiento, elija otro esquema de validación en su lugar.

Nota

El esquema de validación solo afecta a la forma en que Regression Learner calcula las métricas de validación. El modelo final se entrena siempre con el conjunto de datos completo, excluyendo los datos reservados para las pruebas.

Todos los modelos que entrene una vez seleccionados los datos usan el mismo esquema de validación que seleccione en este cuadro de diálogo. Puede comparar todos los modelos de su sesión utilizando el mismo esquema de validación.

Para cambiar la validación seleccionada y entrenar nuevos modelos, puede seleccionar datos de nuevo, pero pierde los modelos entrenados. La app advierte de que importar datos inicia una nueva sesión. Guarde los modelos entrenados que desee conservar en el espacio de trabajo y, a continuación, importe los datos.

Para ver los siguientes pasos para entrenar modelos, consulte Train Regression Models in Regression Learner App.

(Opcional) Reservar datos para las pruebas

Cuando importa datos en Regression Learner, puede especificar si desea reservar un porcentaje de los datos para las pruebas. En la sección Test del cuadro de diálogo New Session, haga clic en la casilla para reservar un conjunto de datos de prueba. Especifique el porcentaje de los datos importados para utilizar como conjunto de prueba. Si lo prefiere, aún puede elegir importar un conjunto de datos de prueba independiente después de iniciar una sesión en la app.

Puede utilizar el conjunto de prueba para evaluar el rendimiento de un modelo entrenado. En concreto, puede comprobar si las métricas de validación ofrecen buenas estimaciones para el rendimiento del modelo en nuevos datos. Para obtener más información, consulte Evaluar el rendimiento del modelo de un conjunto de prueba. Para ver un ejemplo, consulte Train Regression Model Using Hyperparameter Optimization in Regression Learner App.

Nota

La app no utiliza datos de prueba para entrenar el modelo. Los modelos exportados desde la app se entrenan con la totalidad de los datos de entrenamiento y validación, excluyendo los datos reservados para las pruebas.

Guardar y abrir una sesión en la app

En Regression Learner, puede guardar la sesión actual de la app y abrir una sesión previamente guardada.

  • Para guardar la sesión actual de la app, haga clic en Save en la sección File de la pestaña Learn. Cuando guarda por primera vez la sesión actual, debe especificar el nombre y la ubicación del archivo de la sesión. La opción Save Session guarda la sesión actual, y la opción Save Session As guarda la sesión actual como archivo nuevo. La opción Save Compact Session As guarda una versión compacta de la sesión actual de la app, lo que da como resultado un tamaño de archivo más pequeño para la sesión guardada. Tenga en cuenta que la opción Save Compact Session As elimina permanentemente los datos de entrenamiento de todos los modelos entrenados en la sesión actual.

  • Para guardar una sesión de la app guardada, haga clic en Open en la sección File. En el cuadro de diálogo Select File to Open, seleccione la sesión guardada que desee abrir.

Temas relacionados