Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Entrenar clasificadores Naive Bayes utilizando la aplicación clasificación aprendiz

En este ejemplo se muestra cómo crear y comparar diferentes clasificadores Bayes ingenuos mediante la aplicación clasificación de aprendizaje y exportar modelos entrenados al área de trabajo para realizar predicciones para nuevos datos.

Los clasificadores Bayes Naive aprovechan el teorema de Bayes y presuponen que los predictores son independientes entre sí dentro de cada clase. Sin embargo, los clasificadores parecen funcionar bien incluso cuando la suposición de independencia no es válida. Puede usar Bayes ingenua con dos o más clases en el aprendizaje de clasificación. La aplicación le permite entrenar un modelo Bayes Ingenuo gaussiano o un modelo Bayes Ingenuo kernel individualmente o simultáneamente.

Esta tabla enumera los modelos Bayes ingenuos disponibles en el aprendizaje de clasificación y las distribuciones de probabilidad utilizadas por cada modelo para ajustar los predictores.

ModeloPredictor numéricoPredictor categórico
Bayes ingenua gaussianaDistribución gaussiana (o distribución normal)Distribución multinomial multivariada
Bayes ingenua del kernelDistribución del kernel puede especificar el tipo de kernel y el soporte.
El alumno de clasificación determina automáticamente el ancho del kernel mediante la función subyacente.fitcnb
Distribución multinomial multivariada

Este ejemplo utiliza el conjunto de datos de iris de Fisher, que contiene mediciones de flores (longitud del pétalo, ancho del pétalo, longitud del sépalo y ancho del sésido) para especímenes de tres especies. Entrena a los clasificadores Bayes ingenuos para predecir la especie basándose en las mediciones predictoras.

  1. En la ventana de comandos, cargue el conjunto de datos de iris de Fisher y cree una tabla de predictores de medida (o entidades) utilizando variables del conjunto de datos.MATLAB®

    fishertable = readtable('fisheriris.csv');
  2. Haga clic en la pestaña y, a continuación, haga clic en la flecha situada a la derecha de la sección para abrir la galería de aplicaciones.AppsApps En el grupo, haga clic en.Machine Learning and Deep LearningEl alumno de clasificación

  3. En la pestaña, en la sección, seleccione.El alumno de clasificaciónFileNew Session > From Workspace

  4. En el cuadro de diálogo nueva sesión, seleccione la tabla de la lista (si es necesario).fishertableWorkspace Variable

    Como se muestra en el cuadro de diálogo, la aplicación selecciona las variables de respuesta y predictores en función de su tipo de datos. El pétalo y la longitud y el ancho del sépalo son predictores, y la especie es la respuesta que desea clasificar. Para este ejemplo, no cambie las selecciones.

  5. Para aceptar el esquema de validación predeterminado y continuar, haga clic en.Start Session La opción de validación predeterminada es la validación cruzada, para protegerse contra el sobreajuste.

    El alumno de clasificación crea un gráfico de dispersión de los datos.

  6. Utilice el gráfico de dispersión para investigar qué variables son útiles para predecir la respuesta. Seleccione diferentes opciones en las listas y debajo para visualizar la distribución de las especies y las mediciones.XYPredictors Observe qué variables separan los colores de las especies con más claridad.

    La especie (puntos azules) es fácil de separar de las otras dos especies con los cuatro predictores.setosa Las especies están mucho más juntas en todas las mediciones predictoras y se superponen, especialmente cuando se traza la longitud y el ancho del sépalo. es más fácil de predecir que las otras dos especies.versicolorvirginicasetosa

  7. Cree un modelo Bayes ingenuo. En la pestaña, en la sección, haga clic en la flecha para abrir la galería.El alumno de clasificaciónModel Type En el grupo, haga clic en.Naive Bayes ClassifiersGaussian Naive Bayes Tenga en cuenta que el aprendizaje de clasificación deshabilita el botón en la sección, porque este tipo de modelo no tiene ninguna configuración avanzada.AdvancedModel Type

    En la sección, haga clic en.TrainingTrain

    Sugerencia

    Si tiene el cuadro de diálogo abrir Grupo abre la primera vez que haga clic (o cuando haga clic de nuevo después de un período prolongado de tiempo).Parallel Computing Toolbox™TrainTrain El cuadro de diálogo permanece abierto mientras la aplicación abre un grupo paralelo de trabajadores. Durante este tiempo, no puede interactuar con el software. Después de que se abra el grupo, puede entrenar varios clasificadores a la vez y continuar trabajando.

    La aplicación crea un modelo Bayes Ingenuo gaussiano y traza los resultados.

    La aplicación muestra el modelo en la lista historial.Gaussian Naive Bayes Compruebe la puntuación de validación del modelo en el cuadro.Accuracy La partitura muestra que el modelo funciona bien.

    Para el modelo, de forma predeterminada, la aplicación modela la distribución de predictores numéricos utilizando la distribución gaussiana y modela la distribución de predictores categóricos utilizando la distribución multinomial multivariante (MVMN).Gaussian Naive Bayes

    Nota

    La validación introduce cierta aleatoriedad en los resultados. Los resultados de validación del modelo pueden variar de los resultados mostrados en este ejemplo.

  8. Examine el gráfico de dispersión. Una X indica puntos mal clasificados. Los puntos azules (especies) están todos correctamente clasificados, pero las otras dos especies tienen puntos mal clasificados.setosa Debajo, cambia entre las opciones y.PlotDatosModel predictions Observe el color de los puntos incorrectos (X). O bien, para ver solo los puntos incorrectos, desactive la casilla de verificación.Correct

  9. Entrenar un modelo Bayes Ingenuo kernel para la comparación. En la pestaña, en la sección, haga clic en.El alumno de clasificaciónModel TypeKernel Naive Bayes Tenga en cuenta que el aprendizaje de clasificación habilita el botón, ya que este tipo de modelo tiene una configuración avanzada.Advanced

    La aplicación muestra un modelo Bayes Ingenuo del kernel de borrador en la lista historial.

    En la sección, haga clic para cambiar la configuración en el menú de opciones de Bayes Naive avanzado.Model TypeAdvanced Seleccione Triangle de la lista y seleccioneKernel Type Positive de la lista.Support

    Nota

    Los ajustes del menú opciones de Bayes Naive avanzadas están disponibles solo para datos continuos. Señalando para mostrar la información sobre herramientas "especificar la función de suavizado de kernel para variables continuas" y señalando para mostrar la información sobre herramientas "especificar el soporte de densidad de suavizado del kernel para variables continuas."Kernel TypeSupport

    En la sección, haga clic para entrenar el nuevo modelo.TrainingTrain

    La lista historial ahora incluye el nuevo modelo Bayes Ingenuo del kernel. Su puntuación de validación de modelo es mejor que la puntuación para el modelo Bayes Ingenuo gaussiano. La aplicación resalta la puntuación del mejor modelo mediante la esquematización en una caja.Accuracy

  10. En la lista historial, haga clic en cada modelo para ver y comparar los resultados.

  11. Entrenar un modelo Bayes Ingenuo gaussiano y un modelo Bayes Ingenuo kernel al mismo tiempo. En la pestaña, en la sección, haga clic en.El alumno de clasificaciónModel TypeAll Naive Bayes El alumno de clasificación deshabilita el botón.Advanced En la sección, haga clic en.TrainingTrain

    La aplicación entrena uno de cada tipo de modelo Bayes ingenuo y resalta la puntuación del mejor modelo o modelos.Accuracy

  12. En la lista historial, haga clic en un modelo para ver los resultados. Examine el diagrama de dispersión para el modelo entrenado e intente trazar diferentes predictores. Los puntos clasificados erróneamente aparecen como una X.

  13. Para inspeccionar la precisión de las predicciones en cada clase, en la pestaña, en la sección, haga clic en.El alumno de clasificaciónPlotsConfusion Matrix La aplicación muestra una matriz de clase verdadera y los resultados de la clase pronosticada.

    Nota

    La validación introduce cierta aleatoriedad en los resultados. Los resultados de la matriz de confusión pueden variar de los resultados mostrados en este ejemplo.

  14. En la lista historial, haga clic en los otros modelos y compare sus resultados.

  15. En la lista historial, haga clic en el modelo con la puntuación más alta.Accuracy Para mejorar el modelo, intente modificar sus características. Por ejemplo, vea si puede mejorar el modelo eliminando entidades con baja potencia predictiva.

    En la pestaña, en la sección, haga clic en.El alumno de clasificaciónFeaturesFeature Selection

    En el menú selección de características, desactive las casillas de verificación y para excluirlas de los predictores.PetalLengthPetalWidth Un nuevo modelo de borrador (modelo 4) aparece en la lista historial con la nueva configuración (características 2/4), basada en el modelo Bayes Ingenuo del kernel (modelo 3,2 en la lista historial).

    En la sección, haga clic para entrenar un nuevo modelo Bayes Ingenuo del kernel usando las nuevas opciones de predictor.TrainingTrain

    La lista historial incluye ahora el modelo 4. También es un modelo Bayes Ingenuo kernel, entrenado usando sólo 2 de 4 predictores.

  16. Para determinar qué predictores se incluyen, haga clic en un modelo en la lista historial y, a continuación, haga clic en la sección y observe qué casillas de verificación están seleccionadas.Selección de característicasFeatures El modelo con sólo mediciones sepales (modelo 4) tiene una puntuación mucho más baja que los modelos que contienen todos los predictores.Accuracy

  17. Entrenar otro modelo de Bayes Ingenuo kernel incluyendo sólo las mediciones de pétalo. Cambie las selecciones en el menú selección de características y haga clic en.Train

    El modelo entrenado utilizando sólo las mediciones de pétalo (modelo 5) se realiza de forma comparable al modelo que contiene todos los predictores. Los modelos no predicen mejor utilizando todas las mediciones en comparación con sólo las mediciones de pétalo. Si la recopilación de datos es costosa o difícil, es posible que prefiera un modelo que se realice satisfactoriamente sin algunos predictores.

  18. Para investigar las entidades que se incluirán o excluirán, utilice el trazado de coordenadas paralelas. En la pestaña, en la sección, haga clic en.El alumno de clasificaciónPlotsParallel Coordinates Plot

  19. En la lista historial, haga clic en el modelo con la puntuación más alta.Accuracy Para mejorar aún más el modelo, intente cambiar la configuración de Bayes ingenua. En la pestaña, en la sección, haga clic en.Classification LearnerModel TypeAdvanced El botón solo está habilitado para los modelos Bayes ingenuos del kernel.Advanced Cambie un ajuste y, a continuación, entrenar el nuevo modelo haciendo clic.Train

  20. Exporte el modelo entrenado al espacio de trabajo. En la pestaña, en la sección, seleccione.Classification LearnerExportExport Model > Export Model Ver.Modelo de clasificación de exportación para predecir nuevos datos

  21. Examine el código para entrenar este clasificador. En la sección, haga clic en.ExportGenerate Function

Utilice el mismo flujo de trabajo para evaluar y comparar los otros tipos de clasificador que puede entrenar en el aprendizaje de clasificación.

Para probar todos los ajustes preestablecidos del modelo de clasificador disponibles para el conjunto de datos:

  1. Haga clic en la flecha de la sección para abrir la galería de clasificadores.Model Type

  2. En el grupo, haga clic y, a continuación, haga clic en la sección.Get StartedAllTrainTraining

Para obtener información sobre otros tipos de clasificadores, consulte.Modelos de clasificación de trenes en la aplicación clasificación aprendiz

Temas relacionados