funciones miden la inexactitud predictiva de los modelos de clasificación.La pérdida de clasificación Cuando se compara el mismo tipo de pérdida entre muchos modelos, una pérdida menor indica un mejor modelo predictivo.
Considere el siguiente escenario.
es la pérdida de clasificación promedio ponderada.L
es el tamaño de la muestra.n
Para la clasificación binaria:
yj es la etiqueta de clase observada. El software codifica como – 1 o 1, indicando la clase negativa o positiva, respectivamente.
(fXj) es la puntuación de clasificación sin procesar para la observación (fila) de los Datos predictores.jX
Mj =
yj(fXj) es la puntuación de clasificación para clasificar la observación en la clase correspondiente aj
yj. Los valores positivos de Mj indicar la clasificación correcta y no contribuyen mucho a la pérdida media. Los valores negativos de
Mj indicar una clasificación incorrecta y contribuir significativamente a la pérdida media.
Para algoritmos que admiten la clasificación multiclase (es decir, ≥ 3):K
yj*
es un vector de – 1 ceros, con 1 en la posición correspondiente a la clase verdadera, observadaK
yj. Por ejemplo, si la clase verdadera de la segunda observación es la tercera clase y = 4, entoncesKy*2
= [0 0 1 0] ′. El orden de las clases corresponde al orden en la propiedad del modelo de entrada.ClassNames
(fXj) es el vector de longitud de las puntuaciones de clase para la observación de los Datos predictores.KjX El orden de las puntuaciones corresponde al orden de las clases de la propiedad del modelo de entrada.ClassNames
Mj =
yj*′ (fXj). por lo tanto Mj es la puntuación de clasificación escalar que predice el modelo para la clase verdadera observada.
El peso para la observación esj
Wj. El software normaliza los pesos de observación de modo que sumará a la probabilidad de clase anterior correspondiente. El software también normaliza las probabilidades previas por lo que suman a 1. por lo tanto
Dado este escenario, en la tabla siguiente se describen las funciones de pérdida admitidas que se pueden especificar mediante el argumento de par nombre-valor.'LossFun'
Función de pérdida | Valor deLossFun | Ecuación |
---|
Desviación binomial | 'binodeviance' | |
Pérdida exponencial | 'exponential' | |
Error de clasificación | 'classiferror' |
Es la fracción ponderada de las observaciones mal clasificadas donde es la etiqueta de clase correspondiente a la clase con la probabilidad posterior máxima. {} es la función indicadora.Ix |
La pérdida de bisagra | 'hinge' | |
La pérdida de Logit | 'logit' | |
El costo mínimo | 'mincost' | Costo mínimo. El software calcula el coste mínimo ponderado utilizando este procedimiento para observaciones = 1,...,.jn
Estimar el 1 por vector de los costos de clasificación esperados para la observación:Kj
(fXj) es el vector de columna de las probabilidades posteriores de clase para la clasificación binaria y multiclase. es la matriz de costes que el modelo de entrada almacena en la propiedad.CCosto Para la observación, predecir la etiqueta de clase correspondiente al coste mínimo de clasificación esperado:j
Utilizando, identifique el costo incurrido (CCj) para realizar la predicción.
La pérdida de costo mínima ponderada, promedio, es
|
Pérdida cuadrática | 'quadratic' | |
Esta figura compara las funciones de pérdida (excepto) para una observación.'mincost'
m Algunas funciones se normalizan para pasar a través de [0,1].