Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Trabajar con distribuciones de probabilidad

Las distribuciones de probabilidad son distribuciones teóricas basadas en suposiciones sobre una población de origen. Las distribuciones asignan la probabilidad al evento de que una variable aleatoria tiene un valor específico, discreto o cae dentro de un rango especificado de valores continuos.

ofrece varias formas de trabajar con distribuciones de probabilidad.Statistics and Machine Learning Toolbox™

Para obtener una lista de distribuciones admitidas, consulte.Statistics and Machine Learning ToolboxDistribuciones admitidas

Puede definir un objeto de probabilidad para una distribución personalizada y, a continuación, utilizar la aplicación de Fitter de distribución o las funciones del objeto de probabilidad, como,, y, para evaluar la distribución, generar números aleatorios, etcétera.pdfcdficdfrandom Para obtener más información, consulte.Definir distribuciones personalizadas mediante la aplicación de Fitter de distribución También puede definir una distribución personalizada mediante un identificador de función y utilizar la función para buscar estimaciones de máxima verosimilitud.mle Para ver un ejemplo, vea.Ajuste la distribución personalizada a los datos censurados

Objetos de distribución de probabilidad

Los objetos de distribución de probabilidad permiten ajustar una distribución de probabilidad a datos de ejemplo o definir una distribución especificando valores de parámetro. A continuación, puede realizar una variedad de análisis en el objeto de distribución.

Crear objetos de distribución de probabilidad

Estime los parámetros de distribución de probabilidad a partir de datos de ejemplo mediante el ajuste de un objeto de distribución de probabilidad a los datos.fitdist Puede ajustar una única distribución paramétrica o no paramétrica especificada a los datos de la muestra. También puede ajustar varias distribuciones del mismo tipo a los datos de ejemplo en función de las variables de agrupación. Para la mayoría de distribuciones, utiliza la estimación de máxima verosimilitud (MLE) para estimar los parámetros de distribución a partir de los datos de muestra.fitdist Para obtener más información y opciones de sintaxis adicionales, consulte.fitdist

Como alternativa, puede crear un objeto de distribución de probabilidad con valores de parámetro especificados mediante.makedist

Trabajar con objetos de distribución de probabilidad

Una vez creado un objeto de distribución de probabilidad, puede utilizar funciones de objeto para:

  • Calcule los intervalos de confianza para los parámetros de distribución ().paramci

  • Calcule las estadísticas de Resumen, incluidas la media (), la mediana (), el intervalo intercuartil (), la varianza () y la desviación estándar ().meanmedianiqrvarstd

  • Evalúe la función de densidad de probabilidad ().pdf

  • Evalúe la función de distribución acumulativa () o la función de distribución acumulativa inversa ().cdficdf

  • Calcule la función de verosimilitud () y de probabilidad de perfil () negativas para la distribución.negloglikproflik

  • Genere números aleatorios a partir de la distribución ().random

  • Truncar la distribución a los límites inferior y superior especificados ().truncate

Guardar un objeto de distribución de probabilidad

Para guardar el objeto de distribución de probabilidad en a. Archivo MAT:

  • En la barra de herramientas, haga clic.Save Workspace Esta opción guarda todas las variables del área de trabajo, incluidos los objetos de distribución de probabilidad.

  • En el explorador de área de trabajo, haga clic con el botón derecho en el objeto de distribución de probabilidad y seleccione.Save as Esta opción guarda sólo el objeto de distribución de probabilidad seleccionado, no las otras variables del espacio de trabajo.

Como alternativa, puede guardar un objeto de distribución de probabilidad directamente desde la línea de comandos mediante la función. le permite elegir un nombre de archivo y especificar el objeto de distribución de probabilidad que desea guardar.savesave Si no especifica un objeto (u otra variable), guarda todas las variables del área de trabajo, incluidos los objetos de distribución de probabilidad, en el nombre de archivo especificado.MATLAB® Para obtener más información y opciones de sintaxis adicionales, consulte.save

Analizar distribución mediante objetos de distribución de probabilidad

Este ejemplo muestra cómo utilizar objetos de distribución de probabilidad para realizar un análisis de varios pasos en una distribución ajustada.

El análisis ilustra cómo:

  • Ajuste una distribución de probabilidad a datos de muestra que contengan calificaciones de exámenes de 120 estudiantes mediante el uso.fitdist

  • Calcule la media de las calificaciones del examen utilizando.mean

  • Trace un histograma de los datos de la calificación del examen, superpuesto con una gráfica del pdf de la distribución ajustada, utilizando y.plotpdf

  • Calcule el límite para el 10 por ciento superior de las calificaciones de los alumnos utilizando.icdf

  • Guarde el objeto de distribución de probabilidad ajustada mediante.save

Cargue los datos de ejemplo.

load examgrades

Los datos de muestra contienen una matriz de calificaciones de examen de 120 por 5. Los exámenes se anotan en una escala de 0 a 100.

Cree un vector que contenga la primera columna de datos de grado de examen.

x = grades(:,1);

Ajuste una distribución normal a los datos de muestra mediante la creación de un objeto de distribución de probabilidad.fitdist

pd = fitdist(x,'Normal')
pd =    NormalDistribution    Normal distribution        mu = 75.0083   [73.4321, 76.5846]     sigma =  8.7202   [7.7391, 9.98843]  

Devuelve un objeto de distribución de probabilidad, del tipo.fitdistpdNormalDistribution Este objeto contiene los valores de parámetro estimados y, para la distribución normal ajustada.musigma Los intervalos junto a las estimaciones del parámetro son los intervalos de confianza del 95% para los parámetros de distribución.

Calcule la media de las calificaciones del examen de los alumnos utilizando el objeto de distribución ajustado.pd

m = mean(pd)
m = 75.0083 

La media de las calificaciones del examen es igual al parámetro estimado por.mufitdist

Trace un histograma de las calificaciones del examen. Superponer una gráfica del pdf ajustado para comparar visualmente la distribución normal ajustada con las calificaciones reales del examen.

x_pdf = [1:0.1:100]; y = pdf(pd,x_pdf);   figure histogram(x,'Normalization','pdf') line(x_pdf,y)

El PDF de la distribución ajustada sigue la misma forma que el histograma de las calificaciones del examen.

Determine el límite del 10 por ciento superior de las calificaciones de los exámenes de los alumnos mediante la función de distribución acumulativa inversa ().icdf Este límite equivale al valor en el que la CDF de la distribución de probabilidad es igual a 0,9. En otras palabras, el 90 por ciento de las calificaciones del examen son menores o iguales que el valor límite.

A = icdf(pd,0.9)
A = 86.1837 

Basado en la distribución ajustada, el 10 por ciento de los estudiantes recibió un grado de examen superior a 86,1837. Equivalentemente, 90 por ciento de los estudiantes recibieron un grado de examen menor o igual a 86,1837.

Guarde la distribución de probabilidad ajustada, como un archivo llamado.pdmyobject.mat

save('myobject.mat','pd')

Funciones de distribución de probabilidad

También puede trabajar con distribuciones de probabilidad utilizando funciones específicas de la distribución. Estas funciones son útiles para generar números aleatorios, calcular las estadísticas de Resumen dentro de un bucle o script y pasar un CDF o PDF como una función a otra.identificador de función (MATLAB) También puede utilizar estas funciones para realizar cálculos en matrices de valores de parámetro en lugar de un único conjunto de parámetros. Para obtener una lista de distribuciones de probabilidad admitidas, consulte.Distribuciones admitidas

Analizar distribución mediante funciones específicas de la distribución

En este ejemplo se muestra cómo utilizar funciones específicas de la distribución para realizar un análisis de varios pasos en una distribución ajustada.

El análisis ilustra cómo:

  • Ajuste una distribución de probabilidad a datos de muestra que contengan calificaciones de exámenes de 120 estudiantes mediante el uso.normfit

  • Trace un histograma de los datos de la calificación del examen, superpuesto con una gráfica del pdf de la distribución ajustada, utilizando y.plotnormpdf

  • Calcule el límite para el 10 por ciento superior de las calificaciones de los alumnos utilizando.norminv

  • Guarde los parámetros de distribución estimados mediante.save

Puede realizar el mismo análisis utilizando un objeto de distribución de probabilidad. Ver.Analizar distribución mediante objetos de distribución de probabilidad

Cargue los datos de ejemplo.

load examgrades

Los datos de muestra contienen una matriz de calificaciones de examen de 120 por 5. Los exámenes se anotan en una escala de 0 a 100.

Cree un vector que contenga la primera columna de datos de grado de examen.

x = grades(:,1);

Ajuste una distribución normal a los datos de ejemplo mediante el uso de.normfit

[mu,sigma,muCI,sigmaCI] = normfit(x)
mu = 75.0083 
sigma = 8.7202 
muCI = 2×1

   73.4321
   76.5846

sigmaCI = 2×1

    7.7391
    9.9884

La función devuelve las estimaciones de los parámetros de distribución normales y los intervalos de confianza del 95% para las estimaciones del parámetro.normfit

Trace un histograma de las calificaciones del examen. Superponer una gráfica del pdf ajustado para comparar visualmente la distribución normal ajustada con las calificaciones reales del examen.

x_pdf = [1:0.1:100]; y = normpdf(x_pdf,mu,sigma);   figure histogram(x,'Normalization','pdf') line(x_pdf,y)

El PDF de la distribución ajustada sigue la misma forma que el histograma de las calificaciones del examen.

Determine el límite del 10 por ciento superior de las calificaciones del examen de los alumnos mediante la función de distribución acumulativa inversa normal. Este límite equivale al valor en el que la CDF de la distribución de probabilidad es igual a 0,9. En otras palabras, el 90 por ciento de las calificaciones del examen son menores o iguales que el valor límite.

A = norminv(0.9,mu,sigma)
A = 86.1837 

Basado en la distribución ajustada, el 10 por ciento de los estudiantes recibió un grado de examen superior a 86,1837. Equivalentemente, 90 por ciento de los estudiantes recibieron un grado de examen menor o igual a 86,1837.

Guarde los parámetros de distribución estimados como un archivo llamado.myparameter.mat

save('myparameter.mat','mu','sigma')

Utilice funciones de distribución de probabilidad como identificador de función

Este ejemplo muestra cómo utilizar la función de distribución de probabilidad como un identificador de función en la prueba de bondad de ajuste de Chi-cuadrado ().normcdfchi2gof

En este ejemplo se prueba la hipótesis nula de que los datos de ejemplo contenidos en el vector de entrada proceden de una distribución normal con parámetros e iguales a la media () y la desviación estándar () de los datos de ejemplo, respectivamente.xµσmeanstd

rng('default') % For reproducibility x = normrnd(50,5,100,1); h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})
h = 0 

El resultado devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof

En el siguiente ejemplo se ilustra cómo utilizar las funciones de distribución de probabilidad como un identificador de función en el muestreador de sectores ().slicesample El ejemplo se utiliza para generar una muestra aleatoria de 2.000 valores de una distribución normal estándar y traza un histograma de los valores resultantes.normpdf

rng('default') % For reproducibility x = slicesample(1,2000,'pdf',@normpdf,'thin',5,'burnin',1000); histogram(x)

El histograma muestra que, cuando se utiliza, la muestra aleatoria resultante tiene una distribución normal estándar.normpdf

Si pasa la función de distribución de probabilidad para la distribución exponencial pdf () como un manejador de funciones en lugar de, entonces genera las muestras aleatorias 2.000 a partir de una distribución exponencial con un valor de parámetro predeterminado igual a 1.exppdfnormpdfslicesampleµ

rng('default') % For reproducibility x = slicesample(1,2000,'pdf',@exppdf,'thin',5,'burnin',1000); histogram(x)

El histograma muestra que la muestra aleatoria resultante cuando se utiliza tiene una distribución exponencial.exppdf

Aplicaciones de distribución de probabilidades e interfaces de usuario

Las aplicaciones y las interfaces de usuario proporcionan un enfoque interactivo para trabajar con distribuciones paramétricas y no paramétricas de probabilidad.

Distribución de la aplicación Fitter

La aplicación le permite ajustar de forma interactiva una distribución de probabilidad a sus datos.Distribución Fitter Puede mostrar diferentes tipos de trazados, calcular los límites de confianza y evaluar el ajuste de los datos. También puede excluir datos del ajuste. Puede guardar los datos y exportar el ajuste a su espacio de trabajo como un objeto de distribución de probabilidad para realizar más análisis.

Cargue la aplicación Fitter de distribución desde la pestaña aplicaciones o escriba en la ventana de comandos.distributionFitter Para obtener más información, consulte.Datos del modelo utilizando la aplicación de distribución

Herramienta de función de distribución de probabilidad

La interfaz de usuario explora visualmente distribuciones de probabilidad.Función de distribución de probabilidad Puede cargar la interfaz de usuario de la función de distribución de probabilidades ingresando en la ventana de comandos.disttool

Herramienta de generación de números aleatorios

La interfaz de usuario de generación de números aleatorios genera datos aleatorios a partir de una distribución especificada y exporta los resultados al área de trabajo. Puede utilizar esta herramienta para explorar los efectos de cambiar los parámetros y el tamaño de la muestra en las distribuciones.

La interfaz de usuario de generación de números aleatorios le permite establecer valores de parámetro para la distribución y cambiar sus límites inferior y superior; dibujar otra muestra de la misma distribución, utilizando el mismo tamaño y parámetros; y exporte la muestra aleatoria actual a su espacio de trabajo para utilizarla en un análisis posterior. Un cuadro de diálogo le permite proporcionar un nombre para el ejemplo.

Consulte también

| | | |

Temas relacionados