Main Content

Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Trabajar con distribuciones de probabilidad

Las distribuciones de probabilidad son distribuciones teóricas basadas en suposiciones sobre una población de origen. Las distribuciones asignan probabilidad al evento de que una variable aleatoria tiene un valor específico y discreto o se encuentra dentro de un intervalo especificado de valores continuos.

ofrece varias formas de trabajar con distribuciones de probabilidad.Statistics and Machine Learning Toolbox™

Para obtener una lista de distribuciones admitidas por , consulte .Statistics and Machine Learning ToolboxSupported Distributions

Puede definir un objeto de probabilidad para una distribución personalizada y, a continuación, utilizar la aplicación Distribution Fitter o funciones de objeto de probabilidad, como , , y , para evaluar la distribución, generar números aleatorios, etc.pdfcdficdfrandom Para obtener más información, consulte .Define Custom Distributions Using the Distribution Fitter App También puede definir una distribución personalizada mediante un identificador de función y utilizar la función para buscar estimaciones de máxima verosimilitud.mle Para obtener un ejemplo, consulte .Ajustar la distribución personalizada a los datos censurados

Objetos de distribución de probabilidad

Los objetos de distribución de probabilidad permiten ajustar una distribución de probabilidad a los datos de muestra o definir una distribución especificando valores de parámetro. A continuación, puede realizar una variedad de análisis en el objeto de distribución.

Crear objetos de distribución de probabilidad

Calcule los parámetros de distribución de probabilidad a partir de datos de muestra ajustando un objeto de distribución de probabilidad a los datos utilizando .fitdist Puede ajustar una única distribución paramétrica o no paramétrica especificada a los datos de muestra. También puede ajustar varias distribuciones del mismo tipo a los datos de ejemplo en función de las variables de agrupación. Para la mayoría de las distribuciones, utiliza la estimación de máxima verosimilitud (MLE) para estimar los parámetros de distribución a partir de los datos de muestra.fitdist Para obtener más información y opciones de sintaxis adicionales, consulte .fitdist

Como alternativa, puede crear un objeto de distribución de probabilidad con valores de parámetro especificados utilizando .makedist

Trabajar con objetos de distribución de probabilidad

Una vez creado un objeto de distribución de probabilidad, puede utilizar funciones de objeto para:

  • Calcular intervalos de confianza para los parámetros de distribución ( ).paramci

  • Calcular estadísticas de resumen, incluida la media ( ), la mediana ( ), el rango intercuartil ( ), la varianza ( ) y la desviación estándar ( ).meanmedianiqrvarstd

  • Evaluar la función de densidad de probabilidad ( ).pdf

  • Evaluar la función de distribución acumulativa ( ) o la función de distribución acumulativa inversa ( ).cdficdf

  • Calcular la probabilidad de registro negativa ( ) y la función de probabilidad de perfil ( ) para la distribución.negloglikproflik

  • Generar números aleatorios a partir de la distribución ( ).random

  • Truncar la distribución a los límites inferior y superior especificados ( ).truncate

Guardar un objeto de distribución de probabilidad

Para guardar el objeto de distribución de probabilidad en un archivo . Archivo MAT:

  • En la barra de herramientas, haga clic en .Save Workspace Esta opción guarda todas las variables del área de trabajo, incluidos los objetos de distribución de probabilidad.

  • En el explorador del espacio de trabajo, haga clic con el botón derecho en el objeto de distribución de probabilidad y seleccione .Save as Esta opción guarda solo el objeto de distribución de probabilidad seleccionado, no las otras variables del área de trabajo.

Como alternativa, puede guardar un objeto de distribución de probabilidad directamente desde la línea de comandos mediante la función. le permite elegir un nombre de archivo y especificar el objeto de distribución de probabilidad que desea guardar.savesave Si no especifica un objeto (u otra variable), guarda todas las variables del área de trabajo, incluidos los objetos de distribución de probabilidad, en el nombre de archivo especificado.MATLAB® Para obtener más información y opciones de sintaxis adicionales, consulte .save

Analizar distribución mediante objetos de distribución de probabilidad

En este ejemplo se muestra cómo utilizar objetos de distribución de probabilidad para realizar un análisis de varios pasos en una distribución ajustada.

El análisis ilustra cómo:

  • Ajuste una distribución de probabilidad a datos de muestra que contengan calificaciones de exámenes de 120 alumnos mediante .fitdist

  • Calcular la media de las calificaciones del examen mediante el uso de .mean

  • Trazar un histograma de los datos de calificación del examen, superpuesto con una gráfica del pdf de la distribución ajustada, utilizando y .plotpdf

  • Calcular el límite para el 10 por ciento superior de las calificaciones de los alumnos mediante el uso de .icdf

  • Grabe el objeto de distribución de probabilidad ajustado utilizando .save

Cargue los datos de ejemplo.

load examgrades

Los datos de muestra contienen una matriz de 120 por 5 de calificaciones del examen. Los exámenes se puntúan en una escala de 0 a 100.

Cree un vector que contenga la primera columna de datos de calificación de examen.

x = grades(:,1);

Ajuste una distribución normal a los datos de ejemplo mediante el uso para crear un objeto de distribución de probabilidad.fitdist

pd = fitdist(x,'Normal')
pd =    NormalDistribution    Normal distribution        mu = 75.0083   [73.4321, 76.5846]     sigma =  8.7202   [7.7391, 9.98843]  

devuelve un objeto de distribución de probabilidad, , del tipo .fitdistpdNormalDistribution Este objeto contiene los valores de parámetro estimados y , para la distribución normal ajustada.musigma Los intervalos junto a las estimaciones de parámetros son los intervalos de confianza del 95% para los parámetros de distribución.

Calcular la media de las calificaciones del examen de los alumnos utilizando el objeto de distribución ajustado, .pd

m = mean(pd)
m = 75.0083 

La media de las calificaciones del examen es igual al parámetro estimado por .mufitdist

Trazar un histograma de las calificaciones del examen. Superponga una gráfica del pdf ajustado para comparar visualmente la distribución normal ajustada con las calificaciones reales del examen.

x_pdf = [1:0.1:100]; y = pdf(pd,x_pdf);   figure histogram(x,'Normalization','pdf') line(x_pdf,y)

El pdf de la distribución ajustada sigue la misma forma que el histograma de las calificaciones del examen.

Determine el límite para el 10 por ciento superior de las calificaciones de los exámenes de los alumnos mediante la función de distribución acumulativa inversa ( ).icdf Este límite es equivalente al valor en el que el cdf de la distribución de probabilidad es igual a 0,9. En otras palabras, el 90 por ciento de las calificaciones del examen son menores o iguales que el valor límite.

A = icdf(pd,0.9)
A = 86.1837 

Según la distribución ajustada, el 10 por ciento de los estudiantes recibieron una calificación de examen superior a 86.1837. Equivalentemente, el 90 por ciento de los estudiantes recibieron una calificación de examen menor o igual que 86.1837.

Guarde la distribución de probabilidad ajustada, como un archivo denominado .pdmyobject.mat

save('myobject.mat','pd')

Funciones de distribución de probabilidad

También puede trabajar con distribuciones de probabilidad utilizando funciones específicas de distribución. Estas funciones son útiles para generar números aleatorios, calcular estadísticas de resumen dentro de un bucle o script, y pasar un cdf o pdf como una función a otra.manija de la función También puede utilizar estas funciones para realizar cálculos en matrices de valores de parámetro en lugar de un único conjunto de parámetros. Para obtener una lista de distribuciones de probabilidad admitidas, consulte .Supported Distributions

Analizar la distribución mediante funciones específicas de distribución

En este ejemplo se muestra cómo utilizar funciones específicas de distribución para realizar un análisis de varios pasos en una distribución ajustada.

El análisis ilustra cómo:

  • Ajuste una distribución de probabilidad a datos de muestra que contengan calificaciones de exámenes de 120 alumnos mediante .normfit

  • Trazar un histograma de los datos de calificación del examen, superpuesto con una gráfica del pdf de la distribución ajustada, utilizando y .plotnormpdf

  • Calcular el límite para el 10 por ciento superior de las calificaciones de los alumnos mediante el uso de .norminv

  • Guarde los parámetros de distribución estimados utilizando .save

Puede realizar el mismo análisis utilizando un objeto de distribución de probabilidad. Ver.Analizar distribución mediante objetos de distribución de probabilidad

Cargue los datos de ejemplo.

load examgrades

Los datos de muestra contienen una matriz de 120 por 5 de calificaciones del examen. Los exámenes se puntúan en una escala de 0 a 100.

Cree un vector que contenga la primera columna de datos de calificación de examen.

x = grades(:,1);

Ajuste una distribución normal a los datos de muestra utilizando .normfit

[mu,sigma,muCI,sigmaCI] = normfit(x)
mu = 75.0083 
sigma = 8.7202 
muCI = 2×1

   73.4321
   76.5846

sigmaCI = 2×1

    7.7391
    9.9884

La función devuelve las estimaciones de los parámetros de distribución normales y los intervalos de confianza del 95% para las estimaciones de parámetros.normfit

Trazar un histograma de las calificaciones del examen. Superponga una gráfica del pdf ajustado para comparar visualmente la distribución normal ajustada con las calificaciones reales del examen.

x_pdf = [1:0.1:100]; y = normpdf(x_pdf,mu,sigma);   figure histogram(x,'Normalization','pdf') line(x_pdf,y)

El pdf de la distribución ajustada sigue la misma forma que el histograma de las calificaciones del examen.

Determine el límite para el 10 por ciento superior de las calificaciones de los exámenes de los alumnos mediante la función de distribución acumulativa inversa normal. Este límite es equivalente al valor en el que el cdf de la distribución de probabilidad es igual a 0,9. En otras palabras, el 90 por ciento de las calificaciones del examen son menores o iguales que el valor límite.

A = norminv(0.9,mu,sigma)
A = 86.1837 

Según la distribución ajustada, el 10 por ciento de los estudiantes recibieron una calificación de examen superior a 86.1837. Equivalentemente, el 90 por ciento de los estudiantes recibieron una calificación de examen menor o igual que 86.1837.

Guarde los parámetros de distribución estimados como un archivo denominado .myparameter.mat

save('myparameter.mat','mu','sigma')

Usar funciones de distribución de probabilidad como controlador de función

Este ejemplo muestra cómo utilizar la función de distribución de probabilidad como un identificador de función en la prueba de bondad de ajuste de chi-cuadrado ( ).normcdfchi2gof

Este ejemplo prueba la hipótesis nula de que los datos de muestra contenidos en el vector de entrada, , provienen de una distribución normal con parámetros e igual a la media ( ) y la desviación estándar ( ) de los datos de muestra, respectivamente.xµσmeanstd

rng('default') % For reproducibility x = normrnd(50,5,100,1); h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})
h = 0 

El resultado devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof

En este ejemplo siguiente se muestra cómo utilizar funciones de distribución de probabilidad como identificador de función en el muestreador de sectores ( ).slicesample El ejemplo se utiliza para generar una muestra aleatoria de 2.000 valores a partir de una distribución normal estándar y traza un histograma de los valores resultantes.normpdf

rng('default') % For reproducibility x = slicesample(1,2000,'pdf',@normpdf,'thin',5,'burnin',1000); histogram(x)

El histograma muestra que, cuando se utiliza , la muestra aleatoria resultante tiene una distribución normal estándar.normpdf

Si pasa la función de distribución de probabilidad para la distribución exponencial pdf ( ) como un identificador de función en lugar de , genera las 2.000 muestras aleatorias de una distribución exponencial con un valor de parámetro predeterminado igual a 1.exppdfnormpdfslicesampleµ

rng('default') % For reproducibility x = slicesample(1,2000,'pdf',@exppdf,'thin',5,'burnin',1000); histogram(x)

El histograma muestra que la muestra aleatoria resultante cuando se utiliza tiene una distribución exponencial.exppdf

Aplicaciones de distribución de probabilidad e interfaces de usuario

Las aplicaciones y las interfaces de usuario proporcionan un enfoque interactivo para trabajar con distribuciones de probabilidad paramétricas y no paramétricas.

Aplicación De Fitter de Distribución

La aplicación le permite ajustar interactivamente una distribución de probabilidad a sus datos.Creador Fitter Puede mostrar diferentes tipos de trazados, calcular límites de confianza y evaluar el ajuste de los datos. También puede excluir datos del ajuste. Puede guardar los datos y exportar el ajuste al espacio de trabajo como un objeto de distribución de probabilidad para realizar un análisis posterior.

Cargue la aplicación Distribution Fitter desde la pestaña Aplicaciones o escribiendo en la ventana de comandos.distributionFitter Para obtener más información, consulte .Model Data Using the Distribution Fitter App

Herramienta de función de distribución de probabilidad

La interfaz de usuario explora visualmente las distribuciones de probabilidad.Función de distribución de probabilidad Puede cargar la interfaz de usuario Función de distribución de probabilidad introduciendo en la ventana de comandos.disttool

Herramienta de generación de números aleatorios

La interfaz de usuario Generación de números aleatorios genera datos aleatorios a partir de una distribución especificada y exporta los resultados al área de trabajo. Puede utilizar esta herramienta para explorar los efectos de los parámetros cambiantes y el tamaño de la muestra en las distribuciones.

La interfaz de usuario Generación de números aleatorios le permite establecer valores de parámetro para la distribución y cambiar sus límites inferior y superior; extraer otra muestra de la misma distribución, utilizando el mismo tamaño y parámetros; y exporte la muestra aleatoria actual a su espacio de trabajo para su uso en análisis posteriores. Un cuadro de diálogo le permite proporcionar un nombre para el ejemplo.

Consulte también

| | | | | |

Temas relacionados