Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.
Las distribuciones de probabilidad son distribuciones teóricas basadas en suposiciones sobre una población de origen. Las distribuciones asignan probabilidad al evento de que una variable aleatoria tiene un valor específico y discreto o se encuentra dentro de un intervalo especificado de valores continuos.
ofrece varias formas de trabajar con distribuciones de probabilidad.Statistics and Machine Learning Toolbox™
Se utiliza para ajustar un objeto de distribución de probabilidad a datos de ejemplo o para crear un objeto de distribución de probabilidad con valores de parámetro especificados.Objetos de distribución de probabilidad
Se utiliza para trabajar con la entrada de datos de matrices.Funciones de distribución de probabilidad
Utilícelo para ajustar, explorar y generar números aleatorios de forma interactiva a partir de distribuciones de probabilidad.Aplicaciones de distribución de probabilidad e interfaces de usuario Las aplicaciones e interfaces de usuario disponibles incluyen:
La aplicaciónCreador Fitter
La interfaz de usuarioFunción de distribución de probabilidad
La interfaz de usuario de generación de números aleatorios ( )randtool
Para obtener una lista de distribuciones admitidas por , consulte .Statistics and Machine Learning ToolboxSupported Distributions
Puede definir un objeto de probabilidad para una distribución personalizada y, a continuación, utilizar la aplicación Distribution Fitter o funciones de objeto de probabilidad, como , , y , para evaluar la distribución, generar números aleatorios, etc.pdf
cdf
icdf
random
Para obtener más información, consulte .Define Custom Distributions Using the Distribution Fitter App También puede definir una distribución personalizada mediante un identificador de función y utilizar la función para buscar estimaciones de máxima verosimilitud.mle
Para obtener un ejemplo, consulte .Ajustar la distribución personalizada a los datos censurados
Los objetos de distribución de probabilidad permiten ajustar una distribución de probabilidad a los datos de muestra o definir una distribución especificando valores de parámetro. A continuación, puede realizar una variedad de análisis en el objeto de distribución.
Calcule los parámetros de distribución de probabilidad a partir de datos de muestra ajustando un objeto de distribución de probabilidad a los datos utilizando .fitdist
Puede ajustar una única distribución paramétrica o no paramétrica especificada a los datos de muestra. También puede ajustar varias distribuciones del mismo tipo a los datos de ejemplo en función de las variables de agrupación. Para la mayoría de las distribuciones, utiliza la estimación de máxima verosimilitud (MLE) para estimar los parámetros de distribución a partir de los datos de muestra.fitdist
Para obtener más información y opciones de sintaxis adicionales, consulte .fitdist
Como alternativa, puede crear un objeto de distribución de probabilidad con valores de parámetro especificados utilizando .makedist
Una vez creado un objeto de distribución de probabilidad, puede utilizar funciones de objeto para:
Calcular intervalos de confianza para los parámetros de distribución ( ).paramci
Calcular estadísticas de resumen, incluida la media ( ), la mediana ( ), el rango intercuartil ( ), la varianza ( ) y la desviación estándar ( ).mean
median
iqr
var
std
Evaluar la función de densidad de probabilidad ( ).pdf
Evaluar la función de distribución acumulativa ( ) o la función de distribución acumulativa inversa ( ).cdf
icdf
Calcular la probabilidad de registro negativa ( ) y la función de probabilidad de perfil ( ) para la distribución.negloglik
proflik
Generar números aleatorios a partir de la distribución ( ).random
Truncar la distribución a los límites inferior y superior especificados ( ).truncate
Para guardar el objeto de distribución de probabilidad en un archivo . Archivo MAT:
En la barra de herramientas, haga clic en .Save Workspace Esta opción guarda todas las variables del área de trabajo, incluidos los objetos de distribución de probabilidad.
En el explorador del espacio de trabajo, haga clic con el botón derecho en el objeto de distribución de probabilidad y seleccione .Save as Esta opción guarda solo el objeto de distribución de probabilidad seleccionado, no las otras variables del área de trabajo.
Como alternativa, puede guardar un objeto de distribución de probabilidad directamente desde la línea de comandos mediante la función. le permite elegir un nombre de archivo y especificar el objeto de distribución de probabilidad que desea guardar.save
save
Si no especifica un objeto (u otra variable), guarda todas las variables del área de trabajo, incluidos los objetos de distribución de probabilidad, en el nombre de archivo especificado.MATLAB® Para obtener más información y opciones de sintaxis adicionales, consulte .save
En este ejemplo se muestra cómo utilizar objetos de distribución de probabilidad para realizar un análisis de varios pasos en una distribución ajustada.
El análisis ilustra cómo:
Ajuste una distribución de probabilidad a datos de muestra que contengan calificaciones de exámenes de 120 alumnos mediante .fitdist
Calcular la media de las calificaciones del examen mediante el uso de .mean
Trazar un histograma de los datos de calificación del examen, superpuesto con una gráfica del pdf de la distribución ajustada, utilizando y .plot
pdf
Calcular el límite para el 10 por ciento superior de las calificaciones de los alumnos mediante el uso de .icdf
Grabe el objeto de distribución de probabilidad ajustado utilizando .save
Cargue los datos de ejemplo.
load examgrades
Los datos de muestra contienen una matriz de 120 por 5 de calificaciones del examen. Los exámenes se puntúan en una escala de 0 a 100.
Cree un vector que contenga la primera columna de datos de calificación de examen.
x = grades(:,1);
Ajuste una distribución normal a los datos de ejemplo mediante el uso para crear un objeto de distribución de probabilidad.fitdist
pd = fitdist(x,'Normal')
pd = NormalDistribution Normal distribution mu = 75.0083 [73.4321, 76.5846] sigma = 8.7202 [7.7391, 9.98843]
devuelve un objeto de distribución de probabilidad, , del tipo .fitdist
pd
NormalDistribution
Este objeto contiene los valores de parámetro estimados y , para la distribución normal ajustada.mu
sigma
Los intervalos junto a las estimaciones de parámetros son los intervalos de confianza del 95% para los parámetros de distribución.
Calcular la media de las calificaciones del examen de los alumnos utilizando el objeto de distribución ajustado, .pd
m = mean(pd)
m = 75.0083
La media de las calificaciones del examen es igual al parámetro estimado por .mu
fitdist
Trazar un histograma de las calificaciones del examen. Superponga una gráfica del pdf ajustado para comparar visualmente la distribución normal ajustada con las calificaciones reales del examen.
x_pdf = [1:0.1:100]; y = pdf(pd,x_pdf); figure histogram(x,'Normalization','pdf') line(x_pdf,y)
El pdf de la distribución ajustada sigue la misma forma que el histograma de las calificaciones del examen.
Determine el límite para el 10 por ciento superior de las calificaciones de los exámenes de los alumnos mediante la función de distribución acumulativa inversa ( ).icdf
Este límite es equivalente al valor en el que el cdf de la distribución de probabilidad es igual a 0,9. En otras palabras, el 90 por ciento de las calificaciones del examen son menores o iguales que el valor límite.
A = icdf(pd,0.9)
A = 86.1837
Según la distribución ajustada, el 10 por ciento de los estudiantes recibieron una calificación de examen superior a 86.1837. Equivalentemente, el 90 por ciento de los estudiantes recibieron una calificación de examen menor o igual que 86.1837.
Guarde la distribución de probabilidad ajustada, como un archivo denominado .pd
myobject.mat
save('myobject.mat','pd')
También puede trabajar con distribuciones de probabilidad utilizando funciones específicas de distribución. Estas funciones son útiles para generar números aleatorios, calcular estadísticas de resumen dentro de un bucle o script, y pasar un cdf o pdf como una función a otra.manija de la función También puede utilizar estas funciones para realizar cálculos en matrices de valores de parámetro en lugar de un único conjunto de parámetros. Para obtener una lista de distribuciones de probabilidad admitidas, consulte .Supported Distributions
En este ejemplo se muestra cómo utilizar funciones específicas de distribución para realizar un análisis de varios pasos en una distribución ajustada.
El análisis ilustra cómo:
Ajuste una distribución de probabilidad a datos de muestra que contengan calificaciones de exámenes de 120 alumnos mediante .normfit
Trazar un histograma de los datos de calificación del examen, superpuesto con una gráfica del pdf de la distribución ajustada, utilizando y .plot
normpdf
Calcular el límite para el 10 por ciento superior de las calificaciones de los alumnos mediante el uso de .norminv
Guarde los parámetros de distribución estimados utilizando .save
Puede realizar el mismo análisis utilizando un objeto de distribución de probabilidad. Ver.Analizar distribución mediante objetos de distribución de probabilidad
Cargue los datos de ejemplo.
load examgrades
Los datos de muestra contienen una matriz de 120 por 5 de calificaciones del examen. Los exámenes se puntúan en una escala de 0 a 100.
Cree un vector que contenga la primera columna de datos de calificación de examen.
x = grades(:,1);
Ajuste una distribución normal a los datos de muestra utilizando .normfit
[mu,sigma,muCI,sigmaCI] = normfit(x)
mu = 75.0083
sigma = 8.7202
muCI = 2×1
73.4321
76.5846
sigmaCI = 2×1
7.7391
9.9884
La función devuelve las estimaciones de los parámetros de distribución normales y los intervalos de confianza del 95% para las estimaciones de parámetros.normfit
Trazar un histograma de las calificaciones del examen. Superponga una gráfica del pdf ajustado para comparar visualmente la distribución normal ajustada con las calificaciones reales del examen.
x_pdf = [1:0.1:100]; y = normpdf(x_pdf,mu,sigma); figure histogram(x,'Normalization','pdf') line(x_pdf,y)
El pdf de la distribución ajustada sigue la misma forma que el histograma de las calificaciones del examen.
Determine el límite para el 10 por ciento superior de las calificaciones de los exámenes de los alumnos mediante la función de distribución acumulativa inversa normal. Este límite es equivalente al valor en el que el cdf de la distribución de probabilidad es igual a 0,9. En otras palabras, el 90 por ciento de las calificaciones del examen son menores o iguales que el valor límite.
A = norminv(0.9,mu,sigma)
A = 86.1837
Según la distribución ajustada, el 10 por ciento de los estudiantes recibieron una calificación de examen superior a 86.1837. Equivalentemente, el 90 por ciento de los estudiantes recibieron una calificación de examen menor o igual que 86.1837.
Guarde los parámetros de distribución estimados como un archivo denominado .myparameter.mat
save('myparameter.mat','mu','sigma')
Este ejemplo muestra cómo utilizar la función de distribución de probabilidad como un identificador de función en la prueba de bondad de ajuste de chi-cuadrado ( ).normcdf
chi2gof
Este ejemplo prueba la hipótesis nula de que los datos de muestra contenidos en el vector de entrada, , provienen de una distribución normal con parámetros e igual a la media ( ) y la desviación estándar ( ) de los datos de muestra, respectivamente.x
µσmean
std
rng('default') % For reproducibility x = normrnd(50,5,100,1); h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})
h = 0
El resultado devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0
chi2gof
En este ejemplo siguiente se muestra cómo utilizar funciones de distribución de probabilidad como identificador de función en el muestreador de sectores ( ).slicesample
El ejemplo se utiliza para generar una muestra aleatoria de 2.000 valores a partir de una distribución normal estándar y traza un histograma de los valores resultantes.normpdf
rng('default') % For reproducibility x = slicesample(1,2000,'pdf',@normpdf,'thin',5,'burnin',1000); histogram(x)
El histograma muestra que, cuando se utiliza , la muestra aleatoria resultante tiene una distribución normal estándar.normpdf
Si pasa la función de distribución de probabilidad para la distribución exponencial pdf ( ) como un identificador de función en lugar de , genera las 2.000 muestras aleatorias de una distribución exponencial con un valor de parámetro predeterminado igual a 1.exppdf
normpdf
slicesample
µ
rng('default') % For reproducibility x = slicesample(1,2000,'pdf',@exppdf,'thin',5,'burnin',1000); histogram(x)
El histograma muestra que la muestra aleatoria resultante cuando se utiliza tiene una distribución exponencial.exppdf
Las aplicaciones y las interfaces de usuario proporcionan un enfoque interactivo para trabajar con distribuciones de probabilidad paramétricas y no paramétricas.
La aplicación le permite ajustar interactivamente una distribución de probabilidad a sus datos.Creador Fitter Puede mostrar diferentes tipos de trazados, calcular límites de confianza y evaluar el ajuste de los datos. También puede excluir datos del ajuste. Puede guardar los datos y exportar el ajuste al espacio de trabajo como un objeto de distribución de probabilidad para realizar un análisis posterior.
Cargue la aplicación Distribution Fitter desde la pestaña Aplicaciones o escribiendo en la ventana de comandos.distributionFitter
Para obtener más información, consulte .Model Data Using the Distribution Fitter App
La interfaz de usuario explora visualmente las distribuciones de probabilidad.Función de distribución de probabilidad Puede cargar la interfaz de usuario Función de distribución de probabilidad introduciendo en la ventana de comandos.disttool
La interfaz de usuario Generación de números aleatorios genera datos aleatorios a partir de una distribución especificada y exporta los resultados al área de trabajo. Puede utilizar esta herramienta para explorar los efectos de los parámetros cambiantes y el tamaño de la muestra en las distribuciones.
La interfaz de usuario Generación de números aleatorios le permite establecer valores de parámetro para la distribución y cambiar sus límites inferior y superior; extraer otra muestra de la misma distribución, utilizando el mismo tamaño y parámetros; y exporte la muestra aleatoria actual a su espacio de trabajo para su uso en análisis posteriores. Un cuadro de diálogo le permite proporcionar un nombre para el ejemplo.
| | Creador Fitter | fitdist
| Función de distribución de probabilidad | makedist
| randtool