Main Content

cdfplot

Gráfica de la función de distribución acumulativa (cdf) empírica

Descripción

ejemplo

cdfplot(x) crea una función de distribución acumulativa (cdf) empírica de los datos de x. Para un valor t de x, la función de distribución acumulativa empírica F(t) es la proporción de los valores de x menor que o igual a t.

h = cdfplot(x) devuelve un identificador de objeto de línea de la función de distribución acumulativa empírica. Utilice h para consultar o modificar propiedades del objeto después de crearlo. Para ver una lista de las propiedades, consulte Line Properties.

[h,stats] = cdfplot(x) también devuelve una estructura que incluye estadísticas descriptivas de los datos de x.

Ejemplos

contraer todo

Represente la cdf empírica de un conjunto de datos de muestra y compárela con la cdf teórica de la distribución subyacente del conjunto de datos de muestra. En la práctica, una cdf teórica puede desconocerse.

Genere un conjunto de datos de muestra aleatorios a partir de la distribución de valores extremos con un parámetro de localización de 0 y un parámetro de ampliación de 3.

rng('default')  % For reproducibility
y = evrnd(0,3,100,1);

Represente la cdf empírica del conjunto de datos de muestra y la cdf teórica de la misma figura.

cdfplot(y)
hold on
x = linspace(min(y),max(y));
plot(x,evcdf(x,0,3))
legend('Empirical CDF','Theoretical CDF','Location','best')
hold off

Figure contains an axes object. The axes object with title Empirical CDF contains 2 objects of type line. These objects represent Empirical CDF, Theoretical CDF.

La gráfica muestra la similitud entre la cdf empírica y la teórica.

Alternativamente, puede utilizar la función ecdf. La función ecdf también representa los intervalos de confianza del 95% estimados mediante la fórmula Greenwood. Para obtener más detalles, consulte Algorithms.

ecdf(y,'Bounds','on')
hold on
plot(x,evcdf(x,0,3))
grid on
title('Empirical CDF')
legend('Empirical CDF','Lower Confidence Bound','Upper Confidence Bound','Theoretical CDF','Location','best')
hold off

Figure contains an axes object. The axes object with title Empirical CDF contains 4 objects of type stair, line. These objects represent Empirical CDF, Lower Confidence Bound, Upper Confidence Bound, Theoretical CDF.

Realice la prueba de Kolmogorov-Smirnov para una muestra mediante kstest. Confirme la decisión de la prueba comparando visualmente la función de distribución acumulativa (cdf) empírica con la cdf normal estándar.

Cargue el conjunto de datos examgrades. Cree un vector que contenga la primera columna de los datos de notas de exámenes.

load examgrades
test1 = grades(:,1);

Pruebe la hipótesis nula de que los datos provienen de una distribución normal con una media de 75 y una desviación estándar de 10. Utilice estos parámetros para centrar y ampliar cada elemento del vector de datos, ya que kstest comprueba una distribución normal estándar de manera predeterminada.

x = (test1-75)/10;
h = kstest(x)
h = logical
   0

El valor devuelto de h = 0 indica que kstest no rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Represente la cdf empírica y la cdf normal estándar para compararlas visualmente.

cdfplot(x)
hold on
x_values = linspace(min(x),max(x));
plot(x_values,normcdf(x_values,0,1),'r-')
legend('Empirical CDF','Standard Normal CDF','Location','best')

Figure contains an axes object. The axes object with title Empirical CDF contains 2 objects of type line. These objects represent Empirical CDF, Standard Normal CDF.

La figura muestra la similitud entre la cdf empírica del vector de datos centrado y ampliado y la cdf de la distribución normal estándar.

Argumentos de entrada

contraer todo

Datos de entrada, especificados como vector numérico.

Tipos de datos: single | double

Argumentos de salida

contraer todo

El identificador del objeto de línea de la gráfica de la cdf empírica, devuelto como objeto de línea de la gráfica. Utilice h para consultar o modificar propiedades del objeto después de crearlo. Para ver una lista de las propiedades, consulte Line Properties.

Las estadísticas descriptivas de los datos de x, devueltas como una estructura con los campos siguientes:

CampoDescripción

min

Valor mínimo

max

Valor máximo

mean

Media de muestra

median

Mediana de muestra (percentil 50)

std

Desviación estándar de muestra

Sugerencias

  • cdfplot es útil para examinar la distribución de un conjunto de datos de muestra. Puede superponer una cdf teórica en la misma gráfica de cdfplot para comparar la distribución empírica de la muestra con la distribución teórica. Para ver un ejemplo, consulte Comparar la cdf empírica y la cdf teórica.

  • Las funciones kstest, kstest2 y lillietest calculan estadísticas de prueba derivadas de una cdf empírica. cdfplot es útil como ayuda para comprender el resultado de estas funciones. Para ver un ejemplo, consulte Prueba de la distribución normal estándar.

Funcionalidad alternativa

Puede utilizar la función ecdf para encontrar los valores de una cdf empírica y crear una gráfica de una cdf empírica. La función ecdf permite indicar datos censurados y calcula los límites de confianza de los valores estimados de una cdf.

Historial de versiones

Introducido antes de R2006a