chi2gof

Prueba de bondad de ajuste de chi-cuadrado

Sintaxis

h = chi2gof(x)

h = chi2gof(x,Name,Value)

[h,p] = chi2gof(___)

[h,p,stats] = chi2gof(___)

Descripción

h = chi2gof(x) devuelve una decisión de prueba para la hipótesis nula de que los datos del vector x proceden de una distribución normal con una media y una varianza estimadas a partir de x, usando la prueba de bondad de ajuste de chi-cuadrado. La hipótesis alternativa es que los datos no proceden de dicha distribución. El resultado h es 1 si la prueba rechaza la hipótesis nula al nivel de significación del 5%, y 0 en el caso contrario.

ejemplo

h = chi2gof(x,Name,Value) devuelve una decisión de prueba para la prueba de bondad de ajuste de chi-cuadrado con más opciones especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede probar una distribución distinta de la normal o cambiar el nivel de significación de la prueba.

ejemplo

[h,p] = chi2gof(___) también devuelve el valor p, p, de la prueba de hipótesis, usando cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[h,p,stats] = chi2gof(___) devuelve también la estructura stats que contiene información sobre la estadística de la prueba.

ejemplo

Ejemplos

contraer todo

Prueba de la distribución normal

Abrir script en vivo

Cree un objeto de distribución de probabilidad normal estándar. Genere un vector de datos x usando números aleatorios a partir de la distribución.

pd = makedist('Normal');
rng default;  % for reproducibility
x = random(pd,100,1);

Pruebe la hipótesis nula de que los datos de x proceden de una población con una distribución normal.

h = chi2gof(x)

h = 
0

El valor devuelto h = 0 indica que chi2gof no rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Probar la hipótesis con distintos niveles de significación

Abrir script en vivo

Cree un objeto de distribución de probabilidad normal estándar. Genere un vector de datos x usando números aleatorios a partir de la distribución.

pd = makedist('Normal');
rng default;  % for reproducibility
x = random(pd,100,1);

Pruebe la hipótesis nula de que los datos de x proceden de una población con una distribución normal al nivel de significación del 1%.

[h,p] = chi2gof(x,'Alpha',0.01)

h = 
0

p = 
0.3775

El valor devuelto h = 0 indica que chi2gof no rechaza la hipótesis nula al nivel de significación del 1%.

Prueba de la distribución de Weibull mediante el objeto de distribución de probabilidad

Abrir script en vivo

Cargue los datos de muestra de la vida útil de bombillas.

load lightbulb

Cree un vector a partir de la primera columna de la matriz de datos, que contiene la vida útil en horas de las bombillas.

x = lightbulb(:,1);

Pruebe la hipótesis nula de que los datos de x proceden de una población con una distribución de Weibull. Utilice fitdist para crear un objeto de distribución de probabilidad con parámetros A y B estimados a partir de los datos.

pd = fitdist(x,'Weibull');
h = chi2gof(x,'CDF',pd)

h = 
1

El valor devuelto h = 1 indica que chi2gof rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Prueba de la distribución de Poisson

Abrir script en vivo

Cree seis bins, numerados del 0 al 5, para utilizarlos en la agrupación de datos.

bins = 0:5;

Cree un vector que contenga los recuentos observados para cada bin y calcule el número total de observaciones.

obsCounts = [6 16 10 12 4 2];
n = sum(obsCounts);

Ajuste un objeto de distribución de probabilidad de Poisson a los datos y calcule el recuento previsto para cada bin. Utilice el operador de trasposición .' para transformar bins y obsCounts de vectores fila en vectores columna.

pd = fitdist(bins','Poisson','Frequency',obsCounts');
expCounts = n * pdf(pd,bins);

Pruebe la hipótesis nula de que los datos de obsCounts proceden de una distribución de Poisson con un parámetro lambda igual a lambdaHat.

[h,p,st] = chi2gof(bins,'Ctrs',bins,...
                        'Frequency',obsCounts, ...
                        'Expected',expCounts,...
                        'NParams',1)

h = 
0

p = 
0.4654

st = struct with fields:
    chi2stat: 2.5550
          df: 3
       edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000]
           O: [6 16 10 12 6]
           E: [7.0429 13.8041 13.5280 8.8383 6.0284]

El valor devuelto h = 0 indica que chi2gof no rechaza la hipótesis nula al nivel de significación predeterminado del 5%. El vector E contiene los recuentos previstos para cada bin bajo la hipótesis nula y O contiene los recuentos observados para cada bin.

Prueba de la distribución normal usando un identificador de función

Abrir script en vivo

Utilice la función de distribución de probabilidad normcdf como identificador de función en la prueba de bondad de ajuste de chi-cuadrado (chi2gof).

Pruebe la hipótesis nula de que los datos de muestra en el vector de entrada x provienen de una distribución normal con parámetros µ y σ iguales a la media (mean) y la desviación estándar (std) de los datos de muestra, respectivamente.

rng('default') % For reproducibility
x = normrnd(50,5,100,1);
h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})

h = 
0

El resultado devuelto de h = 0 indica que chi2gof no rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Argumentos de entrada

contraer todo

`x` — Datos de muestra
vector

Datos de muestra para la prueba de hipótesis, especificados como vector.

Argumentos de par nombre-valor

contraer todo

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'NBins',8,'Alpha',0.01 agrupa los datos en ocho bins y realiza la prueba de hipótesis al nivel de significación del 1%.

`NBins` — Número de bins
`10` (predeterminado) | valor entero positivo

Número de bins que se desea utilizar para la agrupación de datos, especificado como el par separado por comas que consta de 'NBins' y un valor entero positivo. Si especifica un valor para NBins, no especifique un valor para Ctrs o Edges.

Ejemplo: 'NBins',8