Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

chi2gof

Prueba de bondad de ajuste de Chi-cuadrado

Descripción

ejemplo

h = chi2gof(x) devuelve una decisión de prueba para la hipótesis nula de que los datos en vector proceden de una distribución normal con una media y varianza estimada a partir de , utilizando el .xxchi-cuadrado prueba de bondad de ajuste La hipótesis alternativa es que los datos no provienen de dicha distribución. El resultado es si la prueba rechaza la hipótesis nula en el nivel de significancia del 5%, y de lo contrario.h10

ejemplo

h = chi2gof(x,Name,Value) devuelve una decisión de prueba para la prueba chi-square goodness-of-fit con opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede probar una distribución distinta de la normal o cambiar el nivel de significancia de la prueba.

ejemplo

[h,p] = chi2gof(___) también devuelve el valor -value de la prueba de hipótesis, utilizando cualquiera de los argumentos de entrada de las sintaxis anteriores.pp

ejemplo

[h,p,stats] = chi2gof(___) también devuelve la estructura, que contiene información sobre la estadística de prueba.stats

Ejemplos

contraer todo

Cree un objeto de distribución de probabilidad normal estándar. Genere un vector de datos utilizando números aleatorios de la distribución.x

pd = makedist('Normal'); rng default;  % for reproducibility x = random(pd,100,1);

Pruebe la hipótesis nula de que los datos de una población con una distribución normal.x

h = chi2gof(x)
h = 0 

El valor devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof

Cree un objeto de distribución de probabilidad normal estándar. Genere un vector de datos utilizando números aleatorios de la distribución.x

pd = makedist('Normal'); rng default;  % for reproducibility x = random(pd,100,1);

Pruebe la hipótesis nula de que los datos de una población con una distribución normal en el nivel de significancia del 1%.x

[h,p] = chi2gof(x,'Alpha',0.01)
h = 0 
p = 0.3775 

El valor devuelto indica que no rechaza la hipótesis nula en el nivel de significancia del 1%.h = 0chi2gof

Cargue los datos de muestra de vida útil de la bombilla.

load lightbulb

Cree un vector a partir de la primera columna de la matriz de datos, que contiene la duración en horas de las bombillas.

x = lightbulb(:,1);

Pruebe la hipótesis nula de que los datos de una población con una distribución De Weibull.x Se utiliza para crear un objeto de distribución de probabilidad con y parámetros estimados a partir de los datos.fitdistAB

pd = fitdist(x,'Weibull'); h = chi2gof(x,'CDF',pd)
h = 1 

El valor devuelto indica que rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 1chi2gof

Cree seis ubicaciones, numeradas del 0 al 5, que se utilizarán para la agrupación de datos.

bins = 0:5;

Cree un vector que contenga los recuentos observados para cada ubicación y calcule el número total de observaciones.

obsCounts = [6 16 10 12 4 2]; n = sum(obsCounts);

Ajuste un objeto de distribución de probabilidad de Poisson a los datos y calcule el recuento esperado para cada ubicación. Utilice el operador transpose para transformar y de vectores de fila a vectores de columna..'binsobsCounts

pd = fitdist(bins','Poisson','Frequency',obsCounts'); expCounts = n * pdf(pd,bins);

Pruebe la hipótesis nula de que los datos de una distribución de Poisson con un parámetro lambda igual a .obsCountslambdaHat

[h,p,st] = chi2gof(bins,'Ctrs',bins,...                         'Frequency',obsCounts, ...                         'Expected',expCounts,...                         'NParams',1)
h = 0 
p = 0.4654 
st = struct with fields:
    chi2stat: 2.5550
          df: 3
       edges: [-0.5000 0.5000 1.5000 2.5000 3.5000 5.5000]
           O: [6 16 10 12 6]
           E: [7.0429 13.8041 13.5280 8.8383 6.0284]

El valor devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof El vector contiene los recuentos esperados para cada bin bajo la hipótesis nula y contiene los recuentos observados para cada bin.EO

Utilice la función de distribución de probabilidad como un identificador de función en la prueba de bondad de ajuste de chi-cuadrado ( ).normcdfchi2gof

Pruebe la hipótesis nula de que los datos de muestra en el vector de entrada provienen de una distribución normal con parámetros e igual a la media ( ) y la desviación estándar ( ) de los datos de muestra, respectivamente.xµσmeanstd

rng('default') % For reproducibility x = normrnd(50,5,100,1); h = chi2gof(x,'cdf',{@normcdf,mean(x),std(x)})
h = 0 

El resultado devuelto indica que no rechaza la hipótesis nula en el nivel de significancia predeterminado del 5%.h = 0chi2gof

Argumentos de entrada

contraer todo

Datos de muestra para la prueba de hipótesis, especificados como vector.

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: agrupa los datos en ocho contenedores y lleva a cabo la prueba de hipótesis en el nivel de significancia del 1%.'NBins',8,'Alpha',0.01

Número de ubicaciones que se utilizarán para la agrupación de datos, especificado como el par separado por comas que consta de y un valor entero positivo.'NBins' Si especifica un valor para , no especifique un valor para o .NBinsCtrsEdges

Ejemplo: 'NBins',8

Tipos de datos: single | double

Centros de ubicación, especificados como el par separado por comas que consta de y un vector de valores de centro para cada bin.'Ctrs' Si especifica un valor para , no especifique un valor para o .CtrsNBinsEdges

Ejemplo: 'Ctrs',[1 2 3 4 5]

Tipos de datos: single | double

Bordes de ubicación, especificados como el par separado por comas que consta de y un vector de valores de arista para cada bin.'Edges' Si especifica un valor para , no especifique un valor para o .EdgesNBinsCtrs

Ejemplo: 'Edges',[-2.5 -1.5 -0.5 0.5 1.5 2.5]

Tipos de datos: single | double

El cdf de la distribución hipotética, especificado como el par separado por comas que consta de un objeto de distribución de probabilidad, un identificador de función o una matriz de celdas.'CDF'

  • Si es un objeto de distribución de probabilidad, los grados de libertad tienen en cuenta si se estiman los parámetros utilizando o se especifican utilizando .CDFfitdistmakedist

  • Si es un identificador de función, la función de distribución debe tomar como único argumento.CDFx

  • Si es una matriz de celdas, el primer elemento debe ser un identificador de función y los elementos restantes deben ser valores de parámetro, uno por celda.CDF La función debe tomar como su primer argumento y los demás parámetros de la matriz como argumentos posteriores.x

Si especifica un valor para , no especifique un valor para .CDFExpected

Ejemplo: 'CDF',pd_object

Tipos de datos: single | double

Recuentos esperados para cada ubicación, especificados como el par separado por comas y un vector de valores no negativos.'Expected' Si depende de los parámetros estimados, utilice para asegurarse de que calcula correctamente los grados de libertad.ExpectedNParamschi2gof Si especifica un valor para , no especifique un valor para .ExpectedCDF

Ejemplo: 'Expected',[19.1446 18.3789 12.3224 8.2432 4.1378]

Tipos de datos: single | double

Número de parámetros estimados utilizados para describir la distribución nula, especificada como el par separado por comas que consta de y un valor entero positivo.'NParams' Este valor ajusta los grados de libertad de la prueba en función del número de parámetros estimados utilizados para calcular el cdf o los recuentos esperados.

El valor predeterminado para depende de cómo especifique la distribución nula:NParams

  • Si especifica como objeto de distribución de probabilidad, es igual al número de parámetros estimados utilizados para crear el objeto.CDFNParams

  • Si especifica como nombre de función o identificador, el valor predeterminado de es .CDFNParams0

  • Si especifica como matriz de celdas, el valor predeterminado de es el número de parámetros de la matriz.CDFNParams

  • Si especifica , el valor predeterminado de es .ExpectedNParams0

Ejemplo: 'NParams',1

Tipos de datos: single | double

Recuento mínimo esperado por ubicación, especificado como el par separado por comas que consta de y un valor entero no negativo.'EMin' Si la ubicación en el extremo extremo de cualquiera de las colas tiene un valor esperado menor que , se combina con una ubicación vecina hasta que el recuento en cada bin extremo es al menos 5.EMin Si alguna ubicación interior tiene un recuento inferior a 5, muestra una advertencia, pero no combina las ubicaciones interiores.chi2gof En ese caso, debe utilizar menos ubicaciones o proporcionar centros o aristas de ubicación para aumentar los recuentos esperados en todas las ubicaciones. Especifique como impedir la combinación de ubicaciones.EMin0

Ejemplo: 'EMin',0

Tipos de datos: single | double

Frecuencia de valores de datos, especificada como el par separado por comas que consta de y un vector de valores enteros no negativos que tiene la misma longitud que el vector.'Frequency'x

Ejemplo: 'Frequency',[20 16 13 10 8]

Tipos de datos: single | double

Nivel de significancia de la prueba de hipótesis, especificado como el par separado por comas que consta de y un valor escalar en el rango (0,1).'Alpha'

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Argumentos de salida

contraer todo

Resultado de la prueba de hipótesis, devuelto como o .10

  • Si , esto indica el rechazo de la hipótesis nula en el nivel de significancia.h= 1Alpha

  • Si , esto indica una falla al rechazar la hipótesis nula en el nivel de significancia.h= 0Alpha

-valor de la prueba, devuelto como un valor escalar en el intervalo [0,1]. es la probabilidad de observar una estadística de prueba tan extrema como, o más extrema que, el valor observado bajo la hipótesis nula.pp Pequeños valores de poner en duda la validez de la hipótesis nula.p

Estadísticas de prueba, devueltas como una estructura que contiene lo siguiente:

  • — Valor de la estadística de prueba.chi2stat

  • — Grados de libertad de la prueba.df

  • — Vector de bordes de la bandeja después de la agrupación.edges

  • — Vector de recuentos observados para cada ubicación.O

  • — Vector de los recuentos esperados para cada ubicación.E

Más acerca de

contraer todo

Prueba de bondad de ajuste de Chi-Square

La prueba de bondad de ajuste de chi-cuadrado determina si una muestra de datos procede de una distribución de probabilidad especificada, con parámetros estimados a partir de los datos.

La prueba agrupa los datos en ubicaciones, calculando los recuentos observados y esperados para esas ubicaciones, y calculando la estadística de prueba chi-cuadrada

χ2=i=1N(OiEi)2/Ei,

DóndeOi son los conteos observados yEi son los recuentos esperados basados en la distribución hipotética. La estadística de prueba tiene una distribución aproximada de chi-cuadrado cuando los recuentos son lo suficientemente grandes.

Algoritmos

compara el valor de la estadística de prueba con una distribución chi-cuadrada con grados de libertad iguales a - 1 - , donde está el número de ubicaciones utilizadas para la agrupación de datos y es el número de parámetros estimados utilizados para determinar los recuentos esperados.chi2gofnbinsnparamsnbinsnparams Si no hay suficientes grados de libertad para realizar la prueba, devuelve el valor -value como .chi2gofpNaN

Capacidades ampliadas

Introducido antes de R2006a