Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

ecdf

Función de distribución acumulativa empírica

Descripción

ejemplo

[f,x] = ecdf(y) Devuelve la función de distribución acumulativa empírica (CDF), evaluada en los puntos en, utilizando los datos del vector.fxy

En el análisis de supervivencia y confiabilidad, esta CDF empírica se denomina estimación de Kaplan-Meier. Y los datos pueden corresponder a tiempos de supervivencia o fracaso.

ejemplo

[f,x] = ecdf(y,Name,Value) Devuelve los valores de la función empírica, evaluados en los puntos en, con opciones adicionales especificadas por uno o más argumentos de par.fxName,Value

Por ejemplo, puede especificar el tipo de función que se va a evaluar o qué datos se censuran.

ejemplo

[f,x,flo,fup] = ecdf(___) también devuelve los límites de confianza 95% inferior y superior para los valores de función evaluados. Puede utilizar cualquiera de los argumentos de entrada de las sintaxis anteriores.

calcula los límites de confianza mediante.ecdfLa fórmula de Greenwood No son límites de confianza simultáneos.

ejemplo

ecdf(___) dibuja un gráfico de paso de escaleras de la función evaluada mediante la función.stairs Especifique si desea incluir los límites de confianza en el gráfico.'Bounds','on'

ecdf(ax,___) parcelas en los ejes especificados en lugar de los ejes actuales ().axgca

Ejemplos

contraer todo

Calcule la estimación de Kaplan-Meier de la función de distribución acumulativa (CDF) para los datos de supervivencia simulados.

Genere datos de supervivencia a partir de una distribución de Weibull con los parámetros 3 y 1.

rng('default')  % for reproducibility failuretime = random('wbl',3,1,15,1);

Calcule la estimación de Kaplan-Meier de la CDF para los datos de supervivencia.

[f,x] = ecdf(failuretime); [f,x]
ans = 16×2

         0    0.0895
    0.0667    0.0895
    0.1333    0.1072
    0.2000    0.1303
    0.2667    0.1313
    0.3333    0.2718
    0.4000    0.2968
    0.4667    0.6147
    0.5333    0.6684
    0.6000    1.3749
      ⋮

Trazar el CDF estimado.

ecdf(failuretime)

Computa y traza la función de peligro de los datos simulados de supervivencia con censura a la derecha.

Genere tiempos de fracaso de una distribución Birnbaum-Saunders.

rng('default')  % For reproducibility failuretime = random('birnbaumsaunders',0.3,1,100,1);

Suponiendo que el final del estudio es en el momento 0,9, generar una matriz lógica que indica los tiempos de error simulados que son mayores que 0,9 como datos censurado y almacenar esta información en un vector.

T = 0.9; cens = (failuretime>T);

Trace la función de riesgo empírico para los datos.

ecdf(failuretime,'Function','cumulative hazard', ...     'Censoring',cens,'Bounds','on');

Genere datos de supervivencia censurados a la derecha y compare la función empírica de distribución acumulativa (CDF) con la CDF conocida.

Genere tiempos de falla a partir de una distribución exponencial con un tiempo medio de falla de 15.

rng('default')  % For reproducibility y = exprnd(15,75,1);

Genere tiempos de entrega desde una distribución exponencial con un tiempo de falla medio de 30.

d = exprnd(30,75,1);

Genere los tiempos de falla observados. Son el mínimo de los tiempos de falla generados y los tiempos de entrega.

t = min(y,d);

Cree una matriz lógica que indique los tiempos de error generados que son mayores que los tiempos de entrega. Los datos para los que esto es cierto están censurados.

censored = (y>d);

Calcule el CDF empírico y los límites de confianza.

[f,x,flo,fup] = ecdf(t,'Censoring',censored);

Trace los límites de la CDF y la confianza.

figure() ecdf(t,'Censoring',censored,'Bounds','on'); hold on

Superponer una parcela de la población conocida CDF.

xx = 0:.1:max(t); yy = 1-exp(-xx/15); plot(xx,yy,'g-','LineWidth',2) axis([0 50 0 1]) legend('Empirical','LCB','UCB','Population', ...     'Location','southeast') hold off

Genere datos de supervivencia y trace la función de superviviente empírico con un 99% de límites de confianza.

Genere datos de duración de una distribución de Weibull con los parámetros 100 y 2.

rng('default')  % For reproducibility R = wblrnd(100,2,100,1);

Trace la función de superviviente para los datos con un 99% de límites de confianza.

ecdf(R,'Function','survivor','Alpha',0.01,'Bounds','on') hold on

Ajuste la función de superviviente de Weibull.

x = 1:1:250; wblsurv = 1-cdf('weibull',x,100,2); plot(x,wblsurv,'g-','LineWidth',2) legend('Empirical','LCB','UCB','Population', ...     'Location','northeast')

La función de superviviente basada en la distribución real está dentro de los límites de confianza.

Argumentos de entrada

contraer todo

Datos de entrada, especificados como un vector. Por ejemplo, en el análisis de supervivencia o confiabilidad, los datos podrían ser tiempos de supervivencia o de fracaso para cada elemento o individuo.

omite los valores.ecdfNaNy Además, cualquier valor en el vector de censura () o vector de frecuencia () causa ignorar los valores correspondientes en.NaN'Censoring''Frequency'ecdfy

Tipos de datos: single | double

Identificador de ejes para las gráficas de figuras a, especificado como un identificador.ecdf

Por ejemplo, si es un identificador para una figura, puede trazar a esa figura de la siguiente manera.hecdf

Ejemplo: ecdf(h,x)

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: Especifica que devuelve la función de riesgo acumulado y traza los límites de confianza del 97,5%, que representa los datos censurados especificados por vector.'Censoring',c,'Function','cumulative hazard','Alpha',0.025,'Bounds','on'ecdfc

Indicador de datos censurados, especificado como el par separado por comas incluyendo y una matriz booleana del mismo tamaño que.'Censoring'x Entrar para las observaciones que están censuradas a la derecha y para las observaciones que se observan completamente.10 El valor predeterminado es que todas las observaciones se observan completamente.

omite los valores de este vector de censura.ecdfNaN Además, cualquier valor en o el vector de frecuencia () causa ignorar los valores correspondientes en el vector de censura.NaNy'Frequency'ecdf

Ejemplo: Si vector almacena la información de datos censurados, ingrese.cdata'Censoring',cdata

Tipos de datos: logical

Frecuencia de observaciones, especificada como el par separado por comas que consta de un vector que contiene recuentos de enteros no negativos.'Frequency' Este vector tiene el mismo tamaño que el vector.x El elemento TH de este vector da el número de veces que se observó el elemento TH.jjx El valor predeterminado es una observación por elemento de.x

omite los valores de este vector de frecuencia.ecdfNaN Además, cualquier valor en o el vector de censura () causa ignorar los valores correspondientes en el vector de frecuencia.NaNy'Censoring'ecdf

Ejemplo: Si es un vector de frecuencias, ingresefailurefreq'Frequency',failurefreq

Tipos de datos: single | double

Nivel de significancia para el intervalo de confianza de la función evaluada, especificado como el par separado por comas que consta de y un valor escalar entre en el rango (0,1).'Alpha' El valor predeterminado es 0,05 para 95% de confianza. Para un valor determinado, el nivel de confianza es%.alpha100(1-alpha)

Por ejemplo, para un intervalo de confianza de 99%, puede especificar el valor alfa de la siguiente manera.

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Tipo de función que evalúa y devuelve, especificada como el par separado por comas que consta de y uno de los siguientes.ecdf'Function'

'cdf'Predeterminado. Función de distribución acumulativa.
'survivor'Función superviviente.
'cumulative hazard'Función de riesgo acumulado.

Ejemplo: 'Function','cumulative hazard'

Indicador para incluir límites, especificado como el par separado por comas que consta de y uno de los siguientes.'Bounds'

'off'Predeterminado. Especifique omitir límites.
'on' Especifique si desea incluir límites.

Nota

Este argumento de nombre-valor sólo se utiliza para el trazado.

Ejemplo: 'Bounds','on'

Argumentos de salida

contraer todo

Valores de función evaluados en los puntos en, devueltos como un vector de columna.x

Se ordenan los puntos observados en el vector de datos, devueltos como un vector de columna.y

ordena, quita los valores duplicados en el ordenado y guarda los resultados en la salida.ecdfyyx La salida incluye el valor mínimo de como sus dos primeros valores.xy Estos dos valores son útiles para trazar las salidas del uso de la función.ecdfstairs

Menor límite de confianza para la función evaluada, devuelta como vector de columna. calcula los límites de confianza mediante.ecdfLa fórmula de Greenwood No son límites de confianza simultáneos.

Límite de confianza superior para la función evaluada, devuelta como un vector de columna. calcula los límites de confianza mediante.ecdfLa fórmula de Greenwood No son límites de confianza simultáneos.

Más acerca de

contraer todo

La fórmula de Greenwood

Aproximación para la varianza del estimador de Kaplan-Meier.

La estimación de la desviación viene dada por

V(S(t))=S2(t)ti<Tdiri(ridi),

Dónderi es el número en riesgo en el momentotiYdi es el número de fallas en el tiempoti.

Referencias

[1] Cox, D. R., and D. Oakes. Analysis of Survival Data. London: Chapman & Hall, 1984.

[2] Lawless, J. F. Statistical Models and Methods for Lifetime Data. 2nd ed., Hoboken, NJ: John Wiley & Sons, Inc., 2003.

Capacidades ampliadas

Introducido antes de R2006a