Main Content

Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

ecdf

Función de distribución acumulativa empírica

Descripción

ejemplo

[f,x] = ecdf(y) devuelve la función de distribución acumulativa empírica (cdf), , evaluada en los puntos de , utilizando los datos del vector .fxy

En el análisis de supervivencia y fiabilidad, este cdf empírico se llama la estimación Kaplan-Meier. Y los datos pueden corresponder a tiempos de supervivencia o de error.

ejemplo

[f,x] = ecdf(y,Name,Value) devuelve los valores de función empírica, , evaluados en los puntos de , con opciones adicionales especificadas por uno o más argumentos de par.fxName,Value

Por ejemplo, puede especificar el tipo de función que se va a evaluar o qué datos se censuran.

ejemplo

[f,x,flo,fup] = ecdf(___) también devuelve los límites de confianza inferior y superior del 95% para los valores de función evaluados. Puede utilizar cualquiera de los argumentos de entrada de las sintaxis anteriores.

calcula los límites de confianza mediante .ecdfFórmula de Greenwood No son límites de confianza simultáneos.

ejemplo

ecdf(___) dibuja un gráfico de escaleras de la función evaluada mediante la función.stairs Especifique para incluir los límites de confianza en el gráfico.'Bounds','on'

ecdf(ax,___) trazados en los ejes especificados por en lugar de los ejes actuales ( ).axgca

Ejemplos

contraer todo

Calcular la estimación De Kaplan-Meier de la función de distribución acumulativa (cdf) para datos de supervivencia simulados.

Generar datos de supervivencia a partir de una distribución de Weibull con los parámetros 3 y 1.

rng('default')  % for reproducibility failuretime = random('wbl',3,1,15,1);

Calcular la estimación Kaplan-Meier del cdf para los datos de supervivencia.

[f,x] = ecdf(failuretime); [f,x]
ans = 16×2

         0    0.0895
    0.0667    0.0895
    0.1333    0.1072
    0.2000    0.1303
    0.2667    0.1313
    0.3333    0.2718
    0.4000    0.2968
    0.4667    0.6147
    0.5333    0.6684
    0.6000    1.3749
      ⋮

Trazar el cdf estimado.

ecdf(failuretime)

Calcular y trazar la función de peligro de los datos de supervivencia censurados por la derecha simulados.

Genere tiempos de error a partir de una distribución Birnbaum-Saunders.

rng('default')  % For reproducibility failuretime = random('birnbaumsaunders',0.3,1,100,1);

Suponiendo que el final del estudio es en el momento 0.9, genere una matriz lógica que indique tiempos de error simulados que son mayores que 0.9 como datos censurados y almacene esta información en un vector.

T = 0.9; cens = (failuretime>T);

Trazar la función de peligro empírico para los datos.

ecdf(failuretime,'Function','cumulative hazard', ...     'Censoring',cens,'Bounds','on');

Genere datos de supervivencia censurados por la derecha y compare la función de distribución acumulativa empírica (cdf) con el cdf conocido.

Genere tiempos de error a partir de una distribución exponencial con un tiempo medio de error de 15.

rng('default')  % For reproducibility y = exprnd(15,75,1);

Genere tiempos de abandono a partir de una distribución exponencial con un tiempo medio de error de 30.

d = exprnd(30,75,1);

Genere los tiempos de error observados. Son el mínimo de los tiempos de error generados y los tiempos de abandono.

t = min(y,d);

Cree una matriz lógica que indique los tiempos de error generados que son mayores que los tiempos de entrega. Los datos para los que esto es cierto están censurados.

censored = (y>d);

Calcular el cdf empírico y los límites de confianza.

[f,x,flo,fup] = ecdf(t,'Censoring',censored);

Trazar los límites de cdf y confianza.

figure() ecdf(t,'Censoring',censored,'Bounds','on'); hold on

Superponer una parcela de la población conocida cdf.

xx = 0:.1:max(t); yy = 1-exp(-xx/15); plot(xx,yy,'g-','LineWidth',2) axis([0 50 0 1]) legend('Empirical','LCB','UCB','Population', ...     'Location','southeast') hold off

Genere datos de supervivencia y trace la función de superviviente empírico con límites de confianza del 99%.

Genere datos de por vida a partir de una distribución de Weibull con los parámetros 100 y 2.

rng('default')  % For reproducibility R = wblrnd(100,2,100,1);

Trazar la función de superviviente para los datos con límites de confianza del 99%.

ecdf(R,'Function','survivor','Alpha',0.01,'Bounds','on') hold on

Ajuste la función de superviviente de Weibull.

x = 1:1:250; wblsurv = 1-cdf('weibull',x,100,2); plot(x,wblsurv,'g-','LineWidth',2) legend('Empirical','LCB','UCB','Population', ...     'Location','northeast')

La función de supervivencia basada en la distribución real está dentro de los límites de confianza.

Argumentos de entrada

contraer todo

Datos de entrada, especificados como vectores. Por ejemplo, en el análisis de supervivencia o confiabilidad, los datos pueden ser tiempos de supervivencia o de error para cada elemento o individuo.

ignora los valores de .ecdfNaNy Además, cualquier valor del vector de censura ( ) o vector de frecuencia ( ) hace que se ignoren los valores correspondientes en .NaN'Censoring''Frequency'ecdfy

Tipos de datos: single | double

Los ejes se encargan de los trazados de figuras, especificados como un identificador.ecdf

Por ejemplo, si es un identificador para una figura, puede trazar a esa figura de la siguiente manera.hecdf

Ejemplo: ecdf(h,x)

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: especifica que devuelve la función de peligro acumulativo y traza los límites de confianza del 97,5 %, teniendo en cuenta los datos censurados especificados por vector .'Censoring',c,'Function','cumulative hazard','Alpha',0.025,'Bounds','on'ecdfc

Indicador de datos censurados, especificado como el par separado por comas incluyendo y una matriz booleana del mismo tamaño que .'Censoring'x Ingrese para observaciones que estén censuradas por la derecha y para las observaciones que se observan plenamente.10 El valor predeterminado es que todas las observaciones se observan completamente.

ignora cualquier valor de este vector de censura.ecdfNaN Además, cualquier valor en o el vector de frecuencia ( ) hace que ignore los valores correspondientes en el vector de censura.NaNy'Frequency'ecdf

Ejemplo: Si vector almacena la información de datos censurados, escriba .cdata'Censoring',cdata

Tipos de datos: logical

Frecuencia de observaciones, especificada como el par separado por comas que consta de y un vector que contiene recuentos enteros no negativos.'Frequency' Este vector tiene el mismo tamaño que el vector .x El th elemento de este vector da el número de veces que se observó el elemento th de.jjx El valor predeterminado es una observación por elemento de .x

ignora cualquier valor de este vector de frecuencia.ecdfNaN Además, cualquier valor en o el vector de censura ( ) hace que ignore los valores correspondientes en el vector de frecuencia.NaNy'Censoring'ecdf

Ejemplo: Si es un vector de frecuencias, introduzcafailurefreq'Frequency',failurefreq

Tipos de datos: single | double

Nivel de significancia para el intervalo de confianza de la función evaluada, especificado como el par separado por comas que consta de y un valor escalar entre en el intervalo (0,1).'Alpha' El valor predeterminado es 0,05 para una confianza del 95%. Para un valor determinado, el nivel de confianza es %.alpha100(1-alpha)

Por ejemplo, para un intervalo de confianza del 99%, puede especificar el valor alfa de la siguiente manera.

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Tipo de función que evalúa y devuelve, especificado como el par separado por comas que consta de y uno de los siguientes.ecdf'Function'

'cdf'Predeterminado. Función de distribución acumulativa.
'survivor'Función de superviviente.
'cumulative hazard'Función de peligro acumulativa.

Ejemplo: 'Function','cumulative hazard'

Indicador para incluir límites, especificado como el par separado por comas que consta de y uno de los siguientes.'Bounds'

'off'Predeterminado. Especifique para omitir los límites.
'on' Especifique para incluir límites.

Nota

Este argumento nombre-valor solo se utiliza para el trazado.

Ejemplo: 'Bounds','on'

Argumentos de salida

contraer todo

Valores de función evaluados en los puntos de , devueltos como vector de columna.x

Puntos observados ordenados en el vector de datos, devueltos como vector de columna.y

ordena , elimina los valores duplicados en el ordenado y guarda los resultados en la salida.ecdfyyx La salida incluye el valor mínimo de como sus dos primeros valores.xy Estos dos valores son útiles para trazar las salidas del uso de la función.ecdfstairs

Límite de confianza inferior para la función evaluada, devuelta como vector de columna. calcula los límites de confianza mediante .ecdfFórmula de Greenwood No son límites de confianza simultáneos.

Confianza superior limitada para la función evaluada, devuelta como vector de columna. calcula los límites de confianza mediante .ecdfFórmula de Greenwood No son límites de confianza simultáneos.

Más acerca de

contraer todo

Fórmula de Greenwood

Aproximación para la varianza del estimador Kaplan-Meier.

La estimación de varianza es dada por

V(S(t))=S2(t)ti<Tdiri(ridi),

Dónderi es el número en riesgo en el momentotiYdi es el número de fallos en el tiempoti.

Referencias

[1] Cox, D. R., and D. Oakes. Analysis of Survival Data. London: Chapman & Hall, 1984.

[2] Lawless, J. F. Statistical Models and Methods for Lifetime Data. 2nd ed., Hoboken, NJ: John Wiley & Sons, Inc., 2003.

Capacidades ampliadas

Introducido antes de R2006a