Está en la página 1de 17

STATGRAPHICS Rev.

9/14/2006

Ajustando Distribucin (Datos Censurados)


Resumen
El procedimiento Ajustando Distribucin (Datos Censurados) ajusta cualquiera de las 45 distribuciones de probabilidad a una columna numrica de datos censurados. La censura ocurre cuando alguno de los valores de los datos no son conocidos exactamente. Por ejemplo, cuando medimos tiempos de falla, algunos artculos bajo estudio pueden no haber fallado cuando termino el estudio, resultando en una cota inferior para el tiempo de falla para estos artculos.

Ejemplo StatFolio: distfit censored.sgp Datos del Ejemplo:


El archivo absorbers.sf3 contiene n = 38 observaciones identificando el numero de kilmetros de uso para una muestra de amortiguadores de choque del vehculo, tomadas de Meeker y Escobar (1998). Cuando se inspecciono, algunos de los amortiguadores de choque del vehculo haban fallado mientras que otros no. La siguiente tabla muestra una lista parcial de los datos de este archivo: Distance (Distancia) 6700 6950 7820 8790 9120 9660 9820 11310 11690 11850 11880 12140 Censores (Censurado) 0 1 1 1 0 1 1 1 1 1 1 1

El archivo contiene 11 observaciones que corresponden a amortiguadores de choque que han fallado. Los datos de estos amortiguadores son tiempos de falla. El archivo tambin contiene 27 amortiguadores que no hay fallado. Estos datos representan informacin censurada por la derecha en los tiempos de falla de estos amortiguadores, ya que la verdadera distancia de falla es ms grande que el nmero registrado. Cuando analizamos datos censurados, STATGRAPHICS requiere que crees una columna con un indicador de censura, definida por: 0 si el valor no ha sido censurado 1 si el valor es censurado por la derecha (el valor verdadero es ms grande) -1 si el valor es censurado por la izquierda (el valor verdadero es ms pequeo) 2005 por StatPoint, Inc. Ajustando Distribucin (Datos Censurados) - 1

STATGRAPHICS Rev. 9/14/2006

Entrada de Datos
Los datos que sern analizados consisten de una columna numrica que contiene n observaciones y una segunda columna que contiene indicadores de censura.

Datos: columna que contiene las n observaciones que sern ajustadas. El nmero de datos no perdidos debe ser al menos tan grande como el nmero de parmetros que sern estimados. Censura: columna que contiene los indicadores de censura. Esta columna debera contener un 0 para cualquier rengln en el que el dato no sea censurado, un 1 si es censurado por la derecha y -1 si es censurado por la izquierda.

Resumen del Anlisis


El Resumen del Anlisis muestra el nmero de observaciones, los rangos de los datos, y los valores de los parmetros estimados para cada distribucin que es ajustada a los datos.
Datos Censurados - Distance
Datos/Variable: Distance Censura: Censored 38 valores con rango desde 6700.0 a 28100.0 Nmero de observaciones censuradas a la izquierda: 0 Nmero de observaciones censuradas a la derecha: 27 Distribuciones Ajustadas Normal media = 24570.9 desviacin estndar = 8356.32

Valor Extremo Inferior modo = 26896.4 escala = 5668.58

Weibull forma = 3.16047 escala = 27718.7

Los parmetros desplegados dependen de la distribucin seleccionada (ver la documentacin del procedimiento Distribuciones de Probabilidad). Los estimadores son obtenidos usando 2005 por StatPoint, Inc. Ajustando Distribucin (Datos Censurados) - 2

STATGRAPHICS Rev. 9/14/2006 Estimacin de Mxima Verosimilitud (EMV). Puedes ajustar entre1 y 5 distribuciones al mismo tiempo usando Opciones del Anlisis. En la tabla anterior, 3 distribuciones han sido ajustadas a n = 38 distancias. La distribucin normal es definida por su media y desviacin estndar. La distribucin de valores extremos para mnimos es definida por su moda y el parmetro de escala. La distribucin Weibull esta definida por un parmetro de forma y un parmetro de escala.

Opciones del Anlisis

Distribucin: selecciona entre 1 y 5 distribuciones para ajustar los datos. Cada distribucin es descrita en detalle en la documentacin de Distribuciones de Probabilidad. Para ayudar a determinar cual distribucin ajusta, el panel Comparacin de Distribuciones Alternas descrito abajo puede ser de gran ayuda. Las siguientes tablas pueden ser tambin de ayuda.

Distribuciones Discretas Distribucin Rango de los Datos Bernoulli 0o1 Binomial Uniforme Discreta Geomtrica Hipergeomtrica Binomial Negativa 0, 1, 2, , m a, a+1, a+2, , b 0, 1, 2, 0, 1, 2, , m 0, 1, 2,

Poisson 0, 1, 2, 2005 por StatPoint, Inc.

Uso comn Modelo para eventos con solo dos posibles resultados. Numero de xitos en m ensayos Bernoulli. Modelo para enteros con limites fijos Numero de ensayos hasta el primer xito Bernoulli. Conteo cuando se muestrea de una poblacin finita. Numero de ensayos hasta el k-esimo xito Bernoulli. Numero de eventos en un intervalo fijo. Ajustando Distribucin (Datos Censurados) - 3

STATGRAPHICS Rev. 9/14/2006 Distribuciones Continuas Distribucin Rango de los Datos Beta 0X1 Beta (4-parmetros) a X b Birnbaum-Saunders X > 0 Cauchy all real X Chi-Cuadrada X0 Erlang Exponencial Exponencial(2parms) Exponencial power F Folded Normal Gamma Gamma (3parmetros) Gamma Generalizada Logstica Generalizada Normal Truncada Gausiana Inversa Laplace Valores Extremos Mximos Logistica Loglogistica Loglogistica (3parmetros) Lognormal Lognormal (3parmetros) Maxwell Chi-cuadrada No central F No central t No central Normal Pareto Pareto (2X>0 X>0 X>a all real X X0 X0 X0 Xa X>0 All real x X X>0 todos los reales X todos los reales X todos los reales X X>0 X>a X>0 X>a X>a X0 X0 todos los reales X todos los reales X X1 Xa Uso comn Distribucin de una proporcin aleatoria. Modelo para datos con umbrales superior e inferior. Tempo de Fallas. Medidas que exhiben colas pesadas. Distribucin de referencia para la varianza muestral. Tiempo entre k arribos en un proceso Poisson. Tiempo entre consecutivos eventos Poisson. Tiempos de vida con umbral inferior fijo. Datos simtricos con kurtosis variable. Razn de dos estimadores de varianzas independientes. Valores absolutos de datos de una distribucin normal Modelo para medidas positivamente sesgada. Datos positivamente sesgados con umbral inferior. Incluye varias distribuciones con casos especiales. Usada para el anlisis de valores extremos. Datos normales doblados alrededor de su media. Primer paso de tiempo en el movimiento Browniano. Datos con picos pronunciados y colas pesadas. Valores ms grandes en una muestra. Modelo de crecimiento; alternativa comn a la normal. Logs de datos de una distribucin logstica. Logs de datos con umbral inferior fijo. Datos positivamente sesgados. Datos positivamente sesgados con umbral inferior. Velocidad de una molcula en un gas ideal. Calculo de potencia de una prueba chi-cuadrada. Calculo de potencia de una prueba F. Calculo de potencia de una prueba t Datos con muchas fuentes de variabilidad. Cantidades socio-econmicas con colas pesadas en la derecha Cantidades socio-econmicas con umbral Ajustando Distribucin (Datos Censurados) - 4

2005 por StatPoint, Inc.

STATGRAPHICS Rev. 9/14/2006 parmetros) Rayleigh Valores Extremos Mnimos t de Student Triangular Uniforme Weibull Weibull (3parmetros) X>a todos los reales X todos los reales X aXb aXb X0 Xa inferior. Distancia entre objetos vecinos. Valore ms pequeos en una muestra. Distribucin de referencia para la media. Modelo spero en ausencia de datos. Datos con la misma probabilidad sobre un intervalo. Tiempo de vida de productos. Tiempo de vida de productos con umbral inferior.

Ensayos Binomial cuando se ajusta la distribucin binomial, debes especificar el tamao de la muestra n. Ensayos Hypergeomtrica cuando se ajusta la distribucin hypergeomtrica, puedes especificar el tamao de la muestra n. puedes especificar el parmetro tamao de la poblacin N o estimarlo de los datos. Ensayos Binomial Negativa cuando se ajusta la distribucin binomial negativa, puedes especificar el parmetro k o estimarlo de los datos. Parmetros del umbral extendidos cuando se ajusta distribuciones que tienen uno o mas parmetros umbrales, puedes especificar estos parmetros o estimarlos de los datos. Las distribuciones relevantes son: Beta (4-parmetros) inferior y superior Exponencial (2-parmetros) inferior solamente Normal truncada (2-parmetros) inferior solamente Gamma (3-parmetros) inferior solamente loglogistica (3-parmetros) inferior solamente lognormal (3-parmetros) inferior solamente Maxwell (2-parmetros) inferior solamente Pareto (2-parmetros) inferior solamente Rayleigh (2-parmetros) inferior solamente Weibull (2-parmetros) inferior solamente

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 5

STATGRAPHICS Rev. 9/14/2006

Prueba de Bondad-de-Ajuste
El panel de Prueba de Bondad-de-Ajuste realiza hasta 7 diferentes pruebas para determinar si es razonable que los datos provengan de la distribucin ajustada. Para todas las pruebas, las hiptesis de inters son: Hiptesis Nula: los datos son muestras independientes de la distribucin especificada Hiptesis Alternativa: los datos no son muestras independientes de la distribucin especificada

La prueba que ser corrida es seleccionada usando las Opciones del Panel.
Pruebas de Bondad-de-Ajuste para Distance Prueba de Kolmogorov-Smirnov Normal Valor Extremo Inferior DMAS 0.0760417 0.0818301 DMENOS 0.0903629 0.122783 DN 0.0903629 0.122783 Valor-P 0.915578 0.615589

Weibull 0.0901357 0.087023 0.0901357 0.917047

Las prueba de bondad-de-ajuste es descrita con detalle en la documentacin de Ajustando Distribucin (Datos No Censurados). Para datos censurados, las pruebas son modificadas de forma que dependan de cmo los datos fueron censurados. Usando las Opciones del Panel, se puede seleccionar entre 3 tipos de censura: Aleatoria, Tipo I, o Tipo II, situadas en dicho panel. Modificaciones para las pruebas son descritas en las secciones de clculos al final de este documento. De acuerdo a la prueba desplegada en la tabla anterior, cualquiera de las 3 distribuciones ajusta bien los datos, ya que los P-valores son iguales o no exceden 0.10.

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 6

STATGRAPHICS Rev. 9/14/2006 Opciones del Pane l

Incluir: Seleccione una o mas pruebas a realizar. Para la prueba chi-cuadrada, selecciones use clases equiprobables para agrupar los datos en clases con frecuencia esperadas iguales. . Si esta opcin no es elegida las clases sern creadas del Histograma de Frecuencias. Calculo de los P-Valores en la distribucin especfica Si es seleccionado, los Valores-P sern basados en tablas o formulas especficamente desarrolladas para la distribucin que es probada. De otra manera, los P-Valores sern basados en tablas o formulas generales que aplican a todas las distribuciones. La aproximacin general es mas conservadora (no rechazar una distribucin tan fcilmente) pero puede ser preferida cuando comparamos Valores-P entre distribuciones diferentes. Censura Seleccione el tipo de censura. Los tipos son definidos: Aleatoria Indica que los datos han sido aleatoriamente censurados. La censura aleatoria ocurre cuando los valores son censurados por varias razones, no caen dentro de los mecanismos Tipo I o Tipo II. Tipo I - Indica que los datos son censura por tiempo, i.e., artculos han sido removidos de una prueba en un tiempo preespecificado. Si este tipo de censura es seleccionado, todos los valores censurados deben de ser igual o un mensaje de error ser generado. Tipo II Indica que la prueba fue detenida despus de que ocurri un nmero predeterminado de fallas. Si este tipo de censura es seleccionado, todos los valores censurados deben de ser igual o un mensaje de error ser generado.

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 7

STATGRAPHICS Rev. 9/14/2006

Histograma de Frecuencias
El Histograma de Frecuencias muestra un histograma de los datos como un conjunto de barras verticales, junto con la densidad de probabilidad estimada o funciones de masa.
Histograma para Distance 8 Distribucin Normal Valor Extremo Weibull

6 frecuencia

0 0 0.5 1 1.5 Distance 2 2.5 3 (X 10000.0)

Si los datos contienen muchas observaciones censuradas, como en la grafica anterior, las distribuciones ajustadas pueden no parecer emparejar las barras. Opciones del Panel

Numero de Clases: El numero de intervalos en los cuales los datos sern divididos. Los intervalos son adyacentes y tienen igual anchura. El numero de intervalos en los cuales los datos sern divididos por defecto es fijado en la pestaa EDA de la caja de dialogo de Preferencias en el men Editar. Limite Inferior: Limite inferior del primer intervalo. Ajustando Distribucin (Datos Censurados) - 8

2005 por StatPoint, Inc.

STATGRAPHICS Rev. 9/14/2006 Limite Superior: Limite superior del primer intervalo. Mantener: Mantiene el nmero de intervalos y limites iguales aunque la fuente de datos cambie. Por defecto, el nmero de clases y los lmites son recalculados cuando los datos cambian. Es necesario que todas las observaciones sean desplegadas por si algn dato actualizado cae ms all de los lmites originales. Desplegar: La manera en la cual las frecuencias son desplegadas. Un Histograma escala las barras de acuerdo al nmero de observaciones en cada clase. Un Rotograma escala las barras de acuerdo a la raz cuadrada del nmero de observaciones. Un Rotograma Suspendido escala por la raz cuadrada y suspende las barras de la curva. La idea de usar races cuadradas es para igualar la varianza de las desviaciones entre las barras y la curva, lo cual de otra forma incrementara con una frecuencia creciente. La idea de suspender las barras de la curva es permitir una comparacin visual sencilla con la lnea horizontal graficada en 0, ya que la comparacin visual con una lnea curva puede ser engaosa.

Comparacin de Distribuciones Alternas


Este panel automticamente muestra una coleccin de distribuciones diferentes y las despliega en orden de acuerdo a que tan bien ajustan los datos.
Comparacin de Distribuciones Alternas Distribucin Parmetros Est. Weibull 2 Normal 2 Logstica 2 Laplace 2 Valor Extremo Inferior 2 Valor Extremo Superior 2 Gamma 2 Loglogstica 2 Lognormal 2 Uniforme 2 Exponencial 1 Pareto 1 Log Verosimilitud -404.991 -406.4 -408.408 -413.516 -409.469 -405.653 -404.845 -406.131 -405.125 -400.338 -427.009 -510.249 KS D 0.0901357 0.0903629 0.103344 0.108477 0.122783 0.128409 0.128419 0.131113 0.155015 0.159942 0.329046 0.448162

La tabla muestra: Distribucin El nombre de la distribucin ajustada. T puedes seleccionar distribuciones adicionales usando las Opciones del Panel. Parmetros Est. El numero de parmetros estimados para esta distribucin. Log Verosimilitud El logaritmo natural de la funcin de verosimilitud. Valores mas grandes tienden a indicar mejores ajustes de las distribuciones. KS D, A^2, y otras estadsticas Valores de varias estadsticas de bondad-de-ajuste, seleccionadas usando el botn Pruebas en la caja de dialogo de las Opciones del Panel. Valores mas pequeos tienden a indicar mejores ajustes de las distribuciones.

Las distribuciones son ordenadas de mejor a peor de acuerdo a una de las columnas de bondadde-ajuste. Esta columna es seleccionada usando el botn Pruebas en la caja de dialogo de las Opciones del Panel. La tabla anterior muestra las distribuciones ordenadas de acuerdo al valor de 2005 por StatPoint, Inc. Ajustando Distribucin (Datos Censurados) - 9

STATGRAPHICS Rev. 9/14/2006 la estadstica Kolmogorov-Smirnov D. De acuerdo a esta estadstica, la distribucin de valores extremos para mnimos ajusta mejor Opciones del Panel

Distribucin: Seleccione las distribuciones que ajustaran los datos. Las distribuciones seleccionadas actualmente son transparentadas ya que ellas siempre estarn incluidas. Ms Comn Presionar este botn para seleccionar las distribuciones mas comnmente usadas (continuas). Todas Discretas Presionar este botn para seleccionar todas las distribuciones discretas. Todas Continuas Presionar este botn para seleccionar todas las distribuciones continuas. Localizacin-Escala Presionar este botn para seleccionar todas las distribuciones que son parametrizadas por un parmetro de localizacin (como la media) y uno de escala (como la desviacin estndar). Umbral - Presionar este botn para seleccionar todas las distribuciones que contienen un parmetro umbral inferior. Todas Presionar este botn para seleccionar todas las distribuciones. Limpiar Presionar este botn para deseleccionar todas las distribuciones. Pruebas Presionar este botn para desplegar la caja de dialogo usada para especificar las estadsticas deseadas de bondad-de-ajuste:

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 10

STATGRAPHICS Rev. 9/14/2006

Incluir Las estadsticas de bondad-de-ajuste que sern incluidas en la tabla. La lista incluye funciones de verosimilitud y varias estadsticas desplegadas en el panel Bondadde-ajuste. Ordenar Por Seleccione una de las estadsticas para ordenar las distribuciones de mejor a peor.

Grfico Cuantil
El Grfico Cuantil muestra la fraccin de observaciones en o por debajo de X, junto con la funcin de distribucin de acumulacin de la distribucin ajustada.

Grfico Cuantil 1 probabilidad acumulada 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 Distance 2 2.5 3 (X 10000.0) Distribucin Normal Valor Extremo Inferior Weibull

Para crear la grafica, los datos son ordenados del ms pequeo al ms grande y los valores no censurados son graficados en las coordenadas ( p ), x ) (F
i (i )

(1) Ajustando Distribucin (Datos Censurados) - 11

2005 por StatPoint, Inc.

STATGRAPHICS Rev. 9/14/2006 donde pi son las probabilidades de Kaplan-Meier. Las probabilidades de Kaplan-Meier son calculadas de acuerdo a

pi = 1

n j c +1 n c +1 n 2c + 1 jS R n j c + 2
j i

(2)

para todas las observaciones no censuradas mayores que el valor mas grande de los datos censurados por la izquierda, donde SR es el conjunto de todos los valores los cuales no son censurados por la derecha, y

pi =

jc n c +1 n 2c + 1 jS L j c + 1
j i

(3)

para todas las observaciones no censuradas menores o iguales a el valor mas grande de los datos censurados por la izquierda, donde es el conjunto de todos los valores los cuales no son censurados por la izquierda, y c = 0.3175. Idealmente, los puntos deberan estar cerca de la lnea de la distribucin ajustada, como es el caso en la grafica anterior

reas de Cola
Este panel muestra el valor de la distribucin de acumulacin hasta en 5 valores de X.
reas de Cola para Distance rea Cola Inferior (<=) X Normal Valor Extremo Inferior 10000.0 0.040606 0.0494898 20000.0 0.29219 0.256386 30000.0 0.74206 0.822526 40000.0 0.967583 0.999959 50000.0 0.998829 1.0 rea Cola Superior (>) X Normal 10000.0 0.959394 20000.0 0.70781 30000.0 0.25794 40000.0 0.0324166 50000.0 0.00117082

Weibull 0.0390841 0.299858 0.723066 0.958716 0.998423

Valor Extremo Inferior 0.95051 0.743614 0.177474 0.000041464 0.0

Weibull 0.960916 0.700142 0.276934 0.0412835 0.00157716

La tabla muestra: rea de Cola Inferior La probabilidad de que la variable aleatoria sea menor o igual a X. rea de Cola Superior La probabilidad de que la variable aleatoria sea mayor o igual a X.

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 12

STATGRAPHICS Rev. 9/14/2006 Por ejemplo, la probabilidad de ser menor o igual a X = 10,000 para la distribucin normal es aproximadamente 0.0406. Opciones del Panel

Valores Crticos: Valores de X en los cuales la probabilidad acumulada ser calculada.

Valores Crticos
Este panel calcula el valor de una variable aleatoria X debajo del cual yace una probabilidad especificada.
Valores Crticos para Distance rea Cola Inferior (<=) 0.01 0.1 0.5 0.9 0.99 Normal 5131.13 13861.8 24570.9 35279.9 44010.6 Valor Extremo Inferior 820.116 14140.0 24818.8 31624.2 35553.4 Weibull 6466.15 13600.0 24683.6 36089.5 44939.6

La tabla muestra los valores mas pequeos de X tal que la probabilidad de ser menor o igual a X es al menos el rea de cola deseada. La tabla anterior muestra que la c.d.f. de una distribucin normal ajustada es igual a 0.01 en X = 5,131.13. Opciones del Panel

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 13

reas de Cola: Valores de la distribuciones ajustadas.

STATGRAPHICS Rev. 9/14/2006 c.d.f. por lo menos para determinar porcentajes de las

Grfico Cuantil-Cuantil
El grfico Cuantil-Cuantil muestra la fraccin de observaciones en o por debajo de X graficadas versus los percentiles equivalentes de las distribuciones ajustadas.
Grfica Cuantil-Cuantil (X 10000.0) 3 2.5 Distance 2 1.5 1 0.5 0 0 0.5 1 1.5 2 Normal distribucin 2.5 3 (X 10000.0) Distribucin Normal Valor Extremo Inferior Weibull

Una distribucin, seleccionada usando Opciones del panel, es usada para definir el eje X y es representada por la lnea diagonal. Las otras son representadas por curvas. En la grafica anterior, la distribucin ajustada normal ha sido usada para definir el eje X. Con una muestra pequea, es muy difcil elegir entre las distribuciones. Opciones del Panel

Distribucin de Escala para el Eje X: La distribucin usada para escalar el eje horizontal, correspondiente a la lnea diagonal. Resolucin del Eje X: El nmero de valores de X en los cuales las funciones son graficadas. Incrementa este valor si las lneas no son suficientemente suaves. Ajustando Distribucin (Datos Censurados) - 14

2005 por StatPoint, Inc.

STATGRAPHICS Rev. 9/14/2006

Funciones de Distribucin 1 y 2
Estos dos paneles grafica varias funciones para las distribuciones ajustadas.
Funcin de Densidad (X 0.00001) 8 Distribucin Normal Valor Extremo Inferior Weibull

6 densidad

0 0 1 2 3 Distance 4 5 6 (X 10000.0)

Usando Opciones del Panel, se pueden graficar cualquiera de las siguientes: 1. 2. 3. 4. 5. Densidad de Probabilidad o funcin de masa Funcin de Distribucin Acumulada Funcin de Supervivencia Log Funcin de Supervivencia Funcin de Riesgo

Para las definiciones de estas funciones, ver la documentacin para Distribuciones de Probabilidad. Opciones del Panel

Graficar: La funcin a graficar.

Resolucin del Eje X: El nmero de valores de X en los cuales las funciones son graficadas. Incrementa este valor si las lneas no son suficientemente suave. 2005 por StatPoint, Inc. Ajustando Distribucin (Datos Censurados) - 15

STATGRAPHICS Rev. 9/14/2006 Clculos Estimacin de Parmetros Los estimadores de los parmetros son obtenido usando Estimacin de Mxima Verosimilitud (EMV), donde la funcin de verosimilitud es dada por
L = l ( xi )
i =1 n

(4)

y
left censored F ( xi ) l ( xi ) = f ( xi ) if xi is uncensored 1 F ( x ) right censored i

(5)

Prueba Chi-Cuadrada Cuando realizamos esta prueba, despus de que los intervalos iniciales son construidos, todas las clases incluyendo la observacin ms grande de las censuradas por la izquierda son combinadas en una sola clase inferior. Adicionalmente, todas las clases incluyendo la las observacin mas pequea de las censuradas por la derecha son combinadas en una sola clase superior. En algunos casos, esto puede no dejar suficientes clases para realizar la prueba. Prueba EDF Para la prueba Kolmogorov-Smirnov y otras pruebas EDF, las pruebas son realizadas modificando la c.d.f. emprica. Para censura aleatoria, las estadsticas KolmogorovSmirnov y Kuiper son calculadas remplazando la simple funcin de pasos i/n por el estimador de Kaplan-Meier Fn ( x) = 0 , 1 1
jS x( j ) x

x < x(1) x(1) x x(n) x > x(n)

(6) (7) (8)

n j + 1 ,

n j

donde S es el conjunto de todas las observaciones no censuradas. Ninguna de las otras estadsticas son calculadas en este caso. Para la censura de Tipo I y Tipo II, la muestra de los valores no censurados es transformada una muestra completa sobre la regin no censurada modificando la c.d.f. ajustada de acuerdo a
*(X ) = F(X i ) A F i BA

(9)

Para la censura de Tipo I, A es la c.d.f. ajustada evaluada en los valores de censura inferior (si hay), mientras que B es la c.d.f. ajustada evaluada en los valores de censura superior (si hay). Para la censura de Tipo II, A es la fraccin de las observaciones que son censuradas por la izquierda, y B es la fraccin de las observaciones que son censuradas por la derecha. Las 2005 por StatPoint, Inc. Ajustando Distribucin (Datos Censurados) - 16

STATGRAPHICS Rev. 9/14/2006 formulas usuales e.d.f. son entonces usadas, remplazando n por el numero de datos no censurados y definiendo

* (x ) zi = F i

(10)

2005 por StatPoint, Inc.

Ajustando Distribucin (Datos Censurados) - 17

También podría gustarte