Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bondad de ajuste.......................................................................................... 2
Anlisis Ji-cuadrada....................................................................................... 2
Prueba de independencia............................................................................. 3
Prueba de la bondad del ajuste...................................................................6
Tablas de contingencia................................................................................. 8
Pruebas no paramtricas.............................................................................. 8
Escala de medicin....................................................................................... 8
Pruebas de los rangos con signo de wilcoxon para la mediana..................10
Pruebas de sumas de rangos con signo de wilcoxon para la diferencia entre
dos medianas (2 poblaciones independientes)...........................................11
Prueba de rangos con signo de wilcoxon para la diferencia de 2 medianas
(2 poblaciones dependientes, datos pareados)..........................................14
Prueba de las corridas................................................................................ 15
Mtodos estadsticos contra no paramtricos............................................16
Pruebas para verificar la normalidad en un grupo de datos.......................18
Prueba de kolmogorov-smirnov..................................................................18
Prueba de Anderson-Darling.......................................................................18
Prueba de Ryan- Joiner................................................................................ 19
Prueba de Shapiro-Wilks............................................................................. 20
Bibliografa.................................................................................................. 22
Bondad de ajuste.
Anlisis Ji-cuadrada.
Otro caso especial muy importante de la distribucin gamma se obtiene al hacer
=/2 y = 2, donde es un entero positivo. Este resultado se llama distribucin
ji cuadrada. La distribucin tiene un solo parmetro, , llamado grados de libertad.
La variable aleatoria continua X tiene una distribucin ji cuadrada, con grados de
libertad, si su funcin de densidad est dada por:
Prueba de independencia.
El procedimiento de prueba de ji cuadrada que se presenta en la seccin tambin
se puede usar para probar la hiptesis de independencia de dos variables de
clasificacin. Suponga que deseamos determinar si las opiniones de los votantes
residentes del estado de Hilinois con respecto a una nueva reforma de impuestos
son independientes de sus niveles de ingresos. Una muestra aleatoria de 1000
votantes registrados del estado de Hilinois se clasifican de acuerdo con su
posicin en las categoras de ingreso bajo, medio o alto y si estn a favor o no de
la nueva reforma de impuestos. Las frecuencias observadas se presentan en la
tabla que se conoce como tabla de contingencia.
la frecuencia esperada
Calcular:
Donde la suma se extiende a todas las celtal rc en la tabla de contingencia r X c.
si X2 > X2 con = (r 1) (c 1) grados de libertad, rechazar la hipotesis nula de
indepenencia al nivel de significancia , en cualquier otro caso, aceptar la
hipotesis nula.
Al aplicar estre criterio a nuestro ejemplo, encontramos que:
fiscal
Evento
E1
E2
E3
Ek
Frecuencia observada
o1
o2
o3
ok
Frecuencias esperadas
e1
e2
e3
ek
2
El estadstico
(lase chi cuadrada) proporciona una medida de la discrepancia
existente entre la frecuencia observada y la frecuencia esperada, que est dada
por
k (o e )
(o e ) 2
(o e ) 2 (o e ) 2
1 1 2 2 ... k k j j
e1
e2
ek
ej
j 1
(1)
o e
j
n
.
(2)
2
Bajo
la
hiptesis
nula,
el
estadstico
(ji-cuadrado)
se
distribuye
2
aproximadamente
2
excede el valor critico
2 1
Tablas de contingencia.
En estadstica las tablas de contingencia se emplean para registrar y analizar la
relacin entre dos o ms variables, habitualmente de naturaleza cualitativa
(nominales u ordinales)
La tabla nos permite ver de un vistazo que la proporcin de hombres diestros es
aproximadamente igual a la proporcin de mujeres diestras. Sin embargo, ambas
proporciones no son idnticas y la significacin estadstica de la diferencia entre
ellas puede ser evaluada con la prueba de Pearson, supuesto que las cifras de
la tabla son una muestra aleatoria de una poblacin. Si la proporcin de individuos
en cada columna vara entre las diversas filas y viceversa, se dice que existe
asociacin entre las dos variables. Si no existe asociacin se dice que ambas
variables son independientes.
El grado de asociacin entre dos variables se puede evaluar empleando distintos
coeficientes: el ms simple es el coeficiente phi que se define por
Pruebas no paramtricas.
Escala de medicin.
Se entender por medicin al proceso de asignar el valor a una variable de un
elemento en observacin. Este proceso utiliza diversas escalas: nominal, ordinal,
de intervalo y de razn.
Las variables de las escalas nominal y ordinal se denominan tambin categricas,
por otra parte las variables de escala de intervalo o de razn se denominan
variables numricas. Con los valores de las variables categricas no tiene sentido
o no se puede efectuar operaciones aritmticas. Con las variables numricas s.
La escala nominal slo permite asignar un nombre al elemento medido. Esto la
convierte en la menos informativa de las escalas de medicin.
Los siguientes son ejemplos de variables con este tipo de escala:
Nacionalidad.
Uso de anteojos.
Nmero de camiseta en un equipo de ftbol.
Nmero de Cdula Nacional de Identidad.
A pesar de que algunos valores son formalmente numricos, slo estn siendo
usados para identificar a los individuos medidos.
La escala ordinal, adems de las propiedades de la escala nominal, permite
establecer un orden entre los elementos medidos.
Ejemplos de variables con escala ordinal:
Preferencia a productos de consumo.
Etapa de desarrollo de un ser vivo.
Clasificacin de pelculas por una comisin especializada.
Madurez de una fruta al momento de comprarla.
10
Planteamiento
Suponga que se dispone de n pares de observaciones, denominadas
objetivo del test es comprobar si puede dictaminarse que los valores
e
no iguales.
. El
son o
Suposiciones
1. Si
son independientes.
Mtodo
La hiptesis nula es
:
. Retrotrayendo dicha hiptesis a los valores
originales, sta vendra a decir que son en cierto sentido del mismo tamao.
Para verificar la hiptesis, en primer lugar, se ordenan los valores
absolutos
y se les asigna su rango
. Entonces, el estadstico de
la prueba de los signos de Wilcoxon,
, es
11
En ocasiones, esta prueba se usa para comparar las diferencias entre dos
muestras de datos tomados antes y despus del tratamiento, cuyo valor central se
espera que sea cero. Las diferencias iguales a cero son eliminadas y el valor
absoluto de las desviaciones con respecto al valor central son ordenadas de
menor a mayor. A los datos idnticos se les asigna el lugar medio en la serie. La
suma de los rangos se hace por separado para los signos positivos y los
negativos. S representa la menor de esas dos sumas. Comparamos S con el valor
proporcionado por las tablas estadsticas al efecto para determinar si rechazamos
o no la hiptesis nula, segn el nivel de significacin elegido.
12
Procedimiento:
Para efectuar la prueba de suma de rangos de wilcoxon debemos sustituir las
observaciones de las dos muestras de tamaos n1 y n2 por sus rangos
combinados. Los rangos son asignados de tal manera que el rango 1 se asigna a
la ms pequea de las n = n1 + n2 observaciones combinadas, el rango 2 se le
asigna a la siguiente ms alta y as sucesivamente, de modo que el rango n queda
asignado a la observacin mas grande.
Si varias observaciones tienen el mismo valor, asignamos a cada una de estas el
promedio de los rangos que, en otra circunstancia, se les habra asignado.
Por cuestiones de comodidad, siempre que los dos tamaos de muestras sean
distintos, haremos que n1 represente el de la muestra ms pequea y que n2
corresponda al de la ms grande. La estadstica de prueba de suma de rangos de
wilcoxon, T1, es simplemente la suma de rangos asignados a las n1
observaciones de la muestra ms pequea.
Para cualquier valor entero n, la suma de los n primeros enteros consecutivos
puede calcularse fcilmente como n(n + 1)/2. La estadstica de prueba, T1, mas la
suma de los rangos asignados a los n2 elementos de la segunda muestra, T2, por
consiguiente, debe sr igual a este valor; es decir,
De modo que esta ecuacin puede servir como una verificacin del procedimiento
de asignacin de rangos. La prueba de hiptesis nula puede ser de dos extremos
o de un extremo dependiendo de si estamos probando si las dos medianas de
poblacin son exclusivamente diferentes o si una de ellas es mayor que la otra.
Cuando los tamaos de ambas muestras n1 y n2 son 10, se puede usar la tabla
para obtener los valores crticos de la estadstica de prueba T1 para pruebas de
uno y dos extremos, a varios niveles de significacin.
13
14
Criterios a considerar:
T= se elige a la ms pequea de las siguientes sumas:
La suma de los valores absolutos de los rangos negativos de las diferencias
La suma de los rangos positivos de las diferencias d
Si el tamao de la muestra es menor a 30, entones empleamos estadstico
T y se compara con T critico de tablas.
Si el valor de TOBT es menor o igual a TCRI rechazamos Ho
La suma de los rangos debe ser igual a T1 + T2 = n ( n + 1)/ 2
15
12 corridas, comoen la
secuencia alternamente
Mfmfmfmfmfmf
De nuevo sospechamos del orden en que se seleccionaron los individuos para la
encuesta
La prueba de corridas para la aleatoriedad se basa en la variable aleatoria V el
numero total de corridas que ocurren en la secuencia completa de nuestro
experimento. Se dan valores de p(V<v) cuando h0 es verdadera para V=2,3.20
corridas, y valores de n1 y n2 menores que o iguales a 10, los valores p para
pruebas de una cola y de dos colas se pueden obtener con el uso de estos valores
tabulados.
Prueba de Anderson-Darling.
Esta prueba es aplicada para evaluar el ajuste a cualquier distribucin de
probabilidades. Se basa en la comparacin de la distribucin de probabilidades
acumulada emprica (resultado de los datos) con la distribucin de probabilidades
acumulada terica (definida por H0).
la prueba de Anderson-Darling es una prueba no paramtrica sobre si los datos
de una muestra provienen de una distribucin especfica. La frmula para
el estadstico A determina si los datos
(observar que los datos
se deben ordenar) vienen de una distribucin con funcin acumulativa
Donde
19
A =NS
Donde el estadstico de prueba para la prueba de Anderson Darling:
Donde:
n: es el nmero de datos
Prueba de Shapiro-Wilks
Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilstico
normal. Este tipo de representacin tambin lo proporcionan algunos programas
de estadstica, de tal manera que nos permite adems apreciar el ajuste o
desajuste de forma visual:
20
21
H0
Bibliografa.
22
23