Está en la página 1de 7

PRUEBAS NO PARAMETRICAS

En este captulo presentamos el uso de la distribucin Chi- Cuadrado en contrastes no


paramtricos, esto es, aquellos que no dependen de los parmetros poblacionales no de sus
respectivos estimadores. Este tipo de pruebas frecuentemente ocurre, cuando el anlisis se
basa en conteos o frecuencias y no en medidas tales como metros, kilogramos o puntajes de
pruebas.

I. PRUEBA DE CHI-CUADRADO PARA LA INDEPENDENCIA DE DOS


VARIABLES

1.1. TABLA DE CONTINGENCIA

Es una tabla estadstica en la que cada observacin de la muestra es clasificada en dos o ms


niveles de categoras.

TABLA DE CONTINGENCIA DE LAS VARIABLES CUALITATIVAS X E Y


Categoras de Y Total
Categoras de X CY1 CY2 .. CYk Subtotales
CX1 O11 O12 .. O1k OX1
(e11 ) (e12 ) (e1k )
CX2 O21 O22 .. O2k OX2
(e21 ) (e22 ) (e2k )
. . . .. . .
. . . . .
CXm Om1 Om2 .. Omk OXm
(em1 ) (em2 ) (emk )
Subtotales OY1 OY2 .. OYk n

Donde

Oij son las Frecuencias observadas eij son las frecuencias esperadas

k
OX =
i Oij = n de veces que se presenta el nivel xi , i = 1, 2, ..., m
j =1

m
OY = Oij = n de veces que se presenta el nivel yi , i = 1, 2, .. ., k
j
i =1

m k m k
n = O X = OYi = Oij = tamao de la muestra
i
i =1 j =1 i = 1 j =1
1.2. CONTRASTE DE INDEPENDENCIA
Con frecuencia un investigador est interesado en saber si dos mtodos de clasificacin son
independientes o probablemente estn relacionadas. Se dice que dos mtodos de categorizacin son
independientes si la distribucin de un mtodo no depende de la distribucin del otro.

HIPTESIS
H0
: Los dos mtodos de clasificacin son ind ependientes

H1
: Los dos mtodos de clasificacin no son independientes

Que tambin se puede expresar:


Ho: No existe relacin entre los dos mtodos de clasificacin
H1: Existe relacin entre los dos mtodos de clasificacin

ESTADSTICO DE PRUEBA A USAR


Dada la Tabla de Contingencia

TABLA DE CONTINGENCIA DE LAS VARIABLES CUALITATIVAS X E Y


Categoras de Y Total
Categoras de X CY1 CY2 .. CYk Subtotales
CX1 O11 O12 .. O1k OX1
(e11 ) (e12 ) (e1k )
CX2 O21 O22 .. O2k OX2
(e21 ) (e22 ) (e2k )
. . . .. . .
. . . . .
CXm Om1 Om2 .. Omk OXm
(em1 ) (em2 ) (emk )
Subtotales OY1 OY2 .. OYk n

Donde
Oij son las Frecuencias observadas

O Xi .OY j
eij son las frecuencias esperadas; donde eij =
n

Entonces el estadstico de prueba es

Oij eij 2 =
m k m k


Oi2j
o2 =
i =1 j =1
ei j e
i =1 j =1
ij
n

Decisin Si o2 (2 ,( m 1)( k 1)) = 2 se rechaza H 0 ,


Donde :

o2 es denominado valor calculado


es el nivel des significancia a considerar por ejemplo 0.05

(2 ,( m 1)( k 1)) = 2 es el valor tabular correspondiente a la distribucin Chi-Cuadrada con


( m 1)( k 1) grados de libertad con nivel de significancia
m es el nmero de filas de la tabla de contingencia
k es el nmero de columnas de la tabla de contingencia

Observaciones finales:

Cuando empleamos la v.a. 2 en un contraste de hiptesis debemos tener en cuenta las

siguientes consideraciones:

1) Para que la v.a. 2 tenga una buena aproximacin a la distribucin Chi cuadrado es

necesario que las frecuencias esperadas de las distintas categoras no sea inferior a 5 (es

decir, debemos tener eij 5 )


2) Si hay alguna categora que tiene una frecuencia esperada menor que cinco se agrupan
dos o ms categoras en una sola hasta lograr que la nueva frecuencia esperada sea
mayor o igual que cinco.
3) Se puede aplicar la prueba Chi cuadrado en situaciones en las que deseamos decidir si
una serie de observaciones se ajustan o no a una distribucin terica previamente
determinada que puede ser binomial, Poisson , exponencial, normal o hipottica

EJEMPLO1. Verificar si existe o no independencia entre el sexo y carrera profesional escogida con una

muestra de 80 alumnos de Economa y Administracin de cierta Universidad al nivel de 5%. Los datos se

dan en la siguiente tabla de contingencia:

Sexo Total
Carrera Masculino Femenino
Economa 36 11 47
Administracin 14 19 33
Total 50 30 80

SOLUCION:

i) Hiptesis

H o : El sexo y la carrera son independientes (no tienen relacin)

H 1 : El sexo y la carrera no son independientes (estn relacionados)

ii) Calculando las frecuencias esperadas:


47 50 47 3 0
e11 = = 29. 38 e12 = = 17.6 2
80 80

3 3 50 33 30
e21 = = 20.62 e22 = = 12 . 38
80 80

iii) Con lo anterior podemos formar la siguiente tabla de contingencia 2x2

Sexo Total
Carrera Masculino Femenino
36 11
47
Economa (29.38) (17.63)
14 19
33
Administracin (20.62) (12.38)
Total 50 30 80

iv) Calculamos ahora el valor de 2 con nuestros datos segn el estadstico de prueba:

Oij eij 2 =
m k m k


Oi2j
o2 =
i =1 j =1
eij e
i =1 j =1
ij
n

36 29.38 14 20.62 11 17.63 19 12.38


2 2 2 2

2
= + + + = 9.659
29.38 20.62 17.63 12.38

v) Hallamos en la tabla el valor crtico (2 ,( m 1)( k 1)) = 2 para = 0.05 . Para nuestro
caso
m=2 filas y k=2 columnas, por lo cual los grados de libertad = (2-1)(2-1)=1, entonces buscaremos

en la tabla con 0.05


2
,1 = 3.84

vi) Decisin:

Como 2 = 9.659 3.84 entonces rechazamos Ho y decimos que El sexo y la carrera no son
independientes (estn relacionados)

EJEMPLO 2
En un trabajo de Investigacin se tiene que su Hiptesis central es:

Hiptesis
H o : No existe una relacin entre la Gestin de los Directores y el Clima Laboral de los docentes
en las Instituciones Educativas

H 1 : Si existe una relacin entre la Gestin de los Directores y el Clima Laboral de los docentes en
las Instituciones Educativas.

Ahora determinaremos el valor calculado valor del estadstico de prueba a partir de la siguiente tabla
de contingencia
TABLA DE CONTINGENCIA DE LA GESTION DE LOS DIRECTORES Y EL CLIMA
LABORAL DE LOS DOCENTES EN LAS I. E. DE NIVEL SECUNDARIA
NIVEL DE CALIDAD DEL
CLIMA LABORAL Total
DIRECTORESGESTIN DE

Regular o
NIVELES DE CALIDAD Bueno Malo Subtotales
Bueno Frecuencias Observadas: Oij
21 8 29
( Frecuencias Esperadas eij : ) (12.5) (16.5)
Regular Frecuencias Observadas: Oij 4 25 29
o Malo
( Frecuencias Esperadas eij : )

(12.5) (16.5)
Subtotales 25 33 58

Estadstico de prueba

De la tabla de contingencia tenemos que


m k
Oij2
o2 =
ei =1 j =1
ij
n=
212
+
82
+
42
+
252
12.5 16.5 12.5 6 .5
58 = 20.318

Entonces

o2 = 2 0 .3 18 .
El valor tabular de la Ch-Cuadrada con 1 grado de libertad y aun nivel de significancia de = 0.05

es 2 = (0.05,
2
1) = 3.841
Decisin

Como o2 = 20.318 2 = 3 . 8 4 1 , rechazamos H 0 , es decir que entre la Gestin de los


Directores y el Clima Laboral de los docentes en las Instituciones Educativas de nivel secundario de
la zona urbana de Andahuaylas Existe una relacin estadsticamente significativa.
PRACTICA 03 CONTRASTE DE INDEPENDENCIA - CHI CUADRADO

1. Un investigador clasific en forma cruzada a 355 nios de una escuela primaria de acuerdo con su grupo
socioeconmico y la presencia o ausencia de un defecto congnito. Con base en estos datos,
Podramos concluir que los defectos congnitos estn relacionados con la posicin econmica a un

nivel de confianza del 99%?

Grupo Socioeconmico
Defecto Total
Congnito Alto Medio Bajo
Presente 4 32 35
Ausente 46 138 100
Total

2. Sean los datos de 3 proveedores en relacin a las condiciones de sus productos vendidos. Probar a un
5% de significancia si la condicin de los productos depende del tipo de proveedor.

Condicin del producto


Tipo de Con defectos Con defectos
Proveedor Buenos menores graves
A 90 3 7
B 170 18 7
C 135 6 9

3. Al final de un semestre, las calificaciones de Psicologa clnica fueron tabuladas en la siguiente tabla de
contingencia de 3 2 para estudiar la relacin entre la asistencia a clase y la calificacin obtenida.

Condicin
Ausencias Aprobado No aprobado
0-3 135 110
4-6 36 4
7 - 45 9 6

Con = 0.05 , indican los datos que son independientes la asistencia a clase y la calificacin
obtenida?

4. Se trata de ver si el nmero de reclamaciones depende de la marca para un 5% de nivel de


significancia. Ho: Los rechazos son independientes de la marca?
Ha: los rechazos dependen de la marca?
Reclamaciones
Marca OK Rechazos
1 200 35
2 150 24
3 210 40

PRACTICA DISTRIBUCION MUESTRAL


2) Se determinaron los niveles del PH de la saliva en una muestra aleatoria de 12 resultados, los
cuales presentaban una alta incidencia de caries. Los datos fueron los siguientes:
7.36 7.04 7.19 7.41 7.10 7.15 7.36 7.57 7.64 7.00 7.25 7.19
Si la muestra fue extrada de una poblacin normal y con una media 8 de PH,
Es posible que el promedio de PH en la muestra sea menor ?
con un nivel de confianza de 95% , interpretar.

3) Un vendedor de seguros de vida dice que en promedio un trabajador en la ciudad de Lima


Metropolitana tiene no ms de S/. 25,000 de seguro de vida personal. Para probar esto, muestrea
aleatoriamente 100 trabajadores en L.M. y encuentra que esta muestra de trabajadores promedia
De S/. 26,650 de seguro de vida personal y que la desviacin estndar es S/. 12,000.
Es probable a firmar que el seguro de vida personal sea superior a 25,000. Use = 0.05
Para resolver usar los 5 pasos

4) Los sacos de caf que recibe un exportador de cierto proveedor deben tener un peso promedio
de 100 kilos. Un inspector tom una muestra de 20 sacos de caf encontrando una media de 99
kilos y una desviacin estndar de 3 kilos.
Con = 10% Es razonable que el exportador rechace el lote de sacos de caf?. (Bilateral)
Para resolver usar los 5 paso

También podría gustarte