Está en la página 1de 3

TRABAJO DE PRUEBAS DE BONDAD DE AJUSTE, INDEPENDECIA, HOMOGENEIDAD

YPROPORCIONES

3. Presente un breve resumen de LA PRUEBA DE INDEPENDENCIA DE DATOS


CATEGORICOS. Cuando se utiliza e hipótesis que se plantean, como se hace el
contraste de hipótesis, cálculo del P value. DESARROLLAR PROBLEMA 10.87
Solución

Resumen

Las tablas de contingencia se utilizan para examinar la relación entre dos


variables categóricas, o bien explorar la distribución que posee una variable
categórica entre diferentes muestras.

Hay diferentes cuestiones que surgen al examinar una tabla de contingencia, y


en este tema vamos a tratar la cuestión de la independencia.

La independencia de dos variables consiste en que la distribución de una de las


variables es similar sea cual sea el nivel que examinemos de la otra. Esto se
traduce en una tabla de contingencia en que las frecuencias de las filas (y las
columnas) son aproximadamente proporcionales. Esto es equivalente a
observar que los porcentajes por columnas(o filas) son similares.

La prueba de independencia χ2χ2 (chi-cuadrado) contrasta la hipótesis de que


las variables son independientes, frente a la hipótesis alternativa de que una
variable se distribuye de modo diferente para diversos niveles de la otra.
Una tabla de contingencia con r renglones y c columnas se denomina tabla r × c (“r × c” se
lee “r por c”). Los totales de renglones y columnas en la tabla se denominan frecuencias
marginales. Nuestra decisión de aceptar o rechazar la hipótesis nula, H0, se basa en qué
tan bien se ajusten las frecuencias observadas en cada una de las celdas de la tabla y en
las frecuencias que esperaríamos para cada celda si supusiéramos que H0 es verdadera.

Tabla de contingencia
Tota
Masculino Femenino l
más de 25 horas 15 29 44
menos de 25 horas 27 19 46
42 48 90
Datos
n 90
α 0.01

H0: El tiempo dedicado a ver televisión es independiente del género


H1: El tiempo dedicado a ver televisión es dependiente del género
TRABAJO DE PRUEBAS DE BONDAD DE AJUSTE, INDEPENDECIA, HOMOGENEIDAD
YPROPORCIONES

Definimos los siguientes eventos


A- Una persona seleccionada es de género masculino
B- Una persona seleccionada es del género femenino
C- Una persona seleccionada dedica más de 35 horas
D- Una persona seleccionada dedica menos de 25 horas

Podemos usar las frecuencias marginales para listar las siguientes


estimaciones de probabilidad:
42
P ( A )=
90
48
P ( B )=
90
44
P (C)=
90
46
P ( D )=
90
Si asumimos que H0 es verdadera y las 2 variables son independiente
tenemos que:
42
∗44
90
P ( A ∩C ) =P ( A )∗P ( C )=
90
42
∗46
90
P ( A ∩ D )=P ( A )∗P ( D )=
90
48
∗44
90
P ( B ∩C )=P ( B )∗P ( C )=
90
48
∗46
90
P ( B ∩ D )=P ( B )∗P ( D )=
90
cuando H0 es verdadera. La regla general para obtener la frecuencia
esperada de cualquier celda es dada por la siguiente fórmula:

oi Ei (oi-ei)^2/ei
15 20.5333333 1.49112554
27 21.4666667 1.426294
29 23.4666667 1.30473485
19 24.5333333 1.24800725
TRABAJO DE PRUEBAS DE BONDAD DE AJUSTE, INDEPENDECIA, HOMOGENEIDAD
YPROPORCIONES

X^2 5.47016163

Ahora para buscar el valor de las tablas necesitamos los grados de libertad,
estos serían:
V=(2-1)(2-1) = 1
En la tabla A-5 de los valores críticos de la distribución chi cuadrada, α=
0.01 y v=1 nos da un valor de 6.635
Por lo tanto, tenemos que:
2
X =5.47
2
X 0.01=6.635
Justificación:
Para un nivel de significancia de 0.01 se acepta H0: El tiempo dedicado a
ver televisión es independiente del género, se acepta en base a que el valor
calculado es menor que el valor encontrado en la tabla.

También podría gustarte