Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. Tabla de contingencia.
Con mucha frecuencia el análisis estadístico se orienta a la evaluación de la
existencia o no de una relación entre dos variables a partir de una muestra aleatoria
de tamaño n. Cuando ambas variables son cuantitativas y se realizan mediciones
de los valores en cada uno de n elementos o individuos, usando una escala de
ordinal, de intervalo o de razón, el análisis se realiza a través de alguno de los
coeficientes de correlación.
Cuando se trata de analizar la relación entre dos variables cualitativas, medidas en
escala nominal u ordinal, o cuando una o ambas variables cuantitativas han sido
categorizadas, para llevar a cabo el análisis de la relación entre dichas variables se
obtiene una muestra de tamaño n y se construye una tabla de frecuencias conjunta
con una estructura similar a la tabla 1. Dicha tabla se denomina tabla de clasificación
cruzada, tabla bivariante, tabla bidimensional, etc. La denominación más utilizada
es la de tabla de contingencia, que tiene la siguiente estructura.
Tabla de contingencia
En esta tabla:
nij es la frecuencia conjunta de la fila i y columna j de la tabla de contingencia y
ni. es el total de la fila (renglón) de la tabla de contingencia
n.j es el total de la columna j en la tabla de contingencia
n es la cantidad total de datos o tamaño de la muestra
3. Prueba de Independencia
Esta tabla de contingencia permite analizar la relación entre las variables A y B.
Las hipótesis estadísticas que se formulan son:
Hipótesis Nula Ho: Las variables A y B. Que es lo mismo que decir que No existe
relación entre las variables A y B.
Hipótesis Alternativa H1: Las variables A y B no son independientes (Existe
relación entre las variables A y B).
c r (nij − eij ) 2
χ = ∑∑2
j =1 i =1 eij
Cuando la hipótesis nula es cierta este estadístico tiene una distribución que se
aproxima a una Chi-Cuadrado con grados de libertad igual a (r-1)*(c-1).
ni . * n. j
eij =
n
Ejemplo
Un administrados lleva adelante un estudio con el objetivo de descubrir la posible
relación que puede existir entre las fallas de que presentan cinco máquinas y el
turno de operación de dichas máquinas. Se han obtenidos datos de 160 fallas y se
han clasificado en la siguiente tabla de contingencia.
Máquina
Máquina Máquina Máquina Máquina
Turno A B C D Total
Mañana 12 6 12 13 43
Tarde 10 12 19 22 63
Noche 13 10 13 18 54
Total 35 28 44 53 160
j =1 i =1 eij
χ 2 ≥ 12.59
Se puede observar que no hay frecuencias esperadas menores que cinco, por lo
que procedemos a calcular el valor del estadístico.
c r (nij − eij ) 2
χ = ∑∑
2
j =1 i =1 eij
=
(12 − 9.41) 2 (6 − 7.53) 2 (18 − 17.89) 2
χ2 = + + ... + = 2.87
9.41 7.53 17.89
5) Decisión. Dado que 2.87 es menor que 12.59, no se rechaza la hipótesis nula.
6) Se concluye que no hay relación entre las fallas de las máquinas y el turno de
trabajo de estas.
4. Prueba de Homogeneidad
Objetivo.
La prueba de Homogeneidad tiene como objetivo analizar si una variable cualitativa
o categórica se distribuye de manera uniforme en k poblaciones.
Sea A una variable cualitativa con k categorías: A1, A2, …, Ar.
Hipótesis.
Las hipótesis nula y alternativa de una prueba de homogeneidad son:
Ho: La variable A se distribuye de manera uniforme en las k poblaciones.
H1: La variable A no se distribuye de manera uniforme en las k poblaciones.
Estadístico de prueba
c r (nij − eij ) 2
χ = ∑∑
2
j =1 i =1 eij
Ejemplo.
Un empresario desea saber si los consumidores de cinco marcas de gaseosa:
Coca-Cola, Pepsi, Inca cola, Kola real y Fanta se distribuyen de manera uniforme
en las ciudades de Piusa, Chiclayo, Trujillo y Lima. Con tal propósito realiza una
encuesta a sendas muestras de consumidores de gaseosa en las cuatro ciudades.
Los resultados se presentan en la tabla de contingencia siguiente.
Marca de
gaseosa Piura Chiclayo Trujillo Lima
Coca-Cola 60 90 122 138
Pepsi 120 130 102 162
Inca Kola 104 100 114 152
Kola real 72 50 38 46
Fanta 44 130 74 102
Tamaño de
400 500 450 600
muestra (nj)
¿Es posible concluir que las proporciones de consumidores de las cinco marcas de
gaseosa no son homogéneas en las cuatro ciudades? Use un nivel de significancia
del 5%.
Resumen Gráfico:
Conclusiones:
Referencias: