Está en la página 1de 11

Lic.

Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

Frecuencias Observadas y Teóricas

Los resultados obtenidos por muestreo no siempre coinciden exactamente con los esperados
teóricamente de acuerdo con las leyes de las probabilidades.

Supongamos que en una muestra particular un conjunto de sucesos posibles

se observa que ocurren con frecuencias , llamadas frecuencias observadas, y

que según las leyes de probabilidades, se espera que sucedan con frecuencia ,

llamadas frecuencias esperadas o teóricas.

Sucesos …

Frecuencia observada …

Frecuencia esperada …

Para el caso en que se desea saber si la frecuencias observadas difieren significativamente de


las esperadas, para tal caso sólo son posibles dos sucesos y , como el caso de cara o
cruz, piezas defectuosas o no, etc.

Definición de

Una medida de discrepancia existente entre la frecuencia observada y esperadas viene


proporcionada por el estadístico ji-cuadrado dado por:

El grado de libertad es v = k – 1, Donde k es el número de categorías.

Pruebas de bondad de Ajuste

La hipótesis nula en una prueba de bondad de ajuste es una especificación respecto al patrón
de frecuencia esperado en un conjunto de categorías. El patrón esperado puede ajustarse a la
suposición de igual posibilidad y por tanto puede ser uniforme puede ajustarse a patrones
tales como binomial, el de Poisson o el normal.

Los valores obtenidos para el estadístico de prueba Ji-cuadrada se basan en conteos discretos,
mientras que la distribución Ji- cuadrada es continua. Si las frecuencias esperadas en las
casillas no son pequeñas, este hecho no es importante en términos de grado de aproximación
de la distribución Ji-cuadrada a la distribución del estadístico de prueba. Una regla usual es que
la frecuencia esperada para cada casilla, o categoría, debe ser por lo menos 5. Las casillas que
no cumplen con este criterio deben combinarse, si es posible, con las categorías adyacentes de

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

modo que satisfaga este requerimiento. Entonces, éste número ya reducido de categorías es el
que se emplea para determinar los grados de libertad para esta prueba.

Ejemplo: Frecuencias observadas y esperadas para problemas de fallas de máquina y cálculo


de Ji-cuadrada

Frecuencia observada Frecuencia esperada


Número de fallas

0 0 1,6
0,094
1 6 5,2
2 8 8,3 0,011
3 11 8,9 0,496
4 7 7,1 0,001
5 4 4,6
6 3 2,4
7 1 1,1
8 0 0,4 0,073
9 0 0,2 = 0,675
10 0 0,1

Tabla Combinada

Frecuencia observada Frecuencia esperada


Número de fallas

0 - 1 6 6,8 0,094
2 8 8,3 0,011
3 11 8,9 0,496
4 7 7,1 0,001
5 - 10 8 8,8 0,073
= 0,675

Contraste de Significación

Las frecuencias esperadas se calculan a base de una hipótesis nula, si bajo tal hipótesis el valor
calculado para Ji-cuadrado dado es mayor que algún valor crítico o , que son los

valores críticos de los niveles de significación 0,05 y 0,01 respectivamente, debemos concluir
que las frecuencias observadas difiere significativamente de las frecuencias esperadas y
rechazaremos la hipótesis nula al correspondiente nivel de significación; en caso contrario, la
aceptaremos. Hay que constar que debe mirarse con suspicacia en circunstancias en las que Ji-

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

cuadrado sea demasiado próximo a cero, pues es raro que las frecuencias observadas
coincidan demasiado bien con las frecuencias esperadas.

Las tablas en que las frecuencias observadas ocupan una sola fila, se llama una tabla de
clasificación de entrada única. Como el número de columnas es K, también se le llama tabla
1 x k y cuyo grado de libertad se calcula por medio de V = k - 1. Extendiendo estas ideas,
podemos llegar a tablas de doble entada o tablas h x k, en las que las frecuencias observadas
ocupan h filas y k columnas. Tales tablas se suelen llamar tablas de contingencia.

Cada frecuencia observada en una tabla de contingencia h x k, donde h es la cantidad de


renglones y k la cantidad de columnas; hay una frecuencia esperada o teórica de la misma
dimensión (h x k) que se calcula sujeta a ciertas hipótesis de acuerdo con las leyes de
probabilidades.

La frecuencia total en cada fila o en cada columna se llama frecuencia marginal y se calcula por
la fórmula siguiente:

Donde es la frecuencia total de renglones y la frecuencia total en una columna dada.

Las pruebas de independencia considera (cuando menos) dos variables categóricas, y lo que se
prueba es la hipótesis de que las variables son estadísticamente independiente. La
independencia implica que el conocimiento de categoría en la que se clasifica una observación
respecto de una de las variables no tiene efecto sobre la probabilidad de que, en relación con
otra variable, esté en una de las diferentes categorías.

El grado de libertad se puede calcular por medio de v = (h -1)(k-1).

Corrección de Yates a la Continuidad

Cuando se aplican resultados de distribuciones continuas a datos discretos, pueden hacerse


ciertas correcciones a la continuidad. Una corrección similar es la corrección de Yates para Ji-
Cuadrado. Y se define como:

En general la corrección se hace solo cuando el número de grados de libertad es v = 1, para


grandes muestras, esto da prácticamente los mismos resultados que el Ji-Cuadrado sin corregir
pero pueden surgir dificultades cerca de los valores críticos. Para pequeñas muestras donde
cada frecuencia esperada está entre 5 y 10, es quizás mejor comparar ambos valores de Chi-
Cuadrado, corregido y sin corregir. Si ambos llevan a la misma conclusión acerca de la
hipótesis, tal como el rechazo al nivel de significación 0,05, rara vez surgen dificultades. Si

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

conducen a diferentes conclusiones, uno debe pensar en aumentar el tamaño de la muestra o,


emplear métodos de probabilidad que involucren la distribución multinomial.

Coeficiente de Contingencia

Una medida de interrelación, asociación o dependencia de las clasificaciones en una tabla de


contingencia viene dada por:

Que se llama coeficiente de contingencia. Cuanto mayor es C, mayor es el grado de asociación,


el número de filas y de columnas en la tabla de contingencia determina el máximo valor de C,
que nunca es mayor que 1. Si el número de filas y columnas es igual a k, el máximo valor de C

está dado por .

Ejercicios:

1) En 200 tiradas de una moneda, han salido 115 caras y 85 cruces. Contrastar la hipótesis
de que la moneda es buena, con nivel de significación a) 0,05 y b) 0,01; Calcular el
coeficiente contingencia.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

2) La tabla siguiente muestra las frecuencias observadas y esperadas al lanzar un dado


120 veces. Contrastar la hipótesis de que el dado es bueno, con un nivel de significación
de 0,05. Resolver el problema con y sin corrección de yates. Calcular el coeficiente de
contingencia.

Cara del lado 1 2 3 4 5 6


Frecuencia observada 25 17 15 23 24 16
Frecuencia esperada 20 20 20 20 20 20

3) Dos grupos A y B consisten en 100 personas cada uno, aquejadas toda de cierta
enfermedad. Se suministra un suero al A pero no a B; por lo demás ambos grupos
reciben idéntico tratamiento cuyo resultado se encuentra en la tabla. Contrastar la
hipótesis de que el suero cura la enfermedad al nivel de significación a) 0,01 y b) 0,05;
Calcule el coeficiente de contingencia.
Frecuencia Observada

Curados No curados Total


Grupo A (con suero) 75 25 100
Grupo B (Sin suero) 65 35 100
Total 140 60 200

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

Frecuencia Esperada

Curados No curados Total


Grupo A (con suero)
Grupo B (Sin suero)
Total

4) En 360 tiradas de un par de dados, han salido 74 veces siete y 26 veces once. Con nivel
de significación 0,05; contrastar la hipótesis de que los dados son buenos por la
distribución de Ji-Cuadrado, con y sin corrección de Yates.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

5) Un estudio sobre 320 familias con 5 hijos reveló la distribución de la tabla siguiente. ¿es
consistente el resultado con la hipótesis de que los nacimientos de chicos y chicas son
igualmente probables?. Calcule el coeficiente de contingencia.

Número de chicos 5 chicos 4 chicos 3 chicos 2 chicos 1 chicos 0 chicos


Total
y chicas 0 chicas 1 chicas 2 chicas 3 chicas 4 chicas 5 chicas

Número de familias 18 56 110 88 40 8 320

Frecuencia Esperada

Número de chicos 5 chicos 4 chicos 3 chicos 2 chicos 1 chicos 0 chicos


Total
y chicas 0 chicas 1 chicas 2 chicas 3 chicas 4 chicas 5 chicas

Número de familias

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

6) La tabla recoge la distribución de los dígitos de 0 a 9 en una tabla de números


aleatorios de 250 dígitos. ¿Difiere la distribución observada de la esperada de forma
significativa?

Dígito 0 1 2 3 4 5 6 7 8 9

Frec. Observada 17 31 29 18 14 20 35 30 20 36

Frec. Esperada 25 25 25 25 25 25 25 25 25 25

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

7) Se lanzan tres monedas 240 veces con el número de caras que recoge juntos con los
resultados esperados bajo la hipótesis de que las monedas son buenas en la siguiente
tabla. Contrastar la hipótesis al nivel de significación 0,05.

Frec. Observadas Frec. Esperadas


Caras 0 24 30
Caras 1 108 90
Caras 2 95 90
Caras 3 23 30

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

8) La tabla muestra los números de estudiantes aprobados y suspendidos por tres


profesores. Contrastar la hipótesis de que las proporciones de suspendidos por los tres
profesores son iguales, con nivel de significación de 0,05 y 0,01 y calcular el coeficiente
de contingencia.

Prof. A Prof. B Prof. C Total


Aprobados 50 47 56 153
Suspendidos 5 14 8 27
Total 55 61 64 180

Frecuencia Esperada

Prof. A Prof. B Prof. C Total


Aprobados
Suspendidos
Total

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística Aplicada - Agronomía

9) Ante una propuesta de política exterior, colorados y liberales adjudicaron sus votos
como muestra la tabla. Al nivel de significación de a) 0,05 y b) 0,01, contrastar la
hipótesis de que no hay diferencia entre los dos partidos en lo que a dicha propuesta se
refiere y calcular el coeficiente de contingencia.

Colorados Liberales Total


A favor 85 118
En contra 78 61
Indecisos 37 25
Total

Frecuencia Esperada

Colorados Liberales Total


A favor
En contra
Indecisos
Total

Universidad Privada del Este Ciudad del Este

También podría gustarte