Está en la página 1de 14

Inferencias para una Varianza Poblacional

Las pruebas presentadas con anterioridad se centraban en la estimación de medias y


proporciones poblacionales, pero en muchas circunstancias quienes toman las decisiones
no sólo están interesados en la media de una distribución, sino también en el grado de
dispersión en torno a la media y la varianza es una magnitud importante para determinar
el comportamiento de un proceso.
Dada la importancia de la varianza para mantener estándares de producción, se han
ideado pruebas para estimar la varianza de una distribución. La prueba del valor de una
sola varianza se basa en una distribución conocida como distribución ji-  
 2).

Distribución ji-cuadrada
La distribución ji-cuadrada es, como la distribución t, una familia completa de
distribuciones; hay una distribución diferente para cada valor de los grados de libertad
(g.l.= n – 1).

Esta distribución está sesgada positivamente, pero a medida que aumentan los grados de
libertad, la distribución se hace más simétrica y se aproxima a la normal. Por otra parte,
al ser una distribución de probabilidad, el área total bajo la curva es 1.
Así como en el caso de la distribución normal, que sirvió para estandarizar medias
muestrales, la distribución 2 cumple la misma misión para las varianzas.

Intervalo de confianza para la varianza de una población


El intervalo de confianza de una varianza poblacional se calcula por la fórmula:
(n − 1) * s 2 (n − 1) * s 2
≤ 2

χ superior
2
χ i2nferior



 
 2
son los tomados a partir de la tabla.

Ejemplo: Se desea estimar la precisión de un instrumento de medición. Al realizar tres


mediciones con el instrumento encontró una varianza muestral de 10.57 unidades.
Usando un nivel de confianza del 95%, Calcule un intervalo de confianza para la
variación real del instrumento.

1 − α = 0.9 α = 0.05
2
χ 0.95 = 0.1025 χ 2 0.05 = 5.99147
2
Sustituyendo en la fórmula del Intervalo de Confianza obtenemos:

2 * 10.57 2 *10.57
≤σ2 ≤
5.99 0.1025
3.53 ≤ σ ≤ 206.1
2

Note que este intervalo es de una longitud muy grande, es decir la estimación es muy
imprecisa, lo cual se debe a que el tamaño de la muestra es muy pequeña.

Pruebas de hipótesis

Para realizar esta pruebas necesitamos, igual que hicimos en el caso de pruebas de
hipótesis para media y proporciones, comparar el valor de un estadístico de prueba con el
percentil adecuado de la distribución muestral del estadístico. En este caso el estadístico
de prueba es:

(n − 1) * S 2
χ 2 prueba =
σ 20
σ 2 0 es la varianza hipotética de la población, s2 es la varianza muestral y n el tamaño de
la muestra.

1.Pruebas unilaterales.

a) H 0 : σ 2 ≥σ 0 H 1 : σ 2 <σ 0
2 2

Regla de Decisión: Se Rechaza H 0 si χ 2 prueba > χ 2 α 2

b) H 0 : σ 2 ≤σ 0 H 1 : σ 2 >σ 0
2 2

Regla de Decisión: Se Rechaza H 0 si χ 2 prueba < χ 21−α 2

2. Prueba bilateral

H 0 : σ 2 =σ 0 H 1 : σ 2 ≠σ 0
2 2

Regla de Decisión: Se Rechaza H 0 si χ 2 prueba < χ 21−α 2 o χ 2 prueba > χ 2 α 2

Ejemplo(continuación)
Suponga ahora que lo estándar es que la desviación de este tipo de instrumento sea de dos
unidades, y se ha decidido probar si con los resultados obtenidos de esta muestra puede
refutarse la hipótesis planteada. Con el mismo nivel de significación tenemos que:
Hipótesis:

H 0 :σ 2 = 4 H1 : σ 2 ≠ 4

(n − 1) S 2
Estadístico: = 5.29
σ 02
Percentil:
χ 2 0.95 = 0.1025 χ 2 0.05 = 5.99147

Decisión:
Debemos comprobar si el valor del estadístico cae o no en la región de rechazo.

0.1025<5.29<5.99, por lo que no cae en la región de rechazo, así que podemos concluir
que no existen evidencias suficientes para plantear que haya variado la varianza del
instrumento. Note que nuevamente a pesar de que la varianza hipotética
σ 0 2 = 4 y S 2 = 10.57 son diferentes aparentemente, esta diferencia no resultó ser
significativa, como para rechazar la hipótesis nula, debido a que la muestra es sólo de 3
observaciones.
5. Pruebas no Paramétricas

Con anterioridad se ha trabajado con muchas pruebas de hipótesis, se hicieron pruebas de


medias poblacionales y de proporciones poblacionales. En algunos casos el tamaño
muestral era mayor que 30, mientras que en otros la muestra era pequeña; también se
trabajó con pruebas de una sola población y otras que comparaban dos poblaciones.
Ahora bien, todas estas situaciones de prueba presentaban una característica común:
exigían hacer determinadas hipótesis sobre la población. Como estas pruebas dependen
de postulados sobre la población y sus parámetros, se denominan pruebas paramétricas.
Sin embargo, en la práctica, surgen muchas situaciones en que no es posible formular una
hipótesis segura sobre el valor de un parámetro o la forma de la distribución poblacional.
Por este motivo se deben utilizar otro tipo de pruebas llamadas pruebas no paramétricas.

Pruebas no Paramétricas
Las pruebas no paramétricas (o libres de distribución) son procedimientos estadísticos
que se pueden utilizar para contrastar hipótesis cuando no es posible fijar ningún
supuesto sobre parámetros o distribuciones poblacionales.
Son muchos los tipos diferentes de pruebas no paramétricas que se pueden utilizar,
dependiendo de la necesidad determinada. Sin embargo, sólo se considerará la
distribución ji-cuadrada como manera de contrastar:
(a) La bondad de ajuste, para determinar si una distribución sigue una estructura
determinada.
(b) Tablas de Contingencia y pruebas de independencia.

Prueba de Bondad de Ajuste


Prueba estadística para determinar si existe una diferencia significativa entre una
distribución de frecuencias observadas y una distribución teórica hipotetizada para
describir a la distribución observada.
Si la diferencia entre las estructuras de aparición de los sucesos observados y de los
esperados es demasiado grande para poderla atribuir a un error de muestreo, se tiene que
llegar a la conclusión de que la población presenta una distribución distinta de la
especificada en la hipótesis nula.
La prueba de bondad de ajuste siempre es de una cola, con la región de rechazo en la cola
superior de la distribución ji-cuadrada.
Pasos generales:
(a) Establecer H0 y H1
(b)Seleccionar
     el  nivel de significancia.
  
 2
que depende del nivel de significancia y cuyo grado de
libertad es k – m – 1, en donde m es el número de parámetros a estimar que se calculan a
partir de la información muestral. Si en el enunciado ya dan los parámetros, entonces los
grados de libertad se obtienen mediante k – 1. Se determina la región de aceptación y
rechazo.

(d) Determinar el valor de χ prueba = ∑


( 2
) k f
o i − f ei
2

i =1 f ei
k = número de categorías o clases
foi = frecuencias observadas de los sucesos en los datos muestrales
fei = frecuencias esperadas de los sucesos si la hipótesis nula es correcta
(e) Se hace la comparación  2 y χ prueba
2

Observaciones:
1. Hay casos en los cuales las frecuencias esperadas son iguales y en otros las frecuencias
se contrastan con cierta estructura en la cual no todas las frecuencias esperadas son
iguales, sino que vienen determinadas por fei = n * pi, en la cual pi es la probabilidad de
cada categoría que especifica la hipótesis nula.

2. En el caso de las frecuencias esperadas desiguales, si hay una frecuencia esperada


inusitadamente pequeña en una celda, la ji cuadrada puede llevar a una conclusión
errónea. Esto se debe a que fe aparece en el denominador y la división entre un número
muy pequeño produce un cociente demasiado grande.

3. Hay dos reglas de aceptación general respeto a pequeñas frecuencias en una celda:
(a) Si sólo hay 2 celdas, la frecuencia esperada en cada celda debe ser igual a 5 o mayor.
(b) Para más de dos celdas, no debe aplicarse la 2 si más del 20% de las celdas de fe
tienen frecuencias esperadas menores que 5.
Ahora bien, es posible recombinar las celdas para garantizar que todas las categorías
tienen una frecuencia esperada mayor o igual que 5

Ejemplo 5.1.1

1. Se supone que el número de defectos en las tarjetas de circuito impreso sigue una
distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de circuito
impreso y se observa el número de defectos. Los resultados obtenidos son los
siguientes:

Número de Frecuencia
defectos observada

0 32

1 15

2 9

3 ó más 4

¿Muestran estos datos suficiente evidencia para decir que provienen de una
distribución Poisson?. Haga la prueba de la bondad del ajuste con un α = 0.05.

Solución:
H0; La distribución de los defectos es Poisson

H1; La distribución de los defectos no es Poisson.

La media de la distribución Poisson propuesta en este ejemplo es desconocida y debe


estimarse a partir de los datos contenidos en la muestra.

32 * 0 + 15 * 1 + 9 * 2 + 4 * 3
λ= = 0.75
60

A partir de la distribución Poisson con parámetro 0.75, pueden calcularse las


probabilidades asociadas con el valor de x.

e − λ λk e −0.75 0.75 0
P( x = k ) = por ejemplo si x = 0 P( x = 0) = = 0.472
k! 0!

Con esta fórmula se calculan las probabilidades las que se que se multiplican por 60
para obtener los valores esperados, ya que: f ei = n * pi

Número de Frecuencia Frecuencia


Probabilidad
defectos esperada observada

0 0.472 28.32 32

1 0.354 21.24 15

2 0.133 7.98 9

3 ó más 0.041 2.46 4

Puesto que la frecuencia esperada en la última celda es menor que 5, se combinan las
dos últimas celdas.

Número de Frecuencia Frecuencia


defectos esperada observada

0 28.32 32

1 21.24 15

2 ó más 10.44 13
Los grados de libertad serían 3-1-1=1, debido a que la media de la distribución
Poisson fue estimada a partir de los datos.

2.

Cálculo del estadístico de prueba:

(32 − 28.32) 2 (15 − 21.24) 2 (13 − 10.44) 2


χ 2 prueba = + + = 2.94
28.32 10.44 10.44

Como el 2.94 <3.84, no se rechaza H0 y se concluye con un


α =0.05 que la distribución de defectos en las tarjetas de circuito impreso es Poisson.

Ejemplo 5.2:

Solución:

Pruebe la hipótesis de que la distribución de frecuencia de las duraciones de baterías


dadas en la siguiente tabla, se puede aproximar mediante una distribución normal con
media µ = 3.5 y desviación estándar σ =0.7. Utilice un α = 0.05.

Límites Frecuencias
de clase observadas

Menor de 1.95 2

1.95 – 2.45 1

2.45 – 2.95 4

2.95 – 3.45 15

3.45 – 3.95 10
3.95 – 4.45 5

4.45 – 4.95 3
Observemos que si realizamos el histograma, para visualizar los datos:

tiene una forma que aparenta ser normal lo cual se probará estableciendo las hipótesis:

H0; Los datos provienen de una distribución normal.


H1; Los datos no provienen de una distribución normal.

En este ejercicio en particular se cuenta con la media y desviación estándar de la


población, por lo que no se tiene que estimar. En caso de que no se tuviera, se estimarían
a partir de los datos agrupados con las fórmulas que se vieron en el curso de Estadística I,
tomando en cuenta que para los grados de libertad el valor de m sería 2, ya que se
estimaría la media y la desviación estándar.

Se procederá a calcular los valores de z para encontrar las probabilidades en la tabla.

Ejemplo:

 1.95 − 3.5 
P( x < 1.95) = P Z <  = P( Z < −2.21) = Φ (−2.21) = 0.01355
 0.7 

A continuación se muestra la curva normal con sus respectivas probabilidades


P(1.95 x 2.45) = 0.0668-0.013553 = 0.053254
P(2.45 x 2.95) = 0.21476-0.0668 = 0.147953
P(2.95 x 3.45) = 0.4721-0.21476 = 0.25734
P(3.45 x 3.50) = 0.50-0.4721 = 0.0279
P(3.50 x 3.95) = 0.50-0.26109= 0.23891
P(3.95 x 4.45) = 0.26109-0.086915 = 0.17417
Con estas probabilidades se calcularán los valores esperados, multiplicando cada
probabilidad por 40.
Límites de Frecuencias Frecuencia
Probabilidad
clase observadas esperada

1.45 – 1.95 2 0.01355 0.54212

1.95 – 2.45 71 0.05325 2.13016

2.45 – 2.95 4 0.14795 5.91812

2.95 – 3.45 15 0.25734 10.29360

3.45 – 3.95 10 0.26681 10.67240

3.95 – 4.45 85 0.17417 6.96680

4.45 – 4.95 3 0.08691 3.47660


Grados de libertad: k-1-m = 4-1-0 = 3
Estadístico de
Prueba:
(7 − 8.5904) 2 (15 − 10.2936) 2 (10 − 10.6724) 2 (8 − 10.4434) 2
χ prueba =
2
+ + + = 3.06
8.5904 10.2936 10.6724 10.4434

Como el 3.06 >.815, no se rechaza H0 y se concluye con un α = 0.05 los datos siguen una
distribución normal.
5.1 Prueba de Independencia

La distribución ji-cuadrada nos permite también comparar dos atributos o características


para determinar si hay alguna relación entre ellos. Consideremos, por ejemplo, que un
especialista en marketing quisiera determinar si hay alguna conexión entre los niveles de
renta de los consumidores y su preferencia por el producto que él vende. Este
procedimiento implicaría comparar dos atributos: rentas y preferencias.
La comparación de dos atributos para determinar si son independientes se realiza de la
misma forma que antes: analizando la diferencia entre frecuencias observadas reales y
frecuencias esperadas.

Tabla de contingencia
Es una tabla que contiene F filas y C columnas. Cada fila corresponde a un nivel de una
variable; cada columna, a un nivel de otra variable. Las entradas del cuerpo de las tablas
son las frecuencias con que cada combinación de variables se presenta.

Observaciones:
1. Para calcular el número de grados de libertad de una prueba de independencia ji-
cuadrada se multiplica el número de filas (menos uno) por el número de columnas
(menos 1)
g. l = (número filas – 1) * (número columnas – 1)

2. La expresión para calcular la frecuencia esperada para cualquier celda de un tabla


de contingencia viene dada por:
Total de la fila * Total de la columna
fe =
Total de observaciones

3.   

  2
se determina por
(f o − f e )2
χ prueba = ∑
2

fe

4. Las frecuencias esperadas deben ser de 5 o más para todas las categorías.

5. La prueba de independencia siempre es de una cola, con la región de rechazo en la


cola superior de la distribución ji-cuadrada.

Pasos generales para las pruebas de independencia:


(a) Establecer H0 y H1

(b) !"$#&%'! )el(*nivel
Seleccionar '( + ,de significancia.
2
que depende del nivel de significancia y de los grados de
libertad. (d) Se determina la región de aceptación y rechazo.
(f o − f e )2
(e) Determinar el valor de χ prueba = ∑ 2

fe
(la expresión se aplica para cada celda y la suma total de cada uno de los valores es el
χ prueba
2
)
(f) Se hace la comparación entre 2
y χ prueba
2

Ejemplo 5.1

Una asociación de profesores universitarios quiere determinar si la satisfacción en el


trabajo es independiente del rango académico. Para ello realizó un estudio nacional
entre los profesores universitarios y encontró los resultados mostrados en la tabla
siguiente. Con α =0.05, haga una prueba para saber si son dependientes la
satisfacción en el trabajo y el rango.

Rango

Profesor Profesor
Instructor Profesor
Satisfacción asistente asociado
en el
Mucha 40 60 52 63
trabajo
Regular 78 87 82 88

Poca 57 63 66 64

Solución:

Ho: La satisfacción en el trabajo y el rango son independientes.

H1: La satisfacción en el trabajo y el rango son dependientes.

Grados de libertad: (r-1)(c-1) = (3-1)(4-1)=(2)(3) = 6

Se procederá a calcular los valores esperados de cada celda. Como los grados de
libertad son 6, esto quiere decir que necesitamos calcular únicamente 6 frecuencias
esperadas, y las faltantes se encuentran por diferencia.
1. Se calcularán los valores esperados necesarios.
2. Como se necesitan los totales de renglón y columna se mostrarán en la tabla:

Rango

Profesor Profesor
Instructor Profesor Total
asistente asociado
Satisfacción
en el Mucha 40 60 52 63 215

trabajo Regular 78 87 82 88 335

Poca 57 63 66 64 250

Total 175 210 200 215 800

215 *175 335 * 200


f e11 = = 47.03 .... f e23 = = 83.75
800 800

Las frecuencias esperadas las colocaremos entre paréntesis en cada una de las casillas
de la tabla, los que no se calcularon por fórmula se obtuvieron por diferencia con
respecto a los totales.

Profesor Profesor
Satisfacción Instructor Profesor Total
asistente asociado

40 60 52 63
Mucha 215
(47.03) (56.44) (53.75) (57.78)

78 87 82 88
Regular 335
(73.28) (87.94) (83.75) (90.03)

57 63 66 64
Poca 250
(54.69) (65.62) (62.50) (67.19)

Total 175 210 200 215 800


los que no se calcularon por fórmula se obtuvieron por diferencia con respecto a los
totales.

Valor del estadístico:

(40 − 47.03) 2 (64 − 67.19) 2


χ 2 prueba = + ...... + = 2.75
47.03 67.19

Como el valor de 2.75 es menor que el de tabla 12.592 no se rechaza Ho y se concluye


con un a confianza del 95% que la satisfacción en el trabajo y el rango son
independientes.

También podría gustarte