Está en la página 1de 29

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Dpto. de Estadística e Informática

Capítulo 2

Prueba de Bondad de Ajuste a la normal


Prueba de Independencia
Prueba de Homogeneidad de Subpoblaciones
Prueba de Yates

Estadística Aplicada a la Economía


y los Negocios I Semestre 2019 - I
Mg. Carmen Saldaña
Contenido:
1. Prueba de Bondad de Ajuste a la normal
2. Prueba de Independencia
3. Prueba de Homogeneidad de Subpoblaciones
4. Prueba de Yates

2
Prueba de Bondad de Ajuste a la normal

El objetivo del contraste de bondad del ajuste normal es saber si


una muestra (x1, x2, x3, …, xk) procede de una población teórica
con distribución normal X~N(µ, ²)
Sea una población, donde se analiza un carácter X con
modalidades excluyentes, denotando Oi por el número de
elementos que presenta la modalidad Xi (frecuencia observada),
donde σ 𝑥𝑖 = 𝑛
Se origina la Tabla de Contingencia:
Prueba de Bondad de Ajuste a la normal

Es necesario que las frecuencias esperadas de la distintas


modalidades no sea inferior a cinco. Si alguna modalidad tiene
una frecuencia esperada menor que cinco se agrupan dos o mas
modalidades contiguas en una sola hasta conseguir que la
frecuencia esperada sea mayor a cinco.

Los grados de libertad de la Chi – Cuadrado dependen del


número de parámetros que se necesitan hallar para obtener las
frecuencias esperadas: m = k – p – 1, p es el número de
parámetros a estimar
Prueba de Bondad de Ajuste a la normal

Dado que tanto µ como  pueden asumir infinitos valores de


acuerdo a las propiedades del parámetro, lo que hace
impracticable tabular las probabilidades para todas las posibles
distribuciones normales, se utiliza la distribución normal
reducida o tipificada.

Se define una variable:

Es una traslación y un cambio de escala de la variable original


Prueba de Bondad de Ajuste a la normal

Si X procede de una población teórica con distribución normal


X~N(µ, ²), los parámetros a estimar son:
σ 𝑂𝑖 𝑥𝑖
𝜇Ƹ =
𝑛

2
σ 𝑂 𝑥
𝑖 𝑖
𝜎ො 2 = − 𝜇Ƹ 2
𝑛
Ajuste a la Distribución Normal
Procedimiento:
(P1) Planteamiento de hipótesis
H0: Los datos provenientes de la variable en estudio "X" se ajustan a una distribución teórica Normal.
H1: Los datos provenientes de la variable en estudio "X" no se ajustan a una distribución teórica Normal

(P2) Elección del nivel de significación “”


𝑘
(P3) Prueba Estadística 𝑜𝑖 − 𝑒𝑖 2 Donde:
𝑄=෍ ~𝜒 2𝑚
𝑒𝑖
𝑖=1
(P4) Criterios o regla de decisión
0.10

Se rechaza H0 si: 2cal  2crit


0.08

0.06
𝝌𝟐𝒄𝒓𝒊𝒕 = 𝝌𝟐𝒕𝒂𝒃 = 𝝌𝟐𝒎;𝟏−𝜶
0.04
O se puede demostrar con el análisis del P-Value
0.02

0.00
0 Chi Critico

(P5) Decisión
(P6) Conclusiones

7
Ejemplo 1:

Realizar una prueba de bondad de ajuste para verificar si la


distribución dada a continuación se aproxima a una distribución
normal. Los daos se presentan en la siguiente tabla y refieren a
los salarios de 100 trabajadores de la empresa en dólares. Use
un nivel de significancia del 5%
[Salarios) N° trabajadores
150 – 156 4
156 – 162 12
162 – 168 22
168 – 174 40
174 – 180 20
180 - 186 2
Total
Pruebas con Tablas de Contingencia
Tablas de Contingencia f x c
Es un cuadro de doble entrada en el
cual se recoge la frecuencia
conjunta de los datos de una o
varias muestras aleatorias. Estas
frecuencias son clasificadas de
acuerdo a las clases o categorías de
una variable A y a las clases o
categorías de una variable B.

A los totales de filas y columnas se


les conoce como totales marginales.

9
Prueba de Independencia

Se aplica cuando los datos de una muestra aleatoria son


clasificados de acuerdo a dos características (variables) y lo
que se desea es probar si las características utilizadas como
criterios de clasificación son independientes entre sí o si existe
alguna relación entre ellas. Los totales marginales de filas y
columnas son aleatorios.
Procedimiento
P1) Planteamiento de la Hipótesis
H0: Las características "A" y "B" son independientes (no están relacionadas)
entre sí.
H1: Las características "A" y "B" no son independientes (si están
relacionadas).
P2) Nivel de Significación ()
P3) Estadístico de prueba: Donde:

P4) Regla de decisión: Se rechaza H0 si:

P5) Decisión: Se rechaza o no H0


P6) Conclusión:
Medida de intensidad de la asociación:

Coeficiente de contingencia de Pearson


La prueba de independencia solo analiza la existencia o no de
una posible asociación entre dos variables de tipo categórico,
pero no indica la intensidad de la posible relación.
El coeficiente de contingencia de Pearson mide la intensidad y
se obtiene:

C toma valores entre 0 y 1. Valores cercanos a cero muestran


una baja asociación entre las variables y los valores próximos a
1 una alta asociación.
Ejemplo 2:
Una investigadora de seguridad de tránsito observó 500 vehículos en una señal de
alto en un vecindario suburbano y registró:
➢ El tipo de vehículo (auto, camioneta, camión de carga)
➢ El comportamiento del conductor frente a la señal de alto (alto total, casi
detenido, no respeta la señal)
Conducta en la señal de alto
Total
Detenido Avanza sin motor No respeta la señal
Sedán 183 107 60 350
Tipo de Camioneta 54 27 19 100
vehículo Camión de
14 20 16 50
carga
Total 251 154 95 500

Con un nivel de significancia de 0.05, ¿puede haber alguna relación entre el


comportamiento del conductor y el tipo de vehículo que conduce?
Determine e interprete el grado de asociación.
Ejemplo 2: solución

P1) H0: La conducta del conductor y el tipo de vehículos son


independientes.
H1: La conducta del conductor y el tipo de vehículos no son
independientes.
P2) Nivel de Significación:  = 0.05
P3) Estadístico de prueba:
Donde:

P4) Regla de decisión: Se rechaza H0 si:


Ejemplo 2: solución
Conducta en la señal de alto
OBSERVADO: Oij Avanza sin No respeta la Total
Cálculos: Detenido
motor señal
Sedán 183 107 60 350
Tipo de
Camioneta 54 27 19 100
vehículo
Camión de carga 14 20 16 50
Total 251 154 95 500

Conducta en la señal de alto


ESPERADO: eij Avanza sin No respeta la
Detenido
motor señal
Sedán 175.7 107.8 66.5
Tipo de Camioneta 50.2 30.8 19
vehículo
Camión de carga 25.1 15.4 9.5

0.303 0.006 0.635


0.288 0.469 0.000
4.909 1.374 4.447

• El valor del estadístico de prueba es: X² = 12.431


• El valor crítico con  = 0.05, f = 3, c = 3 es: 𝑋0.95,4
2
= 9.49
Ejemplo 2: solución
• Gráfica:

 = 0.05
1 -  = 0.95

9.49 12.431

RAH0 RRH0

P5) Decisión: Se rechaza H0


P6) Conclusión: Con un nivel de significancia del 5% existe suficiente
evidencia estadística para rechazar H0, es decir, la conducta del conductor y
el tipo de vehículos no son independientes, es decir, están relacionadas.
Prueba de Homogeneidad de Subpoblaciones:

Esta prueba se aplica cuando se desea verificar si las “K”


categorías de una variable en estudio tiene un comportamiento
semejante ú homogéneo en “P” muestras o sub poblaciones
provenientes de igual número de poblaciones. De verificarse
este comportamiento homogéneo se puede inferir que las
subpoblaciones provienen de una misma población. En una
prueba de homogeneidad de subpoblaciones uno de los totales
marginales de filas y columnas es aleatorio y el otro es fijo.
Procedimiento
P1) Planteamiento de la Hipótesis
H0: Los “K” categorías de la variable se distribuyen homogéneamente en las
“P” muestras o subpoblaciones.
H1: Los “K” categorías de la variable no se distribuyen homogéneamente en
las “P” muestras o subpoblaciones.
P2) Nivel de Significación ()
P3) Estadístico de prueba: Donde:

P4) Regla de decisión: Se rechaza H0 si:

P5) Decisión: Se rechaza o no H0


P6) Conclusión:
Ejemplo 3:

Para conocer la opinión de los ciudadanos sobre la actuación del


alcalde de una determinada ciudad, se realiza una encuesta a
404 personas, cuyos resultados se recogen en la siguiente tabla:
Desacuerdo De acuerdo No Total
contestan
Mujeres 84 78 37
Hombres 118 62 25
Total

Contrastar, con un nivel de significación del 5%, que no existen


diferencias de opinión entre hombres y mujeres ante la
actuación del alcalde.
Ejemplo 3: solución

P1)
H0: No existe diferencia entre hombres y mujeres respecto a la
opinión.
H1: Existe diferencia entre hombres y mujeres respecto a la
opinión.
P2) Nivel significancia:  = 0.05
P3) estadístico de Prueba:
Donde:

P4) Regla de decisión: Se rechaza H0 si:


Ejemplo 3: solución
Cálculos: Frecuencias Observadas: Oij

Desacuerdo De acuerdo No contestan ni.


Mujeres 84 78 37 199
Hombres 118 62 25 205
n.j 202 140 62 404
Frecuencias Esperadas: eij
Desacuerdo De acuerdo No contestan
Mujeres 99.5 68.9604 30.5396
Hombres 102.5 71.0396 31.4604

2.415 1.185 1.367

2.344 1.150 1.327

• El valor del estadístico de prueba es: X² = 9.787


• El valor crítico con  = 0.05, f = 2, c = 3 es: 𝑋0.95,2
2
= 5.991
Ejemplo 3: solución
• Gráfica:

 = 0.05
1 -  = 0.95

5.991 9.787

RAH0 RRH0

P5) Decisión: Se rechaza H0


P6) Conclusión: Con un nivel de significancia del 5% existe suficiente
evidencia estadística para rechazar H0, es decir, existe diferencia entre
hombres y mujeres respecto a la opinión, (no proceden de la misma
población, hombres y mujeres no opinan lo mismo, concluyendo que las
muestras no son homogéneas).
Diferencias entre la prueba de independencia y de
homogeneidad
1) La prueba de Independencia se usa para probar si una característica es
independiente de otra, mientras que la prueba de Homogeneidad de
subpoblaciones se usa para probar si una característica se distribuye
homogéneamente en 2 o más subpoblaciones, o también si diferentes
muestras proceden de la misma población.

2) La prueba de independencia supone una muestra tomada de una sola


población, mientras que la prueba de Homogeneidad de subpoblaciones
supone 2 o más muestras independientes.

3) En la prueba de Independencia las frecuencias marginales de filas y


columnas son valores aleatorios, en la prueba de Homogeneidad de
subpoblaciones una de las frecuencias marginales (filas o columnas) son
valores fijados porque son los tamaños de muestra.
Prueba de Yates

Se aplica en los casos en que se debiera aplicar la prueba Chi


cuadrado pero las frecuencias esperadas son muy bajas
(menores a 5) y el tamaño de muestra es menor a 50 con un
grado de libertad entonces el estimador de Chi cuadrado ya no
es tan conservador, esto implica una mayor cantidad de error.
El estadístico de prueba es:

( o −e − 0.5 )
2
k
 = ~  (2k −m −1)
2 i i
c
i =1 ei
Procedimiento
P1) Planteamiento de la Hipótesis
H0: Las características "A" y "B" son no están relacionadas entre sí.
H1: Las características "A" y "B" si están relacionadas.
P2) Nivel de Significación ()
P3) Estadístico de prueba:
( oi − ei − 0.5 )
2
k
c = 
2
~  (2k − m −1)
i =1 ei
P4) Regla de decisión: Se rechaza H0 si:

P5) Decisión: Se rechaza o no H0


P6) Conclusión:
Ejemplo 4:

Se tienen dos grupos de clase A y B y se está evaluando la


satisfacción que tienen los estudiantes en estos dos grupos,
comparar el grado de satisfacción en cada uno de estos dos
grupos a fin de conocer si esta proporción es la misma o es
distinta con un nivel de significancia del 5%, los datos se
muestran en la siguiente tabla:
A B Total
Satisfecho 24 8

Insatisfecho 4 7
Total
Ejemplo 4: solución

P1)
H0: No existe diferencia entre la satisfacción que tienen los
estudiantes y los grupos de clase A y B.
H1: Existe diferencia entre la satisfacción que tienen los
estudiantes y los grupos de clase A y B.
P2) Nivel significancia:  = 0.05
P3) estadístico de Prueba:
( oi − ei − 0.5 )
2
k
c = 
2
~  (2k − m −1)
i =1 ei
P4) Regla de decisión: Se rechaza H0 si:
Ejemplo 3: solución
Cálculos: Frecuencias Observadas: Oij
A B ni.
Satisfecho 24 8 32
Insatisfecho 4 7 11
n.j 28 15 43

Frecuencias Esperadas: eij


A B
Satisfecho 20.8372 11.1628
Insatisfecho 7.1628 3.8372

3.1628 3.1628
( oi − ei − 0.5)
2
Ioi-eiI k 0.3403 0.6352
 =
2
c ~ 2
( k − m −1)
3.1628 3.1628 i =1 ei 0.9899 1.8478

• El valor del estadístico de prueba es: X² = 3.8132

• El valor crítico con  = 0.05: 2


𝑋0.95,1 = 3.841
Ejemplo 4: solución
• Gráfica:

 = 0.05
1 -  = 0.95

3.8132 3.841

RAH0 RRH0

P5) Decisión: No se rechaza H0


P6) Conclusión: Con un nivel de significancia del 5% no existe suficiente
evidencia estadística para rechazar H0, es decir, no existe diferencia entre la
satisfacción que tienen los estudiantes y los grupos de clase A y B.

También podría gustarte