Está en la página 1de 7

MA461 Estadística Inferencial

UNIDAD 1: Inferencia Estadística

Semana 3 – Sesión
1

Logro: Al finalizar la unidad, el estudiante aplica la prueba de hipótesis en casos


empresariales, justificando su toma de decisiones.

Pruebas Chi Cuadrado: Prueba de Independencia y Prueba de Homogeneidad de Subpoblaciones

Prueba de Independencia

Estamos interesados en ver la relación existente entre dos variables categóricas de una misma
población.
Las variables cualitativas o categóricas son aquellas variables cuyos valores son del tipo categórico;
es decir; que indican categorías o son etiquetadas numéricamente o con nombres.

La pregunta que el investigador desea contestar podría ser

 ¿Existe relación entre “hacer deporte” y “depresión” en los jóvenes?


 ¿Existe relación entre “la gravedad de un accidente” y el “género”
 ¿Existe relación entre “Motivo del préstamo” y “grupo de edad”?

Procedimiento para elaborar una prueba de independencia

Cada individuo de la población en estudio se puede clasificar según dos criterios A y B. Suponga que
la primera variable permite clasificar a cada observación en una de r categorías y que la segunda
variable permite clasificar a cada observación en una de c categorías. A la tabla que muestra ambas
variables y las frecuencias observadas en cada una de las r ×c categorías resultantes se le conoce
como tabla de contingencia r ×c.

Variable Y
Total
Columna 1 Columna 2 ... Columna c
Fila 1 O11 O12 O1c O1⋅¿ ¿
Fila 2 O21 O22 O2c O2⋅¿ ¿
Variable . . . . .
X . . . . .
. . . . .
Fila r Or 1 Or 2 ... Orc Or⋅¿ ¿
Total O¿ 1 O¿ 2 ... O¿ c n

Esta prueba es especialmente útil cuando se trata de analizar la independencia entre dos variables
en escala nominal. Para analizar si dos variables son independientes, los datos deben corresponder a
una sola muestra.
La frecuencia esperada correspondiente en cada una de las rc celdas está dada por la expresión:

-1-
MA461 Estadística Inferencial
UNIDAD 1: Inferencia Estadística

O i • × O • j total de fila i × total de columna j


Frecuencia esperada = e ij = =
n Gran total

Pasos para realizar la Prueba de Independencia

1) Planteamiento de la Hipótesis

Ho: X e Y son independientes (X e Y no están relacionadas)


H1: X e Y no son independientes (X e Y están relacionadas)

2) Nivel de significación: α

3) Estadístico de prueba:

k
χ 2cal =∑ ¿ ¿ ¿
i=1

4) Regiones críticas

5) Decisión

Criterio:

Si χ 2cal > χ 2crítico se rechaza Ho

Si χ 2cal ≤ χ 2Crítico no se rechaza Ho

6) Conclusión

Se derivan de la decisión estadística y de las variables especificas concerniente al problema que


se encuentra en evaluación.

-2-
MA461 Estadística Inferencial
UNIDAD 1: Inferencia Estadística

Ejemplo de aplicación:

El jefe del área de riesgo crediticio implementará una nueva política de


gestión de riesgos, si se comprueba que existe relación entre el motivo de
préstamo y la condición laboral. Para esta evaluación, el analista financiero
ha seleccionado aleatoriamente una muestra de 200 clientes del Banco
Estrella. Utilizando un nivel de significación del 5%, y en base a los resultados
del analista financiero ¿qué decisión deberá tomar el jefe del área de riesgo
crediticio?

  Condición laboral
Motivo del
Dependiente Independiente Total
préstamo
Vehicular 42 21 63
Hipotecario 33 34 67
Personal 40 30 70
Total 115 85 200

Solución:

Interpretación

Determinar si ………….

Representación

Variable 1:
Variable 2:
Herramienta Estadística:

Hipótesis:
Ho:
H1:

Nivel de significación:

-3-
MA461 Estadística Inferencial
UNIDAD 1: Inferencia Estadística

Cálculo

  Condición laboral
Motivo del
Dependiente Independiente Total
préstamo
Vehicular 42 ( 36.225 ) 21 ( 26.775 ) 63
Hipotecario 33 ( ) 34 ( 28.475 ) 67
Personal 40 ( 40.25 ) 30 ( ) 70
Total 115 85 200

Estadístico de prueba:

k
2
χ =∑ ¿ ¿ ¿
cal
i=1

Análisis

Regiones críticas: χ 2Critico = χ 2α , v =¿

NRH0 RH0

Decisión:

Conclusión:

Argumentación

-4-
MA461 Estadística Inferencial
UNIDAD 1: Inferencia Estadística

Prueba de Homogeneidad de Subpoblaciones

Esta prueba permite analizar si la distribución de probabilidades de una variable categórica es la


misma en r poblaciones, es decir se busca determinar si dos o más muestras independientes
provienen de una misma población.
Como en el método anterior, para esta prueba los datos muestrales se registran en r ×c celdas de
una tabla de doble entrada de orden r ×c.

La hipótesis nula y alternativa son respectivamente:

Ho: Las k poblaciones son homogéneas (similares) con respecto a la variable categórica.
(La distribución de los sujetos de la población (variable categórica) es homogénea en las k
subpoblaciones)
H1: Las k poblaciones no son homogéneas con respecto a la variable categórica.
(La distribución de los sujetos de la población (variable categórica) no es homogénea en las k
subpoblaciones)

El proceso de esta prueba de hipótesis es el mismo de la prueba de independencia.

Ejemplo de aplicación:

El jefe de riesgo crediticio implementará un mismo control integral de


riesgo, si se comprueba que la distribución de la condición laboral de los
clientes es similar para las tres sucursales. Para analizar este objetivo, el
analista ha tomado una muestra aleatoria de cada sucursal, tal como se
muestra en la siguiente tabla:

Sucursal
Condición laboral
Monterrico La Molina Santiago de Surco
Dependiente 25 20 20
Independiente 55 40 40
Total 80 60 60

Utilizando un nivel de significación del 5%, y en base a los resultados del analista financiero ¿qué
decisión deberá tomar el jefe del área de riesgo crediticio?

Solución:

Interpretación

Determinar si ………….

Representación
-5-
MA461 Estadística Inferencial
UNIDAD 1: Inferencia Estadística

Variable:
Subpoblaciones:
Herramienta Estadística:

Hipótesis:
Ho:
H1:

Nivel de significación:

Cálculo

Condición Sucursal Total


laboral Monterrico La Molina Santiago de Surco
Dependiente 25 ( ) 20 ( 19.5 ) 20 ( 19.5 ) 65
Independiente 55 ( 54 ) 40 ( ) 40 ( ) 135
Total 80 60 60 200

k
χ 2cal =∑ ¿ ¿ ¿
i=1

Análisis

Regiones críticas: χ 2Critico = χ 2α , v =¿

NRH0 RH0

Decisión:

Conclusión:

Argumentación

-6-
MA461 Estadística Inferencial
UNIDAD 1: Inferencia Estadística

Ejercicios propuestos:

1. El gerente de la Empresa JHK, para determinar si existe una relación entre la calificación de un
empleado en el programa de capacitación y su rendimiento real en el trabajo, tomó una
muestra de 400 casos de los archivos y se obtuvo las frecuencias observadas:

Calificación en el programa de capacitación Total


Rendimiento real
Debajo del Sobre el
en el trabajo Promedio
promedio promedio
Deficiente 23 60 29 112
Promedio 28 79 60 167
Muy bueno 9 49 63 121
Total 60 188 152 400

Solo si el rendimiento real en el trabajo de un empleado está relacionada con la calificación en


el programa de capacitación, el gerente de la empresa decidirá crear un área de capacitación
para los empleados nuevos. Con el nivel de significación 0,01, ¿qué decidirá el gerente?
χ 2cal =20.1789
χ 2crit =13.276

2. En un estudio reciente, al personal de ventas de una compañía de computación se le preguntó


si sus ventas se verían acrecentadas por una reducción en el precio de las computadoras o por
una mejora en la calidad del servicio que se ofrece a los usuarios. Se tomaron muestras al azar
de vendedores de cada uno de los tres territorios de ventas, con los siguientes resultados:
Motivos Norte Sur Este Total
Menor precio 41 27 22 90
Mejor servicio 79 53 78 210
Total 120 80 100 300

Solo si se logra probar que hay homogeneidad en las tres áreas geográficas con respecto a la
opinión de los vendedores sobre los motivos del crecimiento de sus ventas, se creará una
oficina de marketing en la sede central de la compañía. Use un nivel de significación de 0,05.
χ 2cal =4.575
χ 2crit =5.991

-7-

También podría gustarte