Está en la página 1de 20

Licenciatura en Economía

Estadística II

Tema: Inferencia estadística acerca de medias y


proporciones con dos poblaciones

Presenta:
Dra. María del Rosario Granados Sánchez
Inferencia acerca de la diferencia entre dos medias
poblacionales: σ1 y σ2 desconocidas
Si no conocemos las σ1 y σ2, empleamos la s1 y s2

Utilizar una distribución “t- Student”

Problema:

CITIGROUP
Identificar las diferencias entre las cuentas de cheques de sus clientes en
dos de sus sucursales
a. Muestra aleatoria (n=28) sucursal Cherry Grove
b. Muestra aleatoria (n=22) sucursal Beechmont

El banco desea estimar la diferencia entre el saldo medio en las


cuentas de cheques de los clientes de las dos sucursales.
¿Qué conocemos?
Desviación estándar muestra de cada población S1 y S2

Distribución t -
Student
Intervalo para la diferencia entre dos medias
poblacionales con σ1 y σ2 desconocida

La dificultad a la que nos enfrentamos al utilizar la distribución t es la


estimación de los gl.
gl: distribución t con muestras aleatorias
independientes

Tenemos dos poblaciones, ¿cuántos gl


debo usar de acuerdo a los datos
muestrales proporcionados?
Nivel de significancia del 95%

a= 0.05 a/2= 0.025


gl=47
gl= 47 a/2=0.025 t0.025=¿? Intervalo de confianza al
95%= ¿?
En la tabla de distribución t,
buscarán el valor crítico para 47 gl
con un a/2=0.025
t tablas = 2.012

La estimación puntual: 115


El margen de error : 78
El intervalo de confianza a un 95% para la
diferencia entre las dos medias
poblacionales va de [37 a 193] (115-78 ;
115+78)
Pruebas de hipótesis acerca de m1 y m2 : σ1 y σ2
desconocidas
Condiciones:
Ejemplo:
σ1 y σ2 desconocidas
Un nuevo software que ayuda a los
Estadístico de prueba: analistas de sistemas a reducir el tiempo
requerido para diseñar, elaborar y poner en
marcha un sistema de información.
Para evaluar las ventajas del nuevo
programa, se toma una muestra aleatoria
de 24 analistas de sistemas.
A cada analista se le proporciona
información sobre un sistema de
información hipotético.
A 12 de ellos se les pide que elaboren el
sistema de información usando la
tecnología actual.
A los otros 12 se les capacita para usar el
nuevo software y se les instruye para que
lo empleen en el desarrollo del sistema de
información.
Tenemos:
Población 1: analistas de sistemas que usan tecnología
actual
Población 2: analistas de sistemas que aplican un nuevo
m1: tiempo medio para completar el proyecto con la
software
tecnología actual
m2: tiempo medio para completar el proyecto con un nuevo
software
Demostrar que con el nuevo software se requiere
menos tiempo para completar el proyecto de
sistema de información:μ2 < μ1
La diferencia entre las dos medias poblacionales
μ1 - μ2 > 0
1. Planteamos la hipótesis
2. Nivel de significancia
a= 0.05
3.1 Estimamos los gl:
¿Es una prueba de una o dos
colas?
3. Definimos el estadístico de
prueba
Al no conocer las DS
poblacionales empleamos el
estadístico de prueba “t” 3.2 Buscamos el valor de t
calculada en tabla de
distribución t
4. Estimación de p-value

2.27 se encuentra entre la


probabilidad de 0.025 y 0.01

0.025 y 0.01 < 0.05  Se


rechaza Ho
Conclusión:
- >0 o bien >
El nuevo software proporciona una media
poblacional menor de tiempo requerido
Ejercicio:
Inferencia acerca de la diferencia entre dos medias
poblacionales: muestras pareadas
¿Qué es una muestra pareada?
μ1: la media poblacional del tiempo empleando el Ho: μ1 - μ2 = 0
método 1 Ha: μ1 - μ2 ≠ 0
μ2: la media poblacional del tiempo empleando el
método 2 basa en muestras independientes y el otro en
Uno se
muestras pareadas (o muestras por pares).

Muestras independientes Muestras pareadas


Primera M.A.S de trabajadores M.A.S de trabajadores.
y cada uno de ellos usa el Cada trabajador usa primero uno
método 1. de los métodos y después el otro.
Segunda M.A.S de trabajadores A cada sujeto se le asigna en
y cada uno usa el método 2. forma aleatoria el orden en que
aplicará los dos métodos.
Cada trabajador proporcionará un
par de valores de datos.
Ventajas:

Experimentos se prueban en condiciones similares


Error muestral es más pequeño que el encontrado en
muestras independientes
Ejemplo:
Nos interesa saber si hay una diferencia entre los tiempos que se
realiza una determinada actividad
n= 6 trabajadores
Dos métodos para desarrollar la actividad (tiempo necesario para
realizarla)
Diferencia entre ambos tipos de desarrollarla
Ejemplo:

μd: es la media de la diferencia entre los valores de la población de los


trabajadores

n=6  t – Satudent gl= n-1

Estadístico de prueba para PRUEBAS DE HIPÓTESIS CON MUESTRAS


PAREADAS
Ejemplo:

a: 0.05 =0.30 ; sd=0.335 ; n=6

Estimamos el p- value

El valor t se ubica entre 0.05 y 0.025,


(0.10 y 0.05) > 0.05  No se rechaza
Ho: μd=0
I.C. 95%
Ejercicio:
Inferencia acerca de la diferencia entre dos proporciones
poblacionales
Pruebas de hipótesis

Fin

También podría gustarte