Está en la página 1de 37

PRUEBA DE HIPÓTESIS PARA

DOS MUESTRAS
INDEPENDIENTE Y
DEPENDIENTE

SEMANA 12
SESIÓN 23-24
RESULTADO DE APRENDIZAJE DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta pruebas de


hipótesis para dos muestras independientes y dependientes
apreciando la importancia en la toma de decisiones.
REFLEXIÓN DESDE LA EXPERIENCIA
Suponga que se desea comparar los tiempos de atención (en minutos) de los
médicos de la clínica San Camilo y San Andrés.
Población 1: Tiempo de atención de los médicos Población 2: Tiempo de atención de los médicos
de la clínica San Camilo de la clínica San Andrés
Pedro 10 Jorge 12 Lucia 13 Camila 24 Sonia 22 Silvia 16
Mónica 16 Luis 15 Edgar 14 Daniela 27 Roger 17 Martin 24
Carlos 12 David 12 Fiorella 11 ¿ 𝝁𝟏 𝒗𝒔 𝝁𝟐 ? Pedro 22 María 12 Vanesa 21
Mayra 17 Rony 19 Juana 14 Juliana 19 Ketelby 17 Yolanda 26
Romelia 18 Sofía 14 Martha 13 ¿ 𝝈𝟐𝟏 𝒗𝒔 𝝈𝟐𝟐 ?
Carla 23 Soledad 24 Juana 27
Clarisa 15 ...
Elsa 18 ...
Se selecciona aleatoriamente la siguiente Se selecciona aleatoriamente la siguiente
muestra de la clínica San Camilo: muestra de la clínica San Andrés:
Pedro 10 Lucia 13 Rony 19 Pedro 22 María 12 Vanesa 21
Mónica 16 Sofía 14 Fiorella 11 Juliana 19 Ketelby 17 Yolanda 26
Mayra 17 Juana 14 Martha 13
Carla 23 Soledad 24 Juana 27
Jorge 12 Clarisa 15
Elsa 18 ...
De acuerdo a lo observado en estas muestras, ¿se puede pensar que el tiempo promedio es el
mismo en ambas clínicas?
REFLEXIÓN DESDE LA EXPERIENCIA

Responde en el Padlet las siguientes


preguntas

• ¿Qué tipo de prueba conoces?

• ¿Cómo se puede comparar las medias de dos poblacionales


o grupos?
Se pueden distinguir cuatro situaciones:

m1 y m2 son muestras independientes


•Poblaciones con varianzas conocidas
•Poblaciones con varianzas desconocidas pero iguales
•Poblaciones con varianzas desconocidas pero diferentes

• m1 y m2 son muestras dependientes (valores apareados)


PRUEBA DE HIPÓTESIS PARA LA
DIFERENCIA DE MEDIAS CON
MUESTRAS INDEPENDIENTES

Cuando las Cuando las


σ12 =σ22 , pero σ12 ≠σ22 , pero
desconocidas desconocidas

Tc 
 x1  x 2   k ~ t n1  n2  2 Tc 
 x  x  k ~ t
1 2

(n1  1) S  (n2  1) S 1 1
2
2 2 S S 22
1 2
    1
n1 n2
n1  n2  2  n1 n2 
2
𝑆12 𝑆22
+
𝑛1 𝑛2
K = (µ1 - µ2) 𝑔𝑙 = 2 2
𝑆12 𝑆22
gl= n1 + n2 - 2 𝑛1
+
𝑛2
𝑛1 − 1 𝑛2 − 1
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE
MEDIAS CON MUESTRAS INDEPENDIENTES
Cuando las σ12 = σ22 , pero desconocidas.
Unilateral Izquierda Bilateral Unilateral Derecha
 Hipótesis: H0: m1 ≥ m2 H0: m1 = m2 H0: m1 ≤ m2
H1: m1 < m2 H1: m1 ≠ m2 H1 : m 1 > m 2

 Sea α el nivel de significación escogido (0< α <1)


Tc 
 x1  x 2   k ~ t n1  n2  2
 Estadístico de prueba: (n1  1) S  (n2  1) S
1
2 2
2
1 1
  
n1  n2  2  n1 n2 

Donde: para encontrar los valores críticos utilizamos la tabla “t-student”, teniendo en
cuenta los grados de libertad n + n - 2
1 2
 Establezca la región de rechazo

RHO NRHO RHO NRHO RHO NRHO RHO

t;n1+n2-2 t/2;n1+n2-2 t1-/2;n1+n2-2 t1-;n1+n2-2

 Regla de decisión: Se rechaza Ho, con un riesgo α, cuando el valor 𝑇𝑐 pertenece a la


región de rechazo, según sea el caso.

 Conclusión
Ejemplo:
Dos técnicas de ventas son aplicadas por dos grupos de vendedores: la primera
(Técnica A), por 12 vendedores y la segunda (Técnica B), por 15 vendedores. Se
espera que la ambas técnicas den resultados distintos. Al final de un mes se
obtuvieron los siguientes resultados.

Venta con técnica A Venta con técnica B


Media 75 82
Varianza 45 70

¿Existe diferencia significativa entre las ventas promedio de A y B?


Asuma que las poblaciones son normales con varianzas poblacionales desconocidas
pero iguales.
Hipótesis:

Las ventas promedios con las técnicas


𝐻𝑜 : µ𝐴 = µ𝐵 de ventas A y B no son diferentes
Tc  2.35

𝐻1 : µ𝐴 ≠ µ𝐵 Las ventas promedios con las técnicas


No se
A y B son diferentes Se rechaza Se rechaza
rechaza Ho
Ho Ho
Nivel de significancia: α = 0.05

Estadístico de prueba:
-2.06 2.06

Regla de decisión : Como 𝑇𝑐 ∈ RC.


Se rechaza Ho

Conclusión: Los resultados obtenidos


Establezca la región de rechazo muestran evidencia suficiente como para
Valor crítico: concluir que existe diferencia significativa
t/2;n1+n2-2 =t0,025;25 = -2.06 entre las ventas promedio logradas con las
t1-/2;n1+n2-2 =t0,975;25 = 2.06 técnicas A y B con un nivel de significancia
de 0.05.
Ejemplo:
La directora de presupuesto de una cierta compañía desea comparar los gastos
diarios (en dólares) respecto al transporte del equipo de ventas y del personal de
cobranza. Recopiló la siguiente información muestral:

Al nivel de significancia de 0.05 ¿Puede concluirse que los gastos medios diarios del
equipo de ventas son mayores?
Asuma que las poblaciones son normales con varianzas poblacionales desconocidas
pero iguales.
Hipótesis

𝐻𝑜 : µ𝑣𝑒𝑛𝑡𝑎𝑠 ≤ µ𝑐𝑜𝑏𝑟𝑎𝑛𝑧𝑎 Los gastos medios diarios en transporte del equipo de ventas no son
mayores que el equipo de cobranza

𝐻1 : µ𝑣𝑒𝑛𝑡𝑎𝑠 > µ𝑐𝑜𝑏𝑟𝑎𝑛𝑧𝑎 Los gastos medios diarios en transporte del equipo de ventas son
mayores que el equipo de cobranza
Nivel de significancia
α=0.05 Tc =1.54
Estadístico de prueba
No se Se rechaza
n1=6 𝑆12 =149.9 𝑥ҧ1 = 142.5 rechaza Ho Ho

n2=7 𝑆22 =249.2 𝑥ҧ2 = 130.29


142.5 − 130.29 − 0 1.80
Tc = = 1.54
𝟔 − 𝟏 𝟏𝟒𝟗. 𝟗 + 𝟕 − 𝟏 𝟐𝟒𝟗. 𝟐 𝟏 𝟏 Regla de decisión : Como 𝑇𝑐 ∉ RC
× +
𝟔+𝟕−𝟐 𝟔 𝟕
No se rechaza Ho
Establezca la región de rechazo Conclusión
Establezca
Valor crítico: la región de rechazo Los datos de la muestra evidencian que los gastos
t1-;n1+n2-2 =t0,95;11 = 1.80 medios diarios en transporte del equipo de ventas no
son mayores que los gastos medios del equipo de
cobranza con un nivel de significancia de 0.05.
Ejemplo:
Los siguientes datos corresponden a la pureza del ácido en porcentaje observada
en dos plantas de producción de ácido sulfúrico.

Planta A 96.8 95.8 96.2 96.5 96.4 96.7 96.3 96 97.1 96.5
Planta B 95.6 96 97.8 98.4 97.6 98.2 96.9 96.8

Pruebe la hipótesis si existe alguna diferencia en los porcentajes promedios de


pureza del ácido entre la planta A y la planta B, si desea un nivel de significación de
0.01.
Asuma que las poblaciones son normales con varianzas poblacionales
desconocidas pero iguales.
Hipótesis

𝐻𝑜 : µ𝐴 = µ𝐵 Los porcentajes promedios de pureza del ácido entre la planta A y la


planta B no son diferentes

𝐻1 : µ𝐴 ≠ µ𝐵 Los porcentajes promedios de pureza del ácido entre la planta A y la


planta B son diferentes
Nivel de significancia
α=0.01 Tc =-2.10
Estadístico de prueba
No se
Se rechaza Ho Se rechaza Ho
n1=10 𝑆12 =0.15 𝑥ҧ1 = 96.43 rechaza Ho
n2=8 𝑆22 =1.03 𝑥ҧ2 = 97.16 0.005 0.005
96.43 − 97.16 − 0 -2.92 2.92
Tc = = −2.10
𝟏𝟎 − 𝟏 𝟎. 𝟏𝟓 + 𝟖 − 𝟏 𝟏. 𝟎𝟑 𝟏 𝟏 Regla de decisión : Como 𝑇𝑐 ∉ RC
× +
𝟏𝟎 + 𝟖 − 𝟐 𝟏𝟎 𝟖
No se rechaza Ho
Establezca la región de rechazo Conclusión
Establezca
Valor crítico: la región de rechazo Los datos de la muestra evidencian que los
t/2;n1+n2-2 =t0,005;16 = -2.92 porcentajes promedios de pureza del ácido entre la
t1-/2;n1+n2-2 =t0,995;16 = 2.92 planta A y la planta B no son diferentes con un nivel
de significancia de 0.01.
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON
MUESTRAS RELACIONADAS (DEPENDIENTES)
Unilateral Izquierda Bilateral Unilateral Derecha
H0: m1 ≥ m2 H0: m1 = m2 H0 : m 1 ≤ m 2
 Hipótesis:
H1: m1 < m2 H1: m1 ≠ m2 H1: m1 > m2

 Sea α el nivel de significación escogido (0< α <1)


 Estadístico de prueba: ത
𝑑−𝑘
𝑡𝑐 = 𝑆𝑑 ∼ t(n-1)
𝑛

Donde: n n

 d  (x  x )
i i 2
𝑆𝑑2 =
d i 1
 i 1
n n
 Establezca la región de rechazo

RHO NRHO RHO NRHO RHO NRHO RHO

t;n-1 t/2;n-1 t1-/2;n-1 t1-;n-1

 Regla de decisión: Se rechaza Ho, con un riesgo α, cuando el valor 𝑇𝑐 pertenece a la


región de rechazo, según sea el caso.

 Conclusión
Ejemplo:
Se desea analizar el efecto de una droga sobre la presión de la sangre para lo cual
se utiliza una muestra de 10 personas, obteniendo los siguientes datos (presión
codificada). Utilice α = 0.05

Antes de la droga 14 15 12 9 14 12 10 9 13 12
Después de la droga 10 12 12 7 15 10 7 8 11 11

Al nivel de significación del 5% ¿Se puede concluir que la presión sanguínea ha


cambiado?.
Las hipótesis son; ( donde u D  ud  ua )

H 0 : uD  0 La presión sanguínea promedio antes y después


de tomar la droga no es diferente

La presión sanguínea promedio


H1 : u D  0 antes y después de tomar la droga 𝑡𝑐 =-3.60
es diferente

antes después d Se rechaza No se Se rechaza


Nivel de significancia: α=0.05 14 10 -4 Ho rechaza Ho Ho
15 12 -3
Estadístico de prueba: 12 12 0

d k  1.7  0
9 7 -2
-2.26 2.26
𝑡𝑐 t=   3.6
14 15 1
12 10 -2
S d / n 1.494 / 10 10
9
7
8
-3
-1
13 11 -2 Regla de Decisión : Como 𝑡𝑐 ∈ RC.
Establezca la región de rechazo
12 11 -1 Se rechaza Ho.
promedio -1.7
varianza 2.232 Conclusión: Los datos muestran evidencia
Valor crítico:
desviación estándar 1.494 suficiente como para inferir que la presión
t/2;n-1 =t0,025;9 = -2.26 sanguínea ha cambiado por efecto de la
t1-/2;n-1 =t0,975;9 = 2.26 droga con un nivel de significancia de 0.05.
Ejemplo:
Se planifica un ensayo clínico para valorar la Antes del tratamiento Después del tratamiento
Paciente 1 210 176
eficacia de un nuevo tratamiento
Paciente 2 207 208
antihipertensivo. Paciente 3 196 193
Este tratamiento se sospecha que podrá tener Paciente 4 212 187
unos efectos secundarios considerables, por ello Paciente 5 192 178
Paciente 6 189 175
hemos conseguido únicamente 14 pacientes
Paciente 7 208 176
dispuestos a integrar el estudio. Hemos tomado Paciente 8 189 183
la presión arterial de los pacientes antes y Paciente 9 212 157
después de someterse al tratamiento obteniendo Paciente 10 197 198
Paciente 11 201 184
los siguientes valores:
Paciente 12 192 194
Paciente 13 205 180
Paciente 14 190 183

Contrasta la hipótesis que el tratamiento realmente ha producido una disminución


significativa (α=0.05) de la presión arterial.
Las hipótesis son; ( donde u D  ud  ua )
𝑡𝑐 =-3.70
La presión arterial promedio después del
𝐻𝑜 : µ𝐷 ≥ 0 tratamiento no es menor que la presión
arterial promedio antes del tratamiento Se rechaza No se
La presión arterial promedio después Ho rechaza Ho
𝐻1 : µ𝐷 < 0 del tratamiento es menor que la presión
arterial promedio antes del tratamiento
-1.77
Nivel de significancia: α=0.05 Antes del
tratamiento
Después del
tratamiento d
Paciente 1 210 176 -34
Estadístico de prueba: Paciente 2 207 208 1 Regla de Decisión: Como 𝑡𝑐 ∈ RC.
Paciente 3 196 193 -3 Se rechaza Ho.
Paciente 4 212 187 -25

𝑑−𝑘 −16.29−0 Paciente 5 192 178 -14
𝑡𝑐 = = = −3.70 Paciente 6 189 175 -14 Conclusión: Los datos muestran
𝑆𝑑 / 𝑛 16.46/ 14
Paciente 7 208 176 -32
Paciente 8 189 183 -6
evidencia suficiente como para inferir
Establezca la región de rechazo Paciente 9 212 157 -55 que el tratamiento produce una
Paciente 10 197 198 1
Paciente 11 201 184 -17
disminución significativa de la
Paciente 12 192 194 2 presión arterial media con un nivel
Valor crítico: Paciente 13 205 180 -25 de significancia de 0.05.
t;n-1 =t0,025;9 = -1.77 Paciente 14 190 183 -7
promedio -16.29
desviación estándar 16.46
Ejemplo:
La coordinación de Estadística se encuentra preocupada por establecer si el nuevo
sistema que se está aplicando en el desarrollo del curso tendrá mejores resultados que
el anterior. Para lo cual decide realizar un estudio con los estudiantes que se encuentran
en riesgo académico obteniendo las notas del semestre pasado (sistema tradicional) y
las actuales con el nuevo sistema.
A un nivel de significancia del 5% indique si el nuevo sistema por competencias debe
considerarse como mejor sistema de enseñanza y aprendizaje para el desarrollo del
curso.

NOTAS
PC1 PC2 PC3 PC4 Lab 1 Lab 2

Sistema Tradicional 12 15 10 8 14 12
Sistema por competencias 14 17 14 13 16 18
Las hipótesis son; ( donde: u D  u SC  uT )

El rendimiento promedio mediante el sistema por


𝐻𝑜 : µ𝐷 ≤ 0 competencias no es mayor que el rendimiento
promedio mediante el sistema tradicional
El rendimiento promedio mediante el sistema
𝐻1 : µ𝐷 > 0 por competencias es mayor que el rendimiento
promedio mediante el sistema tradicional  4.87
T𝑡c𝑐 =4.87
No se
Nivel de significancia: α=0.05 rechaza Ho Se rechaza Ho
antes después d
12 14 2
15 17 2
Estadístico de prueba: 10 14 4
8 13 5 2.02
d k 3.5  0 14 16 2
𝑡𝑐 t=   4.87 12 18 6
S d / n 1.761 / 6 promedio 3.5 Regla de decisión : Como 𝑡𝑐 ∈ RC.
varianza 3.10
desviación estándar 1.761 Se rechaza Ho.
Establezca la región de rechazo
Conclusión: Los resultados muestran evidencia
Valor crítico:
mas que suficiente como para inferir que el sistema
t1-;n-1 =t0,95;5 = 2.02
por competencias es mejor que el sistema
tradicional con un nivel de significancia de 0.05.
Ejemplo:
Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de
salsa envasada, que puede preparar en una forma más espesa ( A ) o en otra forma
menos espesa ( B ). Para medir la preferencia por uno y otro tipo de salsa, utiliza una
muestra de diez amas de casa, quienes manifiestan sus preferencias por dichos tipos
de salsa, con los siguientes resultados en puntajes

Salsa A (ptos): 3 1 5 2 0 4 3 3 2 5
Salsa B (ptos): 2 4 4 7 3 4 6 5 5 5

Al nivel de significación del 5% ¿Se puede concluir que el tipo de salsa menos espesa
( B ) tiene mayores oportunidades de funcionar en el mercado, que el tipo más
espeso ( A )?
Las hipótesis son ( donde: uD  uB  u A )

El puntaje promedio obtenido con la salsa B


𝐻𝑜 : µ𝐷 ≤ 0 no es mayor que el puntaje promedio
obtenido con la salsa A
El puntaje promedio obtenido con la salsa B
𝐻1 : µ𝐷 > 0
es mayor que el puntaje promedio obtenido Tc𝑡𝑐=2.61
2.61
con la salsa A
Nivel de significancia: α=0.05 Salsa A(ptos): Salsa B(ptos):
3 2
d
-1 No se Se rechaza Ho
1 4 3 rechaza Ho
5 4 -1
Estadístico de prueba: 2 7 5
0 3 3 1.83
4 4 0

𝑡𝑐t 
d k 1.7  0 3
  2.61
3 6
= 3 5 2 Regla de Decisión : Como 𝑡𝑐 ∈ RC.
S d / n 2.058 / 10 2 5 3
0
Se rechaza Ho
5 5
Promedio 1.7
Establezca la región de rechazo Conclusión: Los resultados muestran
Varianza 4.235
Valor crítico: evidencia suficiente para concluir que la
t1-;n-1 =t0,95;9 = 1.83 Desviación estándar 2.058 salsa B tiene mayor preferencia que la salsa
A con un nivel de significancia de 0.05.
APLIQUEMOS LO APRENDIDO

1) Se aplicó un mismo test a dos grupos de personas con el objeto de analizar si


existe o no diferencia entre las puntuaciones medias; elija α = 0.05. Asuma que
las poblaciones son normales con varianzas poblacionales desconocidas pero
iguales.

Grupo I 26 24 18 17 18 20 18
Grupo II 38 26 24 24 30 22
2) En ensayos clínicos que incluyen diferentes grupos de muestras
independientes es importante que los grupos sean similares en los aspectos
importantes que podrían afectar el experimento. En un experimento diseñado
para probar la eficacia de la paroxetina en el tratamiento de la depresión bipolar,
se midió la depresión de los sujetos utilizando la escala de Hamilton, con los
resultados que se presentan abajo.
Grupos
Grupo de tratamiento con
Grupo placebo paroxetina
Media 21.57 20.38
Desviación estándar 3.87 3.91
n 43 33
¿Debería recomendarse la paroxetina como un tratamiento para la depresión
bipolar? Asuma que las poblaciones son normales con varianzas poblaciones
son desconocidas pero iguales. Use α=0.05
3) La medición del diámetro transversal del corazón de hombres y mujeres adultos
presenta los siguientes resultados:

Pruebe la hipótesis que existe diferencia significativa entre los diámetros promedios
transversales entre los corazones de los varones y las mujeres.
Considere que las poblaciones siguen una distribución normal con varianzas
desconocidas pero iguales.
4) Veinticuatro animales de laboratorio con deficiencia de vitamina D fueron divididos
en dos grupos iguales. El grupo I recibió un tratamiento consistente en una dieta que
proporcionaba vitamina D. El segundo grupo no fue tratado. Al término del periodo
experimental, se midieron las concentraciones de calcio en suero, obteniéndose los
siguientes resultados:

Se puede afirmar que la concentración promedio de calcio en el suero es mayor con


aquel grupo que recibió el tratamiento.
Asuma que las poblaciones son normales con varianzas poblacionales desconocidas
pero iguales además α = 0.05
5) Se prueban las propiedades dietéticas de cierto alimento especial para niños.
Las pruebas se realizan bajo control pediátrico, usando dos muestras de niños, en
las mismas condiciones de salud normal. Durante el período experimental la dieta
A, que no contiene alimento especial es administrada a una de las muestras, en
tanto que a la otra muestra se le administró la dieta B, que contiene alimento
especial. Se obtienen los siguientes resultados de aumento de peso en kilos.

Dieta A 0.1 0.2 0.3 0.4 0.4 0.5 0.5 0.8 0.9
Dieta B 0.4 0.6 0.7 0.7 0.8 0.8 0.9 1.0 1.1

¿La dieta B produjo mejores resultados en aumento de peso que la dieta A?


Use α = 0.05.

Asuma que las poblaciones son normales con varianzas poblacionales


desconocidas pero iguales.
INTEGREMOS LO APRENDIDO

• ¿Qué es prueba de hipótesis se han aplicado


en clase?
• ¿Cuándo dos muestras son dependientes e
independientes?
• ¿Qué distribuciones de probabilidad se han
utilizado?
INTEGREMOS LO APRENDIDO

• ¿Qué es lo que más te ha gustado de la


sesión desarrollada?

• ¿Qué es lo que aún puedes mejorar para


realizar la prueba de hipótesis para muestras
independientes y dependientes ?

• ¿Cómo puedes aplicar lo aprendido en la


https://bit.ly/3pKZIzI
sesión a tu vida profesional?
Actividad Asincrónica (virtual)

Resolver el cuestionario virtual de la


semana 12
Referencias Bibliográficas
SECCIÓN DE REFERENCIA
SECCIÓN DE REFERENCIA

También podría gustarte