Está en la página 1de 20

UNIVERSIDAD UTE

FALCULTAD CIENCIAS DE LA INGENIERIA


E INDUSTRIAS
PROBABILIDAD Y ESTADISTICA

INTERVALOS DE CONFIANZA Y PRUEBAS


DE HIPOTESIS

INTEGRANTES
CHULDE LENIN
MANTILLA GRACE

4TO NIVEL “A”


SEP 2018-SEP 2018
INTRODUCCIÓN
La inferencia estadística nos proporciona métodos para sacar conclusiones sobre una
población a partir de los datos de la muestra de dicha población.
Los dos procedimientos más ampliamente utilizados de inferencia estadística son: la
construcción de un intervalo de confianza cuando el objetivo sea estimar un parámetro
poblacional y la prueba de hipótesis, cuando el objetivo sea tomar una decisión respecto
de una hipótesis que se formula sobre el valor de un parámetro poblacional.

INTERVALOS DE CONFIANZA

El objetivo de un estadístico puntual para un parámetro desconocido de una población, es


acercarnos a los valores del parámetro más compatibles con la información muestral.
Esta estimación no acertará con el valor exacto del parámetro. No obstante, podemos
buscar simplemente una “aproximación razonable” del mismo. En esta línea surgen los
intervalos de confianza, para un nivel de confianza dado.
Sea (𝑋1 , … , 𝑋𝑛 ) una muestra aleatoria de una población X con función de masa
𝑃𝜃 (𝑜 𝑢𝑛𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑓𝜃 ), 𝑑𝑜𝑛𝑑𝑒 𝜃 = (𝜃1 , … , 𝜃𝑘 ) ∈ Θ. Una CANTIDAD
PIVOTAL para 𝜃𝑖 es una función 𝐶(𝑋1 , … , 𝑋𝑁 ; 𝜃𝑖 ) tal que su distribución no depende de
𝜃.
Una vez obtenida una cantidad pivotal 𝐶(𝑋1 , … , 𝑋𝑁 ; 𝜃𝑖 ) la construcción de un intervalo
para estimar es el siguiente:
 se eligen dos valores, 𝐶1 𝑦 𝐶2 tales que:

𝑃𝜃 {(𝑋1 , … , 𝑋𝑛 ) ∶ 𝑐1 < 𝐶(𝑋1 , … , 𝑋𝑁 ; 𝜃1 ) < 𝑐2 } = 1 − 𝛼

Obsérvese que 𝑐1 y 𝑐2 no dependen de 𝜃, al ser 𝐶(𝑋1 , … , 𝑋𝑁 ; 𝜃𝑖 ) una cantidad pivotal.

 Despejamos 𝜃𝑖 de las desigualdades 𝑐1 < 𝐶(𝑋1 , … , 𝑋𝑁 ; 𝜃1 ) < 𝑐2.


Obtenemos así un estimador por intervalos de confianza para 𝜃𝑖 .
INTERVALOS DE COFIANZA PARA LAS MEDIAS Y DIFERENCIA
DE MEDIAS

Intervalos de confianza para las medias en una población normal con varianza
conocida

Para estimar la media poblacional μ de una población Normal de media μ (desconocida)


y de varianza 𝜎 2 (conocida), N (μ, 𝜎 2 ), se selecciona una muestra aleatoria 𝑋1 , 𝑋2 , … 𝑋𝑛 de
tamaño 𝑛 de valores de una variable aleatoria de esta población y se calcula su media
muestral, como mejor estimador puntual de μ. La construcción del intervalo de confianza
se hace tomando como base este estimador. Para calcular un intervalo de confianza para
μ partimos de la variable aleatoria
𝑋̅ − 𝜇
𝑍=
𝜎/√𝑛

Sigue una distribución normal de media 0 y desviación típica 1. Buscamos los cuantiles
de esta distribución tales que

Por lo tanto, el intervalo de confianza que debemos calcular es


Ejemplo

 Si se considera una población normal donde μ = 4.5 y la desviación poblacional σ=1, y


se extraen muestras de tamaño 100, la variable promedio muestral se distribuye
normalmente con esperanza 4.5 y desviación estándar 1/10. En símbolos:

𝑋̅~ 𝑁(4,5; 1/10)

¿Entre qué valores se encuentran el 95 % de los promedios muestrales centrales?


̅̅̅1 y 𝑋
Es decir buscamos los valores 𝑋 ̅̅̅2 que satisfagan:

̅̅̅1 ≤ 𝑋̅ ≤ 𝑋
𝑃(𝑋 ̅̅̅̅
2 ) = 0.95

̅̅̅1 − 𝜇
𝑋 ̅̅̅2 − 𝜇
𝑋 ̅̅̅1 − 4.5
𝑋 ̅̅̅2 − 4.5
𝑋
𝑃( 𝜎 ≤𝑍≤ 𝜎 )=( ≤𝑍≤ )
1 1
√𝑛 √𝑛 √100 √100

𝑃(−1.96 ≤ 𝑍 ≤ 1.96) = 0.95

̅̅̅1 − 4.5
𝑋
̅̅̅1 = 4.304
= −1.96 => 𝑋
1
10

̅̅̅2 − 4.5
𝑋
̅̅̅2 = 4.696
= 1.96 => 𝑋
1
10
𝑃(4.304 ≤ 𝑋̅ ≤ 4.696) = 0.95
Por lo tanto, el 95% de los promedios muestrales estarán entre 4.304 y 4.696:

𝜎 𝜎
𝑃 (𝜇 − 1.96 ≤ 𝑋̅ ≤ 𝜇 + 1.96 ) = 0.95
√𝑛 √𝑛

Intervalos de confianza para las medias en una población normal con varianza
desconocida

En este caso, una muestra 𝑋1 , 𝑋2 , … 𝑋𝑛 de tamaño 𝑛 de valores de la variable aleatoria


que sigue una distribución Normal de media μ y de varianza 𝜎 2 desconocida, el cálculo
de un intervalo de confianza para la media se parte de dicha variable.

En este caso, donde se tiene una varianza desconocida se procede a reemplazar σ por S
(desvío muestral), por esa razón se recurre a una nueva distribución llamada: T de Student
con 𝒏 − 𝟏 grados de libertad.

En consecuencia, para una confianza de 100 (1 − 𝛼) % el error de estimación resulta:


Ejemplo

 Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar el valor medio
de las ventas por trabajador en la Empresa. La media y varianza de la muestra (en miles
de euros) son 5 y 2, respectivamente.

1. Intervalo de confianza para la venta media por trabajador en la Editorial al 90 %.

𝑠
̅
X ± 𝑡𝛼
2 √𝑛

𝑉(𝑋) = 2

𝑛 15
𝑠2 = 𝑉(𝑋) = (2) = 2,143
𝑛−1 14

𝑠 = √𝑠 2 = 1,464

Los cuantiles de orden 0.05 y 0.95, que encierran en el centro de la distribución


t de Student con 14 g.l. un ´área igual a 0.9 se muestran en el gráfico siguiente:

1,464
5 ± 1,761 ≡ 5 ± 0,666
√15

(4,334,5,666)

2. Intervalo de confianza para la varianza de las ventas por trabajador en la Editorial


al 90 %.

(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
( 2
, 2 )
𝑋𝑠𝑢𝑝 𝑋𝑖𝑛𝑓
(15 − 1)2; 143 (𝑛 − 1)2; 143
( , )
23,685 6,571

(1,27,4, 58)

Intervalo de confianza para la diferencia de medias

Sean 𝑋11 , 𝑋12 , … , 𝑋1𝑛1, una muestra aleatoria de 𝑛1 observaciones tomadas de una
primera población con valor esperado 𝜇1 , y varianza 𝜎12 ; y 𝑋21 , 𝑋22 , … , 𝑋2𝑛2. Y una
segunda muestra aleatoria de 𝑛2 observaciones tomada de otra población con valor
esperado 𝜇2 , y varianza 𝜎22 .

̅̅̅1 y 𝑋
Si 𝑋 ̅̅̅2 son las medias muestrales, la estadística 𝑋
̅̅̅1 - 𝑋
̅̅̅2 es un estimador puntual de
𝜇1 − 𝜇2 , y tiene una distribución normal si ambas poblaciones son normales, si cumple
con las condiciones del teorema del límite central (tamaños de muestras relativamente
grandes).

̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
Z=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

En el intervalo de confianza para la diferencia de dos medias analizar las varianzas


poblacionales si son conocidas o desconocidas, y en caso de que sean desconocidas, se
debe probar si son iguales o diferentes.
Varianzas conocidas pero diferentes (𝝈𝟏 ≠ 𝝈𝟐 )
Si las varianzas poblacionales son conocidas y diferentes, el intervalo de confianza se
calcula en tres pasos:
̅̅̅1 − 𝑋
a) El estimador puntual de la diferencia de medias 𝜇1 − 𝜇2 , será T= 𝑋 ̅̅̅2

b) La variable aleatoria asociada con el estimador será la variable normal estándar dada
por:

̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
Z=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza


que se quiere considerar.

Teorema. Si 𝑋 ̅̅̅1 − 𝑋
̅̅̅2 son las medias de dos muestras aleatorias independientes de tamaño 𝑛1
y 𝑛2 tomadas de poblaciones que tienen varianzas conocidas 𝜎12 y 𝜎22 , respectivamente, entonces
el intervalo de confianza para 𝜇1 − 𝜇2 es:

𝜎12 𝜎22 𝜎12 𝜎22


̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − 𝑍√ + ̅̅̅ ̅̅̅
≤ 𝜇1 − 𝜇2 ≤ 𝑋1 − 𝑋2 + 𝑍 √ +
𝑛1 𝑛2 𝑛1 𝑛2

Varianzas desconocidas e iguales (𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐 )


Cuando las varianzas son desconocidas, se debe verificar si éstas son iguales o diferentes.
Para hacerlo debemos hacer uso de la distribución F. Como se desconocen las varianzas
de la población, se usan las varianzas de las muestras como estimadores.
a) El estadístico usado como estimador puntual de la diferencia de medias 𝜇1 − 𝜇2
̅̅̅1 − 𝑋
será 𝑋 ̅̅̅2 , que es un estimador suficiente.

b) La variable aleatoria asociada con el estimador será la variable definida como (se
usa t en caso de muestras pequeñas):

̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
t=
1 1
𝑆𝑝 √ +
𝑛1 𝑛2
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de


confianza que se quiere considerar y los grados de libertad que se calculan

𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2
Teorema. Si ̅̅̅ ̅̅̅2 , 𝑆12 , 𝑆22 son las medias y las varianzas de dos muestras aleatorias de
𝑋1 , 𝑋
tamaños 𝑛1 , 𝑛2 respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas pero iguales, entonces un intervalo de confianza para la
diferencia entre medias 𝜇1 − 𝜇2 es:

1 1 1 1
̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − 𝑡 𝑆𝑝 √ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅ ̅̅̅2 + 𝑡 𝑆𝑝 √ +
𝑋1 − 𝑋
𝑛1 𝑛2 𝑛1 𝑛2

Varianzas desconocidas y diferentes (𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 )

a) El estadístico usado como estimador puntual de la diferencia de medias 𝜇1 − 𝜇2


̅̅̅1 − 𝑋
será 𝑋 ̅̅̅2 , que es un estimador suficiente

b) La variable aleatoria asociada con el estimador será la variable t definida como:

̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
t=
𝑆12 𝑆22

𝑛1 + 𝑛2

c) El intervalo de confianza está dado por el siguiente teorema, basado en la


distribución t con n grados de libertad.

Teorema. Si ̅̅̅ ̅̅̅2 , 𝑆12 , 𝑆22 son las medias y las varianzas de dos muestras aleatorias de
𝑋1 , 𝑋
tamaños 𝑛1 , 𝑛2 respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas y diferentes, entonces un intervalo de confianza para la
diferencia entre medias 𝜇1 − 𝜇2 es (nuevamente para el caso de muestras pequeñas):

𝑆12 𝑆22 𝑆12 𝑆22


̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − 𝑡 √ + ̅̅̅ ̅̅̅
≤ 𝜇1 − 𝜇2 ≤ 𝑋1 − 𝑋2 + 𝑡 √ +
𝑛1 𝑛2 𝑛1 𝑛2

Los grados de libertad están dados por:


2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]

Ejemplo

 Cierto metal se produce, por lo común, mediante un proceso estándar. Se


desarrolla un nuevo proceso en el que se añade una aleación a la producción del
metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de éstos se
somete a una tensión hasta que se rompe.

La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en


kilogramos por centímetro cuadrado:

Proceso estándar 446 401 476 421 459 438 481 411 456 427 459 445
Proceso Nuevo 462 448 435 465 429 472 453 459 427 468 452 447

Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e


independientes, obtener los intervalos de confianza estimados del 95% para la
diferencia entre los dos procesos. Interprete los resultados.

𝒏 Media 𝑺
12 443.3 24.8
12 451.4 14.9

2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
𝑡1 = 2.10, 𝑡2 = −2.10

𝑆12 𝑆22 𝑆12 𝑆22


̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − 𝑡 √ + ̅̅̅ ̅̅̅
≤ 𝜇1 − 𝜇2 ≤ 𝑋1 − 𝑋2 + 𝑡 √ +
𝑛1 𝑛2 𝑛1 𝑛2

14.92 24.82
(451.4 − 443.3) − 2.10 √ + ≤ 𝜇1 − 𝜇2
12 12

14.92 24.82
≤ (451.4 − 443.3) + 2.10 √ +
12 12

−25.65 ≤ 𝜇1 − 𝜇2 ≤ 9.49

TAMAÑO DE LA MUESTRA
Siempre es necesario planificar la inferencia conjuntamente con la obtención de los datos.
Si el error de estimación para la media es:

𝜎
𝜀 = 𝑧𝛼
√𝑛
El tamaño de muestra para un error de estimación ε y un nivel de confianza determinado se deduce
de la ecuación anterior, resultando:
𝜎 2
𝑛 = (𝑧𝛼 )
𝜀
El tamaño de la muestra debe ser más grande cuanto menor sea el error máximo
admisible:
 Para estimaciones más precisas se debe aumentar el tamaño de la muestra.
Al aumentar el nivel de confianza 1-𝛼 aumenta el tamaño de la muestra, luego:
 Para aumentar el nivel de confianza se debe aumentar el tamaño de la muestra

Ejemplo
 ¿Cuál es el número mínimo de estudiantes que debemos elegir de una población
de 𝜎 2 , para una muestra aleatoria simple si el error mínimo admisible es de 0’1, y
el nivel de confianza del 95%?

𝜎 2 ′
2 2
𝑛 ≥ (𝑧𝛼 ) => 𝑛 ≥ (1 96 ′ ) = 1536′64
𝜀 01

INTERVALOS DE COFIANZA PARA LAS PROPORCIONES Y


DIFERENCIA DE PROPORCIONES

Intervalo de confianza para las proporciones

Si el estadístico S es la proporción de “éxitos” en una muestra de tamaño N obtenida de


una población binomial en la que p es la proporción de éxitos, entonces los límites de
confianza para p están dados por 𝑃 ± 𝑧𝑐 𝜎𝑝 , donde P es la proporción de éxitos en una
muestra de tamaño N.

𝑝𝑞 𝑝(1 − 𝑝)
𝑃 ± 𝑧𝑐 √ = 𝑃 ± 𝑧𝑐 √
𝑁 𝑁

Si el muestreo se hace de una población infinita o de una población finita, pero con
reposición, y están dados por

𝑝𝑞 𝑁𝑝 − 𝑁
𝑃 ± 𝑧𝑐 √ =√
𝑁 𝑁𝑝 − 1

Si el muestreo se hace sin reposición y de una población finita de tamaño 𝑁𝑝 .


Para calcular estos límites de confianza se emplea la estimación muestral P para p, la que
por lo general resulta satisfactoria siempre que N ≥ 30.

Intervalo de confianza para las diferencias de proporciones

De igual manera, los límites de confianza para la diferencia entre dos proporciones
poblacionales, si las poblaciones son infinitas, están dados por

𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑃1 − 𝑃2 ± 𝑧𝑐 𝜎𝑃1 −𝑃2 = 𝑃1 − 𝑃2 ± 𝑧𝑐 √ +
𝑁1 𝑁2

Donde 𝑃1 y 𝑃2 son las dos proporciones muestrales, 𝑁1 y 𝑁2 son los tamaños de las dos muestras
obtenidas de las poblaciones y 𝑝1 y 𝑝2 son las proporciones en las dos poblaciones (estimadas por
𝑃1 y 𝑃2 ).

Ejemplo
 Una empresa de cable desea conocer qué proporción de sus clientes se informan de las
noticias a través de los noticiarios que difunden. Para ello seleccionó una muestra
aleatoria de 200 clientes. De las 200 personas, 110 respondieron que se informan a través
de los noticieros televisivos. El intervalo obtenido para una confianza de 95% es:

0.55 ∗ 0.45 0.55 ∗ 0.45


𝐼𝐶𝑝,95% = (0.55 − 1.96√ ≤ 𝑝 ≤ 0.55 + 1.96 √ )
200 200
= 0.55 − 0.07 ≤ 𝑝 ≤ 0.55 + 0.07 = (0.48; 0.62)

Se puede inferir que la proporción de clientes que se informan a través de los noticieros
se encuentra entre el 48% y el 62%

A tal fin decide consultar a más clientes. El tamaño de muestra que lo llevaría a cometer
un error de 4%, con la misma confianza, y utilizando la proporción muestral ya obtenida,
resulta:

𝜎 2 1.96 2
𝑛 = (𝑧𝛼 ) 𝑝̅ (1 − 𝑝̅ ) = ( ) 0.55 ∗ 0.45 = 594.25
𝜀 0.04

Es decir que se necesita un tamaño de muestra mayor o igual a 595 clientes

PRUEBAS DE HIPÓTESIS

Es un procedimiento, basado en la evidencia de la muestra y en la teoría de las


probabilidades, usado para determinar si la hipótesis es una afirmación razonable y
debería no ser rechazada o si no es razonable debería ser rechazada
El valor de la prueba de hipótesis no es cuestionar el valor calculado estadístico muestral
si no hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor
planteado del parámetro

PRUEBA DE HIPÓTESIS PARA LAS MEDIAS Y DIFERENCIA DE


MEDIAS
Prueba de hipótesis para las medias

Dada una población sobre la que se observa una variable X, tal que:
𝑋 → 𝑁(𝜇, 𝜎)
Se desea contrastar a un nivel de significación 𝛼 la hipótesis nula:
𝐻𝑜 : 𝜇 = 𝜇𝑜
Frente a la alternativa
𝐻1 : 𝜇 ≠ 𝜇𝑜
Con los datos observados se determina la media de la muestra, 𝑋̅ y el estadístico de
contraste Z. Se sabe que el estadístico media muestral sigue un modelo normal de media
𝜎
𝐸(𝑋̅ ) = 𝜇 y desviación típica 𝜎𝑋̅ = 𝑛

𝑋̅ − 𝜇
𝑧= 𝑠
√𝑛
que sigue un modelo N (0, 1).

En general, se desconoce la desviación típica 𝜎, de la población, por lo que suele usarse


un estimador usando los datos de la muestra. La cuasi-varianza de la muestra, 𝑠 2, es un
estimador insesgado de la varianza, 𝜎 2 , de la población. Para tamaños de muestra 𝑛 ≥ 30
se puede tomar la cuasi-desviación típica de la muestra,𝑠 = √𝑠 2 , en sustitución del
parámetro 𝜎 del estadístico de contraste 𝑧, que se aproxima a una N(0, 1)
𝑋̅ − 𝜇
𝑧= 𝜎 → N(0, 1)
√𝑛
Ejemplo
 Un auditor desea contrastar a un nivel de significación de 0.05 la hipótesis nula
de que la media de las deudas por cobrar de una empresa es de 150.000 euros.
Para ello se selecciona una muestra al azar de 50 de dichas deudas con un valor
medio y cuasi-desviación típica muestrales 189.000 y de 80.000, respectivamente.
Compruebe si se rechaza o acepta dicha hipótesis
𝐻𝑜 : 𝜇 = 150,000
𝐻1 : 𝜇 ≠ 150,000
Para 𝜎 = 0,05 los límites de confianza en la normal estandarizada son ±1,96
𝑋̅ − 𝜇
𝑧= 𝑠
√𝑛
189000 − 150000
𝑧= = 3,447
80000
√50
𝑍 = 3,447 cae en zona de rechazo, fuera de los límites (−1,96, 1,96), por lo que se
rechaza 𝐻𝑜 .
Prueba de hipótesis para la diferencia de medias

Hipótesis nula
𝜇1 − 𝜇2 = 0
𝜇1 − 𝜇2 = 𝑑0
Hipótesis alternativa
𝜇1 − 𝜇2 > 0
𝜇1 − 𝜇2 > 𝑑0
𝜇1 − 𝜇2 ≠ 0

Población 1 Población 2
𝝁𝟏 𝝁𝟐
𝝈𝟐𝟏 𝝈𝟐𝟐

Muestra 1 Muestra 2
̅𝟏
𝑿 ̅𝟐
𝑿
𝑺𝟐𝟏 𝑺𝟐𝟐
𝒏𝟏 𝒏𝟐

Prueba de hipótesis para la diferencia de medias con varianzas conocidas y


desconocidas
Varianzas conocidas 𝝈𝟐
Si 𝑋̅ es la media de una muestra aleatoria de tamaño n tomada de una población con media 𝜇
varianza finita 𝜎 2 , entonces, la forma límite de la distribución

𝑋̅ − 𝜇
𝑧=
𝜎 − √𝑛
Si 𝑛 → ∞ es la distribución normal estándar n (z; 0; 1).
Por propiedad reproductiva, y aplicando TLC. Ya que son independientes:
𝑋̅1 − 𝑋̅2 ~𝑁𝑜𝑟𝑚𝑎𝑙(𝜇𝑋̅1 −𝑋̅2, 𝜎𝑋̅1−𝑋̅2 , )

Media
𝜇𝑋̅1 −𝑋̅2 = 𝜇𝑋̅1 − 𝜇𝑋̅2 = 𝜇1 −𝜇2

Varianza
𝜎12 𝜎22
𝜎𝑋2̅1 −𝑋̅2 = 𝜎𝑋2̅1 − 𝜎𝑋2̅2 = +
𝑛1 𝑛2

̅̅̅̅
𝑋1 − ̅̅̅̅
𝑋2 −(𝜇𝑋
̅ 1 −𝜇𝑋
̅2) ̅̅̅̅
𝑋1 − ̅̅̅̅
𝑋2 −(𝑑0 )
Z= Z=
𝜎 2𝜎 2 𝜎 2𝜎 2
√ 1+ 2 √ 1+ 2
𝑛1 𝑛2 𝑛1 𝑛2

Entonces, evaluaremos nuestra hipótesis en función de y 𝑍 y 𝑍𝛼 , obtenida mediante la


tabla de la distribución normal.

Varianzas desconocidas e iguales (𝝈𝟐𝟏 = 𝝈𝟐𝟐 )


̅̅̅
𝑋1 − ̅̅̅
𝑋2 − (𝜇1 − 𝜇2 )
Z=
1 1
√𝜎 2 [
𝑛1 𝑛2 ]
+

(𝑛1 −1)𝑆12
𝜎2
(𝑛1 −1)𝑆22
} 𝑣. 𝑎. 𝑋 2 con v=n-1
𝜎2

𝑍
𝑇=
𝑉

𝑣

̅̅̅̅
𝑋1 − ̅̅̅̅
𝑋2 −(𝜇1 −𝜇2 )
T= 1 1
√𝑆𝑝 [𝑛 + 𝑛 ]
1 2

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22


𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

Usamos la distribución t-student, con n1+n2-2 gl. A partir de ella, encontramos𝑡𝛼,𝑣 y


comparamos con el valor calculado.

Varianzas desconocidas y diferentes (𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 )


̅̅̅1 − 𝑋
𝑋 ̅̅̅2 − (𝜇1 − 𝜇2 )
T=
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

2
𝑆2 𝑆2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2 2
𝑆2 𝑆2
(𝑛1 ) (𝑛2 )
1 2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
Usamos la distribución t-student, con v gl. A partir de ella, encontramos 𝑡𝛼,𝑣 y
comparamos nuevamente.

PRUEBA DE HIPÓTESIS PARA PROPORCIONES Y DIFERENCIA


DE PROPORCIONES

Prueba de hipótesis para proporciones


Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a
la proporción de una población, es adecuado utilizar una prueba de una muestra.
La metodología de prueba depende de si el número de observaciones de la muestra es
grande o pequeño.
Los estadísticos de prueba miden la desviación de un valor estadístico de muestra a partir
de un valor propuesto. Y ambas pruebas se basan en la distribución normal estándar
para valores críticos.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
Ejemplo
 En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe
esta aseveración, a un nivel de significación de 0,025, respecto a la alternativa de
que la proporción real de los estudiantes universitarios trabajan es mayor de lo
que se afirma, si una muestra aleatoria de 600 estudiantes universitarios revela
que 200 de ellos trabajan. La muestra fue tomada de 10000 estudiantes.

3
𝑃𝑜 = = 0.333
10
𝛼 = 0.025
𝑛 = 600
𝑋 = 200
𝑁 = 10000

Las hipótesis son:


𝐻𝑜 : 𝑝 = 𝑝𝑜
𝐻1 : 𝑝 > 𝑝𝑜

Prueba de hipótesis para la diferencia de proporciones

Sean P1 y P2 las proporciones muestrales de muestras grandes de tamaños N1 y N2


obtenidas de poblaciones cuyas proporciones son p1 y p2. Considérese la hipótesis nula
de que no hay diferencia entre estos parámetros poblacionales (es decir, p1 = p2) y que
por lo tanto las muestras se han obtenido realmente de la misma población.

p1 = p2 = p, se ve que la distribución muestral de las diferencias entre las proporciones


es aproximadamente normal, y que su media y su desviación estándar están dadas por

1 1
𝜇𝑝1 -𝜇𝑝2 =0 y 𝜎𝑃1−𝑃2 = √𝑝𝑞 (𝑁 + 𝑁 )
1 2

Donde

𝑁1 𝑃1 + 𝑁2 𝑃2
𝑝=
𝑁1 + 𝑁2

Se usa como estimación de la proporción poblacional y donde q = 1 − p. Empleando la


variable estandarizada
𝑃1 − 𝑃2 − 0 𝑃1 − 𝑃2
𝑧= =
𝜎𝑃1 −𝑃2 𝜎𝑃1 −𝑃2

Se puede probar la diferencia observada a nivel de significancia apropiado y con esto


probar la hipótesis nula. Se pueden hacer pruebas con otros estadísticos de manera similar

BIBLIOGRAFÍA
Caro, R. (13 de 08 de 2015). Matemáticas Aplicadas a las Ciencias Sociales ll. Obtenido de
http://www.apuntesmareaverde.org.es/grupos/mat/Bachillerato/BS2%2009%20Estim
acion.pdf

Cladera, F. (s.f.). Estadística Técnica. Obtenido de Wordpress:


https://fclad.files.wordpress.com/2010/04/esttecn.pdf

Erik Cobo, B. K. (09 de 2014). Intervalos de Confianza. Obtenido de Bioestadística:


https://ocw.upc.edu/sites/all/modules/ocw/estadistiques/download.php?file=715001
/2013/1/54990/08_intervalos_de_confianza-5331.pdf

Ortega. (s.f.). Intervalos de confianza . Obtenido de Estadistica:


https://www.uam.es/personal_pdi/ciencias/ortega/docencia/0910Estadistica/Interval
os_confianza.pdf

Salinas, H. S. (s.f.). Intervalos de confianza. Obtenido de mat.uda.cl:


http://www.mat.uda.cl/hsalinas/cursos/2009/estadistica/semestre%202/intervalos-
confianza.pdf

Spiegel, M. R. (2009). Estadística. México.

Taborga, C. E. (2011). determinación del tamaño muestral. Obtenido de Universidad Privada


Boliviana: ftp://ftp.repec.org/opt/ReDIF/RePEc/iad/wpaper/0311.pdf