Está en la página 1de 64

INSTITUTO TECNOLOGICO

DE CERRO AZUL
INGENIERIA PETROLERA
ASIGNATURA: PROBABILIDAD Y ESTADISTICA AL
CAMPO PETROLERO

TRABAJO:
UNIDAD 3-4-5
DOCENTE: ING. MARY CARMEN BACA GTZ.
4° SEMESTRE
INTEGRANTES: GRUPO: 1
JIMENEZ CRUZ NORA
PONCE BRAVO OLGA VIRIDIANA
ESTEBAN RAMIREZ CARMEN ITZEL

CERRO AZUL, VERACRUZ

MAYO 2016
UNIDAD 3
DISTRIBUCIONES
MUESTRALES
3.1 DISTRIBUCION DE
MEDIAS
• La distribución muestral de la media muestral es
la distribución de los valores de las medias
muestrales de todas las posibles muestras del
mismo tamaño n tomadas de la misma
población.
• Si no conociera la media de la población, 𝜇, se
podrían escoger cono estimador varios
estradisticos; y las primeras que vienen a mente
son la media y la mediana de la muestra .
• Si una muestra aleatoria de n mediciones se
selecciona de una población con media y desviación
estándar, la distribución muestral de la media tendrá
media y desviación estándar.

• Si una población tiene distribución normal la


distribución muestral de la media e distribuirá de
manera exactamente normal, sin importar el tamaño
de la muestra.

• Si la distribución de la población no es normal, la


distribución muestral de la media se destribuira de
manera aproximadamente normal para muestras
grandes ( por el teorema del limite central).
EJEMPLO 1
La esperanza de vida de quienes adquieren Alzheimer
desde el inicio de los síntomas hasta su muerte varia
de 3 a 20 años; el promedio es de 8 años con una
desviación estándar de 4 años. Se seleccionan al azar
expedientes de 30 pacientes que murieron y anota del
tiempo promedio que sobrevivieron. Encontrar la
probabilidad para el siguiente evento: la duración
promedio de la enfermedad es menor de 7 años.

La probabilidad de que la media sea menor que 7. Para


encontrar esta área se necesita calcular el valor de z
que corresponde a x=7:
𝑥−𝜇 7−8
𝑧= 𝜎 = = −1.37
0.73
𝑛
EJEMPLO 2
Para evitar difilcultades con la comisión de comercio federal o las
oficinas de protección al consumidor, estatales y locales un
embotellador debe asegurarse de que las botellas de 12 onzas en
realidad contengan esta cantidad de bebida. Para determinar su
una maquina embotelladora esta trabajando satisfactoriamente, se
muestra al azar 10 botellas por hora y se mida la cantidad. ¿ cual
es la probabilidad aproximada de que la media muestral de las
diez botellas de prueba sea menor que 12 onzas?

La media de lo muestra es idéntica a la media de la población de


botellas llenadas, a saber u= 12.1 y el error estándar es de
𝜎 0.2
SE= = = 0.063
𝑛 10
3.2 DISTRIBUCION DE
VARIANZAS
La varianza de una variable aleatoria discreta X, denotada por
σ2 o V(X), es

La varianza de una variable aleatoria discreta es similar a la


varianza muestral utilizada anteriormente. La varianza de una
variable aleatoria se calcula ponderando el cuadrado de cada
desviación con respecto a la media, con la probabilidad asociada
de la desviación. La probabilidad asociada con una desviación
representa la proporción de un grande de repeticiones del
experimento aleatorio en los que se obtiene dicha desviación.
La desviación estándar de una variable aleatoria X, denotada
por σ, es la raíz cuadrada positiva deσ2.

  v x    2
EJEMPLO
Suponga que la probabilidad de recuperar un automóvil
robado en cierta ciudad es de 0.40.
¿Cuál es la probabilidad de 2 automóviles de los 10
robados?
¿Cuál es la probabilidad de recuperar cuando mucho 3
de los 10 automóviles robados?
¿Cuál es la probabilidad de recuperar por lo menos 7
de los 10 automóviles robados?
n= 10
P= 0.40
X= 2
a)
10 
f (2)   .40  1  .40   450.16 0.60   0.12093
2 10  2 8

2 
b)
 10 
 p  x  0  
0  0 . 40 0
1  0 . 40 10  0
 110 . 60 10
 0.00604
  
 10 
 p  x  1 0.40 1 1  0.40 101  10 0.40 0.60 9  0.04031
 1 
 x  3  
 p  x  2 10 0.40 2 1  0.40 10 2  450.16 0.60 8  0.12093
 2 
  
 10 
 p  x  3  0.40  1  0.40   120 0.064 0.60   0.21499
3 10  3 7

 3 

p  x  3  p  x  0   p  x  1  p  x  2   p  x  3  0.3822
 10 
c)  p  x  10   
10  0 . 40 10
1  0 . 40 1010
 10.00011  0.0001
  
 10 
 p  x  9  0.409 1  0.40109  100.000260.6   0.00156
 9 
p  x  7 
 p  x  810 0.408 1  0.40108  450.0006536  0.01053
 8 
  
 10 
 p  x  7  
7  0 . 40 7
1  0 . 40 10 7
 1200.001630.216  0.04224
  

p  x  7   p  x  10  p  x  9   p  x  8  p  x  7   0.0544
3.3 DISTRIBUCION DE
PROPORCIONES
Existen ocasiones en las cuales no estamos interesados en la
media de la muestra, sino que queremos investigar la
proporción de artículos defectuosos o la proporción de
personas con teléfono, etc en la muestra. La distribución
muestral de proporciones es la adecuada para dar respuesta
a estas situaciones.
Esta distribución se genera de igual manera que la
distribución muestral de medias, a excepción de que al
extraer las muestras de la población s e calcula el estadístico
proporción (p=x/n en donde “ x” es el número de éxitos u
observaciones de interés y “ n” el tamaño de la muestra).
EJEMPLO 1
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos
defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin
reemplazo. Vamos a generar la distribución muestral de proporciones
para el número de piezas defectuosas. Como se puede observar en este
ejercicio la proporción de artículos defectuosos de esta población es P =
4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote
están defectuosas. El número posible de muestras de tamaño 5 a extra er
de una población de 12 elementos es 12 C 5=792, las cuales se pueden
desglosar de la siguiente manera:

Para calcular la media de la distribución muestral de proporciones se


tendría que hacer la sumatoria de la frecuencia por el valor de la
proporción muestral y dividirla entre el número total de muestras.
( 0.8 8 ) ( 0.6 112 ) ( 0.4 336 ) ( 0.2 280 ) ( 0 56 ) 1
𝜇𝑝 = = = 0.333
792 3
EJEMPLO 2

Si de la población de 1000 estudiantes se elige


una muestra aleatoria de 50 estudiantes y en la
misma se seleccionan 20 varones entonces la
proporción muestral resulta ser
𝑁𝐴
P=
𝑁
450
P= = 0.45 = 45%
1000
3.4 DISTRIBUCION DE
DIFERENCIAS
Suponga que se tienen dos poblaciones distintas, la primera con
media y desviación estándaR, y la segunda con mediaN y
desviación estándar . Más aún, se elige una muestra aleatoria de
tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la
media muestral para cada muestra y la diferencia entre dichas
medias. La colección de todas esas diferencias se
llama distribución muestral de las diferencias entre medias o
la distribución muestral del estadístico
EJEMPLO
En un estudio para comparar los pesos promedio de niños y niñas
de sexto grado en una escuela primaria se usará una muestra
aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para
niños como para niñas los pesos siguen una distribución normal. El
promedio de los pesos de todos los niños de sexto grado de esa
escuela es de 100 libras y su desviación estándar es de 14.142,
mientras que el promedio de los pesos de todas las niñas del sexto
grado de esa escuela es de 85 libras y su desviación estándar es
de 12.247 libras. Si representa el promedio de los pesos de 20
niños y es el promedio de los pesos de una muestra de 25 niñas,
encuentre la probabilidad de que el promedio de los pesos de los
20 niños sea al menos 20 libras más grande que el de las 25
niñas.
SOLUCION
Datos:
1 = 100 libras

2 = 85 libras

1 = 14.142 libras

2 = 12.247 libras
n1 = 20 niños
n2 = 25 niñas
p(𝑥1= ?

Por lo tanto, la probabilidad de que el promedio de los pesos de la


muestra de niños sea al menos 20 libras más grande que el de la
muestra de las niñas es 0.1056.
UNIDAD 4

ESTIMACION DE
PARAMETROS
4.1 INTERVALOS DE
CONFIANZA PARA LA MEDIA
• Sea X una variable aleatoria cuya
distribución depende de un parámetro
𝜃 , y sea (𝑋1 , … , 𝑋𝑛 ) una muestra
aleatoria simple de X.
• Si 𝑇1 (𝑋1 , … , 𝑋𝑛 ) y 𝑇2 (𝑋1 , … , 𝑋𝑛 ) son
dos estimadores tales que al intervalo
I = [𝑇1 (𝑋1 , … , 𝑋𝑛 ), 𝑇2 (𝑋1 , … , 𝑋𝑛 )] se le
llama intervalo de confianza para 𝜃
de coeficiente de confianza 1 – 𝛼.
Interpretación: De los distintos intervalos
numéricos construidos a partir de sucesivos
muestreos, un porcentaje del (1 – 𝛼 . )100%
contiene al verdadero valor del parámetro
desconocido 𝜃.
INTERVALO DE CONFIANZA PARA LA MEDIA
Μ DE UNA POBLACIÓN NORMAL CON
DESVIACIÓN TÍPICA CONOCIDA 𝜎

Si partimos de una población que sigue una distribución


Z ~ N(0,1) bastará con encontrar el punto crítico 𝑍𝛼 /2
para tener un intervalo que contenga la media
poblacional con probabilidad c.

p(𝑍𝛼 /2 < Z < 𝑍𝛼 /2) = c


Si en el caso general tomamos:
𝑥−𝜇
𝑍= 𝜎
𝑛
bastará con hacer unas sencillas operaciones para
llegar a que el intervalo de confianza para la media μ de
una población normal con desviación típica conocida σ
es:
𝜎 𝜎
𝑥 − 𝑍𝛼 , 𝑥 − 𝑍𝛼
2 𝑛 2 𝑛
INTERVALO DE CONFIANZA PARA LA
MEDIA Μ DE UNA POBLACIÓN CON
DESVIACIÓN TÍPICA DESCONOCIDA

Cuando se desconoce la desviación típica poblacional


se usa como estimador la desviación típica de la
muestra con lo que el intervalo de confianza para la
media μ de una población con desviación típica
desconocida es:

𝑠 𝑠
𝑥 − 𝑍𝛼 , 𝑥 − 𝑍𝛼
2 𝑛 2 𝑛
EJEMPLO
Se ha obtenido una muestra de 15
vendedores de una Editorial para estimar el
valor medio de las ventas por trabajador en
la Empresa.
La media y varianza de la muestra (en miles
de euros) son 5 y 2, respectivamente.

Intervalo de confianza para la venta media


por trabajador en la Editorial al 90 %.
SOLUCION
1. Intervalo de confianza para la media de ventas por vendedor al
90 %. Usamos la fórmula:
𝑠
𝑥 ± 𝑍𝛼
2 𝑛
Se conoce la varianza de la muestra v (x)= 2, pero necesitamos la
cuasi-varianza 𝑠2 .
2
𝑛 15
𝑠 = 𝑣 𝑥 = 2 = 2,143
𝑛−1 14

Por último, sustituyendo los datos en la fórmula del intervalo,


tenemos:
1,464
5 ± 1,761 ≡ 5 ± 0,666
15
Y, por tanto, una cuasi-desviación típica igual a 𝑠 = 𝑠2 = 1, 464.
Los cuantiles de orden 0.05 y 0.95, que encierran en el centro de la
distribución t de Student con 14 gl. un área igual a 0.9 se muestran
en el gráfico siguiente:
4.2 INTERVALOS DE
CONFIANZA PARA LA
VARIANZA
Si tenemos una muestra de tamaño n tomada de
una población normal, podemos obtener un
intervalo de confianza del nivel dado (90%, 95%,
99%, etc) para la varianza sabiendo que el valor
de chi cuadrada es para este caso:

𝒏 − 𝟏 𝒔𝟐
𝝈𝟐
El cual es una variable aleatoria que tiene una distribución Chi
cuadrada con n -1 grados de libertad. Por lo tanto, podemos
emplear esta definición para estimar un intervalo de confianza ya
que lo que necesitamos es que.
𝟐 𝒏−𝟏 𝒔 𝟐
𝑷 X𝟏−𝜶 < 𝟐
< X𝟏−
𝜶 =𝟏−𝜶
𝟐 𝝈 𝟐

Donde 𝑋2 es el valor de Chi cuadrada para los grados de libertad y


nivel de confianza (1 - α) especificado.

Entonces podemos despejar la varianza 𝜎2 :


𝑷 X𝟐𝟏−𝜶 < 𝝈𝟐 < X𝟐𝟏−𝜶 = 𝟏 − 𝜶
𝟐 𝟐

Donde X𝟐𝟏 𝜶 es el valor de una distribución chi-cuadrado con n − 1


𝟐
grados de libertad que deja a su derecha una probabilidad de α/2.
Por ejemplo, dados los datos siguientes:

Distribución poblacional: Normal


Tamaño de muestra: 10
Confianza deseada para el intervalo: 95 %
Varianza muestral corregida: 38,5

Los valores de Chi cuadrada


X𝟐𝟏−𝜶 X𝟐𝟏𝜶
𝟐 𝟐

Corresponden a lo que se muestra en la siguiente figura (notar


que el valor mayor define el límite de la izquierda del intervalo y
el menor el derecho, ya que están dividiendo).
EJEMPLO
Se construye un intervalo de confianza para la
diferencia en el contenido medio de ortofósforo,
que se mide en miligramos por litro, en dos
estaciones sobre el rio James mediante la
suposición de que las varianzas normales de la
población son diferentes. Justifique esta suposición
mediante la construcción de un intervalo de
𝜎21 𝜎1
confianza del 98% para 𝜎22
y para 𝜎2 , donde 𝜎21
y 𝜎22 son las varianzas poblacionales del contenido
de ortofósforo en la estación 1 y en la estación 2,
respectivamente.
SOLUCION

Tenemos que 𝑛1 = 15, 𝑛2 = 12, 𝑠1 = 3.07, 𝑦 𝑠2 = 0.80. Para un


intervalo de confianza de 98% 𝛼 = 0.02. Encontramos que
𝑓0.01 14,11 ≃ 4.30 𝑦 𝑓0.01 11,14 ≃ 3.87. Por lo tanto, el intervalo
𝜎21
de confianza de 98% para 𝜎22
es
3.072 1 𝜎21 3.072
< < (3.87),
0.802 4.30 𝜎22 0.802

𝜎21
Que se simplifica a 3.425 < < 56.991
𝜎22
Al calcular las raíces cuadradas de los limites de confianza,
𝜎21
encontramos que un intervalo de confianza de 98% para 𝜎22
es.
𝜎21
1.851 < 2 < 7. 549
𝜎2
𝜎21
Como este intervalo no permite la posibilidad de que 𝜎22
sea
igual a 1, es correcto suponer que 𝜎1 ≠ 𝜎2 o 𝜎21 ≠ 𝜎22 .
Hasta este momento todos los intervalos de confianza presentando
son de la forma.
Estimación puntual ± 𝐾 s.e (estimación puntual),
Donde K es una constante (ya sea t o punto porcentual de la
norma). Éste es el caso cuando el parámetro es una medida,
diferencia entre medidas, proporción o diferencia entre
proporciones. Sin embargo, esto no se aplica a varianzas y
razones de varianzas.
4.3 INTERVALOS DE
CONFIANZA DE
PROPORCIONES
Una proporción muestral 𝑃 es un estimador puntual (un número)
de la proporción en la población P .

Un estimador de intervalo de confianza de la proporción en la


población P , es un intervalo, calculado a partir de los datos de la
muestra, en el cual nosotros “confiamos” se encuentra la
proporción de la población P.

El nivel de confianza es la probabilidad de que el método de


estimación nos dé un intervalo que contiene al parámetro ( P en
este caso). El nivel de confianza se denota por 1−α , donde
valores comunes de α son 0,10; 0,05; y 0,01, para una confianza
de 90%, 95%, y 99%.
Para construir intervalos de confianza recordemos
la distribución muestral de la proporción muestral
𝑃(1−𝑃)
𝑃: 𝑝 ~ 𝑁 𝑃, , entonces
𝑛

aproximadamente 95% de los valores de 𝑃


estarán entre dos desviaciones estándar de P .
EJEMPLO
𝑃(1−𝑃)
: 𝑃 ± 1,96 . Esperamos que el 95% de los
𝑛
intervalos de confianza formados por 𝑃±
𝑃(1−𝑃)
1,96 van a contener al parámetro P y 5%
𝑛
no lo van a contener. El problema es que si no
conocemos el parámetro no conocemos la
desviación estándar
SOLUCION
Estimar la desviación estándar, con el error estándar de
𝑃 1−𝑃
𝑆(𝑃) =
𝑛
Un intervalo de 95% de confianza para P esta dado por:

𝑃 1−𝑃
𝑃 ± 1, 96
𝑛
4.4 INTERVALOS DE
CONFIANZA PARA LAS
DIFERENCIAS
Cuando tenemos razones para suponer que la varianza no es
común, no podemos utilizar el estadístico anterior. Hemos de
destacar que, en esta situación, no existe un método exacto que
permita obtener el intervalo de confianza deseado. Lo más que
tenemos son aproximaciones a la solución. Un intervalo
aproximado con nivel de confianza (1 − α) · 100 % es.
𝑠1 𝑠2 𝑠1 𝑠2
𝑥 − 𝑥 − 𝑧𝛼 ∙ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥 − 𝑥 + 𝑧𝛼 ∙ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde Ŝ1 y Ŝ2 son las varianzas muéstrales corregidas para cada
población y donde tα/2 es el valor de una distribución t de Student
con g grados de libertad, donde.
2
𝑆21 𝑆22
𝑛1 + 𝑛2
𝑔= 2 2
−2
𝑆21 𝑆22
𝑛1 𝑛2
+
𝑛1 + 1 𝑛2 + 1

Si los grados de libertad resultantes son decimales, puede


optarse por hacer una interpolación entre los dos valores enteros
más cercanos o bien por tomar el valor más desfavorable, aquel
que suponga un radio mayor para el intervalo de confianza y que
coincide con el redondeo a la baja de los grados de libertad.
Es, por tanto, muy importante, antes de proceder a la obtención
del intervalo de confianza para la diferencia de medias, verificar
si la suposición de homogeneidad de varianzas es razonable o
no. Una manera de verificarlo consiste en la construcción del
intervalo para el cociente de varianzas, tal como se explica más
adelante, y comprobar si en dicho intervalo está incluido el valor
1. La inclusión de la unidad dentro del intervalo resultante, la
debemos interpretar en el sentido de que la muestra no
proporciona evidencia suficiente para afirmar que las varianzas
son diferentes y, por tanto, no es incorrecta la utilización del
intervalo para varianza común. De manera análoga, el intervalo
de confianza para la diferencia de medias nos puede servir para
verificar la suposición de que las medias son iguales o
diferentes; en este caso, si el valor 0 está incluido en el
intervalo, la conclusión es que la muestra no proporciona
evidencia suficiente para afirmar que las medias son diferentes.
EJEMPLO
UNIDAD 5

PRUEBAS DE
HIPOTESIS
5.1 PRUEBA DE HIPOTESIS
PARA LA MEDIA
• Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una de una
población con media µ 𝑥 y varianza 𝜎2𝑥 . Si el tamaño de la
muestra es grande y 2𝜎2𝑥 es conocida, el Teorema Central
𝑥− 𝜇 𝑎𝑝𝑟𝑜𝑥
del Límite garantiza que 𝜎𝑥 𝑛 + ∞. Y de esta
𝑛
manera un Intervalo de confianza aproximado al 100 1( −
α)% para µ 𝑥 es de la forma:
𝜎𝑥 𝛼
𝑥 ± 𝑧𝛼 2 , Donde 𝑃 𝑍 > 𝑧𝛼 2 =
𝑛 2
Si 𝜎2𝑥 es desconocida, esta es estimada usando la varianza
Muestral:
1
𝑆2𝑥 = 𝑛
𝑖=0 𝑥1 − 𝑥 2 y un Intervalo de Confianza aproximado al
𝑛−1
𝜎𝑥
100 1( − α) % para µ 𝑥 es de la forma; 𝑥 ± 𝑧𝛼 2 Si µ0 es un valor
𝑛
particular para µ𝑥 , podemos establecer tres hipótesis alternativas
respecto al valor real de µ :

𝐻𝑎 : 𝜇𝑥 < 𝜇𝑜
𝐻𝑜 : 𝜇 𝑥 = 𝜇𝑜 VS 𝐻𝑎 : 𝜇𝑥 > 𝜇𝑜
𝐻𝑎 : 𝜇𝑥 ≠ 𝜇𝑜

𝑥− 𝜇 𝑥
Estadístico de prueba: 𝑍𝑐 = 𝑠𝑥
𝑛
𝑅. 𝐶 = 𝑍𝑐 𝑍𝑐 < −𝑧𝛼
𝑅. 𝐶. = 𝑍𝑐 𝑍𝑐 > 𝑧𝑐

𝑅. 𝐶. = 𝑍𝑐 𝑍𝑐 < 𝑧𝛼 2
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIA

Si lo que se desea es comparar el comportamiento promedio de


una misma característica en dos poblaciones diferentes, cuando
los tamaños de muestra son pequeños, no podemos usar el
Teorema Central del Límite para construir un Estadístico de
Prueba adecuado.
De nuevo, supongamos que 𝑋1 , 𝑋2 , … , 𝑋𝑛 es una muestra aleatoria
de una población normal con media 𝜇𝑥 y varianza 𝜎2𝑥 𝑌1 , 𝑌2,…, 𝑌𝑛
es otra muestra aleatoria de otra población normal con media 𝜇𝑦 y
la varianza 𝜎2𝑦 , donde 𝜎2𝑥 y 𝜎2𝑦 son desconocidas y ambas
muestras independientes entre sí.
5.2 PRUEBA DE HIPOTESIS
PARA LA VARIANZA
𝐻𝑜 : 𝜎 2 ≥ 𝜎02

𝐻𝑜 : 𝜎2 = 𝜎20

𝐻𝑎 : 𝜎2 > 𝜎20

𝐻𝑜 : 𝜎2 ≤ 𝜎20

𝐻𝑎 : 𝜎2 < 𝜎20
𝐻𝑎 : 𝜎2 ≠ 𝜎20
Con para 𝜎20 denotar el valor hipotético de la varianza poblacional,
las tres formas de una prueba de hipótesis son:

 Estas tres pruebas son semejantes a las pruebas de hipótesis


de las sesiones anteriores, para pruebas de una o dos colas para
medias y proporciones poblacionales.
En una prueba de hipótesis para la varianza poblacional se
emplean el valor hipotético de la varianza poblacional 𝜎20 y la
varianza muestral 𝑆2 para calcular el valor estadístico de prueba 𝑋2 .
Si la población tiene una distribución normal, el estadístico de
prueba es el siguiente:
ESTADISTICO DE PRUEBA DE HIPOTESIS PARA LA VARIANZA
POBLACIONAL.
2 𝑛 − 1 𝑠2
𝑋 =
𝜎20
Donde 𝑋2 tiene una distribución chi-cuadrada con n-1 grados de
libertad
Una vez calculado el estadístico de prueba 𝑋2 , para determinar si
se acepta o se rechaza la hipótesis nula se encuentra el valor
crítico y se realiza la comparación.
EJEMPLO
La St. Louis Metro Bus Company de Estados Unidos,
desea dar una imagen de confiabilidad haciendo que sus
conductores sean puntuales en los horarios de llegada a
las paradas. La empresa desea que haya poca
variabilidad en dichos tiempos. En términos de la
varianza de los tiempos de llegada de las paradas, la
empresa desea que la varianza sea de 4 minutos o
menos. Esta prueba de hipótesis se realiza con un nivel
de significancia de α = 0.05
Asuma que en una muestra aleatoria de 24 llegadas a
cierta parada en una intersección en el centro de la
ciudad, la varianza muestral encontrada es 𝑠2 =4.9
Paso 1: Formular las hipótesis
𝐻 𝑜 : 𝜎2 ≤ 4
𝐻𝑎 : 𝜎2 > 4

Paso 2: Nivel de significancia de α = 0.05, como la prueba es de


una sola cola (la del lado derecho), se considera una distribución
𝑋2
Paso 3: Obtenemos el valor critico 𝑋𝑐2 utilizando la tabla de
valores de esta distribución:
 Grados de libertad = n-1= 24 – 1 = 23 (renglones de
tabla).
 Probabilidad: nivel de significancia α = 0.05 (columnas de
tabla).
 Buscando estos valores en la tabla tenemos que
𝑋𝑐2 =35.172.

Paso 4: Calcular el estadístico de prueba 𝑋𝑝2

2
𝑛 − 1 𝑠 (24 − 1)(4.9)
𝑋2 = 2 = = 28.18
𝜎0 4
Si el estadístico de prueba es menor que el valor crítico, se
rechaza 𝐻0 , de manera contraria se acepta. Por lo tanto para esta
prueba, tenemos que: 28.18 < 35.172, se rechaza 𝐻0

Paso 5: Se concluye que existe evidencia suficiente para rechazar


𝐻0 , en tal caso habrá que tomar medidas para reducir la varianza
poblacional.
5.3 PRUEBA DE HIPOTESIS DE
PROPORCIONES
Cuando el objetivo del muestreo es evaluar la validez de una
afirmación con respecto a la proporción de una población, es
adecuado utilizar una prueba de una muestra.
La metodología de prueba depende de si el número de
observaciones de la muestra es grande o pequeño.

Como se habrá observado anteriormente, las pruebas de


grandes muestras de medias y proporciones son bastante
semejantes. De este modo, los valores estadísticos de prueba
miden la desviación de un valor estadístico de muestra a partir
de un valor propuesto. Y ambas pruebas se basan en la
distribución normal estándar para valores críticos. Quizá la única
diferencia real entre las ambas radica en la forma corno se
obtiene la desviación estándar de la distribución de muestreo
Esta prueba comprende el cálculo del valor estadístico de prueba
Z
Posteriormente este valor es comparado con el valor de Z,
obtenido a partir de una tabla normal a un nivel de significación
seleccionado.
Como ocurrió con la prueba de medias de una muestra, las
pruebas de proporciones pueden ser de una o dos colas.

La primera alternativa establece una prueba de cola derecha,


la segunda, izquierda y la tercera, una prueba de dos colas
EJEMPLO
En un estudio se afirma que 3 de 10 estudiantes
universitarios trabajan. Pruebe esta aseveración, a un
nivel de significación de 0,025, respecto a la alternativa
de que la proporción real de los estudiantes
universitarios trabajan es mayor de lo que se afirma, si
una muestra aleatoria de 600 estudiantes universitarios
revela que 200 de ellos trabajan. La muestra fue
tomada de 10000 estudiantes.
Los datos son:
Como en los datos aparece el tamaño de la población, se debe
verificar si el tamaño de la nuestra es mayor que el 5%. Se
remplaza valores en la siguiente fórmula:
5.4 PRUEBA DE HIPOTESIS
PARA LAS DIFERENCIAS
Para resolver pruebas de hipótesis para la diferencia
de proporciones en muestras grandes, podemos
basarnos en la distribución en el muestreo de las
diferencias de proporciones utilizando la distribución
normal y el proceso que debemos seguir es muy
similar al utilizado para el caso de la media. Para
mejor comprensión, en el caso de pruebas bilaterales
y unilaterales, el estudiante debe remitirse a las
páginas 217 y 218 y hacer las mismas reflexiones con
fundamento en los gráficos, pero teniendo en cuenta
que el estadístico en éste caso es la diferencia de
proporciones muestrales y no la media muestral
La hipótesis nula puede plantearse como H0: P1 - P2=0
ó H0:P1=P2 y en ambos casos, la hipótesis alternativas
podrían ser: HA: P1 - P  0 ó HA: P1 -P2 >0 ó HA: P1 -
P230 y n2=300>30, por lo cual según el teorema
central del límite, las diferencias de las proporciones
muestrales se distribuirán aproximadamente como una
distribución normal.
EJEMPLO
Una compañía asegura que el mercado para su producto X tiene
una aceptación de iguales proporciones en la ciudad A que en la
ciudad B. Un especialista en mercado pone en duda dicha
afirmación y para tal fin tomó una muestra aleatoria de 500 amas
de casa en la ciudad A y encontró que el 59.6% de las mismas
prefería el artículo X. Por otra parte tomó una muestra aleatoria de
300 amas de casa en la ciudad B y encontró que el 50% de las
mismas preferían el artículo X. ¿Existe una diferencia real entre las
dos ciudades? Nivel de significación 5%
1) Hipótesis nula e hipótesis alternativa: H0: PA=PB, Ha:
PA  PB. La prueba es bilateral, puesto que el
especialista en mercado no está afirmando que ciudad
tiene más proporción que la otra.

2) Nivel de significación:   05.0

3) Criterio de decisión: Como las diferencias de las


proporciones muestrales se distribuyen normalmente y la
prueba es bilateral, entonces, según las tabla el valor de z
es:  96.1 . Por lo tanto, el criterio de decisión será el
siguiente: “Si el valor de Z calculado es mayor que +1.96 ó
menor que –1.96, se rechaza la hipótesis nula de que la
proporción es idéntica en ambas ciudades.
4) Cálculo del estadístico sobre el cual se basará la decisión:
n1=500, p1=0.596, n2=300, p2 =0.50. Según la fórmula 6.14 de la
página 174 en la distribución en el muestreo de la diferencia de
proporciones, el correspondiente valor de z
será: 65.2 300 50.0*50.0 500 404.0*596.0 0)50.0596.0(     Z 
5) Tomar la decisión: Como el valor de Z calculado (+2.65) se
encuentra en la zona de rechazo, entonces, con un nivel de
significación del 5%, debemos rechazar la hipótesis nula de que las
proporciones en ambas ciudades son iguales.

También podría gustarte