Está en la página 1de 38

Gua de la Unidad III Fernando A. Contreras J.

0
















































GUA DE LA UNIDAD # 3
Fecha: 6 de Abril del 2011 Fernando A. Contreras J.
Gua de la Unidad III Fernando A. Contreras J.

1

Estadstica Inferencial

La estadstica inferencial es aquella parte de la estadstica que genera conclusiones
sobre la totalidad de las observaciones en estudio (Poblacin) a partir de la informacin
parcial e incompleta suministrada por un conjunto de observaciones que son parte de la
poblacin (Muestra).











Un buen mecanismo para tomar muestras es a travs de la introduccin de un mtodo al
azar. En este caso a las muestras seleccionadas, se les denomina muestras aleatorias



































Poblacin Fsica
Muestra
La muestra se toma de la poblacin fsica a
travs de algn mecanismo de muestreo. Luego,
de acuerdo a la caracterstica medible de la
poblacin fsica de la cual se tiene un inters
para su estudio, sta es analizada en la
muestra tomada a partir de los datos obtenidos
en la misma. Este anlisis se hace a travs de
la tabulacin, el clculo de estimadores y de
representaciones grficas, con el fin generalizar
los resultados obtenidos a toda la poblacin de
donde se extrajo la muestra.
Gua de la Unidad III Fernando A. Contreras J.

2

El objetivo fundamental de la estadstica es generar conclusiones sobre la totalidad de
las observaciones en estudio (poblacin) a partir de la informacin parcial e incompleta
suministrada por un conjunto de observaciones que son parte de la poblacin (muestra).
La muestra es tomada de la poblacin a travs de algn mecanismo de muestreo, luego
esta se tabula, se grafica y analiza con el fin de generalizar los resultados a toda la
poblacin en estudio. El proceso de generalizacin se conoce con el nombre de inferencia
estadstica. Este proceso permite generar conclusiones a partir de pocos datos. El
primer paso hacia una inferencia estadstica consiste en la forma de tomar la muestra.
Normalmente, una tcnica de muestreo va procedida por un mecanismo aleatorio o al
azar; se dice que la muestra es aleatoria cuando en trminos generales cualquier
elemento de la poblacin tiene la misma posibilidad de pertenecer a ella.


Intervalos de Confianza














= Media poblacional X = Media muestral
o
2
= Varianza poblacional S
2
= Varianza muestral
p

= Proporcin de xitos Poblacional p

= Proporcin de xitos Muestral
El objetivo de la inferencia estadstica es aproximarse a partir de los estimadores
poblacionales X , S
2
y p
, a los parmetros poblacionales , o
2
y p. Para este
propsito hay dos formas de actuar: 1) A travs de intervalos de confianza y 2) A travs de
un contraste de hiptesis estadstica.


Intervalos de Confianza para la Media de una Poblacin Normal

A partir de una muestra aleatoria X1, X2, X3, . . ., Xi, . . ., Xn se calcula el
estimador de ; es decir:

n
x
X
n
i
i
=
= =
1

Gua de la Unidad III Fernando A. Contreras J.

3

Si se conoce la desviacin estndar poblacional o, se usa la distribucin normal.
Luego, la media poblacional se encontrar en el intervalo:

|
|
.
|

\
|

n
Z
X
t
o
< < |
.
|

\
|
+
n
Z
X
t
o
; lo cual es asegurado con un % de confianza




R

|
|
.
|

\
|

n
Z
X
t
o
X |
.
|

\
|
+
n
Z
X
t
o


n
Z
t
o
o = ; de ah que la longitud del intervalo de confianza es: l = 2o
Para buscar Zt en la tabla de la curva normal estandariza, se busca en
su interior el nmero ms aproximado a
2
1


+ ; que representa el rea bajo
la curva que la recta vertical Zt deja a la izquierda.

Si se no conoce la desviacin estndar poblacional o, se calcula o = S a partir
de la muestra aleatoria en donde se calcul la media y se usa la distribucin
t-student con v = n 1. Luego, la media poblacional se encontrar en el intervalo:

|
.
|

\
|

n
S t
X
t
< < |
.
|

\
|
+
n
S t
X
t
; lo cual es asegurado con un % de confianza




R
|
.
|

\
|

n
S t
X
t
X |
.
|

\
|
+
n
S t
X
t

n
S t
t
= o ; de ah que la longitud del intervalo de confianza es: l = 2o


Ejemplo 1: La concentracin promedio de Oro que se saca de una de las
ramificaciones del Ro Orinoco en 36 sitios diferentes es de 2.3 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la
concentracin media de Oro en las ramificaciones del ro Orinoco mencionada.
Suponga que la desviacin estndar poblacional de la concentracin de Oro en
estas ramificaciones del ro es 0.29. Determine tambin la longitud del intervalo
de confianza en cada caso.
o o
o o
Gua de la Unidad III Fernando A. Contreras J.

4

Desarrollo

La estimacin puntual de es X = 2.3; se tiene que o = 0.29 y n = 36.

I) Dado que % = 95%; el valor de Zt que deja un rea de 0.95 + 0.025 = 0.975
a la izquierda es Zt = 1.96.












De ah que el intervalo de confianza de 95% es:




2.3
36
) 29 . 0 )( 96 . 1 (
; es decir: 2.21 < < 2.40






R
2.3 (0.095) 2.3 2.3 + (0.095)




Se concluye que la media de la poblacin est en el intervalo (2.21 , 2.40); es
decir, 2.21 < < 2.40 lo cual es asegurado con un 95% de confianza.

La longitud del intervalo de confianza es: l = 2o = 2(0.095) = 0.19 gramos por mililitro.


II) Dado que % = 99%; el valor de Zt que deja un rea de 0.99 + 0.005 = 0.995
a la izquierda es Zt = 2.575.


o = 0.095
2.21 2.40
o o
Gua de la Unidad III Fernando A. Contreras J.

5












De ah que el intervalo de confianza de 99% es:




2.3
36
) 29 . 0 )( 575 . 2 (
; es decir: 2.18 < < 2.43







R

2.3 (0.125) 2.3 2.3 + (0.125)






Se concluye que la media de la poblacin est en el intervalo (2.18 , 2.43);
es decir, 2.18 < < 2.43 lo cual es asegurado con un 99% de confianza.

La longitud del intervalo de confianza es: l = 2o = 2(0.125) = 0.25 gramos por
mililitro.

Ntese que para estimar a con un porcentaje (%) ms alto de precisin, se requiere de
un intervalo ms grande.

Ejemplo 2: Determine intervalos con niveles de 80%, 90% y 95% de confianza para
estimar la estatura promedio de los estudiantes de Estadstica de la Universidad Nacional
Experimental del Tchira. Utilice los datos de la tabla del Ejemplo 2 de la gua del
Trabajo de Estadstica Descriptiva.
o = 0.125
2.18 2.43
o o
Gua de la Unidad III Fernando A. Contreras J.

6

Desarrollo

La estimacin puntual de es X = 1.682; se calcula S
2
y se obtiene que S = 0.066
y n = 11.

1.) Para un 80% de confianza se tiene:















De ah que el intervalo de confianza de 80% es:




1.682
11
) 066 . 0 )( 372 . 1 (
; es decir: 1.655 < < 1.709






R

1.682 (0.0273) 1.682 1.682 + (0.0273)






Se concluye que la media de la poblacin est en el intervalo (1.655 , 1.709);
es decir, 1.655 < < 1.709 lo cual es asegurado con un 80% de confianza.


La longitud del intervalo de confianza es: l = 2o = 2(0.0273) = 0.0546 metros.

o = 0.0273
1.655 1.709
o o
Gua de la Unidad III Fernando A. Contreras J.

7

2.) Para un 90% de confianza se tiene:






















De ah que el intervalo de confianza de 90% es:





1.682
11
) 066 . 0 )( 812 . 1 (
; es decir: 1.646 < < 1.718.







R

1.682 (0.0361) 1.682 1.682 + (0.0361)






Se concluye que la media de la poblacin est en el intervalo (1.646 , 1.718);
es decir, 1.646 < < 1.718 lo cual es asegurado con un 90% de confianza.


La longitud del intervalo de confianza es: l = 2o = 2(0.0361) = 0.0721 metros.

o = 0.0361
1.646 1.718
o o
Gua de la Unidad III Fernando A. Contreras J.

8

2.) Para un 95% de confianza se tiene:























De ah que el intervalo de confianza de 95% es:





1.682
11
) 066 . 0 )( 228 . 2 (
; es decir: 1.638 < < 1.726.







R

1.682 (0.0443) 1.682 1.682 + (0.0443)





Se concluye que la media de la poblacin est en el intervalo (1.638 , 1.726);
es decir, 1.638 < < 1.726 lo cual es asegurado con un 95% de confianza.


La longitud del intervalo de confianza es: l = 2o = 2(0.0442) = 0.0887 metros.
o = 0.0443
1.638 1.726
o o
Gua de la Unidad III Fernando A. Contreras J.

9

La longitud l del intervalo de confianza depende fundamentalmente del nivel de
confianza (%) y del tamao de la muestra n; esto es, si se aumenta el nivel de
confianza % para un tamao n de muestra fijo, la longitud del intervalo de confianza
aumenta; y si se aumenta el tamao de la muestra n, se logra reducir el tamao del
intervalo de confianza %.

Una estimacin es ms precisa cuando el intervalo de confianza es pequeo



Intervalo de Confianza para Proporciones

Se analizar el Intervalo de Confianza para p de una muestra grande (n > 30).
Si p es la proporcin de xitos en una muestra aleatoria de tamao n; y q = 1 p ,
un intervalo de confianza de % para el parmetro binomial p esta dado por:


n
q p
Z p
t

< p <
n
q p
Z p
t

+ ; lo cual es asegurado con un % de confianza





R

n
q p
Z p
t

p
n
q p
Z p
t

+


n
q p
Z
t

= o ; de ah que la longitud del intervalo de confianza es: l = 2o.



# de xitos en la muestra
Donde p =
n


Ejemplo 3: En una muestra aleatoria de 550 familias (n = 550) que tienen televisores
en la ciudad de San Cristbal se encuentra que 345 estn suscritas a canales a travs de
cable. Encuentre un intervalo de confianza del 95% para la proporcin real de familias en
esta ciudad que estn suscritas a canales a travs de cable.

Desarrollo

La estimacin puntual de p es p = 345 / 550 = 0.63, q = 1 p = 1 0.63
= 0.37; luego el intervalo de confianza del 95% (% = 95%) est dado por:

o o
Gua de la Unidad III Fernando A. Contreras J.

10















El intervalo de confianza de 95% queda:




(0.63)(0.37)
0.63 1.96 0.59 < p < 0.67
550







R

0.63 (0.04) 0.63 0.63 + (0.04)




Se concluye que la proporcin real de familias (p) en esta ciudad que estn
suscritas a canales a travs de cable est en el intervalo (0.59 , 0,67); es decir,
0.59 < p < 0.67 lo cual es asegurado con un 95% de confianza.



Intervalo de Confianza para la Varianza de una Poblacin Normal"

Si S
2
es la varianza de una muestra aleatoria de tamao n de una poblacin normal,
un intervalo de confianza de % = (1 o)% para o
2
es:


( )
2
2
2
1
o
_
S n
< o
2
<
( )
2
1
2
2
1
o
_

S n

Donde _
2
o/2 y _
2
(1 o/2) son valores de _
2
con v = n 1 grados de libertad,
que dejan reas de o/2 y (1 o/2), respectivamente a la derecha.
o = 0.04
0.59 0.67
o o
Gua de la Unidad III Fernando A. Contreras J.

11














Ejemplo 4: Considrese los pesos en Kg. de 10 bultos de cambures distribuidos por
cierta compaa:

Pesos 46.4 46.1 45.8 47.0 46.1 45.9 45.8 46.9 45.2 46.0

Encuentre un intervalo de confianza de 95% para la varianza de todos los bultos de
cambures que distribuye esta compaa. Suponga que el peso de los bultos se distribuye
en forma aproximadamente normal.

Desarrollo

Se tiene % = (1 o)% = 95% y n = 10. De ah que v = 10 1 = 9 grados de
libertad.


1 (461.2)
2

Por otro lado S
2
= (21273.12) = 0.286
10 1 10




















De ah que el intervalo de confianza para o
2
es:

= 1 o
o/2
o/2
0
_
2


_
2
(1 o/2) _
2
o/2
Gua de la Unidad III Fernando A. Contreras J.

12

(10 1)(0.286)

(10 1)(0.286)
< o
2
<
19.023 2.700

Es decir, 0.135 < o
2
< 0.953. Se concluye que la varianza de la poblacin o
2
se encuentra entre 0.135 y 0.953 y esto se puede asegurar con un 95% de confianza.



Contraste de Hiptesis Estadstica

Una hiptesis estadstica es una aseveracin o conjetura con respecto a una o ms
poblaciones.
















Estructura de un Contraste de Hiptesis Estadstica

Hiptesis Nula (H0): es una afirmacin sobre una o ms poblaciones estadsticas que
lleva intrnsecamente el concepto de igualdad.



Hiptesis Alternativa (H1): Es aquella afirmacin que es verdadera cuando la
hiptesis nula (H0) es falsa.

Ejemplo 5:

H0: La media de esta poblacin es igual a 68 ( = 68)
H1: La media de esta poblacin no es igual a 68 ( = 68)

H0: La varianza de esta poblacin es igual a 5 (o = 5)
H1: La varianza de esta poblacin es mayor a 5 (o > 5)

H0: La proporcin de xitos de esta poblacin es igual a 0.7 (p = 0.7)
H1: La proporcin de xitos de esta poblacin es menor a 0.7 (p < 0.7)

Poblacin
Estadstica
La media de esta poblacin es igual a 68
La varianza o
2
de esta poblacin es igual a 3.7
La proporcin p de esta poblacin es igual a
X
Gua de la Unidad III Fernando A. Contreras J.

13

3) Prueba de Hiptesis Estadstica: Es un planteamiento que permite tomar la
decisin frente a un contraste de hiptesis estadstica entre H0 y H1; es decir, es un
criterio que permite rechazar o aceptar H0; a partir de una muestra aleatoria de
tamao n.


Regin de Aceptacin de H0 Regin de Rechazo de H0



En la prctica si se quiere realizar un contraste de hiptesis estadstica, se elige el
nivel de significancia o y la prueba a utilizar depender de la hiptesis alterna (H1).


Prueba de las dos colas: Es la ms potente.











Prueba de una cola por la derecha











Prueba de una cola por la izquierda










Regin de Rechazo
o/2
Vc
Regin de Rechazo Regin de Aceptacin

o/2
H0 : =

H1 : = (< >)
Regin de Rechazo Regin de Aceptacin

o
H0 : =

H1 : >
Regin de Rechazo
o
Regin de Aceptacin

H0 : =

H1 : <
Gua de la Unidad III Fernando A. Contreras J.

14

Prueba de Hiptesis sobre la Media de una Poblacin Normal

Las Hiptesis que se plantean son:



H0:
X

= 0


X

= 0
H1:
X

> 0

X

< 0





Se toma una muestra de tamao n



Si o es conocida; se trabaja con la normal estndar (Z); y el estadstico de
prueba para Zc = Zcalculada es:
n
X
Z
c
o

=


















Si o no es conocida; se trabaja con la t student (t) con v = n 1; y el
estadstico para tc = tcalculada es:
n
S
X
t
c
0

=


X ~ Normal



X
-

-

-

-

-
S
Z
Zt Zt
Suponiendo que se realiza una prueba de las dos colas
Regin de Rechazo
o/2
Regin de Rechazo
Regin de Aceptacin

o/2
Se calcula la media
y la desviacin
estndar de la
muestra.
X
oX
X

Luego

Si Zc e regin de rechazo, entonces rechazo a H0.
Si Zc e regin de aceptacin, entonces acepto a H0.
Gua de la Unidad III Fernando A. Contreras J.

15


















Ejemplo 6: Se toma una muestra aleatoria del nmero de 98 muertes en San Cristbal
el ao pasado la cual da un promedio de vida de 67.5 aos. Suponga que la desviacin
estndar poblacional es 7.8 aos. Es mayor a 65 aos el promedio de vida en San
Cristbal hoy en da? Utilice un nivel de significancia de 0.05.

Desarrollo

Tabla de Datos
n = 98 Muertes
X = 67.5 Aos
o = 7.8 Aos
o = 5%



Para contrastar estas hiptesis se ha tomado una muestra de tamao n = 98

Se plantean las hiptesis:

H0 : X = 0 = 65 Aos
H1 : X = 1 > 65 Aos

Como o es conocida; se trabaja con la distribucin normal estandarizada Z; y el
estadstico para Zc = Zcalculada es:


n
X
Z
X
C
o

0

= =
98
8 . 7
65 5 . 67
= 3.17

t
tt tt
Suponiendo que se realiza una prueba de las dos colas

Regin de Rechazo
o/2
Regin de Rechazo Regin de Aceptacin

o/2
Luego

Si tc e regin de rechazo, entonces rechazo a H0.
Si tc e regin de aceptacin, entonces acepto a H0.
Gua de la Unidad III Fernando A. Contreras J.

16

















Luego como Zc e Regin de Rechazo, entonces se Rechaza a H0 (se acepta a
H1) y se concluye con un nivel altamente significativo que existe suficiente evidencia
estadstica (muestral) para decir que el promedio de vida en San Cristbal es mayor a 65
aos.

Ejemplo 7: El tiempo promedio de inscripcin de los estudiantes de un ciclo bsico es
aproximadamente de 50 minutos. Se quiere implementar un nuevo proceso de inscripcin
computarizado que ocupe menos tiempo, lo que naturalmente requiere de ciertos gastos
de inversin en implementos y en adiestramiento del personal. Con el fin de tomar la
decisin correcta se toma una muestra de 25 estudiantes y el promedio de tiempo
gastado fue de 46 minutos con una desviacin estndar de 10 minutos. Si se toma
un nivel de significancia de 10% recomendara usted el nuevo sistema?. Y si se
toma o = 5% y o = 1%, emita conclusiones.

Desarrollo

Tabla de Datos
X = 50 Minutos
n = 25 Estudiantes
X = 46 Minutos
S = 10 Minutos
o = 10% o = 5% o = 1%


Se plantean las hiptesis:

H0 : X = 0 = 50
H1 : X = 1 < 50

El nuevo sistema es mejor si ste utiliza un menor tiempo promedio. Es decir, si en
promedio el tiempo es menor a 50 minutos (X < 50); pero si en promedio el tiempo es
mayor o igual a 50 minutos (X > 50) el nuevo sistema no es mejor que el existente.
Gua de la Unidad III Fernando A. Contreras J.

17


Para determinar cual sistema es mejor, se decidir con una prueba de hiptesis. Dado
que o no es conocida se calcula S de la muestra y se trabaja con t student con
v = n 1 = 25 1 = 24 grados de libertad. Y el estadstico de prueba a calcular es:


tc = 2.00



Para un nivel de significancia de o = 10%.














Luego tc = 2.00 est en la regin de rechazo; es decir, tc e Regin de Rechazo
Para o = 10% se rechaza a H0. De acuerdo a lo anterior, como se rechaza a H0, se acepta
a H1 y se concluye que con 10% de significacin, existe suficiente evidencia estadstica
muestral para decir que el nuevo sistema de inscripcin es mejor que el antiguo sistema
de inscripcin. Se dice que el nuevo sistema de inscripcin es significativamente mejor
que el antiguo sistema de inscripcin.


Para un nivel de significancia de o = 5%.












Gua de la Unidad III Fernando A. Contreras J.

18

Luego tc = 2.00 est en la regin de rechazo; es decir, tc e Regin de Rechazo
Para o = 5% se rechaza a H0. De acuerdo a lo anterior, como se rechaza a H0, se acepta a
H1 y se concluye que con 5% de significacin que existe la suficiente evidencia estadstica
muestral para decir que el nuevo sistema de inscripcin es mejor que el antiguo sistema
de inscripcin. Se dice que el nuevo sistema de inscripcin es altamente
significativamente mejor que el antiguo sistema de inscripcin.


Para un nivel de significancia de o = 1%.












Luego tc = 2.00 est en la regin de aceptacin; es decir, tc e Regin de
Aceptacin Para o = 1% se acepta a H0. De acuerdo a lo anterior, como se acepta a H0,
se concluye que con 1% de significacin que no existe suficiente evidencia estadstica
para decir que el nuevo sistema de inscripcin es mejor que el antiguo sistema de
inscripcin. Se dice que el nuevo sistema de inscripcin no es mejor que el antiguo
sistema de inscripcin.


Prueba de Hiptesis sobre la Varianza de una Poblacin Normal

Las Hiptesis que se plantean son:



H0: o
2
= o0
2


o
2
= o0
2

H1: o
2
> o0
2

o
2
< o0
2







Se trabaja con la distribucin ji cuadrada _
2
con v = n 1 grados de libertad con
un nivel de significancia o; donde el estadstico para _
2
c = _
2
calculado es:
Se calcula la
desviacin
estndar de la
muestra.
X ~ Normal

oX

X X
-
-
-
-
-
-
-
-
S
Se toma una muestra de tamao n


Gua de la Unidad III Fernando A. Contreras J.

19

( )
2
0
2
2
1
o
_
S n
c

=













0





Luego
Si _
2
c e Regin de Rechazo, entonces Rechazo a H0.
Si _
2
c e regin de Aceptacin, entonces Acepto a H0.


Ejemplo 8: Un fabricante de motores para vehculos televisor afirma que la duracin de
sus motores se distribuye de forma aproximadamente normal con una desviacin
estndar igual a 0.9 aos. Si una muestra aleatoria de 10 motores tiene una desviacin
estndar de 1.4 aos, considera que la desviacin estndar del tiempo de duracin de
sus motores es mayor a 0.9 aos (o > 0.9 aos)? Utilice un nivel de significancia de 0.05.


Desarrollo


Tabla de Datos
o = 0.9 Aos
n = 10 Motores
S = 1.4 Aos
o = 0.05


I) Se plantean las hiptesis:

H0: o
2
= o0
2
= 0.81
H1: o
2
= o1
2
> 0.81


o/2
o/2
_
2
(1 o/2)
_
2
o/2
Regin de Rechazo
Regin de Aceptacin Regin de Rechazo
Suponiendo que se realiza una prueba de las dos colas

_
2

Gua de la Unidad III Fernando A. Contreras J.

20

II) Se trabaja con la distribucin ji cuadrada _
2
con v = n 1 grados de libertad con
un nivel de significancia de o = 0.05; donde estadstico para _
2
c = _
2
calculado es:

(n 1)S
2
(10 1)(1.4)
2

_
2
c = = = 21.8
o0
2
(0.81)


Con v = n 1 = 10 1 = 9 grados de libertad.















0 _
2






Luego como _
2
c e Regin de Rechazo, entonces Se Rechaza a H0 y se concluye
con un nivel de significancia de 0.05 que existe evidencia estadstica muestral para
decir que la desviacin estndar de la poblacin es mayor a cero punto nueve aos; es
decir, o > 0.9 aos.


Si se tiene una muestra grande (n > 30) y las hiptesis que se plantean son:









Se calcula el estadstico de prueba Zc de Z; es decir,
n
S
Z
c
2
0
0
o
o
= , es un
valor de una variable aleatoria cuya distribucin de muestreo es aproximadamente la
distribucin normal estndar.

o = 0.05
_
2
o
= 16.919
Regin de Aceptacin Regin de Rechazo
H0: o
2
= o0
2

o
2
= o0
2

H1: o
2
< o0
2

o
2
> o0
2

Gua de la Unidad III Fernando A. Contreras J.

21

Prueba de Hiptesis de una Proporcin

Se considerar el problema de probar la hiptesis de que la proporcin de xitos de
un experimento binomial p es igual a un valor especfico p0. Supngase que se toma
una muestra grande (n > 30) y la probabilidad de xito es pequea (p 0). Se trabaja
con la normal Z; y el estadstico de prueba para Zc = Zcalculada es:
0 0
0
q np
np x
Z
c

=
Las hiptesis que se plantean son:





























Luego
Si Zc e Regin de Rechazo, entonces Rechazo a H0.
Si Zc e Regin de Aceptacin, entonces Acepto a H0.



Ejemplo 8: Una medicina que se prescribe comnmente para aliviar la gripe se
considera que es efectiva en 60%. Resultados experimentales con una nueva medicina
que se administra a una muestra aleatoria de 100 adultos que padecen gripe muestran
que 70 tuvieron alivio. sta es evidencia suficiente para concluir que la nueva medicina
es superior a la que se prescribe actualmente? Utilice un nivel de significancia de 0.05.

Desarrollo

X ~ Binomial
H0: p = p0

p = p0
H1: p

< p0
p > p0
-
-
-
-
-
-
-
Se toma una muestra de tamao n

xitos
Fracasos
x cuenta el nmero de
xitos de la muestra.
X
Z
Zt Zt
Suponiendo que se realiza una prueba de las dos colas

Regin de Rechazo
o/2
Regin de Rechazo
Regin de Aceptacin

o/2
Gua de la Unidad III Fernando A. Contreras J.

22

Tabla de Datos
p = p0 = 0.6
n = 100 Adultos
x = # de xitos = 70 Tuvieron Alivio
o = 0.05

Se plantean las hiptesis:

H0: p = p0 = 0.6
H1: p = p1 > 0.6

De ah que como n = 100 > 30 se utiliza la aproximacin normal y el estadstico de
prueba Zc = Zcalculado es:

Zc =
0 0
0
q np
np x
=
) 4 . 0 )( 6 . 0 )( 100 (
) 6 . 0 )( 100 ( 70
= 2.04











Luego como Zc e Regin de Rechazo, entonces se Rechaza a H0; es decir, se
concluye con un nivel de significancia de 0.05 que existe suficiente evidencia estadstica
muestral para decir que la nueva medicina es mejor que la existente.



Modelo de Regresin Lineal Simple

En la vida cotidiana, se presentan un sin nmero de situaciones en las que es de vital
importancia la determinacin del grado y forma de relacin entre dos fenmenos,
aspectos o situaciones cuantificables a ser consideradas. Supngase que estas dos
situaciones se asumen como dos variables X (variable de prediccin) e Y (variable de
respuesta). Para ilustrar lo anterior se pueden mencionar las interrogantes: Qu relacin
tiene la estatura y el peso de una muestra aleatoria de individuos de sexo masculino
tomada de un gimnasio?, Qu relacin puede tener la oferta y la demanda de una
coleccin de productos en un lapso de tiempo considerado?, Qu relacin existe entre el
tiempo de entrega de una mercanca y la distancia de la entrega de la misma, si esta es
realizada por una compaa de motorizados?, . . . ; son muchas las situaciones en las que
Gua de la Unidad III Fernando A. Contreras J.

23

es necesario relacionar dos o ms variables. Para responder de alguna manera las
interrogantes planteadas anteriormente, se requiere la determinacin de un grado
cuantitativo de relacin entre las dos variables distintas X y Y en estudio. El primer paso
consiste en realizar una representacin grfica, en la que cada punto trazado represente
un par de valores observados de las variables independiente (X) y dependiente (Y), de la
muestra de datos considerada. Los valores observados de la variable independiente se
grafican en el eje horizontal (X) y los valores observados de la variable dependiente se
grafican en el eje vertical (Y). Cuando se tiene una nube de puntos de acuerdo al proceso
anterior, se plantea la interrogante: Cmo ajustar un modelo matemtico lineal a un
conjunto de datos de dos variables correlacionadas? La forma de elegir y encontrar
el modelo matemtico lineal (Frmula Matemtica) adecuado que describe el
comportamiento promedio descrito por la nube de puntos; se conoce con el nombre de
regresin lineal.

La regresin lineal nos permite calcular los valores de los parmetros
0

| y
1

| que
definen una recta ( Y

=
0

| +
1

| X) que mejor se ajusta al comportamiento promedio


descrito por la nube de puntos.





















La ecuacin de regresin es la frmula algebraica por la cual se determina el valor
estimado de la variable dependiente, de respuesta (Y).

En la regresin lineal se plantea la interrogante: Cmo ajustar un modelo
matemtico lineal a un conjunto de datos de dos variables correlacionadas? Una manera
de responder a esta interrogante es a travs del mtodo de los mnimos cuadrados.
El mtodo de los mnimos cuadrados nos conduce al sistema de dos ecuaciones cuyas
X
X
X X

X

X
X
X


X
X
X

X X
X
X X X
X

X
X X X

X

X
X X X
X X


X X

X X X

X
X X X

X

X

X
Y
Y

=
0

| +
1

| X
Modelo: Y = |0 + |1X + c

Ecuacin de prediccin muestral
Y

: Variable dependiente.
0

|
: Primer parmetro de la ecuacin de regresin, (Indica el valor de Y

cuando X = 0).
1

| : Segundo parmetro de la ecuacin de regresin (Pendiente de la lnea de regresin).


X : Variable independiente.
c : Error de muestreo aleatorio.
Gua de la Unidad III Fernando A. Contreras J.

24

incgnitas son
0

| y
1

| . El sistema de dos incgnitas planteado esta dado a


continuacin:

n
0

| +
1

|

=
n
i
i
x
1
=

=
n
i
i
y
1
(1)

0

|

=
n
i
i
x
1
+
1

|

=
n
i
i
x
1
2
=

=
n
i
i i
y x
1
(2)


Al resolver se tiene:
1

| =


= =
= = =
|
.
|

\
|

|
.
|

\
|
|
.
|

\
|

n
i
n
i
i i
n
i
n
i
i
n
i
i i i
x x n
y x y x n
1
2
1
2
1 1 1
y
0

| =
n
x y
n
i
n
i
i i
= =

1 1
1

|


De acuerdo con el criterio de los mnimos cuadrados, la lnea de regresin del mejor
ajuste, es aquella para la cual se reduce al mnimo la suma de las desviaciones
cuadradas entre los valores estimados y reales de la variable dependiente para los datos
muestrales.

Los valores
0

| y
1

| se hallan a travs de datos muestrales.




Ejemplo 9: Se quiere analizar la relacin existente entre las ventas Y y el rea de
exposicin X de los alimentos para nios. Para ello el encargado de mercadeo tom
una muestra de 12 tiendas, fij reas de 5, 10, 15 y 20 m
2
y midi las ventas
semanales. Los datos obtenidos fueron:

Tiendas rea: X (m
2
) Ventas: Y (Miles $)
1 5 1.6
2 5 2.2
3 5 1.4
4 10 1.9
5 10 2.4
6 10 2.6
7 15 2.3
8 15 2.7
9 15 2.8
10 20 2.6
11 20 2.9
12 20 3.1

Realice lo siguiente:

Construya un diagrama de puntos de la situacin
Encuentre la ecuacin de prediccin muestral ( Y

=
0

| +
1

| X)
Gua de la Unidad III Fernando A. Contreras J.

25

Predecir las ventas para un rea de exhibicin de 7m
2
y de 100m
2


Desarrollo

1.) Diagrama de Dispersin o Nube de Puntos























Se tiene que:

n = 12,

=
12
1 i
i
x = 150,

=
12
1 i
i
y = 28.5,

=
12
1
2
i
i
x = 2250 y
i
i
i
y x

=
12
1
= 384

2.) Ecuacin de Prediccin Muestral ( Y

=
0

| +
1

| X)

n
0

| +
1

|

=
12
1 i
i
x =

=
12
1 i
i
y (1)


0

=
12
1 i
i
x +
1

=
12
1
2
i
i
x =
i
i
i
y x

=
12
1
(2)


Sustituyendo se tiene:

12
0

| + 150
1

| = 28.5
1

| = 0.074

150
0

| + 2250
1

| = 384
0

| = 1.45


3.0



2.0



1.0
5 10 15 20
Y: Venta (Miles de $)
X: rea de Exposicin (m
2
)
.
. .
. . .
. .
. .


.
.



En promedio, el modelo
es lineal: Y = |0 + |1X + c

Gua de la Unidad III Fernando A. Contreras J.

26

Y

= 1.45 + 0.074 X Ecuacin de Regresin Muestral



3.) Prediccin de las ventas para X = 7 m
2
y X = 100 m
2
.

Para Y

= 1.45 + 0.074 (7)


= 1.968 Miles de $


Para Y

= 1.45 + 0.074 (100)


= 8.850 Miles de $

Pero X = 100 m
2
est fuera del rango de trabajo.


Un modelo de regresin slo debe usarse para predecir dentro de un rango de trabajo

























No tiene sentido prctico. El
1

| = 0.074 indica que las ventas aumentan en 0.074 por


cada metro que se aumente el rea de exposicin.


Teorema de la Media Muestral
Considrese una variable aleatoria poblacional X con media
X

y varianza
2
X
o .
Sea X1, X2, X3, . . . , Xi, . . . , Xn una muestra aleatoria de tamao n de la
poblacin. Entonces la distribucin de la media muestral
n
x
X
n
i
i
=
=
1
tiene las
siguientes propiedades:
3.0



2.0



1.0
5 10 15 20
Y: Venta (Miles de $)
X: rea de Exposicin (m
2
)
Y

= 1.45 + 0.074X

0

| = 1.45
Ventas para rea cero.
Gua de la Unidad III Fernando A. Contreras J.

27

1.) La media de la distribucin de la media muestral es precisamente la media de la
poblacin
X
X
=
.
2.) La varianza de la distribucin de la media muestral es precisamente la
varianza de la poblacin dividida entre n
n
X
X
2
2
o
o =
.
3.) La distribucin de la media muestral, tiene forma aproximadamente normal
conforme crece el tamao de la muestra (n + ), cualquiera sea la distribucin de la
poblacin.





X

Dado que X se distribuye aproximadamente en forma normal; la variable aleatoria
X se estandariza de la forma:








Z = 0 Z


Observaciones

1.) La media de la distribucin de la media muestral es igual a la media poblacional
(
X
X
=
). Esto se puede interpretar afirmando que si se toman muchas muestras de
tamao n y se le calcula la media muestral a cada una; el promedio del clculo
anterior, ser un valor muy aproximado al verdadero valor de la media poblacional
X

.
2.) La varianza de la distribucin de la media muestral es igual a la varianza
poblacional entre n (
n
X
X
2
2
o
o =
). Esto quiere decir que a medida que se aumenta el
tamao de la muestra, la varianza de la media muestral disminuye.
oZ = 1.0

Gua de la Unidad III Fernando A. Contreras J.

28

Ejemplo 10: Una empresa fabrica bombillos que tienen un tiempo de duracin que se
distribuye en forma aproximadamente normal con media 800 =
X
horas y desviacin
estndar 70 =
X
o . Calcule:

a) Cul es la probabilidad de que un bombillo dure ms de 1000 horas?
b) Cul es la probabilidad de que un bombillo dure menos de 650 horas?
c) Dentro de que lmites de tiempo durar el 90% de los bombillos en torno a la media
poblacional?
d) Cul es la probabilidad de que un bombillo dure entre 700 y 950 horas?
e) Si se toma una muestra aleatoria de 16 bombillos (n = 16). Cul es la probabilidad
de que la vida promedio de los bombillos sea de menos de 775 horas?
f) Si se toma una muestra de 25 bombillos (n = 25). Cul es la probabilidad de que la
vida promedio de los bombillos sea mayor a 830 horas?
g) Si se toma una muestra aleatoria de 36 bombillos (n = 36). Dentro de que lmites
caer el 80% del promedio muestral en torno a la media poblacional?
h) Si se toma una muestra de 49 bombillos (n = 49). Cul es la probabilidad de que el
tiempo promedio de los bombillos este entre 780 y 830 horas?

Desarrollo

Sea X: Tiempo de duracin de los bombillos fabricados por la empresa.


a) P(X > 1000) = ?
X = 800 horas
oX = 70 horas



Se estandariza:

P(X > 1000) = P Z >
70
800 1000
= P (Z > 2.86)













Luego, se busca en la tabla de Z, el valor 2.86 y se tiene que: P(X > 1000) =
La probabilidad est
representada por la
regin sombreada

La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

29

= P(Z > 2.86) = 1 P(Z s 2.86) = 1 0.9979 = 0.0021.

La probabilidad de que un bombillo de la empresa tomado al azar tenga una duracin
superior a las 1000 horas es de un 0.21%.

b) P(X < 650) = ?
X = 800 horas
oX = 70 horas





Se estandariza:

P(X < 650) = P Z <
70
800 650
= P(Z < 2.14)












Luego, se busca en la tabla de Z, el valor 2.14 y se tiene que: P(X < 650) =
P(Z < 2.14) = 0.0162.

La probabilidad de que un bombillo de la empresa tomado al azar tenga una duracin
inferior a las 650 horas es de un 1.62%.

c) P(X1 < X < X2) = 0.9
X = 800 horas
oX = 70 horas



Se estandariza:

La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

30

Z1 =
o

1
x
=
70
800
1
x
y Z2 =
o

2
x
=
70
800
2
x



Se buscan los valores de Z que dejan 0.05 y 0.95 de rea a la izquierda de la
curva. Estos valores son: Z1 = 1.645 que es el promedio entre 1.64 y 1.65; y
Z2 = 1.645 que es el promedio entre 1.64 y 1.65. Se saco un promedio para ambos Z
por que no existen valores exactos que aproximen las reas requeridas.













Luego se despeja el valor de x de las ecuaciones planteadas:

Z1 =
o

1
x
=
70
800
1
x
y Z2 =
o

2
x
=
70
800
2
x


Es decir:
1.645 =
70
800
1
x
y 1.645 =
70
800
2
x


De ah que: X1 = 684.85 ~ 685 y X2 = 915.15 ~ 915

Luego, P(X1 < X < X2) = 0.9 est dada para los valores de X P(685 < X < 915) = 0.9.

El tiempo de duracin del 90% central de los bombillos de la empresa se encuentra
entre 685 horas y 915 horas.


d) P(700 < X < 950) = ?
X = 800 horas
oX = 70 horas






La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

31


Se estandariza:


P(700 < X < 950) = P
70
800 700
< Z <
70
800 950


= P(1.43 < Z < 2.14) = P(Z < 2.14) P(Z < 1.43)
















Luego, se buscan en la tabla de Z, los valores: 2.14 , 1.43 y se tiene que:
P(700 < X < 950) = P(1.43 < Z < 2.14) = P(Z < 2.14) P(Z < 1.43) = 0.9838
0.0764 = 0.9074.

La probabilidad de que un bombillo de la empresa tomado al azar tenga una duracin
entre las 700 horas y las 950 horas es de un 90.74%.


En la siguiente parte, se aplica el teorema de la media muestral

X : Tiempo promedio de duracin de los bombillos fabricados por la empresa.




e) P( X < 775) = ?
X

= X = 800 horas
X
o
=
n
X
o
=
16
70
horas
n = 16 bombillos



La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

32

Se estandariza:

P( X < 775) = P Z <
16
70
800 775
= P(Z < 1.43)











Luego, se busca en la tabla de Z, el valor 1.43 y se tiene que: P( X < 775) =
P(Z < 1.43) = 0.0764.

Se concluye que la probabilidad de que una muestra aleatoria de tamao n = 16
bombillos tenga un tiempo promedio de duracin inferior a 775 horas es de un 7.64%.


f) P( X > 830) = ?
X

= X = 800 horas
X
o
=
n
X
o
=
25
70
horas
n = 25 bombillos


Se estandariza:

P( X > 830) = P Z >
25
70
800 830
= P (Z > 2.14)










La probabilidad est
representada por la
regin sombreada

La probabilidad est
representada por la
regin sombreada

La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

33

Luego, se busca en la tabla de Z, el valor 2.14 y se tiene que: P( X > 830) =
P(Z > 2.14) = 1 P(Z < 2.14) = 1 0.9838 = 0.0162.

Se concluye que la probabilidad de que una muestra aleatoria de tamao n = 25
bombillos tenga un tiempo promedio de duracin superior a 830 horas es de un 1.62%.


g) P(
1
X < X <
2
X ) = 0.8
X

= X = 800 horas
X
o
=
n
X
o
=
36
70
horas
n = 36 bombillos





Se estandariza:

Z1 =
n
X
X
X
o

1
=
36
70
800
1
X
y Z2 =
n
X
X
X
o

2
=
36
70
800
2
X


Se buscan los valores de Z que dejan 0.1 y 0.90 de rea a la derecha de la
curva. Estos valores son: Z1 = 1.285 que es el promedio entre 1.28 y 1.29; y Z2 =
1.285 que es el promedio entre 1.28 y 1.29. Se saco un promedio para ambos Z por que
no existen valores exactos que aproximen las reas requeridas.













Luego se despeja el valor de x de las ecuaciones planteadas:

Z1 =
n
X
X
X
o

1
=
36
70
800
1
X
y Z2 =
n
X
X
X
o

2
=
36
70
800
2
X

La probabilidad est
representada por la
regin sombreada

La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

34

Es decir:
1.285 =
36
70
800
1
X
y 1.285 =
36
70
800
2
X

Se concluye que el 80% central del promedio de una muestra aleatoria tamao n = 36
bombillos, se encuentra entre los promedios muestrales
1
X = 785 y
2
X = 815.




h) P(780 < X < 830) = ?
X
= X = 800 horas
X
o =
n
X
o
=
49
70
horas
n = 49bombillos


Se estandariza:

P(780 < X < 830) = P
49
70
800 780
< Z <
49
70
800 830



= P(2.00 < Z < 3.00) = P(Z < 3.00) P(Z < 2.00)













Luego, se buscan en la tabla de Z, los valores: 3.00 , 2.00 y se tiene que:
P(780 < X < 830) = P(2.00 < Z < 3.00) = P(Z < 3.00) P(Z < 2.00) = 0.9987
0.0228 = 0.9759.

Se concluye que la probabilidad de que una muestra aleatoria de tamao n = 49
bombillos tenga un tiempo promedio de duracin entre los promedios X1 = 780 horas y
X2 = 830 horas es de un 97.59%.
La probabilidad est
representada por la
regin sombreada

La probabilidad est
representada por la
regin sombreada

Gua de la Unidad III Fernando A. Contreras J.

35

Teorema del Lmite Central

Considrese una sucesin X1, X2, X3, . . . , Xi, . . . , Xn de variables aleatorias
independientes idnticamente distribuidas (todas con la misma distribucin) con medias
E(Xi) = i y Var(Xi) = o
2
i. Entonces Sn =

=
n
i
i
X
1
se distribuye en forma aproximadamente
normal con media s =

=
n
i
i
1

y o
2
s =

=
n
i
i
1
2
o
tiene las siguientes propiedades:



=
=
n
i
i
S
1
2
o o



s =

=
n
i
i
1



Luego, al estandarizar se tiene:
S
S n
S
Z
o

=


Ejemplo 11: Supngase que se tiene un cierto nmero de voltaje Vi, i = 1,2,3, , n
que son recibidos por un Sumador de Voltajes. Supngase que los Vi estn
distribuidos uniformemente en el intervalo [0 , 10]. Si se toma un nmero aleatorio de 20
voltajes, calcule la probabilidad de que el voltaje sobrepase los 105 voltios.

Desarrollo
P(S20 > 105) = P(

=
20
1 i
i
V > 105) = ? Se tiene que cada Vi tiene una distribucin uniforme
en el intervalo [0 , 10].










De ah que
Voltios
i
2
) 10 0 ( +
=
i = 5 Voltios y
( )
12
0 10
2
2

=
i
o

2 2
12
100
Voltios
i
= o

Sn
Gua de la Unidad III Fernando A. Contreras J.

36


De acuerdo al teorema del lmite central, se sabe que:

=
+ + + + = =
20
1
20 3 2 1 20
...
i
i
V V V V V S , tiene una distribucin aproximadamente
normal donde: Voltios
S
5 . 20 ...
20 3 2 1
= + + + + = S = 100 Voltios.


2 2
20
2
3
2
2
2
1
2
12
100
. 20 ... Voltios
S
= + + + + = o o o o o oS = 12.91 Voltios.

De ah que: P(S20 > 105) = P(

=
20
1 i
i
V > 105) =
|
.
|

\
|
>
91 . 12
100 105
Z P = P(Z > 0.39) =

= 1 P(Z < 0.39) = 1 0.6517 P(S20 > 105) = P(

=
20
1 i
i
V > 105) = 0.3483.


Ley de los Grandes Nmeros


Supngase que se tiene un experimento de tipo Bernoulli.









Cul ser la probabilidad de xito si no se tiene espacio muestral equiprobable, ni datos
del experimento?

Sea Sn = # de xitos, en donde la probabilidad de xito en las n veces que se
realiza el experimento se puede expresar como
n
S
n
cuando n . Es decir:









Gua de la Unidad III Fernando A. Contreras J.

37

Esto quiere decir que mientras ms veces se realice el experimento, ms cerca se
estar de la verdadera probabilidad del experimento (Casi Siempre).


Ejemplo 12: Se quiere determinar la probabilidad de aceptacin de una nueva marca
de cerveza. Esto es Bernoulli, en efecto:












Sea A = {Le Gusta la Cerveza}


P(A) = p. Al aplicar la Ley de los Grandes Nmeros se tiene que:








El lmite indica que mientras ms consumidores prueben la cerveza, ms cerca se
estar de saber la probabilidad de aceptacin de la misma (Casi Siempre).