Está en la página 1de 87

COLEGIO DE BACHILLERES

ESTADSTICA DESCRIPTIVA E INFERENCIAL II

FASCCULO 3.

FUNCIONES DE DISTRIBUCIN NORMAL ESTNDAR UNA VISIN ESTTICA

Autores: Emigdio Arroyo Cervantes Juan Matus Parra

NDICE

INTRODUCCIN PROPSITO CUESTIONAMIENTO GUA CAPTULO 1. FUNCIONES PROBABILSTICAS CONTNUAS


1.1 DISTRIBUCIN NORMAL ESTNDAR
1.1.1 Normalizacin 1.1.2 Valores Normalizados Z y rea Bajo la Curva 1.1.3 Aproximacin Normal a la Distribucin Binomial

5 7 9 11

12 14 21 36

1.2 DISTRIBUCIONES MUESTRALES Y TEOREMA 40 DEL LMITE CENTRAL


1.2.1 Distribuciones Muestrales 1.2.2 El Teorema Central del Lmite 1.2.3 Distribucin T-Student 40 50 55 70 71 73 79 92

RECAPITULACIN ACTIVIDADES DE CONSOLIDACIN AUTOEVALUACIN APENDICES BIBLIOGRAFA CONSULTADA

INTRODUCCIN

En el fascculo anterior estudiaste las distribuciones de probabilidad binomial y de Poisson. Estas son distribuciones de variable aleatoria discretas, en que cada valor de las variables se le asigna una probabilidad. Existen otras distribuciones de probabilidad, las de variables aleatorias continuas cuya determinacin de la probabilidad difiere de las anteriores toda vez que las observaciones del experimento generan un espacio muestral infinito y cada intervalo de este tiene un nmero infinito no numerable de posibles resultados los cuales incluyen valores reales. De lo anterior podemos concluir que para determinar la probabilidad de una variable aleatoria continua, se desarrolla un mtodo distinto a los anteriores. En este fascculo estudiars la distribucin normal como modelo de fenmenos aleatorios en los que se efectan mediciones continuas y te capacitars en el clculo de la probabilidad de fenmenos aleatorios de regularidad estadstica, aplicando para ello, la distribucin normal estndar. As mismo, estudiars la aplicacin de a distribucin de medias muestrales mediante el uso del Teorema del Lmite Central para muestras grandes y la distribucin de Student en muestras pequeas.

PROPSITO

Con este fascculo puedes estudiar las funciones probabilsticas continuas su distribucin normal estndar, las distribuciones muestrales y teorema central del lmite, as como la distribucin T de Student. Estos temas que parecen sin sentido, toman una importancia fundamental cuando hablamos de investigacin. Para cualquier ciencia o profesin la investigacin juega un papel preponderante, y para que esta sea aceptada cientficamente es necesario que cuente con datos fidedignos y sistematizados adecuadamente y esta es la contribucin de nuestros temas sin sentido! A travs de su estudio puedes aprender a sistematizar los elementos cuantitativos de cualquier investigacin, y si ests pensando Yo no ser investigador, ser mdico, o socilogo, o qumico, o pedagogo, o...! Nosotros tendramos que contestarte que todos, absolutamente todos, en algn momento de su vida profesional hacen investigacin y entonces requerirs estas herramientas. Para que puedas ejercitar los contenidos que integran el fascculo, aparecen una serie de actividades, no dejes de hacerlas!

CUESTIONAMIENTO GUA

Sabemos que las aguas negras de la Ciudad de Mxico se utilizan para el riego de los campos de cultivo circunvecinos al Valle de Mxico. Esta agua negras contienen entre otras sustancias, el cloro en cantidades perjudiciales al sembrado de cereales porque en lugar de beneficiarlo con el riego, lo quema y lo seca. Por lo anterior, es necesario darle al agua un tratamiento con el fin de disminuir o eliminar el contenido de cloro. Para ello el Departamento del D.F. tiene establecido un laboratorio en los colectores de aguas para determinar el contenido de cloro y dar el tratamiento correspondiente antes de abrir las compuertas. Para el anlisis se toma una muestra de 5 lt. De aguas negras diariamente. Los resultados correspondientes al mes de noviembre de 1993 fueron las que se muestran en la siguiente tabla. Las cantidades de cloro se registran en partes pro milln (ppm). 16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8 15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0 16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3 Usemos estos datos para realizar un recordatorio de los conceptos estudiados en tu curso de Estadstica I. Esto nos servir para abordar los nuevos conceptos que estudiars en este fascculo y para ello realiza el siguiente ejercicio: 1. Ordena los datos en sentido creciente. 2. Determina el rango de variacin de los datos. 3. Elabora una tabla de frecuencia de datos agrupados de 5 clases. 4. Determina la moda, la mediana y la media de la muestra. 5. Determina la desviacin estndar. 6. Traza el histograma. 7. Traza el polgono de frecuencia. 8. Analiza e polgono de frecuencias y determina: a) De qu tipo es (platicrtica, mesocrtica, etc.) b) Determina el sesgo. c) Determina el orden de la media, la moda y la mediana. 9. Analiza la desviacin estndar y determina como es la dispersin de las puntuaciones. 9

CAPTULO 1 FUNCIONES PROBABILSTICAS CONTNUAS


En el siglo XVIII a los jugadores profesionales les interesaba conocer a priori, las probabilidades de xito en los distintos juegos de azar, para ello acudieron a los matemticos de la poca en busca de ayuda. Como una respuesta a una necesidad planteada a los matemticos, en 1973 Abraham DMoavre (1667-1754) es quien obtiene por primera vez la ecuacin matemtica de la curva normal. La distribucin normal nos permite el clculo de probabilidades de variables aleatorias continuas y discretas de cualquier problema de: Ingeniera, Medicina, Ciencias Sociales, Agricultura, Psicologa, Fsica, Qumica, etc. Otros grandes matemticos contribuyeron dndole impulso, entre ellos podemos citar a Friedrich Gauss (1777-1855) quien perfeccion y la utiliz ampliamente en su teora de errores de las mediciones fsicas. Laplace la us en el clculo de lo errores de las observaciones astronmicas. El matemtico Ruso P.L. Chebyshev estableci varios teoremas relacionados con la curva de la distribucin normal. Los experimentos realizados pro muchos cientficos, permiten determinar que la mayor parte de las variables aleatorias se pueden estudiar considerando que tiene una funcin de densidad normal.

11

1.1 DISTRIBUCIN NORMAL ESTNDAR

Retomemos el problema de las aguas negras. Los resultados que debiste obtener son: R = 1.7 M = 16.05 S = 0.42 M = 16.01 X = 16.08

El histograma y el polgono de frecuencias son los siguientes:

fi

10

15.2 15.37

15.72

16.08
Fig. 1

16.42

16.77

Del polgono de frecuencias podemos ver que la curva es asimtrica; est sesgada a la izquierda por lo tanto su asimetra es negativa. Por su puntiagudez es del tipo leptocrtica. Recordars que los polgonos de frecuencias pueden ser : 1. Simtricos ( Grfica A ) 2. Asimtricos ( Grficos B y C ) d) En la asimetra positiva el sesgo es a la derecha (Grfico B) e) En la asimetra negativa el sesgo es a la izquierda (Grfico C)

12

fi B A C

0
Fig. 2

1. Los polgonos simtricos se clasifican en : a) Platicrtico (Grfica A) b) Mesocrtico (Grfica B) c) Leptocrtico (Grfica C) fi C

C B A
Fig. 3

De los grficos anteriores podemos concluir que la forma de cada una, est ntimamente relacionada con las medidas de tendencia central y de dispersin. En las simtricas, las medidas de tendencia central coinciden en el mismo punto, es decir = Mo = Md. 13

Las medidas de dispersin son diferentes, de la figura ( 3 ) obtenemos que: A = B = C En las asimtricas las medidas de tendencia central son diferentes y lo mismo ocurre con las de dispersin. a) Sesgo positivo < Md < Mo b) Sesgo negativo > Md > Mo A B C

En cualquier problema de variable aleatoria continua, su polgono de frecuencia es alguna de las grficas anteriores y stas dependen de sus parmetros de tendencia central y de dispersin. La grfica que tiene forma de campana, su media = 0 y = 1, se llama curva normal estndar o campana de Gauss pro haber sido el primer cientfico que us esta representacin. Las curvas simtricas tienen la forma de campana y las asimtricas no tienen esa forma pero pueden transformarse a simtricas. El procedimiento para transformar las curvas asimtricas en simtricas, es mediante una normalizacin de los datos del problema y que estudiaremos a continuacin.

1.1.1.

Normalizacin

El proceso de transformacin de un polgono de frecuencias a una curva normal, se llama normalizacin y para ello se hace un cambio de escala mediante la normalizacin o tipificacin de las puntuaciones, es decir, los valores ( x ) se transforman en valores Z mediante la ecuacin de transformacin.
Z= Xi

... (1)

Z = Puntuacin normalizada o tipificada Xi = Cada una de las puntuaciones de la poblacin = Media de las puntuaciones de la poblacin = Desviacin estndar de la poblacin

14

Veamos el siguiente ejemplo: Se desea conocer el peso promedio de los alumnos del turno vespertino del plantel 2 del Colegio de Bachilleres. Para ello se toma una muestra representativa de 150 alumnos y se pesan. Los pesos ya organizados en 13 clases, se muestran en la siguiente tabla de frecuencias:

Clases en kg. fi

30 34 35 39 1 5

40 44 8

45 49 50 54 8 10

55 59 18

60 64 12

65 69 36

70 - 74 28

75 79 12

80 84 85 89 8 3

90 94 1

ACTIVIDAD DE REGULACIN

Con estos datos anteriores, calcula: c) La media, y d) La desviacin estndar. e) Traza el polgono de frecuencias.

15

Los resultados que debiste obtener son:

N = 150 X = 63.9 S = 12.2

POLGONO DE FRECUENCIAS

fi
40

30

20

10

Fig. 4

27 32

42

52

62

72

82

92 97 102

De esta grfica podemos concluir que es asimtrica con sesgo negativo y del tipo leptocrtica. Ahora vamos a normalizar estos datos y trazar la curva normal estndar sobre este polgono de frecuencias para poder constatar el cambio de escala.

16

Para explicar el procedimiento vamos a construir la siguiente tabla:

Normalizacin de una Distribucin Asimtrica 1 CLASE 9094 8589 8084 7579 7074 6569 6064 5559 5054 4549 4044 3539 3034 2 fi 1 3 8 12 28 36 12 18 10 8 8 5 1 3 Lr SUP 94.5 89.5 84.5 79.5 74.5 69.5 64.5 59.5 54.5 49.5 44.5 39.5 34.5 4 5 x=xix Z = x/ 30.6 25.6 20.6 15.6 10.6 5.6 0.6 4.4 9.4 14.4 19.4 24.4 29.4 2.51 2.10 1.69 1.28 0.87 0.46 0.05 0.36 0.77 1.18 1.59 2.00 2.41 6 PARTE MAYOR 0.9940 0.9821 0.9545 0.8997 0.8078 0.6772 0.5199 0.3594 0.2206 0.1190 0.0599 0.0228 0.0080 7 PARTE MENOR 0.0119 0.0276 0.0548 0.0919 0.1306 0.1573 0.1605 0.1388 0.1016 0.0631 0.8331 0.0148 0.0080 8 fe 1.785 4.140 8.220 13.875 19.590 23.595 24.075 20.820 15.240 9.465 4.965 2.220 1.200 9 fe redondeada 1.8 4.1 8.2 13.9 19.6 23.6 24.1 20.8 15.2 9.5 5.0 2.2 1.2

Las columnas 1 y 2 corresponden a la clase y la frecuencia establecidas en la primera tabla.

La columna 3 corresponde al lmite real superior de cada clase el cual se determina aumentando medio punto a cada valor del lmite superior.

La columna 4 es igual a la desviacin de cada puntuacin con respecto a la media y se obtiene mediante la ecuacin: x = xi x Se toma como xi, al lmite real superior de cada clase. ... (1)

17

La columna 5 es el valor de Z correspondiente a cada puntuacin y se obtiene mediante la ecuacin de normalizacin o tipificacin, esto es:
Z = x xi x =

... (2)

La columna 6 se determina de los valores de la tabla del apndice ( A ) reas y x que posteriormente ordenadas de la curva de distribucin normal en funcin de ejemplificaremos.

En la primera columna de esta se localiza el valores de z, en la tercera columna se lee el valor del rea bajo la curva normal de la parte mayor. En la cuarta columna se lee el rea bajo la curva normal de la parte menor y se registra en la columna siete de nuestra tabla. EJEMPLO: Para z = 2.51 el rea de la parte mayor que se lee en la tercera columna es 0.9940. Para z = 2.41 en la cuarta columna se lee el rea de la parte menor correspondiente a 0.0080. La columna ocho de nuestra tabla corresponde a la frecuencia esperada (fe) y se calcula multiplicando el total de casos N =150 por el rea de la parte menor (columna 7) de cada puntuacin. Ejemplo: (0.0119) (150) = 1.785

La columna nueve es la frecuencia esperada (fe) redondeada a una cifra decimal.

Con estos valores de la tabla trazamos el polgono de frecuencias y la curva normalizada para ver el cambio que sufre el polgono de frecuencias de cualquier problema que se normalizan los datos:

18

fi
A
30

B
20

10

S
0 0

27 27.3

32

37

42

47

52 51.7

57

62

67 72

77 76.1

82 87 92 88.3

97 100.3

39.5

S=63.9
Fig. 5

A = Polgono de frecuencia de los pesos de 150 alumnos del plantel 2 del turno vespertino del Colegio de Bachilleres. B = Curva normal del mismo problema. En la escala Z de la figura 5, se determinan los valores de la desviacin tpica ( s ), a uno y otro lado de la media ( x ). Del ejemplo anterior habrs notado que normalizar los datos de un problema es equivalente a cambiar la escala x por la z y calcular las nuevas frecuencias que son las ordenadas de cada punto. Para ello usamos los valores de la tabla. Estos valores corresponden a las reas bajo la curva normal y se han calculado mediante la ecuacin que define a la funcin normal y sta es: y = f (x) =
1 2 e

( x ) 2
2

...(3) 19

D = 3.1416.... = media proporcional e = 2.718281... = desviacin estndar de la poblacin x = cada uno de los datos u observaciones. Con la ecuacin ( 3 ) podemos trazar la curva normal que tiene la forma de campana. Primero obtenemos y de los datos del problema y sustituimos en la frmula ( 3 ). Para obtener un par ordenado, usamos un valores arbitrario de x obtenemos un valor de y. Esta sucesin de puntos nos da la curva normal.

La Curva Normal Estndar La curva normal estndar o campana de Gauss es la misma curva normalizada solamente que mediante una traslacin se lleva la curva hasta el origen . En este caso usamos = 0 y = 1. La siguiente grfica muestra la curva normalizada con = 30 y = 10 B A

-30 -3

-20 -2

-10 -

0 =0

10

20 2
Fig. 6

30 3

40

50

60

A = Curva normalizada B = Curva normalizada y estandarizada Al trasladar la grfica anterior al origen, hemos transformado los parmetros y en : =0 y =1

Con estos valores reducidos, la curva normal estndar se obtiene mediante la grfica de la funcin: y = f (x) =
1 2 e

...(4) 20

Y la ecuacin de tipificacin es la ya conocida: x=+Z Z=


x

...(1)

ACTIVIDAD DE REGULACIN
Con los datos del problema de las aguas negras, elabora la tabla con los datos normalizados y traza la curva normal sobre el polgono de frecuencias que ya obtuviste antes.

1.1.2

VALORES NORMALIZADOS Z Y REA BAJO LA CURVA NORMAL

Ya qued establecido que para normalizar el polgono de frecuencias y transformarlo en una campana de Gauss, se tipifican las observaciones ( xi ) del problema cambindolos a una escala (Z) mediante la ecuacin ( 1 ). Esta curva normal es necesaria estandarizarla para poder calcular la probabilidad mediante una misma tabla ya elaborada para toda curva normal estandarizada, que se obtiene trasladando la media al origen como ya se indic. La curva normal estandarizada tiene las siguientes caractersticas: a) La altura alcanza su valor mximo como = 0 y su valor es 0.4, es decir; el punto mximo es Pm(0,0.4) b) La curva normal estndar es simtrica con respecto a la media por lo tanto los parmetros de tendencia central son iguales, es decir: = Mo = Md = 0 ...(5)

21

c) La desviacin estndar es = 1 d) El rea bajo la curva es A=1

Z =0
Fig. 7

El rea sombreada vale 1 y como la curva es simtrica cada regin a los lados del eje y vale 0.5. e) El eje Z es una asntota horizontal de la curva ya que lim (z) = 0 z f) El rea ms importante donde se distribuye la probabilidad de un suceso, se encuentra comprendida entre + 3 y esto lo puedes constatar en la siguiente grfica de la Fig. 8. g) De acuerdo con el teorema de Chebishev relacionado con la desviacin estndar y el rea bajo la curva, podemos establecer los siguientes porcentajes de la misma: 99% 95% 68%

-3

-2

=0
Fig. 8

De esta grfica podemos ver que el rea antes y despus de + 3 corresponde al 1%, es decir el 0.5% para cada lado de la grfica. 22

Por la simetra que tiene la curva normal estndar, existen tablas correspondientes al rea bajo al curva que nicamente contemplan la parte positiva de la grfica y estos mismos valores se usan para el lado negativo. Ejemplo: Con los siguientes valores de Z determinaremos el valor de rea bajo la curva y trazaremos un esquema del rea correspondiente: Z = + 0.5, + 0.7, + 1.5 En la primera columna de la tabla localizamos el valor de Z = 0.5 y en la segunda columna leemos el valor del rea. Z = 0.5 ; A = 0. 1915

Z
= 0 Z = 0.5

Z = -0.5 , A = 0.1915

Z
Z =-0.5 = 0

Z = 0.7

; A = 0.2580

Z
=0 Z = 0.7

23

Z = -0.7

A = 0.2580

Z
Z =-0.7 =0

Z = 1.5

A = 0.4332

Z
=0 Z = 1.5

Z = -1.5

; A = 0.4332

Z
Z =-1.5 =0

De las grficas anteriores podemos ver, que el valor del rea es el mismo para valores positivos y negativos de Z solamente que para el valor negativo, el rea se representa a la izquierda de la media.

24

ACTIVIDAD DE REGULACIN

Normaliza los valores de X = 4, 6, 9,12,18,20, usando = 10 y = 5. traza una grfica para cada valores de x, comprala con la grfica de los valores normalizados y traza una para cada Z sombreando en ambas grficas la regin correspondiente. El rea bajo la curva normal estndar representa la probabilidad de un evento; toda el rea bajo la curva vale uno y representa la probabilidad del evento seguro. El rea de cada mitad de la grfica, es 0.5

=0

=0

P(Z) = 0.5

P(Z) = 0.5

Si queremos la probabilidad de un evento cuyo valor est limitado por dos puntuaciones, por ejemplo: P ( x, X x2 ) Probabilidad de x comprendida entre x1 y x2. Para determinar esta probabilidad, tipificamos los valores x. Sabemos que la curva normalizada de la escala x es equivalente a la curva normall estndar en la escala Z.

P ( x1 x x2) = P ( Z1 Z Z2 )
Determinamos Z1
Z2
=

X1 X2

P ( Z ) = P ( Z1 ) + P ( Z2 )

25

Las grficas correspondientes en ambas escalas son:

Si las x estn en el lado positivo entonces, debemos recordar que los valores que se leen en la tabla normalizada son a partir de la media hasta el valor de Z. Las grficas de las variables x y z son las que se muestran a continuacin: P ( Z ) = P ( Z2 ) P ( Z1 )

26

Si los valores de x estn en la parte negativa de z es decir a la izquierda de la media, entonces los grficos son:

P ( Z ) = P ( Z2 ) P ( Z1 )

X2 X1

Z2 Z1

Si solamente tenemos una X a la derecha de la media entonces el rea bajo la curva es:

P ( Z ) = 0.5 + P ( Z1 )

X1

=0

Z1

27

Recuerda que la primera mitad del rea bajo la curva vale 0.5, es por eso que a la probabilidad de Z, le sumamos 0.5.

X1

Z1

=0

Si nos interesa la probabilidad de x<, entonces la grfica es:

P (Z) = 0.5 P (Z1)

P(X1)

P(Z1)

X1

Z1

28

Si queremos la probabilidad de las partes sombreadas de las siguientes grficas:


P ( Z ) = [ 0.5 P ( Z1) ] + [ 0.5 P ( Z2 )]

P(X1)

P(X2) P(Z1)

P(Z2)

X1

X2

Z1

=0

Z2

Recuerda que la probabilidad de Z , es la parte sin sombrear de la media a la izquierda hasta Z, y la probabilidad de Z2, es la parte sin sombrear de la media a la derecha hasta Z2.

ACTIVIDAD DE REGULACIN

Con los siguientes valores determina la probabilidad y traza la grfica correspondiente para cada inciso. 1. a) b) c) d) e) f) 2. a) b) c) d) e) Z = 0 y Z = 0.94 Z = 0 y Z = -2.15 A la derecha de Z = 0.62 A la derecha de Z = - 0.93 A la izquierda de Z = 0.84 A la izquierda de Z = -0.35 Z = - 0.59 Z = -0.71 Z = 0.32 Z = -0.81 Z = -1.65 y Z = 0.59 y Z = 1.99 y Z = 0.92 y Z = -0.42 y Z = -0.25

29

Si se conoce la probabilidad de un evento y queremos determinar el valor de Z, entonces nos situamos en la segunda columna de la tabla ( rea desde la media), localizamos el valores de la probabilidad y en el mismo rengln y en la misma columna 1 determinamos el valores deZ. Ejemplo: Si P ( Z ) = 0.4429 entonces el valore de Z es? De la tabla obtenemos que Z = 1.58

=0

Determina Z si P ( Z ) = .7580. Este valor es mayor que 0.5 correspondiente a la mitad de la grfica por lo tanto hacemos la siguiente transformacin: P ( Z) = 0.5 + P ( Z )

P (Z1 ) = P ( Z ) 0.5 = 0.7589 0.5 = 0.2589


P ( Z1 ) = 0.2589

=0

Z1

En la tabla nos situamos en este valor y en la columna 1 est el valor de Z = 0.70 Si la probabilidad de z a la izquierda de la media es P ( Z ) = 0.1331, entonces Z es?

30

En la segunda columna de la tabla localizamos el valor de la probabilidad y en la misma lnea en la primera columna determinamos el valor de Z = -0.34. El valor del signo es por estar a la izquierda de la media

-Z

=0

ACTIVIDAD DE REGULACIN

1. Determina el valor de Z y traza la grfica de cada inciso, si la probabilidad de z es: a) b) c) d) e) f) Entre 0 y Z, P ( Z ) = 0.4864 A la izquierda de Z, P ( Z ) = 0.9983 A la derecha de Z, P ( Z ) = 0.7324 A la derecha de Z, P ( Z ) = 0.2981 A la izquierda de Z, P ( Z ) = 0.1314 Entre Z y Z, P ( Z ) = 0.7286

2. Una variable aleatoria tiene una distribucin normal con media = 60 y desviacin estndar = 5.2 Cules son las probabilidades de que la variable aleatoria tome un valor como el que se indica? Traza la grfica de cada inciso. a) b) c) d) Menor que 62.5 Mayor que 70.5 Entre 60.0 y 66.2 Entre 48 y 72

Si tienes alguna duda consulta a tu profesor o a tu consultor.

31

EJEMPLO: Con los siguientes valores, calcula la probabilidad de la distribucin binomial y traza e polgono de frecuencia de cada una. 1) n = 10, p = 0.2, q = 0.8, x = 0, 1, 2, . . . 10 2) n = 10, p = 0.8, q = 0.2, x = 0, 1, 2, . . . 10 3) n = 10, p = 0.5, q = 0.5, x = 0, 1, 2, . . . 10 Para el problema 1 sustituimos valores en ( 6 ) y obtenemos: 10 0 10 F( 0 ) = ( 0 ) ( 0.2 ) ( 0.8 ) = ( 1 ) ( 1 ) ( 0.1073 ) = 0.1073 10 1 9 F( 1 ) = ( 1 ) ( 0.2 ) ( 0.8 ) = ( 10 ) ( 0.2 ) ( 0.1342 ) = 0.2684 10 2 8 F( 2 ) = ( 2 ) ( 0.2 ) ( 0.8 ) = ( 45 ) ( 0.04 ) ( 0.1677 ) = 0.3019 10 3 7 F( 3 ) = ( 3 ) ( 0.2 ) ( 0.8 ) = ( 120 ) ( 0.0008 ) ( 0.2097 ) = 0.2013 10 4 6 F( 4 ) = ( 4 ) ( 0.2 ) ( 0.8 ) = ( 210 ) ( 0.0016 ) ( 0.2621 ) = 0.0881 10 5 5 F( 5 ) = ( 5 ) ( 0.2 ) ( 0.8 ) = ( 252 ) ( 0.00032 ) ( 0.3276 ) = 0.0264 Calcula los siguientes valores: F( 6 ) = F( 7 ) = F( 8 ) = F( 9 ) = F( 10 ) =

32

Clculo del segundo problema: 10 0 10 F( 0 ) = ( 0 ) ( 0.8 ) ( 0.2 ) = ( 1 ) ( 1 ) ( 0.000000102 ) = 0.0000001 10 1 9 F( 1 ) = ( 1 ) ( 0.8 ) ( 0.2 )= ( 10 ) ( 0.8 ) ( 0.000000512 ) = 0.0000009 10 2 8 F( 2 ) = ( 2 ) ( 0.8 ) ( 0.2 ) = ( 45 ) ( 0.64 ) ( 0.000002 ) = 0.0000737 10 3 7 F( 3 ) = ( 3 ) ( 0.8 ) ( 0.2 ) = ( 120 ) ( 0.512 ) ( 0.000012 ) = 0.0008 10 4 6 F( 4 ) = ( 4 ) ( 0.8 ) ( 0.2 ) = ( 210 ) ( 0.4096 ) ( 0.000064 ) = 0.0055 10 5 5 F( 5 ) = ( 5 ) ( 0.8 ) ( 0.2 ) = ( 252 ) ( 0.3276 ) ( 0.00032 ) = 0.02642

Calcula los siguientes valores: F( 6 ) = F( 7 ) = F( 8 ) = F( 9 ) = F( 10 ) = Clculo para el tercer problema: 10 0 10 f( 0 ) = ( 0 ) ( 0.5 ) ( 0.5 ) = ( 1 ) ( 1 ) ( 0.00097 ) = 0.0009 10 1 9 f( 1 ) = ( 1 ) ( 0.5 ) ( 0.5 )= ( 10 ) ( 0.5 ) ( 0.00195 ) = 0.009 10 2 8 f( 2 ) = ( 2 ) ( 0.5 ) ( 0.5 ) = ( 45 ) ( 0.25 ) ( 0.0039 ) = 0.039 10 3 7 f( 3 ) = ( 3 ) ( 0.5 ) ( 0.5 ) = ( 120 ) ( 0.125 ) ( 0.00781 ) = 0.1172 33

10 4 6 f( 4 ) = ( 4 ) ( 0.5 ) ( 0.5 ) = ( 210 ) ( 0.0625 ) ( 0.0156 ) = 0.2051 10 5 5 f( 5 ) = ( 5 ) ( 0.5 ) ( 0.5 ) = ( 252 ) ( 0.03125 ) ( 0.03125 ) = 0.2461 f( 6 ) = f( 7 ) = f( 8 ) = f( 9 ) = f( 10 ) =

Representacin grfica de las probabilidades de cada uno de los problemas: Para poder trazar la grfica como si fuese una variable continua, cerramos los espacios entre cada barra del histograma, para ello tomemos medio punto despus de cada valor para obtener el lmite real superior de clase.

p<q

Grfica del problema 1.

La grfica 1 es asimtrica y sesgada a la derecha-

34

p>q

Grfica del problema 2.

La grfica 2 es antisimtrica y sesgada a la izquierda.

Grfica del problema 3.

La grfica 3 es simtrica muy parecida a la campana de Gauss.

35

1.1.3

APROXIMACIN NORMAL A LA DISTRIBUCIN BINOMIAL

En el fascculo anterior estudiaste el clculo de probabilidades de variables discretas cuya distribucin es binomial. Veamos la representacin grfica de una variable de distribucin binomial cuando n ( nmero de elementos de la poblacin ) aumenta.

n= 5

n = 11

n = 15

n = 50

En las grficas anteriores podemos ver si n aumenta, los espacios entre las barras se van cerrando y la grfica se aproxima a la campana de Gauss que es la grfica de una variable aleatoria continua. Veamos el clculo de los siguientes problemas correspondientes a una dis tribucin binomial definida por la ecuacin:

n f ( x) = p x (1 p ) n x x
n = Nmero de observaciones x = Nmero de xitos esperados p = Probabilidad de xito q = 1-p = Probabilidad de fracaso Con estos ejemplos podrs notar que el clculo en la distribucin binomial, es muy laborioso, aunque existen tablas para algunos valores; pero no son suficientes cuando n crece. Por ejemplo si en un problema de distribucin binomial se han realizado 100 observaciones y se desea saber la probabilidad de obtener al menos 45 xitos.

36

Para determinar esta probabilidad tenemos que calcular f ( 45 ) + f ( 46 ) + f ( 100 ) = P( x ) ...(7)

Otra forma de calcular esta Probabilidad es restndole a la unidad las probabilidades de la siguiente forma: P (x ) = 1 [ f ( 0 ) + f ( 1 ) + f ( 2 ) + . . . + f ( 44 ) ] ...(8)

Una forma de ahorrar este trabajo laborioso es haciendo el clculo de probabilidades por medio de la distribucin normal. Ya vimos en las grficas anteriores cmo el polgono de frecuencias de un problema de distribucin binomial se aproxima a la campana de Gauss, por lo tanto podemos usar la distribucin normal para calcular una probabilidad binomial con una aproximacin aceptable. Se recomienda usar la distribucin cuando n es grande y P se aproxima al valor de 0.5. se considera que n es grande si n>30 Para usar la distribucin normal se calculan los parmetros aplicando las siguientes ecuaciones: = np ...(9) . . . ( 10 )

= np(1 p)
Veamos el siguiente ejemplo:

Determinar la probabilidad de obtener 6 guilas en 15 lanzamientos de una moneda equilibrada y comparar el resultado mediante la distribucin normal. Solucin:
15 1 15 1 1 f (x ) = f ( 6 ) = ( )6 (1 )156 = ( )15 = 5005(0.0000305) = 0.1527 6 2 6 2 2

f ( x ) = 0.1527

Solucin usando la distribucin normal. Para aplicar esta distribucin corregimos los espacios para considerar a la variable como si fuese continua o sea para 6 guilas tomamos medio punto antes y medio punto despus, es decir: 37

x = 5.5

= np = 15 (

1 ) = 7.2 2

x = 6.5
2 5.5 7.5 = = 1.033 1.9365 1.9365 1 6.5 7.5 = = 0.5164 1.9365 1.9365

1 1 1 = np(1 p) = (15)( )( ) = 15 = 1.9365 2 2 2

Z1 =

Z2 =

P(z) = P(Z2)-P(Z1) = =P(-1.033)-P(-0.5164) =0.3485-0.1950=0.1535 P(Z)-f(x)=0.1535-0.1527 =0.0008 Z

-Z2

-Z1 =0

De estos calculus concluimos que la diferencia de la probabilidad normal y binomial es de 8 diezmilsimos. Este ejemplo nos ilustra que podemos usar la distribucin normal para calcular la probabilidad de una distribucin binomial, con una aproximacin tal que no afecta la toma de decisiones. Veamos otro ejemplo: Una editorial de libros tcnicos obsequia un porcentaje de libros para dar a conocer una nueva edicin. Con el libro de obsequio se enva un cuestionario que deben contestar los lectores y devolver a la editorial. En el cuestionario se incluyen preguntas con respecto de las personas para mejorar su contenido y preparar nuevos tirajes; pero la experiencia de sta es que la probabilidad de que devuelvan el cuestionario es de P ( x ) = 0.18. Se envan por correo 100 ejemplares a profesionistas que pudiesen interesarles el contenido, del libro Aplicacin industrial de la probabilidad. A la editorial le interesa saber la probabilidad que al menos reciban 15 cuestionarios de regreso. Solucin: El problema es de recibir o no el cuestionario, por lo tanto es una distribucin binomial con n = 100 y P = 0.18 por lo que para hallar el resultado debemos calcular: P ( x ) = f ( 15 ) + f ( 16 ) + . . . + f ( 100 ) O bien 38 . . . ( 11 )

P ( x ) = 1-[f ( 0 ) + f ( 1 ) + . . . + f ( 14 )]

. . . ( 12 )

El Segundo clculo es menos laborioso, sin embargo no deja de serlo. Sabemos que una buena aproximacin es mediante la distribucin normal cuyo clculo es ms sencillo. Veamos el desarrollo: = np = 100 ( .18 ) = 18 =
np(1 p) = 100(.18)(.82 ) = 3.84

Para transformar la variable binomial a continua tomamos el lmite real inferior de clase 14.5 18 = 0.9114 X = 14.5 o sea medio punto antes. Con este valor calculamos Z1 3.84 P(Z) = P (Z1) + 0.5 . . . ( 13 ) De las tablas obtenemos: P (Z1) = P (-0.9114) = 0.3186 Sustituyendo este valor en ( 13 ) Obtenemos: f(x) = P(Z) = 0.3186+0.5 f(x) = 0.8186 =0 Z

-Z1

De acuerdo con este resultado la editorial recibir el 82% de los cuestionarios enviados. EJERCICIO: 1. Aplica la distribucin binomial y determina la probabilidad de recibir al menos 15 cuestionarios. Compara los resultados e indica el error de aproximacin, si es positivo o negativo. EJERCICIO: 1. Realiza los siguientes problemas aplicando la distribucin binomial y compara el resultado usando la distribucin normal. 2. La polica tiene conocimiento que la probabilidad del robo de automviles en la ciudad de Mxico es de P( x ) = 0.4 y tiene reportados 10 automviles robados en el mes de diciembre. Calcular la probabilidad de recuperar:
a) A lo ms 3 de los 10 robados b) Al menos 6 de los 10 robados

3. En el plantel 11 del Colegio de Bachilleres se tiene el conocimiento de que la 39

probabilidad de mujeres en el primer ingreso es de 0.45. Si seleccionamos una muestra al azar de 10 alumnos de primer ingreso, Cul es la probabilidad de que :
a) Seis de los 10 sean mujeres b) A lo mas 6 de los 10 sean mujeres c) Al menos 5 de los 10 sean mujeres

1.2

DISTRIBUCIONES MUESTRALES Y TEOREMA CENTRAL DEL LMITE

En el fascculo ( 1 ) del curso de estadstica descriptiva se definieron los conceptos: 1) Poblacin a) finita e b) infinita 2) Muestra aleatoria 3) Estadstica 4) Parmetros

Tambin se estableci por qu es conveniente estudiar una muestra aleatoria en lugar de la poblacin. Se recomienda que repases estos conceptos que usaremos en esta unidad.
1.2.1 DISTRIBUCIONES MUESTRALES

Cuando vamos al mercado nos dan una prueba de barbacoa y del sabor de esta muestra se infiere el sabor de toda y si nos gusta entonces la compramos. Lo mismo ocurre si queremos comprar queso, pedimos una prueba y de esta deducimos si todo el queso est bueno o no. Si el industrial quiere determinar el nmero de horas de vida que tiene un foco, toma una muestra de todo el lote y los mantiene encendidos hasta que se funden. De estos casos podemos deducir que no es posible analizar todo el queso o la barbacoa porque no quedara para vender. El industrial no puede fundir todos los focos porque no tendra qu vender. En toda investigacin estadstica el objetivo general de esta, es hacer generalizaciones de inferencias vlidas obtenidas de la muestra. En otras palabras, se trata de conocer las caractersticas de la poblacin a partir de los datos de una o mas muestras obtenidas de la poblacin. Las muestras pueden ser:
a) Las muestras no probabilsticas no nos permiten hacer generalizaciones. b) Las muestras probabilsticas son la base de la inferencia estadstica y a este tipo corresponde el muestreo aleatorio.

40

DEFINICIN: Se llama muestreo aleatorio de una poblacin finita de n elementos, si cada muestra tiene la misma probabilidad de ser seleccionada y cada elemento de la poblacin tiene la misma probabilidad de ser incluido en la muestra. Los tipos de muestras aleatorias son: 1. 2. 3. 4. Muestreo sistemtico. Muestreo estratificado. Muestreo por conglomerados. Muestreo aleatorio simple.

En lo que sigue nos ocuparemos de cada uno de ellos. Muestreo Sistemtico En este muestreo los elementos de la poblacin se seleccionan con un intervalo uniforma que se mide en el tiempo, en el espacio o en el orden. Ejemplo: Se desea entrevistar a cada dcimo estudiante del S.E.A. del Plantel 2 del Colegio de Bachilleres, para ello se toma una lista de todos los estudiantes. Supongamos que escogimos el 5., entonces el siguiente ser de los 10 primeros seleccionados al azar y a partir de este vamos tomando los nmeros dcimos de toda la lista. Este muestreo tiene ventajas y desventajas. a) Ventajas: 1. Cada elemento de la poblacin tiene la misma probabilidad de ser seleccionado.

2. El muestreo requiere de poco tiempo. 3. El costo es reducido. b) Desventajas: 1. No todas las muestras tienen la misma probabilidad de ser seleccionadas. 2. Debido a lo anterior se puede cometer el grave error de tomar una muestra que no sea representativa, por ejemplo: Se muestrea un determinado nmero de familias para saber si el mircoles est incluido un platillo de carne de res en su alimentacin. La respuesta es negativa porque solamente el domingo la consume ya que es el da en que van al pueblo a comprarla. Esta forma de tomar la muestra no es representativa. 41

Muestreo estratificado Para este muestreo, dividimos la poblacin en grupos homogneos llamados estratificados. Determinamos la proporcin correspondiente de cada estrato en base a la poblacin y esta misma proporcin se toma cada estrato para formar la muestra. Este mtodo es til cuando la poblacin ya esta dividida en grupos. Por ejemplo: Los estudiantes del S.E.A. del plantel 2 del Colegio de Bachilleres estn divididos por edades con intervalos de 5 aos y los porcentajes son los siguientes: de 18 a 23 de 24 a 29 de 30 a 35 de 36 a 41 de 42 a 47 de 48 a 53 de 54 y mas 30% 25% 20% 10% 7% 5% 3%

Se desea saber cuantas horas estudian diariamente; para ello de cada grupo se toma un porcentaje igual al del grupo, es decir del primer grupo tomamos el 30% del grupo. De la misma forma se toma el porcentaje de los siguientes grupos para formar la muestra representativa para su estudio. Muestreo con Conglomerados Para este tipo de muestreo, dividimos a la poblacin en grupos conglomerados y de estos seleccionamos una muestra aleatoria, para su estudio. Por ejemplo: En una investigacin de mercados se desea saber el nmero de coches por familia de la ciudad de Mxico. Para ello dividimos las colonias en manzanas y de este nmero seleccionamos aleatoriamente un nmero de manzanas para entrevistar a cada familia. Muestreo Aleatorio Simple El muestreo aleatorio simple tiene las caractersticas establecidas en la definicin dada en la pgina 30. Es el muestreo ms recomendable para el estudio estadstico, solamente que tiene sus inconvenientes. 42

Para poder hacer el siguientes preguntas:

muestreo aleatorio simple debemos

contestarnos las

1. Dada una poblacin finita de N elementos, Cuntas muestras de n elementos podemos formar? 2. Conociendo las n muestras Cmo podemos tomar una de ellas que sea representativa de la poblacin? Para dar respuesta a la primera pregunta, nos trasladamos al fascculo donde estudiaste el anlisis y aplicamos la ecuacin:
N N! C = n n! (N n)!

. . .(14)

EJEMPLO: Determina Cuntas muestras de tamao n se pueden formar de una poblacin finita N para los siguientes datos?
a) n = 2 y N = 20 b) n = 3 y N = 100

Solucin:
20 20! 201918! C = 2 2! ( 20 2)! = 2! (18)! = 190

a)

Este resultado nos dice que con una poblacin de 20 elementos podemos tomar 190 muestras de dos elementos cada una. b) a)
100 100! 100999897! ! C 3 = 3! (100 3)! = 123! (97 )! = 50 33 98 = 161, 700

Este resultado nos indica que de una poblacin de 100 elementos podemos formar 161, 700 muestras de 3 elementos. Para contestar la segunda pregunta observamos lo siguiente: Para que estas muestras sean representativas en el primer caso cada muestra debe 1 de probabilidad de ser seleccionada. tener 190 43

En el 2 caso cada muestra debe tener

1 de probabilidad de ser seleccionada. 161700

Cmo debemos tomar cada muestra para que sea representativa? Hay varias formas de tomar la muestra. Estas formas son las siguientes: en el primer caso cuando el nmero de muestras no es muy grande se pueden numerar recortes de papel, doblarlos y meterlos en un recipiente donde se puedan mezclar ampliamente. Una vez mezclados, se saca la muestra. Por ejemplo: En una empresa se premiar con un viaje a Europa a solo 2 de los 5 empleados de mayor eficiencia. Cmo seleccionamos a los dos que deben ir? Solucin: A cada empleado lo representamos con la primera letra de su nombre. 1. 2. 3. 4. 5. Abraham Dionisio Efran Fausto Ivn (A) (D) (E) ( F) (I )

Determinamos el nmero de muestras


N 5 5! 543! 20 C = C = n 2 2! (5 2)! = 2! (3)! = 2 = 10 P(n)=

1 10

Cada muestra la escribimos en un recorte de papel y stas son: 1 A-D 2 A-E 3 A-F 4 A-I 5 D-E 6 D-F 7 D-I 8 E-F 9 E-I 10 F-I

Doblamos bien el corte de papel de cada muestral, la introducimos en una vasija; la agitamos ampliamente y extraemos a la pareja afortunada. Quiz haya visto este procedimiento en el sorteo de los equipos para el campeonato mundial de ftbol. En el sorteo se usaron esferas huecas bisectadas y en su interior se coloc el nombre de cada equipo, se revolvan ampliamente, se sacaba una esfera de la cual se tomaba el nombre del equipo y se colocaba en el grupo correspondiente.

44

EJERCICIO: 1) Si para el campeonato mundial de ftbol hay 24 equipos de los cuales se deben formar 6 grupos de 4. Cmo organizaras los equipos para que cada muestra sea aleatoria? Cmo tomaras cada muestra y qu equipos la compondran? Determina los dos posibles finalistas. 2) Calcula el nmero de muestras de tamao 3 para una poblacin de: a) 7 elementos b) 15 elementos c) 50 elementos 3) Calcula el nmero de muestras de tamao 5 para una poblacin de: a) 10 elementos b) 25 elementos c) 75 elementos Si tienes alguna duda consulta a tu profesor o a tu consultor acadmico. 5 b) Si el nmero de muestras es muy grande como en el ltimo ejercicio 15, que son 17,259, 390; la forma explicada con recortes de papel no es la adecuada. Para estos casos se usa otro procedimiento que consiste en usar una tabla de nmeros aleatorios como la que se incluye en el apndice B. Esta tabla de nmeros aleatorios se puede constituir fcilmente con un programa de computacin. Uso de la tabla de nmeros aleatorios. Para explicar su uso, veamos el siguiente ejemplo: El Banco Nacional de Mxico tiene una promocin para tarjeta habientes que consiste en condonarles la cuenta a 10 personas de cada sucursal, en la primera quincena del mes de enero de 1994. La lista de cuenta habientes es de 550 y para determinar la muestra aleatoria numeramos cada cliente con tres cifras en orden ascendente esto es: 001, 002, 003, ..., 550 y nos situamos al azar en una columna de nmeros aleatorios y nos desplazamos en ella en la direccin que queramos analizando las tres primeras cifras de cada nmero hasta completar los 10 nmeros de la muestra. Para nuestro ejemplo nos situamos en la ltima pgina de nmeros aleatorios del apndice B, en la columna 27 rengln 31 y nos desplazamos hacia abajo, los nmeros obtenidos de 3 cifras son: 187, 155, 388, 320, 281, 088, 520, 275, 480 y 273 Como la tabla es de nmeros aleatorios, podemos asegurar que esta muestra es 45

aleatoria. Como habrs notado mediante el uso de nmeros aleatorios, es muy fcil tomar una muestra aleatoria. EJERCICIO: Mediante el uso de las tablas del apndice B, realiza e siguiente ejercicio. En una empresa de 120 empleados se desea obtener una muestra aleatoria de 10 empleados para darles un curso de actualizacin. Qu empleados formaran la muestra? Distribucin de Media Muestrales Ya sabemos cmo determinar e nmero de muestras de una poblacin y cmo seleccionar una muestra aleatoria, ahora estudiaremos cmo se organiza una distribucin de medias muestrales. La distribucin de medias muestrales son las probabilidades de todas las medias posibles de las muestras de una poblacin finita. Toda distribucin de probabilidad puede describirse mediante su media y su desviacin estndar. Al tomar las muestras aleatorias se cometen ciertos errores que se reflejan en que la media y la distribucin de cada muestra no son iguales, y por lo tanto la media y la desviacin estndar de la poblacin tampoco coinciden con los de la muestra. Por esta razn, la desviacin estndar de la distribucin de un estadstico muestral recibe el nombre de error estndar estadstico. El error estndar no solamente indica el tamao del error accidental, sino tambin la exactitud que alcanzaremos si usamos un estadstico muestral para estimar un parmetro de la poblacin. Veamos el siguiente ejemplo: De una poblacin cuyos elementos son ( 1, 3, 5, 7, 9 ), formar el nmero de muestras aleatorias de 2 elementos, construir la distribucin de medias muestrales, determinar la media de la distribucin de medias ( - ); determinar la desviacin estndar de la distribucin de medias y comparar estos resultados con los parmetros de la poblacin. Solucin: n=2 N=5 Media de la poblacin:
1 + 3 + 5 + 7 + 9 25 = =5 5 5

= 5

46

2 = Varianza de la poblacin: 2 =

1 [(1-5)+(3-5)+(55)+(75)+(95)] 5
2 = 8 =

8 = 2.83

= 2.83

5 5! Nmero de muestras C = 2 2! (5 2) = 10

Conjunto de muestras {(1, 3), (1, 5), (1, 7), (1, 9), (3, 5), (3, 7), (3, 9), (5, 7), (5, 9), (7, 9)} Conjunto de medias muestrales {2, 3, 4, 5, 4, 5, 6, 6, 7, 8} Probabilidad de las medias muestrales Media de la distribucin

x
2 3 4 5 6 7

Probabilidad
1 10 1 10 2 10 2 10 2 10 1 10 1 10

de medias muestrales
(
2 2 1 1 )+ 6 ( )+ 7 ( )+ 8 ( ) 10 10 10 10

x =

2 (

1 1 2 )+ 3( )+ 4 ( )+ 5 10 10 10

x = 5
Varianza de la distribucin de

medias muestrales:
(
1 1 1 ) + (5-5) ( ) + (6-5) ( ) + (710 10 10

1 1 ) + (3-5) ( ) + (4-5) 10 10 1 1 5) ( ) + (8-5) ( ) 10 10

2 = (2-5) (

2 = 3

3 = 1.73

47

De estos resultados concluimos que: 1. La media de la distribucin de medias desviacin estndar poblacional (). De este ejemplo podemos ver el error estndar de la media en que habamos mencionado. Ilustramos el proceso de la distribucin de media muestrales mediante las siguientes grficas. Dada una poblacin de N elementos, sta tiene una media y una desviacin estndar cuya relacin entre ellos se muestra en la grfica siguiente:

es igual a la media poblacional ( )

2. La desviacin estndar de la distribucin de medias

es menor que la

< , el cual ya

Distribucin de la poblacin

Grfica A.

Distribucin de medias muestrales

Grfica B.

48

De esta poblacin se pueden formar un gran nmero de muestras pero solamente mostramos 4 de ellas para ilustrar el procedimiento.

Distribucin de medias muestrales con x = =0

< ,

Con estas grficas podemos darnos mejor idea de la secuencia de operaciones que realizamos para obtener la distribucin de medias muestrales representada por la grfica C. Esta grfica es simtrica y tiene la forma de la curva normal o campana de Gauss. De esta misma grfica podemos constatar que la media poblacional es igual a la media de la distribucin de medias, lo cual no ocurre con la desviacin estndar en la que hay un error. La desviacin estndar de la distribucin muestral de medias para poblaciones finitas de tamao N, se puede calcular por la ecuacin

x =

Nn = N 1 n

. . . (15)

Esta ecuacin se llama error estndar de las medias.

Nn le llamamos factor de correccin por poblacin finita, toda vez que para N 1 poblaciones infinitas se aplica la ecuacin x = . . . (16) n

A la raz

Si la muestra es al menos el 5% de la poblacin entonces el factor de correccin no afecta porque tiende a la unidad. 49

Veamos el ejemplo que usamos para la distribucin de medias en que: N=5 n=2 x = 3 = 8 Con estos valores sustituimos en la frmula y obtenemos: 3(8) 52 8 8 3 x = = = 5 1 2( 4) 2 2 4
x =

De este resultado concluimos que por ser la muestra al menos el 5% de la poblacin, el factor de correccin no afecta a la distribucin estndar de medias.

EJERCICIO: 1. De una poblacin finita N = { 3, 4, 5, 6, 7, 8 y 9}, se toman muestras aleatorias de 2 elementos. a) Calcula la media y la desviacin estndar de la poblacin, . b) Calcula el nmero de muestras aleatorias que se pueden formar, establece el conjunto de muestras u determina la probabilidad de cada una.

c) Construye la distribucin de medias muestrales de la poblacin. d) Calcula la media, la varianza de la distribucin de medias; valor de la desviacin estndar de las medias, aplicando la ecuacin del error estndar. e) Realiza las grficas de la secuencia de operaciones.

2. Determina el factor de correccin para una poblacin N = 10, 000 con muestras de n = 100 e indica si afecta o no a la desviacin estndar de la distribucin de medias muestrales x .

1.2.2 EL TEOREMA CENTRAL DEL LMITE

En los ejemplos anteriores qued establecido que las muestras aleatorias tomadas de una poblacin tienen diferentes medias y comparadas con la media muestral, hay un determinado error. Con respecto a este error, el teorema de Chebyshev dice: 50

1 que la media de una k2 muestra aleatoria de tamao (n) difiere de la media de la poblacin en un valor igual a x k.

Podemos afirmar con una probabilidad de cuando menos 1-

Este teorema de Chebyschev afirma que para estimar la media poblacional, cuando utilizamos la media de una muestra aleatoria podemos afirmar con una probabilidad de cuando menos 1EJEMPLO: Dada una poblacin de N elementos Cul es el error para K = 2, si tomamos una muestra n = 64 con una desviacin estndar I = 20? Solucin: 20 = 2.5 Calculamos x = 64 Se afirma con una probabilidad de 11 1 = 1 2 = 0.75 que la media de la muestra difiere k2 2 de la media de la poblacin, y que el error que se comete es menor que: x k = 2.5 ( 2 ) = ( 5 )

1 que nuestro error ser menor que: x (k). k2

Con este teorema podemos conocer el error que cometemos sin tener que hacer el desarrollo de la distribucin de medias muestrales. Existe otro teorema an ms preciso que el de Chebyshev, ste teorema se llama: Teorema del lmite central y dice: Si el tamao de la muestra ( n ) es grande, entonces la distribucin muestral terica de las medias Este teorema es fundamental en la estadstica, ya que justifica el uso de los mtodos de la curva normal en la solucin de una amplia gama de problemas. Se aplica a poblaciones infinitas y a poblaciones donde n es una parte de la poblacin. Es difcil especificar con exactitud cuan grande debe ser (n) para poder aplicar el teorema central del lmite. Sin embargo para n=20 ya se puede obtener un polgono de frecuencias simtricas y en forma de campana; para n=30, ya podemos considerar a (n) suficientemente grande. Si la poblacin que muestreamos tiene un polgono de frecuencias simtrico y en forma de campanas, entonces podemos aplicar el teorema del lmite central sin importar el tamao de (n).

51

EJEMPLO: Apliquemos el teorema del lmite central en el mismo problema donde aplicamos el teorema de Chebyshev, o sea N=64 =20 Chebyshev dice: cul es la probabilidad de que el error que se comete al tomar la media de la muestra como parmetro de la poblacin sea menor que 5? Y con su teorema se obtiene cuando menos de 0.75. Este resultado nos indica que puede ser ms pero no se precisa. Veamos el clculo con el teorema central del lmite. El rea bajo la curva es para:
Z1 =
5 = 2

20 / 64

Z2 =

5 20 / 64

=2

Con los valores de Z nos vamos a las tablas del apndice A, que se encuentran al final del fascculo, obtenemos P(Z) = P(Z1) = 0.472 P(Z) = P(Z1) + P(Z2) = 2(0.4772) = 0.9544 Con este ejemplo podemos ver como el teorema central del lmite es ms preciso que el de Chebyshev, toda vez que Chebyshev da un rango de aproximacin y el del lmite central nos fija el valor de la probabilidad. La grfica de la curva normal de este problema se muestra en la siguiente figura cuya rea est sombreada.

-3

-2

=0

Figura 9.

+2

+3

El tamao (n) cobra importancia cuando el polgono de frecuencias no es simtrico, en estos casos en la medida en que (n) aumenta, el error estndar disminuye.

52

Veamos el siguiente ejemplo: Si tomamos a x como estimacin de , cmo es el error estndar de la media si n=50 se incrementa a n=200. Solucin:
50 200 = = 200 50

50 200

1 1 = 4 2

Con este ejemplo podemos vera que al aumentar el valor de (n), el error de la media disminuye; en nuestro ejemplo disminuy la mitad. Si la naturaleza del problema que se est resolviendo tiene distribucin normal, entonces el teorema del lmite central cobra mayor importancia en el clculo del error estndar de la media. Veamos el siguiente ejemplo: Dada una poblacin normal de =100 y =25, formamos muestras de 5elementos y determinamos la media de cada muestra X. Sin duda la media de cada muestra es mayor que la media poblacional y la desviacin estndar de la distribucin muestral es menor que la de la poblacin, porque la dispersin de la muestra es menor que la de la poblacin. Grficamente lo podemos ver de la siguiente forma:

=0
Figura 10.

La grfica A es la distribucin muestral de la poblacin =100 y =25. La grfica B es la distribucin de las medias maestrales con n=5 y _<25. X

53

Ahora formemos muestras con n=20 y la grfica de esta nueva distribucin de medias maestrales es la C

<<<25

=0
Figura 11.

De la grfica C concluimos que al aumentar el valor de (n) estamos intensificando el efecto de promediar la muestra y por ello la dispersin disminuye an ms, es decir en la grfica C _<<25. X De lo anterior concluimos que si (n) crece, el error estndar que se comete al tomar a la media muestral como estimador de la poblacin () es cada vez ms pequeo. Ya dijimos que para n>30 podemos considerar que (n) es grande y aunque el teorema central del lmite se puede aplicar a una muestra cuya n<30, el error estndar es mayor. En estos casos se recomienda aplicar otra distribucin que nos permite clculos ms precisos en muestras pequeas y que veremos a continuacin.

EJERCICIO: 1. La media de una muestra aleatoria de tamao n=400 se utiliza para estimar la media de una poblacin infinita que tiene desviacin estndar =5. Qu podemos decir acerca de la probabilidad de que el error ser menor que 0.4 mediante el uso de: a) El teorema de Chebyshev b) El teorema d}central del lmite

54

2. En los equipos de deteccin de la contaminacin por humo, se usan pequeas bateras cuya duracin tiene una desviacin =77 horas. Se utiliza la media de una muestra de tamao n=49 para estimar la media poblacional. Mediante la aplicacin del lmite central, qu podemos decir acerca de la probabilidad de que la estimacin tenga un error? a) Menor de 10 horas? b) Menor de 20 horas?

1.2.3 DISTRIBUCIN T DE STUDENT

En la inferencia estadstica se hacen generalizaciones con base en muestras, mediante estimaciones y pruebas de hiptesis. La estimacin consiste en asignar un valor numrico a un parmetro de una poblacin sobre la base de datos de muestras; y la prueba de hiptesis est basada en la aceptacin o rechazo de suposiciones concernientes a los parmetros de una poblacin. En el subtema 3.2.2 se hicieron estimaciones de medias poblacionales a travs de medias maestrales cuando el tamao de la muestra es grande (Teorema del lmite central). Sin embargo, cuando la muestra involucrada es pequea es muy probable que la desviacin tpica muestral S sea bastante distinta de la desviacin tpica de la poblacin ; en consecuencia en estos casos no se puede utilizar el teorema central del lmite para estimar la media de una poblacin a travs de la media de una muestra. En estos casos se utiliza otra distribucin llamada t de Student. La teora de las muestras pequeas sacadas de una poblacin normal de desviacin tpica desconocida, fue descubierta por el ingls William Gosset en 1908 con el seudnimo de Student. La distribucin t de Student se representa mediante la expresin:
t= X- s/ n

, ..(12)

donde: X = media de la muestra = media de la poblacin s = desviacin tpica de la muestra n = tamao de la muestra

55

La distribucin t de Student se basa en la consideracin de que la poblacin a partir de la cual se obtiene la muestra tiene una distribucin normal, al menos aproximadamente normal. Con la distribucin Student es posible estimar parmetros de una poblacin a partir de los estadsticos calculados para una muestra cuando sta es pequea. Dicha estimacin puede ser puntual o por intervalos. La estimacin es puntual cuando se estiman parmetros empleando valores de una muestra nica; y por intervalos cuando se establece un rango de valores dentro de los cuales se espera que el parmetro caiga. Como ejemplo para ilustrar un problema en la estimacin de medias, considrese un estudio en el cual un mdico desea determinar el incremento promedio real del pulso cardiaco de una persona que realiza cierta tarea ardua. Los siguientes datos representan los incrementos de pulso cardiaco en pulsaciones por minuto que el mdico obtuvo en relacin con 32 personas: 27, 25, 19, 28, 35, 23, 24, 22, 14, 30, 32, 34, 23, 26, 29, 27, 27, 24, 31, 22, 23, 38, 25, 16, 32, 29, 26, 25, 28, 26, 21, 28. Calculando la media de la muestra se obtiene que X =26.2 pulsaciones por minuto y en ausencia de otra informacin este nmero sirve como estimador de la media de la poblacin . Una estimacin de este tipo es una estimacin puntual ya que consta de un solo nmero. Pero esta manera de estimar un parmetro no es la ms confiable ya que no nos dice en cuanta informacin se basa la estimacin y tampoco nos dice nada acerca del posible tamao del error. Una estimacin por intervalos es mucho ms til que una estimacin puntual, debido a que posee ms informacin; no solo da el valor estimado, sino tambin la precisin y el nivel de confianza.
Propiedades de la distribucin T - Student

Comparando la variable normal estandarizada Z= t=


X-

X-
/ n

y la variable t de student,

se observa que son similares y que el nico cambio est en el denominador s/ n donde se sustituye S en lugar de . Como la distribucin normal estndar Z, la distribucin t tambin es continua, en forma de campana y perfectamente simtrica. La nica diferencia entre las dos distribuciones, es que la distribucin t tiene mayor variabilidad; la curva t est ms extendida en la parte de las clases y es ms achatada en la zona del centro. 56

En la siguiente figura se comparan los dos tipos de curvas. CURVA Z

Figura 12.

La siguiente figura muestra el comportamiento de la distribucin t comparada con la distribucin Z. g.l = grados de libertad.

Figura 13.

De la figura se puede observar que conforme aumenta el tamao de la muestra, la curva t se aproxima a la curva normal; cuando el tamao de la muestra n tiende a infinito, la curva t es idntica a la curva normal. Tambin de la figura se puede afirmar que no hay una sola distribucin para la distribucin t de Student, sino una familia de distribuciones; esto es debido al efecto del tamao de la muestra. Si n es pequea, la t de Student correspondiente es muy ancha, pero si n30, la distribucin t y la normal Z son casi indistinguibles. De todo lo anterior se pueden establecer propiedades de la distribucin de t de Student.

57

Caractersticas de la distribucin t de Student

Es simtrica con respecto a la media Tiene media =0 y >1 La desviacin tpica <1, cuando el tamao de la muestra tiende a infinito. La distribucin Z tiene solamente una distribucin con media =0 y desviacin tpica =1; mientras que la distribucin t tiene una familia de distribuciones. 5. La distribucin t no se tabula segn el tamao de la muestra, sino en trminos del nmero de grados de libertad. 6. La distribucin t es continua, en forma de campana. 7. La distribucin t se basa en la consideracin de que la poblacin a partir de la cual se obtiene la muestra tiene una distribucin normal o aproximadamente normal. 8. La variabilidad de la distribucin t, depende de dos variables aleatorias (S y X ). 9. La distribucin t se Student se utiliza para estimar parmetros poblacionales a travs de los valores de las muestras, para muestras pequeas (n<30) y cuando la desviacin tpica S es conocida. 10. El nmero de grados de libertad es el nico parmetro de la distribucin t. Esto es, la forma de la curva t est totalmente definida cuando se conoce el nmero de grados de libertad (g.l=n-1). El trmino grados de libertad abreviado (g.l.), se refiere al nmero de datos que pueden variar libremente, despus de haber impuesto ciertas restricciones a nuestros datos. El nmero de g.l.=n-1. grados de libertad es el tamao de la muestra menos uno; es decir

1. 2. 3. 4.

Cuando se quiere calcular la media de una poblacin a travs de la media muestral, debido a la variabilidad de la media muestral X; sta no ser exactamente igual a la media poblacional , por lo tanto siempre habr un margen de error llamado error muestral; es decir: = X error muestral El mximo error que se comete cuando se utiliza X como estimacin de , cuando n30 est dado por:
, donde Z denota el valor el valor 2 2 n de Z para el cual el rea situada debajo de la curva normal estndar a su derecha es igual a /2.
E=Z

La seleccin del valor de es arbitraria, depende de qu tanto error se est dispuesto a tolerar. El error que se est dispuesto a tolerar se llama nivel de confianza.

58

EJEMPLO: Z0.05, significa que estamos dispuestos a tolerar un 5% de error. Hallando este nivel de confianza en una grfica, se tiene:

= 0.05 = 0.025 2 Z Zz

Z1

=0
Figura 14.

En las tablas del rea bajo la curva normal se obtiene Z2=1.96; y como la curva es simtrica, Z1=-1.96. Lo anterior significa que el 95% de las diferencias maestrales cae entre -1.96 y 1.96 desviaciones estndares. En base al ejemplo anterior, obtener Z0.01 y representarlo en una grfica. EJEMPLO: Un experto en mecnica utiliza la media de una muestra aleatoria de tamao n=30 para estimar el tiempo promedio que le toma a un mecnico realizar cierta tarea. Si con base en la experiencia, el experto puede suponer f=2.5 minutos para estos datos, qu se puede decir con un nivel de confianza del 1% acerca del tamao mximo de su error? SOLUCIN: n = 30 = 2.5 = 1% = 0.01 = /2 = 0.005

Utilizando las tablas del rea bajo la curva normal se tiene: Z0.005 = 2.57 Sustituyendo estos datos en la frmula E = Z/2
( 2.5)

se tiene:

E = (2.57)

30

6.425 = 1.17 5.477

59

El resultado obtenido significa que el experto en mecnica puede afirmar con una certeza del 99% que su error ser cuando mucho de 1.17 minutos. EJERCICIO: Con referencia al problema de los pulsos cardiacos de las 32 personas, qu se puede decir con un nivel de confianza del 5% acerca del error mximo si se utiliza X=26.5 como estimacin del incremento promedio real del pulso de una persona que realiza la tarea dada?
Formato de una muestra para estimar la media cuando n30

La frmula E =

Z , tambin se puede utilizar para determinar el tamao de la 2 n muestra que se necesita para lograr un grado de exactitud deseada. Despejando n de la expresin anterior se tiene:
Z /2 n= .(16) E
2

Frmula para determinar el tamao de la muestra

EJEMPLO: El profesor de Estadstica de la Universidad desea emplear la media de una muestra tomada para estimar la cantidad promedio de tiempo que los estudiantes requieren para pasar de una clase a la siguiente. Adems desea que esta estimacin tenga un error de cuando mucho 0.30 minutos con probabilidad 0.95. Si se sabe de estudios similares anteriores que es razonable tomar = 1.50 minutos, de qu tamao tendr que tomar una muestra? SOLUCIN: La probabilidad 0.95 de que al hacer la estimacin se tenga un error de cuando mucho 0.30 significa que se est tomando un nivel de confianza del 5%, = 5% = /2 = 2.5% = 0.025. De tablas se tiene Z0.025 = 1.96; adems = 1.50, E = 0.30

60

Sustituyendo los datos de la frmula:


Z /2 n = E
2

se tiene
2

(1.96) (1.50) n= = 96.04 0.30

Se requiere una muestra aleatoria de tamao n=96 para la estimacin. EJERCICIO: 1. En un estudio de los hbitos de ver televisin, se busca estimar el nmero de horas en promedio que los alumnos de bachillerato ven televisin por semana. Si es razonable suponer = 3 horas, de qu tamao deber ser la muestra de manera que se pueda afirmar con la probabilidad de 0.99 que la media de la muestra fallar cuando mucho en 35 minutos?
Intervalos de confianza

Anteriormente ya se dijo que para estimar parmetros, lo ms adecuado es formar un intervalo de confianza, el cual generalmente incluir al parmetro por estimar. Como ya vimos al estimar en base a la media de la muestra X , la estimacin no ser perfecta; es decir, siempre habr un margen de error, tal que: = X error muestral; pero ya vimos que el mximo error muestral que se puede cometer es E = lo tanto podemos escribir:
=X Z 2

Z 2

, por

.(17)

donde:
X Z 2 n

= media muestral = Es el valor de Z para el cual el rea bajo la curva normal a la derecha de Z es /2 = Nivel de confianza = Desviacin tpioca de la media

61

Puesto que los niveles de confianza ms utilizados son 0.05 y 0.01, entonces podemos establecer los siguientes intervalos de confianza: = X 1.96 = X 2.58
n n

; intervalo de confianza de 95% ; intervalo de confianza de 99%

Recuerda que para = 0.01 = /2 = 0.025 y que Z0.025 = 1.96. EJERCICIO: 1. Para = 0.01, obtener: Z1/2 = ___________. EJEMPLO: Obtener el intervalo de confianza del 95% del conjunto de datos: (1, 5, 2, 3, 4, 1, 2, 2, 4, 3) 1er. Paso: Se determina la media
X= X N X = 27 = 2.7 10 Z, = ___________. 2

X 1 5 2 3 4 1 2 2 4 3 27

X2 1 25 4 9 16 1 4 4 16 9 89

X = 27 N = 10

X = 2.7

2do. Paso: Se obtiene la desviacin estndar de la muestra S=


X -X N
89 - (2.7) = 8.9 - 7.29 10 1.61 0 1.27

S= S=

S = 1.27

62

3er. Paso: se obtiene el error estndar de la media.


S = X N-1

ntese que el denominador en la frmula se escribi N-1 en vez de N; la razn es que N-1 corrige el sesgo del error estndar.

1.27 1.27 = = = o.42 X 3 10 - 1

= 0.42 X

4o. paso: Se multiplica el error estndar de ____________ por 1.96 que es el valor de Z al nivel de confianza de 0.05.
= X 1.96 X = 2.7 1.96 (0.42) = 2.7 0.82 1.88 3.52

Lo anterior significa que se puede asegurar con un 95% de confianza que la verdadera muestra poblacional est entre 1.88 y 3.52. EJERCICIO: Del conjunto de datos del problema anterior, encontrar el intervalo de confianza del 99%. EJEMPLO: Un fabricante de productos especiales de acero necesita la dureza media de un lote grande de piezas de acero que acaba de recibir. Es muy importante la determinacin de la dureza ya que si sta sale de cierto rango, es necesario aplicar un tratamiento costos para llevarla al grado de dureza deseado. Imagina que t trabajas en el departamento de pruebas de cierta compaa y le han enviado el resultado de una prueba de dureza efectuada en una muestra aleatoria de 40 piezas, siendo la medida de la muestra X = 70 y la desviacin estndar S = 2. Qu haras? SOLUCIN: Se tiene que estimar la dureza media en base a una muestra con n = 40, X = 70 y S = 2 y un nivel de confianza del 99%, ya que la situacin es bastante delicada.

63

= X 2.58

2 = 70 (2.58) 40 = 70 (2.58) (0.82)

o sea: 69.18 70.82 El gerente, al recibir el informe, observa que este resultado cae muy cerca del extremo del rango aceptable (de 68.3 ________), pide que se aumente la precisin del intervalo de confianza del 0.82 a 0.50, preservando el nivel de confianza en 99%. Qu haras t? SOLUCIN: Hay que determinar el tamao de la muestra necesaria para alcanzar la precisin de E = 0.50.
Z /2 n= E
2 2

podemos tomar = 5
2

(2.58) (2) 5.16 n= = = (10.32) 2 = 106.50 0.50 0.50

Entonces nos bastara una muestra de 107 piezas. Como ya tenamos 40 piezas, se manda completar la muestra probando la dureza de 67 piezas adicionales. Se calculan las nuevas X y S en base a la muestra total y se obtiene el nuevo intervalo de confianza a 99% con precisin de 0.50. EJERCICIO: La actividad de ciertas vacunas puede mediarse nicamente a travs de pruebas en organismos vivos (conejos por ejemplo). Este procedimiento es costos y tardado, pero esencial para asegurar el funcionamiento correcto de estas vacunas. a) Si la muestra de 30 pruebas dio un ndice medio de actividad de X = 880 unidades con S = 110, forma un intervalo de confianza de 95% para la actividad media de la vacuna. Calcula el tamao de muestra total necesaria para tener un error de estimacin E 25 unidades con 99% de confianza. 64

b)

Confiabilidad de Promedios en Muestras Pequeas

Anteriormente ya se compar la distribucin Z con la distribucin t de Student. Si en la distribucin Z =


X- / n

, se reemplaza t por Z y por S se tiene la distribucin:


X- / n

t=

distribucin de Student.

Esta distribucin se utiliza para estimar parmetros para muestras pequeas. Los intervalos de confianza se forman de la misma manera que en la distribucin Z. La forma de la curva de la distribucin t de Student est basada en el nmero de grados de libertad (g. l. = n-1), en lugar del tamao n de la muestra. A medida que aumenta el nmero de grados de grados de libertad, la curva de la distribucin t es menos variable. Una muestra la vamos a considerar pequea cuando sea n<30. La tabla de valores t es diferente de la de valores Z. en la tabla de valores de la distribucin t de Student cada fila corresponde a una distribucin t distinta. La ltima columna da el nmero de grados de libertad. EJEMPLO: Para 10 g. l., el 10% del rea de la curva est a la derecha del valor t = 1.383, y como la curva es simtrica, el 10% del rea de la curva est a la izquierda del valor t = -1.383.

0.10 0.10

-3

-2

-1

=0

Figura 14. Distribucin t para 10 g. l. y /2 = 0.10.

De la figura se tiene que el 80% de los casos estn comprendidos entre -1.383 y 1. 383.

65

EJERCICIO: Para 10 g. l. y un nivel de confianza de 5%, determinar el intervalo de confianza y dibujar su grfica.
, de la misma forma como se defini Z , 2 2 de manera que el rea situada debajo de la curva que est a la derecha de t es igual 2 a -t . Sin embargo t depende del nmero de grados de libertad. 2 2

Para la distribucin t de Student se define t

Utilizando el hecho de que la distribucin t es simtrica con respecto a t = 0 (media de la distribucin t), entonces la probabilidad de que la variable aleatoria que tiene una distribucin t tome un valor entre -t/2 y t/2; es decir, -t/2 t t/2 es 1-.

De la figura podemos afirmar P(-t/2 t t/2) =1- t


-t 2 t 2

=0

Distribucin t Igual que en la distribucin Z, el intervalo de confianza en muestras pequeas se puede escribir:
= X t /2 S n

Frmula para determinar intervalos de confianza para muestras pequeas.

66

EJEMPLO: La curva de la distribucin t con 10 g. l. se muestra en la siguiente figura. Hallar el valor de t para que:

-t1

=0
Figura 16.

t1

a) b) c) d)

El rea rayada de la derecha sea 0.05 El rea total rayada sea 0.10 El rea no rayada sea 0.99 El rea rayada de la izquierda sea 0.01

SOLUCIN a) /2 = 0.05 En las tablas de la distribucin t se busca el nivel de confianza 0.05 con 10 g. l. (n = 10 + 1 = 11), es decir, el tamao de la muestra n = 11. t0.05 = 1.812 EJERCICIO: Resolver los dems incisos del problema anterior. EJEMPLO: Los contenidos de cido sulfrico en siete recipientes similares son: 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 litros. Encuentra un intervalo de confianza al 95% para la media de todos los recipientes, suponiendo una distribucin aproximadamente normal. SOLUCIN: La media y la desviacin estndar de la muestra para los datos proporcionados son: X = 10.0 y S = 0.283 (Checar estos resultados) 67

Empleando la tabla de la distribucin t, se encuentra que t0.025 = 2.447, para 6 g. l. Recuerda que = 0.05 == /2 = 0.025 el intervalo de confianza al 95% para es:
0.283 = 10.0 (2.447) 7

= 10.0

0.6925 2.64575

= 10.0 0.26174 9.738 < < 10.26174 redondeando

9.74 < < 10.26 EJERCICIO 1. Una muestra aleatoria de 25 automviles del mismo modelo se conducen de la misma forma y usando la misma calidad de gasolina. Los automviles recorren un promedio de 9 km por litro de gasolina, con una desviacin tipo de 1.2 km. Estimar el recorrido medio por litro y dar su intervalo de confianza a un nivel de confianza del 95%. Verificar la respuesta: 8.505 9.459

2. En un estudio de la contaminacin del aire, una estacin de experimentos obtuvo una medida de 2.36 miligramos de materia orgnica suspendida soluble de benceno por metro cbico con una desviacin estndar de 0.48 de una muestra tomada al azar de tamao n = 10. a) b) Construye un intervalo de confianza del 99% de la media de la poblacin muestreada. Qu se puede afirmar con el 95% de confianza acerca del error mximo, si X = 2.36 miligramos se utiliza como estimacin de la media de la poblacin muestreada?

Verificar las respuestas. a) b) 1.87 2.85 E = 0.34

68

Pruebas de hiptesis

Al hacer inferencias de caractersticas de poblaciones a travs de muestras se utilizan los mtodos de Estimacin y Pruebas de Hiptesis. Cuando se analizan caractersticas de poblaciones por el mtodo de pruebas de hiptesis, es necesario tener en cuenta los siguientes conceptos: NIVEL DE CONFIANZA. Es el nivel de error que se est dispuesto a tolerar. ESTADSTICO DE PRUEBA. Es una variable aleatoria cuyo valor se utiliza para llegar a la decisin de rechazar o no la hiptesis nula. REGIN CRTICA. Es el conjunto de valores para el estadstico de prueba que llevar a rechazar la hiptesis nula. REGIN DE ACEPTACIN. Es el conjunto de valores para el estadsticos de prueba que provocar la aceptacin de la hiptesis nula. VALOR CRTICO. Es el valor que separa a la regin de rechazo y la regin de aceptacin. HIPTESIS ESTADSTICA. Es una afirmacin o conjetura acerca del parmetro o parmetros de una poblacin. La siguiente grfica muestra el valor crtico, la regin de rechazo y la regin de aceptacin.

1-

REGIN DE RECHAZO

VALOR CRTICO

REGIN DE ACEPTACIN
Figura 17.

VALOR CRTICO

REGIN DE RECHAZO

Se ha aprendido a estimar la media de una poblacin , dando un intervalo de confianza o acompaando la estimacin de punto X con una evaluacin del error posible. Ahora aprenders cmo demostrar una hiptesis referente a la media de una poblacin ; es decir, se presentarn mtodos para decidir si se acepta o se rechaza una afirmacin acerca de un valor especfico de . Estos conceptos sern abordados en la siguiente unidad, preprate para acceder a ellos. 69

RECAPITULACIN

FUNCIN PROBABILSTICA

DISCRETA

CONTINUA

MUESTREO

SISTEMTICO ESTRATIFICADO

ASIMTRICAS

SIMTRICAS

POR CONGLOMERADOS ALEATORIO SIMPLE

NORMALIZACIN

DISTRIBUCIN NORMAL ESTNDAR PEQUEAS n < 30 GRANDES n > 30

DISTRIBUCIN t DE STUDENT

MEDIA MUESTRAL

APLICACIN EN LA SOLUCIN DE PROBLEMAS

GRADOS DE LIBERTAD

TEOREMA DEL LMITE CENTRAL

NIVEL DE CONFIANZA

PRUEBAS DE HIPTESIS

70

ACTIVIDADES DE CONSOLIDACIN

Para reafirmar los conceptos aprendidos resuelve el siguiente ejercicio. Si tienes alguna duda, consulta con tu asesor. I. La Ca. General Motor Company tiene la intencin de promover a sus trabajadores a un tabulador salarial mejor que el actual y para ello aplica un examen de conocimientos culturales, habiendo obtenido las siguientes puntuaciones: 27, 28, 28, 28, 29, 30, 30, 30, 30, 31, 31, 31, 32, 32, 32, 33, 33, 33, 33, 34, 34, 34, 34, 35, 35, 35, 35, 35, 35, 35, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38, 38, 38, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 42, 43, 43, 43, 43, 44, 44, 44, 44, 44, 44, 44, 45, 45, 45, 45, 45, 46, 46, 46, 47, 47, 47, 47, 47, 47, 47, 48, 48, 48, 48, 49, 49, 49, 49, 50, 50, 51, 51, 51, 52, 52, 53, 53, 53, 54, 54, 55, 56, 56, 57, 57, 58, 59, 61, 62, 62. Determina: 1) 2) 3) 4) 5) 6) 7) 8) 9) La media La moda La mediana La varianza La desviacin estndar Traza el polgono de frecuencias Normaliza los datos y traza la curva de mejor ajuste sobre la grfica anterior para contrastar el cambio Determina el tanto por ciento de casos que se espera hallar entre la media y las puntuaciones 28, 38 y 60 Calcula el tanto por ciento y el nmero de casos esperados entre los siguientes pares de puntuaciones: a) b) c) 10) 35 y 45 50 y 55 56 y 60

Cuntos casos se espera hallar por encima de una puntuacin igual a 50? Cuntos por debajo de 35?

71

PROBLEMA II. Los datos dados a continuacin corresponden a incrementos de pulso cardiaco en pulsaciones por minuto que un mdico determina en relacin con diez personas que realizan una tarea ardua: 27, 14, 27, 32, 25, 30, 24, 29, 19, 32 a) b) c) d) estimar el incremento promedio real del pulso cardiaco de una persona que realiza una tarea ardua, mediante el estimador puntual X. Estimar el alejamiento de las pulsaciones por minuto con respecto al promedio, utilizando un estimador puntual. Determinar el nmero de grados de libertad para la muestra dada. Determinar el error mximo que se comete al estimar el incremento promedio del pulso cardiaco de una persona mediante el estimador puntual X, con un nivel de confianza del 95%. Obtener el tamao que deber tener la muestra, de tal manera que al emplear la media X, de una muestra para estimar el incremento promedio del pulso cardiaco de una persona, se tenga un error mximo de 25 pulsaciones por minuto con un nivel de confianza de 95%. Construir un intervalo con un nivel del 99% en relacin con el incremento promedio real del pulso de personas que realizan la tarea dada.

e)

f)

72

AUTOEVALUACIN

Los resultados que debiste obtener son los siguientes, si alguno no coincide, entonces revisa tus clculos, localiza el error y corrgelo. SOLUCIN DEL PROBLEMA I 1) 4) 6) = 47.1 = 64.2 2) 5) Mo = 48.7 = 9.04 3) Md = 50.6

TABLA DE FRECUENCIAS
Xm 61 58 55 52 49 46 43 40 37 34 31 28 Fi 5 10 15 18 20 17 14 10 8 6 4 3 Fa 5 15 30 48 68 85 99 109 117 123 127 130 XmFi 305 580 825 936 980 782 602 400 296 204 124 84 6118 Xm- X 13.9 10.9 7.9 4.9 1.9 -1.1 -4.1 -7.1 -10.1 -13.1 -16.1 -19.1 (Xm- X )
2

CLASE 60-62 57-59 54-56 51-53 48-50 45-47 42-44 39-41 36-38 33-35 30-32 27-29

193.21 118.81 62.1 24.01 3.61 1.21 16.81 50.41 102.01 171.61 259.21 364.81

Fi(Xm- X ) 966.5 1188.1 936.2 432.2 72.2 20.6 235.3 504.1 816.1 1029.7 1036.8 1094.4 8332.2
2

X=

Xmfi 6118 = = 47.1 n 130 fi (Xm - X) 8332.2 833.2 = 64.6 = = n -1 130 - 1 129

2 =

= 64.590698 = 8.04

6 2 Mo = 47.5 + 3 = 47.5 + = 48.7 5 2 + 3


130 - 48 2 = 48 + 51 = 50.6 Md = 48 + 3 20 20

73

POLGONO DE FRECUENCIAS

7)

TABLA DE NORMALIZACIN PARA EL AJUSTE DE CURVAS


Z=

CLASE

fi

Ls.

X = Xi -

X
60-62 57-59 64-56 51-53 48-50 45-47 42-44 39-41 36-38 33-35 30-32 27-29 5 10 15 18 20 17 14 10 8 6 4 3 62.5 59.5 56.5 53.5 50.5 47.5 44.5 41.5 38.5 35.5 32.5 29.5 15.4 12.4 9.4 6.4 3.4 0.4 -2.6 -5.6 -8.6 -11.6 -14.6 -17.6

X I
1.92 1.54 1.12 0.80 0.42 0.05 -0.32 -0.70 -1.07 -1.44 -1.82 -2.19

DEBAJO

ENCIMA

fe

Fe. red.

0.9726 0.9382 0.8686 0.7881 0.6628 0.5199 0.3745 0.2420 0.1423 0.0749 0.0344 0.0143

0.0344 0.0696 0.0805 0.1253 0.1429 0.1454 0.1325 0.0997 0.0674 0.0405 0.0201 0.0143

4.47 9.05 10.47 16.29 18.58 18.90 17.23 12.96 8.76 5.27 2.61 1.86

4.5 9.1 10.5 16.3 18.6 18.9 17.2 13.0 8.8 5.3 2.6 1.9

X = 47.1 = 8.04 N = 130

74

A) POLGONO DE FRECUENCIAS (A) B) Curva NORMALIZADA (B) 8) 9) 10) a) 49% a) 33%, 43 casos a) 47 casos b) 37% b) 19.6%, 26 casos b) 9 casos c)45%

SOLUCIN DEL PROBLEMA II a) Para estimar la media de una poblacin, hay varios estimadores puntuales, los ms conocidos son: media, mediana y moda. De estos estimadores el ms adecuado es la media, ya que es la ms confiable por considerar todos los datos de la muestra, cosa que no ocurre con la mediana y la moda.
X= 27 + 14 + 24 + 32 + 25 + 30 + 24 + 29 + 19 + 32 259 = 25.9 = 10 10

X = 25.69 Esto significa que el incremento promedio real del pulso cardiaco es 25.9 pulsaciones por minuto.

75

Este error que se comete al estimar a travs de X se determina mediante la frmula: E = t /2 Donde: E= error t /2 = rea bajo la curva a la derecha de /2 = desviacin estndar de la poblacin n= N de datos NOTA: Recuerda que en ausencia de se puede utilizar s. = 0.05 /2 = 0.025
n

De las tablas de la distribucin t de Student y tomando g. l. = 9, se tiene: t(0.025) = 2.262


5.44 12. 305 = = 3.89 E = 2.262 10 3.162

E = 3.89 Esto significa que podemos asegurar con un grado de confianza del 95% que el error que se comete al estimar a travs de X es menor de 3.89 pulsaciones por minuto. La confiabilidad de X como estimador de la media de la poblacin depende del tamao de la muestra y el tamao de la desviacin estndar de la poblacin.

b)

Para estimar el alejamiento promedio de las pulsaciones por minuto con respecto al incremento promedio real existen varios estimadores. Los ms usuales son: la desviacin media, varianza y desviacin estndar. De ellos utilizaremos el estimador s (desviacin estndar de la muestra). Dado que generalmente no se conoce el parmetro, que es la desviacin estndar de la muestra; es estadstico s (desviacin estndar de lamuestra), puede servir como estimador de .

76

X 14 19 24 25 27 29 30 32

f 1 1 1 1 2 1 1 2

X2 196 361 576 625 729 841 900 1024 5252 s=

fix2 196 361 576 625 1458 841 900 2048 7005

Para determinar s se utiliza la frmula S= donde


fx 2 2 -X N

N = N de datos f = frecuencia de cada dato X = media de la muestra

7005 ( 25.9) 2 = 700.5 - 670.81 = 29.69 = 5.44 10

s = 5.44 Esto significa que en promedio el incremento promedio del pulso cardiaco se aleja 5.44 pulsaciones por minuto de la media.

c)

g. l. = n 1 g. l. = 9

g. l. = 10 1 = 9

d)

Sabemos que al estimar la media poblacional a travs de la media muestral X existe un error, es decir: = X error muestral

e)

Para determinar el tamao que deber tener la muestra con un nivel de confianza del 95% para tener un error mximo de 2.5 pulsaciones por minuto se utiliza la frmula: E = t /2
t /2 E ( 2.262) (5.44) 2 = (4.922112)2 = 24.22 2.5 n

despejando n se tiene

n=

n=

77

redondeando se tiene n = 24 Esto Significa que el tamao de la muestra debe ser 24 para cometer un error menor de 2.5 pulsaciones por minuto al estimar a travs de X . f) La estimacin de parmetros puede ser puntual o por intervalos. La estimacin de la media poblacional por intervalos tiene la ventaja sobre la estimacin puntual de que en la estimacin por intervalos es posible conocer el tamao del error, as como la precisin y el nivel de confianza, cosa que no se puede tener con la estimacin puntual. Como ya vimos al estimar en base a la media muestral X, la estimacin no es perfecta, es decir, siempre hay un margen de error. = X E = X = t /2 donde = nivel de confianza Para un nivel de confianza del 99% se tiene que: = 0.0 /2 = 0.005 con 9 grados de libertad
n

pero E = t /2

intervalos de confianza para estimar

t (0.005) = 4.032

5.44 = 25.9 4.032 10

= 25.9

21.934 3.162

= 25.9 6.936 18.96 32.83 Esto significa que se puede asegurar con un 99% de confianza que la verdadera muestra poblacional est entre 18.96 y 32.83 pulsaciones por minuto.

78

APNDICES
APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/
(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

79

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

80

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

81

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

82

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

83

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

2.69

84

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

85

APNDICE A REAS Y ORDENADAS DE LA CURVA DE DISTRIBUCIN NORMAL EN FUNCIN DE X/


(1) Z PUNTUACIN TIPIFICADA (2) A REA DESDE LA MEDIA A (3) B REA DE LA PARTE MAYOR (4) C REA DE LA PARTE MENOR (5) Y ORDENADA EN

86

APNDICE B Tabla. Valores crticos de t

t2 n t.100 t.050 t.025 t.010 t.005 d.f

87

NMEROS ALEATORIOS

APNDICE C 88

NMEROS ALEATORIOS

89

APNDICE C NMEROS ALEATORIOS

90

APNDICE C NMEROS ALEATORIOS

91

BIBLIOGRAFA CONSULTADA

DOWNIE, N. M. y HEAT, R. W. Mtodos Estadsticos Aplicados. Ed. Harla. FREUD, John E. , WILLIAM, Frank J., PERLES. Benjamn M. Estadstica para la Administracin. Ed. Prentice Hall Hispanoamericana S. A. GRAY, William A. y OTIS M, Ulm. Probabilidad y Estadstica Elemental. Editorial C.E.C.S.A. HOEL, Paul G. Estadstica Elemental. Ed. C. E. C. S. A. Mxico, 1976. KREYSZING, Edwin. Introduccin a la Estadstica Matemtica. Ed. Limusa. Mxico, 1981. LEVN, Richard I. Estadstica para Administradores. Ed. Pretince Hall. LINCONL L., Chao. Introduccin a la Estadstica. Ed. CECSA. Mxico, 1985. LINCOYAN Portus, Goviden. Curso Prctico de Estadstica. Ed. McGraw-Hill, Mxico, 1985 LIZRRAGA G., Ignacio Manuel. Estadstica. Ed.; McGraw-Hill. Mxico, 1986. MENDENHALL, William. Trad. SEGAMI, Carlos. Introduccin a la Probabilidad y la Estadstica. Grupo Editorial Iberoamrica. Mxico, 1989. PARSEN, Emanuel. Teora Moderna de Probabilidad y sus Aplicaciones. Ed. Limusa. Mxico, 1973. SEYMOR, Lipschutz, Ph. D. Teora y Problemas de Probabilidad. Editorial McGraw-Hill.

92

También podría gustarte