Está en la página 1de 46

UNIVERSIDAD CATÓLICA DE LA SANTÍSIMA CONCEPCIÓN

Departamento de Matemática y Física Aplicadas


Probabilidades y Estadística IN1062C

Unidad 5: DISTRIBUCIONES MUESTRALES

RS/ LR/ HA. Mayo 2016


Introducción

El proceso de estudio de las distribuciones muestrales se organiza en tres lecciones,


cada una de las cuales se divide en varias sesiones y se contextualiza en torno a las
aplicaciones en la ingeniería. El orden de las actividades se va ampliando según la
naturaleza de las variables aleatorias consideradas y se conjugan con situaciones
algebraicas y computacionales. Las actividades se resuelven colectivamente en la clase;
los ejercicios los resuelven los estudiantes individuamente en casa, y es deseable que los
estudiantes entreguen posteriormente la solución al profesor. Al final del apunte se
dispone de un glosario de términos y conceptos relacionado con las distribuciones
muestrales; que consideramos el puente entre las distribuciones de probabilidad y la
inferencia estadística. Estas lecciones son las siguientes:

1. Distribución de la suma de variables aleatorias discretas. Se estudia el


comportamiento distribucional de dos o más variables aleatorias, que sirve para
deducir una aproximación intuitiva a la distribución normal. Puesto que la
distribución binomial es la suma de n variables aleatorias independientes e
idénticamente distribuidas, se analiza la aproximación binomial a la distribución
normal; mediante el estudio de la confiabilidad de un sistema compuesto por un
número grande de componentes individuales, lo que plantea la aproximación de la
distribución binomial b(n, p) para valores grandes de n.
Las aplicaciones de los nuevos conocimientos incluirán aproximación de la
distribución de Poisson por la normal en estudios de tráfico, consumo y control de
calidad. Aceptada la aproximación y la corrección de continuidad, se aplican los
conocimientos adquiridos a otros problemas sobre control de producción,
calculando probabilidades de la media por intervalos y obteniendo tamaños de
muestra adecuados.

2. Distribución de la suma de variables aleatorias continuas. Se estudia a


continuación la extensión del teorema central del límite a variables aleatorias
continuas independientes e idénticamente distribuidas. La situación introductoria
consiste en determinar el voltaje total en un condensador de diferentes líneas
eléctricas. Las aplicaciones de la nueva versión del teorema involucran el estudio de
la aproximación normal a las distribuciones exponencial y gamma en problemas de
atención a clientes y costo de reparación. Finalmente, se presenta una formulación
general del teorema y se discuten las condiciones de validez con los estudiantes.

3. Distribución de la media muestral que proviene de poblaciones normales. Esta


sección aborda el caso particular de los estadísticos obtenidos de una población
normal, y se amplía al caso de comparación de dos muestras analizando los
estadísticos de media, proporción y varianza muestral. Su incorporan el uso de las
distribuciones de probabilidad t-studen, Chi-cuadrado y F de Fisher. Por último se
consideran las propiedades que debe poseer un buen estimador de un parámetro
poblacional.
1
Conceptos previos

En unidades anteriores estudiamos el concepto de variables aleatorias, que son, cuál es


su clasificación, cuál es su distribución de probabilidad teórica o empírica y si la
distribución de probabilidad depende de uno o más parámetros.
Conocida la distribución de probabilidad y conocido el valor del o los parámetros
podemos determinar probabilidades de ocurrencia de algún suceso de interés.
Un parámetro es una medida estadística obtenido con todos los datos de la población,
esto indica que para conocer el valor de un parámetro se debe estudiar la población en
su totalidad, es decir realizar un censo, sin embargo, realizar un censo es poco práctico
ya sea por el alto costo que ello involucra y por el tiempo asociado a los procesos, de
aquí la importancia de esta unidad. No conocer el valor del o los parámetros implica no
poder determinar probabilidades de ocurrencia de eventos. Debemos por lo tanto buscar
alguna solución que nos permita obtener dichas probabilidades.
En estadística, la solución nace de estudiar una pequeña parte de la población, que
llamamos muestra y a partir de esta inferir hacia la población.
Las medidas obtenidas con datos de una muestra reciben el nombre de estadístico.
Básicamente un estadístico es lo mismo que un parámetro, sólo que el parámetro es
obtenido con todos los datos de la población y un estadístico con los datos de la
muestra, es por esto que también serán denotados de distinta forma.
Rápidamente podemos intuir que el valor del estadístico puede cambiar de una muestra
a otra.
Es importante conceptualizar a los estadísticos como variables aleatorias que pueden
asumir diferentes valores en muestras diferentes, que será su distribución de
probabilidad asociada y cuáles son sus propiedades.
Comprender las distribuciones muestrales nos proporciona fundamentos para entender
los procedimientos que permiten inferir sobre un parámetro que no conocemos a partir
del valor de un estadístico obtenido en un estudio realizado por muestreo probabilístico.
Veamos la siguiente situación práctica:

ACTIVIDAD 1
Un agricultor dedicado al cultivo de olivos para producción de aceite, se ha fijado como
objetivo conseguir un sistema productivo que le permita el máximo beneficio en el
mínimo plazo de recuperación del capital.
El agricultor tiene 730 ha plantadas de olivos a una densidad de 312 árboles por ha. Se
sabe que cada árbol puede llegar a producir entre 20 y 50 kg de fruta aproximadamente
y que para obtener un litro de aceite hacen falta entre 4 a 6 kg de aceitunas.
Al agricultor, cada año le interesa estimar la producción media de kg de aceituna que
cosechará para de esta forma poder estimar su producción de aceite.
Si observamos el agricultor tiene 227.760 árboles y para estimar la cosecha se aplican
ciertas fórmulas que implican medir cada árbol, sin embargo medir cada olivo tiene un
costo no muy bajo ya que se requiere de expertos en la materia pero, ¿Es realmente
importante medir la totalidad de los olivos para estimar su producción?
Como mencionamos anteriormente, la estadística ofrece métodos alternativos para
realizar dichas estimaciones, con un ahorro significativo en los costos del estudio y con
un alto grado de confianza. A fin de comprender dicha teoría vamos a considerar una
población teórica de sólo ocho olivos y realizaremos un muestreo aleatorio simple de
sólo 4 árboles.

2
Cuando seleccionamos una muestra mediante un muestreo aleatorio simple, sin
8
reemplazo dicha muestra es una de entre las   = 70 muestras posibles, ya que si la
 4
realizamos con reemplazo tenemos 84 = 4.096 muestras posibles.

Suponga que nuestra población censada de 8 árboles arrojo los siguientes valores en
kilogramos de aceituna:

árbol 1: 36 árbol 2: 30 árbol 3: 39 árbol 4: 46


árbol 5: 41 árbol 6: 48 árbol 7: 25 árbol 8: 37

A partir de los datos tenemos que la cantidad total de kg de aceitunas es de 302 kg, µ =
37.75 kg, σ 2 = 51.375 σ = 7.17199414.

Hacer un censo implica conocer los valores reales de los parámetros. Supongamos ahora
que no es posible estudiar la población total y que para representar los parámetros
trabajaremos con una muestra de tamaño 4.
A continuación se muestran las 70 muestras posibles, sin reemplazo, de tamaño 4
seleccionada aleatoriamente de la población de tamaño 8 junto al promedio de cada
muestra.

x1 x2 x3 x4 promedio x1 x2 x3 x4 promedio
36 30 39 46 37.75 36 30 41 25 33
36 30 39 41 36.5 36 30 41 37 36
36 30 39 48 38.25 36 30 48 25 34.75
36 30 39 25 32.5 36 30 48 37 37.75
36 30 39 37 35.5 36 30 25 37 32
36 30 46 41 38.25 36 39 46 41 40.5
36 30 46 48 40 36 39 46 48 42.25
36 30 46 25 34.25 36 39 46 25 36.5
36 30 46 37 37.25 36 39 46 37 39.5
36 30 41 48 38.75 36 39 41 48 41

36 39 41 25 35.25 36 46 25 37 36
36 39 41 37 38.25 36 41 48 25 37.5
36 39 48 25 37 36 41 48 37 40.5
36 39 48 37 40 36 41 25 37 34.75
36 39 25 37 34.25 36 48 25 37 36.5
36 46 41 48 42.75 30 39 46 41 39
36 46 41 25 37 30 39 46 48 40.75
36 46 41 37 40 30 39 46 25 35
36 46 48 25 38.75 30 39 46 37 38
36 46 48 37 41.75 30 39 41 48 39.5

3
x1 x2 x3 x4 promedio x1 x2 x3 x4 promedio
30 39 41 25 33.75 30 46 25 37 34.5
30 39 41 37 36.75 30 41 48 25 36
30 39 48 25 35.5 30 41 48 37 39
30 39 48 37 38.5 30 41 25 37 33.25
30 39 25 37 32.75 30 48 25 37 35
30 46 41 48 41.25 39 46 41 48 43.5
30 46 41 25 35.5 39 46 41 25 37.75
30 46 41 37 38.5 39 46 41 37 40.75
30 46 48 25 37.25 39 46 48 25 39.5
30 46 48 37 40.25 39 46 48 37 42.5
39 46 25 37 36.75 46 41 48 25 40
39 41 48 25 38.25 46 41 48 37 43
39 41 48 37 41.25 46 41 25 37 37.25
39 41 25 37 35.5 46 48 25 37 39
39 48 25 37 37.25 41 48 25 37 37.75

Si observamos, en muestras distintas algunos promedios muestrales resultan distintos y


frente a un estudio, sola una de estas muestras será seleccionada, y por tanto el
promedio muestral correspondiente será usado para representar el verdadero valor de la
1 4
media. Tenga en cuenta que la variable promedio muestral X = ∑ xi es una variable
4 i =1
aleatoria y por tanto podemos obtener su distribución de frecuencia y su histograma.

Distribución de frecuencias de
la variable promedio muestral, Distribución del promedio muestral
muestras sin reemplazo. 0.27
Clase LI LS ni fi
1 32.00 33.64 5 0.07
frecuencia relativa

0.20
2 33.64 35.29 9 0.13
3 35.29 36.93 12 0.17 0.13

4 36.93 38.57 18 0.26


0.07
5 38.57 40.21 12 0.17
6 40.21 41.86 9 0.13
0.00
7 41.86 43.50 5 0.07 30.36 32.00 33.64 35.29 36.93 38.57 40.21 41.86 43.50 45.14
promedio

Algunas medidas estadísticas para la variable promedio muestral basada en muestras


sin reemplazo son:

variable promedio muestral


Media 37.75
Mediana 37.75
Moda 37.75
Desviación estándar 2.710758987
Varianza de las medias 7.348214286
Mínimo 32
Máximo 43.5
N 70

4
Recordemos que las medidas estadísticas de la población de ocho árboles son:
µ = 37.75 kg, σ = 7.17199414 σ 2 = 51.375

Observando la media de las medias muestrales, que denotaremos por µ X , es igual a la


media de la población de los ocho árboles y la varianza de las media muestrales que
denotaremos por σ X2 , es 7.348214286, la cual en relación a la varianza de la población
 N −n  1 8−4 1
de ocho árboles es   =  = 0.142857 veces más pequeña, es decir
 N −1  n  8 −1  4
 N − n σ
2
σ X2 =  
 N −1  n

Observemos ahora la distribución de frecuencias y su histograma para las medias


muestrales basadas en muestras de tamaño 4 seleccionadas con reemplazo.

Distribución de frecuencias de la
Variable promedio muestral, muestras
Con reemplazo

Clase LI LS FA FR
1 25.00 26.77 5 1.2E-03 Distribución del promedio muestral
2 26.77 28.54 18 4.4E-03 0.20
3 28.54 30.31 73 0.02
4 30.31 32.08 186 0.05 0.15
frecuencia relativa

5 32.08 33.85 318 0.08


6 33.85 35.62 546 0.13 0.10
7 35.62 37.38 722 0.18
8 37.38 39.15 761 0.19
0.05
9 39.15 40.92 674 0.16
10 40.92 42.69 443 0.11
0.00
11 42.69 44.46 236 0.06 25.88 29.42 32.96 36.50 40.04 43.58 47.12
24.12 27.65 31.19 34.73 38.27 41.81 45.35 48.88
12 44.46 46.23 95 0.02
Promedio
13 46.23 48.00 19 4.6E-03

Algunas medidas estadísticas para la variable promedio muestral basada en muestras


con reemplazo son:

Variable Promedio muestral


Media 37.75
Mediana 37.75
Moda 37.25
Desviación estándar 3.58599707
Varianza de las medias 12.859375
Mínimo 25
Máximo 48
N 4096

Observemos nuevamente la media de las medias muestrales es igual a la media de la


población de los ocho árboles y la varianza de las media muestrales es 12.859375, la

5
1 1
cual en relación a la varianza de la población de ocho árboles es = = 0.25 más
n 4
σ2
pequeña, es decir σ X2 =
n

ACTIVIDAD 2
Ahora simularemos la selección de muestras obtenidas desde una Distribución Normal
con media 120 y desviación estándar 50, considerando muestras de tamaño 10, 20, 30 y
40 . Para cada una de ellas obtendremos 1000 muestras a fin de estudiar la distribución
muestral del estadístico muestral X .

Caso 1: Distribución del promedio muestral basado en 1000 muestras de tamaño 10.

Distribución de frecuencias de las medias


muestrales basadas en 1000 muestras de tamaño 10
Dsitribución del promedio muestral
Clase LI LS ni fi
0.31
1 64.11 75.88 2 2.0E-03
2 75.88 87.65 14 0.01 frecuencia relativa
0.23
3 87.65 99.42 68 0.07
4 99.42 111.19 195 0.20 0.15
5 111.19 122.96 291 0.29
6 122.96 134.73 243 0.24 0.08

7 134.73 146.49 143 0.14


0.00
8 146.49 158.26 40 0.04 52.3 65.3 78.2 91.2 104.1 117.1 130.0 143.0 155.9 168.9 181.8
9 158.26 170.03 4 4.0E-03 medias n=10

Estadística de la variable promedio muestral en 1000 muestras de tamaño 10


n Media D.E. Var(n) Mín Máx Mediana
1000 120.41 15.53 240.93 64.11 170.03 120.37

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 2: Distribución del promedio muestral basado en 1000 muestras de tamaño 20.

Distribución de frecuencias de las medias muestrales


basadas en 1000 muestras de tamaño 20

Clase LI LS ni fi . Distribución del promedio muestral


1 80.45 88.46 5 0.01 0.28
2 88.46 96.47 18 0.02
3 96.47 104.48 82 0.08
frecuencia relativa

0.21

4 104.48 112.48 150 0.15


0.14
5 112.48 120.49 270 0.27
6 120.49 128.50 259 0.26
0.07
7 128.50 136.50 146 0.15
8 136.50 144.51 60 0.06 0.00
9 144.51 152.52 10 0.01 72.4 81.3 90.1 98.9 107.7 116.5 125.3 134.1 142.9 151.7 160.5
medias n=20

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 20

n Media D.E. Var(n) Mín Máx Mediana


1000 119.60 11.52 132.63 80.45 152.52 119.93

6
Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 3: Distribución del promedio muestral basado en 1000 muestras de tamaño 30

Distribución de frecuencias de las medias muestrales


basadas en 1000 muestras de tamaño 30

Clase LI LS ni fi
Distribuciòn del promedio muestral
1 86.46 93.74 2 2.0E-03
0.36
2 93.74 101.02 15 0.02
3 101.02 108.29 77 0.08

frecuencia relativa
0.27
4 108.29 115.57 204 0.20
5 115.57 122.85 339 0.34 0.18

6 122.85 130.13 227 0.23


0.09
7 130.13 137.41 107 0.11
8 137.41 144.69 27 0.03 0.00
9 144.69 151.97 2 2.0E-03 79.2 87.2 95.2 103.2 111.2 119.2 127.2 135.2 143.2 151.2 159.2
n=30

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 30

n Media D.E. Var(n) Mín Máx Mediana


1000 120.12 9.02 81.32 86.46 151.97 119.91

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Caso 4: Distribución del promedio muestral basado en 1000 muestras de tamaño 40


Distribución de frecuencias de las medias muestrales
basadas en 1000 muestras de tamaño 40

Clase LI LS ni fi
1 94.48 100.21 5 0.01 Distribución del promedio muestral
0.30
2 100.21 105.95 33 0.03
3 105.95 111.68 98 0.10
frecuencia relativa

0.23
4 111.68 117.42 248 0.25
5 117.42 123.15 288 0.29 0.15

6 123.15 128.89 217 0.22


0.08
7 128.89 134.62 88 0.09
8 134.62 140.36 19 0.02
0.00
9 140.36 146.10 4 4.0E-03 91.6 97.3 103.1 108.8 114.6 120.3 126.0 131.8 137.5 143.2 149.0
n=40

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 40

n Media D.E. Var(n) Mín Máx Mediana


1000 119.80 7.60 57.75 94.48 146.10 119.58

Nota: La media de la muestra debería ser 120, la no coincidencia se basa en que estamos
tomando sólo 1000 muestras en una población infinita.

Si observamos los histogramas para cada caso, estos se ven bastante simétricos, la
media y mediana son muy similares. Además, es poco frecuente encontrar valores de
medias muestrales muy alejadas del valor central, la mayor concentración de dichas
medidas está en tres o cuatro intervalos centrales.

7
ACTIVIDAD 3
Por último, simularemos la selección de muestras obtenidas desde una Distribución
Binomial con parámetros m = 25 y p = 0.3. Consideraremos cuatro casos de 1000
muestras de tamaño 10, 20, 30 y 40 cada una. Para cada una de las 1000 muestras
obtendremos su media a fin de estudiar la distribución muestral de este estadístico.

Caso 1: Distribución del promedio muestral basado en 1000 muestras de tamaño 10.

Distribución de frecuencias de las medias


muestrales basadas en 1000 muestras de tamaño 10 Distribución del promedio muestral

0.25
Clase LI LS FA FR
1 5.30 5.77 10 0.01

frecuencia relativa
0.19
2 5.77 6.23 42 0.04
3 6.23 6.70 131 0.13
0.12
4 6.70 7.17 167 0.17
5 7.17 7.63 236 0.24
0.06
6 7.63 8.10 227 0.23
7 8.10 8.57 116 0.12
0.00
8 8.57 9.03 49 0.05 4.8 5.3 5.9 6.4 6.9 7.4 7.9 8.4 8.9 9.5 10.0
9 9.03 9.50 22 0.02 n = 10

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 10

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.46 0.75 0.56 5.30 9.50 7.50 0.03

Caso 2: Distribución del promedio muestral basado en 1000 muestras de tamaño 20.

Distribución de frecuencias de las medias


muestrales basadas en 1000 muestras de tamaño 20
Distribución del promedio muestral
Clase LI LS ni fi
0.25
1 6.00 6.33 11 0.01
2 6.33 6.66 36 0.04
frecuencia relativa

3 6.66 6.98 97 0.10 0.19

4 6.98 7.31 226 0.23


0.12
5 7.31 7.64 235 0.24
6 7.64 7.97 225 0.23
0.06
7 7.97 8.29 106 0.11
8 8.29 8.62 47 0.05
0.00
9 8.62 8.95 17 0.02 5.7 6.0 6.4 6.8 7.1 7.5 7.8 8.2 8.6 8.9 9.3
n = 20
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 20

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.50 0.50 0.25 6.00 8.95 7.50 0.05

8
Caso 3: Distribución del promedio muestral basado en 1000 muestras de tamaño 30.

Distribución de frecuencias de las medias


muestrales basadas en 1000 muestras de tamaño 30

Clase LI LS ni fi Distribución del promedio muestral


1 6.20 6.51 7 0.01 0.33
2 6.51 6.81 50 0.05
3 6.81 7.12 107 0.11

frecuencia relativa
0.25
4 7.12 7.43 248 0.25
5 7.43 7.74 314 0.3 1 0.16
6 7.74 8.04 169 0.17
7 8.04 8.35 78 0.08 0.08

8 8.35 8.66 23 0.02


9 8.66 8.97 4 4.0E-03 0.00
5.9 6.2 6.6 6.9 7.2 7.6 7.9 8.3 8.6 8.9 9.3
n = 30
Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 30

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.51 0.42 0.18 6.20 8.97 7.50 0.04

Caso 4: Distribución del promedio muestral basado en 1000 muestras de tamaño 40.

Distribución de frecuencias de las medias


muestrales basadas en 1000 muestras de tamaño 40
Distribución del promedio muestral

Clase LI LS ni fi 0.30

1 6.33 6.58 5 0.01


frecuencia relativa

2 6.58 6.84 32 0.03 0.23

3 6.84 7.10 102 0.10


4 7.10 7.36 207 0.21 0.15

5 7.36 7.62 287 0.29


6 7.62 7.88 227 0.23 0.08

7 7.88 8.13 101 0.10


8 8.13 8.39 30 0.03 0.00
6.1 6.4 6.6 6.9 7.2 7.5 7.8 8.1 8.3 8.6 8.9
9 8.39 8.65 9 0.01 n = 40

Estadística de la variable promedio muestral basado en 1000 muestras de tamaño 40

n Media D.E. Var(n) Mín Máx Mediana Asimetria


1000 7.50 0.36 0.13 6.33 8.65 7.50 -0.03

Observando los histogramas, su forma pareciera no diferir mucho de la simetría. Aquí


hay que considerar los valores de los parámetros, por lo que será un buen desafío para
Ud. verificar lo comentado.

EJERCICIO 1
En el laboratorio de computación simular la selección de muestras de tamaño 10, 20, 30
y 40 obtenidas desde una Distribución Exponencial con media 0.125. Para cada una
de ellas obtener 1000 muestras y estudiar la distribución muestral del estadístico
promedio muestral.

9
ACTIVIDAD 4
Con el fin de estimar el tiempo del trayecto desde la casa a la universidad, se realiza un
estudio para analizar el número de detenciones que hace un conductor en los semáforos,
ya sea en un viaje de ida o vuelta, encontrando, mediante la elaboración de
distribuciones de probabilidades para variables aleatorias discretas acotadas lo
siguiente:

x 0 1 2
P(X = x) 0.2 0.5 0.3

Asumiendo X v.a, número de detenciones que hace el conductor ya sea en un viaje de


ida o de vuelta

a. Observe que la distribución de probabilidad tanto para la variable aleatoria X1:


número de semáforos en los que el conductor se detiene en un viaje de ida como
para la variable aleatoria X2 número de semáforos en los que el conductor se detiene
en un viaje de vuelta, es dada por.

0, 2 x = 0

P( X i = x) =  0,5 x = 1 i = 1, 2
0,3 x = 2

Cuya representación gráfica es:

Distribución del número de detenciones en semáforos en un viaje


entre la casa y la Universidad

0.6
0.5
0.4
0.3
0.2
0.1
0
0 1 2

Además su valor esperado µ y desviación estándar σ es.

µ = E(X) = 0×0.2 + 1×0.5 + 2×0.3 = 1.1


σ 2 = V(X) = E(X2) - (E(X))2 = 1.7 – 1.12 = 0.49 y σ = 0.7
E(X2) = 02×0.2 + 12×0.5 + 22×0.3 = 1.7

b. Las variables aleatorias X1 y X2 son independientes y además al tener la misma


distribución de probabilidad, ( X 1 , X 2 ) forma una muestra aleatoria de tamaño 2.
Enumere todas las muestras aleatorias de tamaño 2 con reemplazo que pueden
obtenerse por detención de los semáforos.

Se obtienen 9 muestras (3x3) de tamaño dos:

(0,0) (0,1) (0,2) (1,0) (1,1) (1,2) (2,0) (2,1) (2,2)

10
c. Defina la variable aleatoria T = X1 + X2. Obtenga la distribución de probabilidad
de T.

Distribución de Probabilidad de T
Muestras Probabilidad Suma T P(T = t)
(0,0) p(0,0) = p(0) p(0) 0 0.04
(1,0) (0,1) 2p(0)p(1) 1 0.2
(0,2) (2,0) (1,1) 2p(0)p(2) +p(1)p(1) 2 0.37
(1,2) (2,1) 2 p(1) p(2) 3 0.3
(2,2) p(2)p(2) 4 0.09
1

d. Dibuje un gráfico adecuado para representar la distribución de T y compárela con


(b).

Distribución de probabilidad del número total de


detenciones (Suma de ambas variables aleatorias)

0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4

e. Calcule la media de T. ¿De qué manera se relaciona con la media de la población?

De la distribución de muestreo de la media se obtiene


E(T) = = 0×0.04 + 1×0.2 + 2×0.37 + 3×0.3 + 4×0.09 = 2.2

Usando propiedades de la esperanza:


E(T) = E( X1 + X2) = E( X1) + E( X2) = 1.1 +1.1 = 2.2

Para la varianza de T
E(T2) = 02×0.04 + 12×0.2 + 22×0.37 + 32×0.3 + 42×0.09 = 5.82
V(T) = E(T2) - (E(T))2 = 5.82 – 2.22 = 0.98

Usando propiedades de la varianza para variables aleatorias independientes:


V(T) = V( X1 + X2) = V( X1) + V( X2) = 0.49 + 0.49 = 0.98

f. Calcule la probabilidad de encontrar, de ida y regreso de la universidad, más de dos


semáforos en los que debo detenerme.

P(T > 2 ) = P(T = 3) + P(T=4) = 0.3 + 0.09 = 0.39

11
g. Del apartado (d) obtener la distribución de muestreo de las medias muestrales
X + X2
X= 1
2
La distribución de muestreo del promedio es

Muestras Probabilidad X (
P X =x )
(0,0) p(0,0) = p(0) p(0) 0 0.04
(1,0) (0,1) 2p(0)p(1) 0.5 0.2
(0,2) (2,0) (1,1) 2p(0)p(2) +p(1)p(1) 1 0.37
(1,2) (2,1) 2 p(1) p(2) 1.5 0.3
(2,2) p(2)p(2) 2 0.09
1

h. Dibuje un gráfico adecuado para representar la distribución de X y compárela


con (b).

Distribución de probabilidad del número medio de detenciones

0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0 0.5 1 1.5 2

Ahora calcule la media y desviación estándar de las medias muestrales. Compárela con
(c).
E( X ) = 0×0.04 + 0.5×0.2 + 1×0.37 + 1.5×0.3 + 2×0.09 = 1.1

Usando propiedades: E( X ) = E( ( X 1 + X 2 ) / 2 ) = (1.1 +1.1)/2 = 1.1


Coincide E( X ) = µ

E( X 2) = 02×0.04 + 0.52×0.2 + 12×0.37 + 1.52×0.3 + 22×0.09 = 1.455


V( X ) = E( X 2) – (E( X ))2 = 1.455 – 1.12 = 0.2455

Usando propiedades: V( X ) = V( ( X 1 + X 2 ) / 2 ) = (0.49 + 0.49) / 4 = 0.245


σ2
( )
Por otro lado, V X = σ X2 =
n
= 0.49 / 2 = 0.245

12
i. Indique tres hechos importantes obtenidos en la resolución del problema.
1. E(X) = E( X ) = µ
σ2 V (X )
( )
2. V X = σ X2 =
n
=
n
3. La distribución de la media muestral X tiene forma aproximadamente
simétrica.

j. Del apartado (d) obtener la distribución de muestreo de las varianzas muestrales S2

Muestras Probabilidad S2 Probabilidad


(0,0) (1,1) (2,2) p(0,0) + p(1,1) + p(2,2) 0 0.38
(1,0) (0,1) (1,2) (2,1) 2 p(1,0) + 2 p(1,2) 0.5 0.50
(2,0) (0,2) 2p(2,0) 2 0.12
1

Observe que:
E( S2 ) =0× 0.38 + 0.5× 0.50 + 2× 0.12 = 0.49 = ߪ ଶ
E(S4 ) = 02× 0.38 + 0.52× 0.50 + 22× 0.12 = 0.605
V(S2 ) = 0.605 – 0.49×0.49 = 0.3649

Comente si hay relación de la media y la varianza poblacionales de S2 con la media y


varianza de la distribución de muestreo de S2.

Las actividades 1, 2 y 3 son de aplicación algebraica del teorema central del límite y la
representación gráfica de la distribución muestral de la media de una variable aleatoria
de distribución conocida. Si bien el tamaño de la muestra es pequeño, el objetivo es
trabajar los cálculos con lápiz y papel y observar la convergencia rápida para esta
distribución particular.

EJERCICIO 2
La siguiente actividad tiene por objetivo estudiar algebraicamente y gráficamente el
comportamiento de la distribución de la suma de variables aleatorias a medida que se
van agregando variables.

Una empresa produce celulares con cierto tipo de defecto, identificados como 0, 1 y 2.
Suponiendo que en una partida hay 20 celulares sin defecto, 30 con un defecto y 50 con
dos defectos, se saca un celular al azar y se anota su valor, digamos X 1 . La distribución

0,2 x = 0

de X 1 será P( X 1 = x ) =  0,3 x = 1
0,5 x = 2

a. Suponga que el celular escogido primero se devuelve a la partida y luego se


escoge un segundo celular y se anota su valor, X2. Considere la v.a. S2 =X1 +
X2 como la suma de una muestra aleatoria de tamaño 2. Verifique que la
distribución de la v.a. S2 es: P( S2 =s2 )= 0,04 , 0,12 , 0,29 , 0,30 , 0,25 con
valores respectivamente 0 , 1 , 2 , 3 , 4.

13
b. Suponga que después de que el segundo celular ha sido también devuelto a la
partida, se escoge un tercer celular y se anota su valor X 3 . Determine la
distribución de probabilidad de la v.a. S3 =X1 + X2+X3.
c. Realice el experimento de obtener un cuarto celular siendo devuelto el tercero a
la partida. Obtenga la distribución de probabilidades de la suma de los cuatro
celulares extraídos.
d. En un gráfico dibuje las distribuciones de S1 , S2 , S3 y S4 (Utilice Excel y/o lápiz
y papel). ¿Qué puede comentar sobre la forma de la distribución de los
resultados de esta ilustración numérica?
En un gráfico con lápiz y papel, junto con las cuatro primeras sumas, trace en
línea discontinua como sería la distribución de S5.
e. Si en vez de la suma de variables aleatorias, se analiza la media muestral, X1 ;
X 2 =(X1 + X2)/2 ; X 3 =(X1 + X2+X3)/3 , etc. Fundamente si la distribución de la
suma y el promedio serán similares. Realice algunos comentarios.
f. En el laboratorio de computación mediante los programas R y Excel analice el
comportamiento de convergencia de las variables aleatorias; obteniendo la
distribución de probabilidades de la suma de variables aleatorias discretas y del
promedio, como se representa a continuación.

DISTRIBUCIÓN DE PROBABILIDAD DE LA MEDIA MUESTRAL


Error de muestreo: Es poco probable que una media muestral sea idéntica a la media
poblacional, sin embargo, de acuerdo a lo observado en la actividad dos y tres, puede
haber una alta probabilidad de encontrar promedios muestrales no muy alejados de la
media verdadera. De igual forma la desviación estándar calculada a partir de la muestra
probablemente no sería exactamente igual al valor correspondiente de la población.
La diferencia entre el parámetro poblacional y el valor del estadístico muestral se
denomina el error de muestreo.

14
Supóngase que una población de cinco empleados de producción tiene índices de
eficiencia de 97, 103, 96, 99 y 105. Considere además que se selecciona una muestra de
dos índices de la población. La media de todos los índices (la media de la población) es
igual a 100. Cada diferencia x - µ es el error que habría al evaluar la media poblacional
con base en la media muestral, y estos errores de muestreo se deben al azar. La cantidad
de estos errores será diferente de una muestra a la siguiente.
Muestra Media Error de muestreo
97, 105 101 1.0
103, 96 99.5 -0.5

Ahora que se ha descubierto la posibilidad de un error de muestreo cuando se usan los


resultados de la muestra para determinar un parámetro de la población, surgen las
interrogantes:
¿Cómo se puede realizar un pronóstico exacto sobre el éxito posible de un producto
recientemente elaborado, únicamente con base en resultados muestrales?
¿Cómo puede el departamento de control de calidad enviar un cargamento de circuitos
integrado basado únicamente en una muestra de 10 circuitos integrados?
¿Cómo pueden las empresas de sondeos realizar una predicción acertada respecto a una
campaña electoral con base en una muestra de 2000 electores registrados de una
población de casi 90 millones?
Para responder a estas preguntas primero debemos estudiar la distribución de muestreo
de medias muestrales.

La distribución de medias muestrales es una distribución de probabilidad que señala


todas las medias muestrales posibles de un tamaño de muestra dado y sus
probabilidades de ocurrencia. Además, se establece que:

a. Para un tamaño de muestra dado, el valor medio de todas las medias muestrales
posibles seleccionadas de la población, es exactamente igual a la media
poblacional, lo que reflejamos como E  X  = µ .
b. Existe menos variación en la distribución muestral de medias que en la
distribución de la población lo que reflejamos como σ X = σ para
n
poblaciones infinitas o cuando el muestreo se ha realizado con reemplazo y
 N − n σ
σX =   cuando al población es finita de tamaño N y el muestreo se
 N −1  n
ha realizado sin reemplazo.
c. El error estándar de la media mide la variación en la distribución muestral de la
media muestral.
c1) Si se conoce la desviación estándar poblacional, el error estándar es
σX =σ n
c2) Si no se conoce la desviación estándar poblacional, el error estándar es
estimado mediante σ X = S n

Aunque en la práctica se puede ver sólo una muestra aleatoria en particular, en teoría
puede surgir cualquiera de las muestras. El uso de la distribución de muestreo de la
media muestral es importante porque la mayoría de las decisiones en las empresas y
negocios se toman basándose en los resultados de una muestra. Damos dos ejemplos.

15
En cada una de estas situaciones se tiene una población de la que se tiene alguna
información. Se toma una muestra de la población y se desea determinar si el error
muestral –la diferencia entre el parámetro poblacional y el estadístico muestral- se debe
a la casualidad. Luego, se puede calcular la probabilidad de que una media muestral se
encuentre dentro de cierto intervalo.

EJERCICIO 3. Una empresa quiere estar segura de que su detergente para ropa contiene,
en realidad, 100 onzas (oz) de líquido como se indica en la etiqueta. Reportes anteriores
del proceso de llenado indican que la cantidad media por envase es 100 oz y que la
desviación estándar es 2 oz. El técnico de calidad, en su revisión de las 10 de la mañana,
al revisar 40 envases, encontró que la cantidad media de líquido era 99.8 oz. ¿Debe el
técnico detener la operación de llenado o es un error muestral razonable?

EJERCICIO 4. Una empresa se dedica a dar información a las empresas que se anuncian
en televisión. Investigaciones anteriores indican que un adulto ve en promedio 6.0 horas
(h) de televisión por día con una desviación estándar de 1.5 h. ¿Sería razonable que en
una muestra de 50 adultos, seleccionada aleatoriamente, se encontrara que en promedio
ven 6.5 h de televisión por día?

Al calcular la probabilidad de que una media muestral se encuentre dentro de cierto


intervalo, surge la interrogante: ¿Bajo qué condiciones la distribución de la media
muestral sigue una distribución normal?. La condición que analizaremos en esta sección
será cuando no se conoce la forma de la distribución de probabilidad de la población, o
si se sabe que no es normal, pero el tamaño de la muestra es suficientemente grande.
Consideraremos las aplicaciones del Teorema Central del Límite (TCL) en aquellas
distribuciones de probabilidades clásicas que se utilizan en la inferencia estadística.
El teorema señala que si se seleccionan de cualquier población todas las muestras de un
tamaño determinado, la distribución de las medias muestrales se acercará a una del tipo
normal. Esta aproximación aumenta en el caso de muestras más grandes. Esta
proposición general estudia la convergencia hacia la distribución normal
independientemente de la forma distribución de la poblacional.

Teorema central del límite. Obtenga una muestra aleatoria simple de tamaño n de
cualquier población de media µ y desviación típica finita σ. Cuando n es grande, la
distribución de la media muestral X se aproxima mucho a la distribución normal
σ2
N (µ , ) con media µ y desviación estándar σX = σ para poblaciones infinitas o
n n
 N − n σ
cuando el muestreo se ha realizado con reemplazo y σ X =   cuando al
 N −1  n
población es finita de tamaño N y el muestreo se ha realizado sin reemplazo

ACTIVIDAD 5
Un sistema está formado por 100 componentes cada una de las cuales tiene una
confiabilidad igual a 0,95. (Es decir, la probabilidad de que la componente funcione
correctamente durante un tiempo específico es igual a 0,95). Si esas componentes
funcionan independientemente una de otra, y si el sistema completo funciona
correctamente cuando al menos funcionan 80 componentes, ¿Cuál es la confiabilidad
del sistema?
¿Qué elementos destacarían en esta actividad y cómo la desarrollarías?

16
En primer lugar podemos definir la variable aleatoria “número de componentes que
funcionan correctamente en el sistema” con distribución binomial de parámetros n=100
ensayos y probabilidad de que funcione una componente cualquiera p=0,95. Luego,
escribimos en lenguaje simbólico P(80 ≤ S n ≤ 100 ) e intentamos de calcular la
probabilidad.
Hacemos notar que el valor es demasiado grande para las tablas que tenemos. De esta
manera estamos introduciendo la idea de aproximación mediante las preguntas: ¿Son
muchos términos en la suma?, ¿Los términos son difíciles de calcular?, ¿Podríamos usar
otra distribución de probabilidades para aproximar el cálculo de la probabilidad pedida?

Solución aproximada:
Para calcular P (80 ≤ S n ≤ 100) primero obtenemos la esperanza y varianza de la
variable de interés.
E(Sn)=E(∑Xi)= ∑E(Xi) = n×p = 100×0,95 = 95 ;
Var(Sn)=Var(∑Xi)= ∑Var(Xi) = n×p×(1-p) = 100×0,95×0,05 = 4,75.

La desviación estándar de esta variable es σ S n = 4,75 = 2,18 . Como el tamaño de la


muestra n=100 es grande, aplicamos el teorema central del límite, obteniendo:
( )
S n ~& N np, npq Luego procedería al cálculo, usando la corrección de continuidad:
 79,5 − 95 S n − 95 100,5 − 95 
P (80 ≤ S n ≤ 100) ≈ P(79,5 ≤ S n ≤ 100,5) = P ≤ ≤  ≈ φ (2,52) − φ (−7,1) = 0,994
 2,18 2,18 2,18 
Por tanto, el sistema funcionaría el 99,4% de las veces.

Nota:
La solución del problema está basada en la histórica ocurrida hacia 1713.
Al aumentar el valor de n en la distribución binomial B ( n , p ) cuya expresión
n
matemática es P ( X = x ) =   p x (1 − p )
n−x
para valores x = 0,1,2,3,...,n, los términos
 x
crecen muy rápidamente, por lo que el cálculo de las probabilidades de los valores de la
variable en las distribuciones exactas es demasiado laborioso. Este problema llevó a
distintos matemáticos a tratar de encontrar valores aproximados de estas probabilidades
para valores de n grandes y a estudiar las condiciones en que estas aproximaciones
podrían utilizarse. Abraham de Moivre (1667-1754) sugirió el uso de la función exp(-x2)
como límite de la distribución, pero no la relacionó con la distribución normal
(1 2π ) e− X / 2 .
2

Cabe señalar, que esta problemática es un caso particular de un resultado general; el


teorema central del límite, y que nuestro interés en los temas siguientes es conducirlos a
su generalización y formalización. La interrogante general que lleva a analizar los
teoremas de límite es la siguiente: ¿En qué condiciones y mediante qué funciones o
distribuciones de probabilidad pueden aproximarse la suma de otras distribuciones por
la distribución normal, cuando aumentamos progresivamente el número de sumandos?
Destacamos la importancia práctica en ingeniería, en estudios de la masa forestal,
producción, cargas en estructuras, etc., y que permite usar la distribución normal
tabulada para calcular probabilidades que provienen de la suma de diferentes
distribuciones.

17
Teorema de Laplace-De Moivre. Consideremos una variable aleatoria X con
distribución binomial B ( n, p ) . Para valores grandes de n, X sigue una distribución
aproximadamente normal N ( µ ,σ 2 ) de media µ = n p y desviación estándar σ = npq ;
es decir, la misma media y desviación estándar que la binomial. Luego, la variable
x − np
Z= sigue una distribución normal N (0,1). El resultado anterior fue introducido
npq
por Laplace.

Debemos recordar que la distribución binomial bin(n,p) se puede representar como la


suma de variables aleatorias independientes Bernoulli bin(1,p). Por tanto, el TL-D se
cumple de forma más general, para la suma de variables aleatorias independientes
idénticamente distribuidas:
Sea Sn la variable aleatoria “número de aciertos” en n experiencias de Bernoulli; si Xi es
n
una variable de Bernoulli, la variable Sn = ∑ X i sigue una ley binomial, con E(Sn)=np y
i =1
S n − np
Var (Sn)=np (1-p). Pongamos: Z n =
np(1 − p)
Cuando n tiende a infinito, la función distribución de Sn tiende a la N(np, np(1-p)).

ACTIVIDAD 6. Un fabricante de dispositivos semiconductores toma muestras aleatorias


de chips y los prueba; cada chip es clasificado como defectuoso o no defectuoso. Sea Xi
=0 si el chip no es defectuoso y Xi =1 si el chip es defectuoso. Suponga que ambos
sucesos tienen igual probabilidad.

a) Si el fabricante prueba 5 chips, determine la probabilidad aproximada, mediante el


teorema de Laplace-De Moivre, de obtener a lo más un chip defectuoso, a lo más dos
chips defectuosos. Solución:
Definamos la v.a. X: número de chips defectuosos obtenidos de las cinco extracciones
consecutivas. Así, considerada X le asociamos la distribución Binomial de recorrido x =
0,1,2,3,4,5 y parámetros n =5, p = ½. Además, E ( X ) = np = 5 / 2 , V ( X ) = npq = 5 / 4 . Si
utilizamos el teorema Laplace-DeMoivre tenemos X ~& N (5 / 2 , 5 / 4) . La probabilidad
estimada es P( X ≤ 1) ≈ P( Z ≤ −1,34) = 0,09012 , y P( X ≤ 2) ≈ P( Z ≤ −0,45) = 0,32636

b) Compare los dos resultados anteriores con la probabilidades exactas de la


distribución Binomial. Utiliza la calculadora o la tabla de la distribución Binomial. ¿Es
buena la aproximación? Solución:
Los valores exactos de las probabilidades anteriores son:
0 5 1 4
 5   1   1   5  1   1 
P( X ≤ 1) = P( X = 0) + P( X = 1) =   ⋅   ⋅   +   ⋅   ⋅   = 0,1875
 0  2   2  1  2   2 
P( X ≤ 2) = P( X = 0) + P( X = 1) + P( X = 2) = 0,5

c) Si el fabricante toma una muestra aleatoria de 60 chips, estime la probabilidad de


obtener entre 5 y 15 chips defectuosos; entre 25 y 35; entre 50 y 60; de obtener a lo más
un chip defectuoso; a lo más dos chips defectuosos. ¿Qué observas? Solución:

18
Definamos S1 = ∑ X i : número de chips defectuosos obtenidas en una muestra de 60
chips. Los parámetros de interés son n = 60 y p = ½. Mediante el teorema
aproximamos S1 ~& N (30 , 15) . Las probabilidades estimadas son:
P (5 ≤ S1 ≤ 15) ≈ P ( Z ≤ −3,87 ) − P ( Z ≤ −6,45) = 0
P( 25 ≤ S1 ≤ 35) ≈ P( Z ≤ 1,29) − P( Z ≤ −1,29) = 0,901475 − 0,09853 = 0,80295
P(50 ≤ S1 ≤ 60) ≈ P( Z ≤ 7,75) − P( Z ≤ 5,16) = 0 = P( S1 ≤ 1) = P( S1 ≤ 2)
Nota: Obtener los valores exactos de la distribución Binomial, de las probabilidades
anteriores. ¿Te parece que la aproximación mejora al crecer n?

d) Calcular la probabilidad, mediante el teorema de Laplace-De Moivre, de obtener un


total superior a 950 chips defectuosos; si se analizan 30 cajas de 60 chips cada uno.
Solución: Considerando n = 1800, utilizamos la aproximación S1 ~& N (900 , 450) . Luego,
P( S1 ≥ 950) ≈ 1 − P( Z ≤ 2,34) = 0,009642

Corrección por Continuidad


Cuesta pensar que estamos relacionando una variable aleatoria binomial discreta B con
una v.a. normal continua N, es decir, aproximamos el histograma de probabilidad de una
v.a. discreta X por una función de densidad de probabilidad continua f. La probabilidad
de un suceso relativo a X se puede interpretar como un área bajo el histograma, y se la
puede aproximar entonces por el área correspondiente subtendida por f. La siguiente
figura muestra el cálculo de P( X ≤ b) , donde b es uno de los valores de X, y que
corresponde al centro de un rectángulo de base h del histograma. Se dice que el término
h/2 es una corrección por continuidad, debiendo hacerse siempre que una v.a. discreta
se aproxima a una v.a. continua. Si X es una v.a. continua, entonces h vale cero.

Establecemos el siguiente convenio: Si los posibles valores de X son enteros


consecutivos y b es un entero, entonces h=1 y P( X ≤ b) ≅ F (b + 0,5) . Intuitivamente, el
convenio considera el área del histograma es igual al área en la función densidad
normal, y luego admitir que “los valores de la Normal se redondean en el entero más
cercano (de 0 a n) para obtener así los de la Binomial”.

P( B = 0) ≈ P( N ≤ 0,5)
P( B = x ) ≈ P( x − 0,5 ≤ N ≤ x + 0,5) , x = 1,2,3,..., n − 1
P( B = n ) ≈ P( N ≥ n − 0,5)
b + ( h / 2)
P ( X ≤ b) ≈ ∫ f ( x )dx = F(b + h / 2 )
−∞

19
EJERCICIO 3. En el caso de la aproximación de Laplace-DeMoivre podemos utilizar un
software estadístico para representar gráficamente la distribución B (n,p) para distintos
valores de sus parámetros n y p. La figura siguiente muestra valores para p = 0,3 con n
= 4, 8, 24 y para p = 0,1 con n = 4, 8 y 50. ¿Qué observa de las gráficas para los
distintos valores de los parámetros? Realice simulaciones con los programas R, Excel y
Geogebra.

ACTIVIDAD 7
En terreno arenoso se plantaron 50 arbolitos de cierto tipo y otros 50 en otra área con
terreno arcilloso. Sea X = número de árboles plantados en terreno arenoso que
sobreviven 1 año e Y = número de árboles plantados en terreno arcilloso que sobreviven
1 año. Si la probabilidad de que un árbol plantado en terreno arenoso sobreviva 1 año es
0,7 y la probabilidad de que sobreviva 1 año en terreno arcillos es 0,6, calcule una
aproximación a P(-5≤X-Y≤5).

50
Primero definimos las v.a. S1 = ∑ X i (número de árboles en terreno arenoso que
i =1
50
sobreviven 1 año), y S2 = ∑ Xi (número de árboles que sobreviven 1 año en terreno
i =1
arcilloso). S1 y S2 son definidas con distribución binomial de esperanzas 35 y 30 y
varianzas 10,5 y 12 respectivamente, obtenidas mediante las propiedades de la media y
varianza de la suma de v.a. Ambas v.a. son aproximadas por la distribución normal; por
tanto su diferencia es también de distribución normal, de parámetros S1-S2 ~& N(5, 22,5).
( S1 − S 2 ) − 5
Estandarizando, llegamos a la distribución Z = ~& N (0,1) .
22,5
Podemos deducir que E(S1-S2)=E (S1)-(S2)=35-30=5 y
Var(S1-S2)=Var (S1)+Var(S2)=10,5+12=22,5. Calculamos la probabilidad con ayuda de
tablas y efectuando cálculo algebraico llegamos a la expresión
−5−5 5 − 5 
P ( S1 − S 2 ≤ 5) ≈ P  ≤Z≤ = FZ (0) − FZ (−2,11) =0,5-0,0174=0,4826.
 22,5 22,5 

ACTIVIDAD 8. Las compañías eléctricas podan los árboles que crecen cerca de sus líneas
para evitar cortes eléctricos debidos a la caída de árboles durante las tormentas. La
aplicación de un producto químico para retrasar el crecimiento de los árboles es más
barato que podar los árboles, pero estos productos matan algunos de los árboles.

20
Suponga que un producto químico de este tipo matará el 20% de los arces. La compañía
eléctrica prueba este producto con una muestra aleatoria de 250 arces.
a. ¿Cuál es la media y la desviación estándar del número de árboles que mueren en la
muestra?
b. ¿Cuál es la probabilidad de que mueran más de 60 árboles (el 24% de la muestra)?

Se define la variable Sn “número de árboles que mueren en la muestra de tamaño 250”,


como una suma de variables Bernoulli de parámetro p=0.2; que es la proporción de
árboles que mueren por el producto químico. Han de estimar la probabilidad pedida
P(Sn >60) mediante el teorema central del límite (n es suficientemente grande), lo que
requiere determinar la esperanza y varianza de la variable suma, respectivamente 50 y
40. Al estandarizar la variable suma y usando la corrección de continuidad, se recurre a
la tabla de la distribución normal estándar para obtener el valor crítico; en este caso de
forma indirecta. Así, la probabilidad de que mueran al menos 60 árboles es de un 0,49.
Se sugiere, comparar esta aproximación con el cálculo de probabilidad en forma exacta,
mediante la distribución Binomial de parámetros n = 250 y p = 0,2.

ACTIVIDAD 9. A una central de teléfonos llegan llamadas al ritmo medio de 3 por


minuto. Determinar la probabilidad de que lleguen al menos 200 llamadas en un periodo
de una hora. ¿Cómo desarrollarías esta actividad?

Primero definimos la variable aleatoria X: “número de llamadas recibidas por una


central en 60 minutos” con distribución Poisson de media 180, cuya expresión
simbólica es X ~ P( µ = λt = 3 × 60 = 180) calculando el promedio µ, de llamadas que recibe
la central durante 60 minutos (P1). Se pide utilizar el modelo Poisson para calcular la
∞ 180 x ⋅ e −180
probabilidad P ( X ≥ 200) = ∑ . Como el cálculo con calculadora o tablas
x = 200 x!
estadísticas es laborioso, podríamos intentar ampliar el enunciado del teorema central
del límite conocido para la distribución binomial para este caso de la Poisson. Esta
segunda solución aproximada considera una aproximación al cálculo de la probabilidad
mediante la distribución normal.
La esperanza y la varianza de la distribución Poisson es 180. Utilizando la corrección de
199, 5−180
continuidad y estandarizando se obtiene: P(X ≥ 200) = P(Z ≥ ) =1-FZ(1,45)=1-
180
0,9264=0,0736.

A continuación, se enuncia una nueva versión del teorema central del límite:

ACTIVIDAD 10. Los tiempos que tarda un cajero en procesar el pedido de cada persona
son variables aleatorias independientes con distribución exponencial y una media de 1,5
minutos. ¿Cuál es la probabilidad aproximada de que se puedan procesar los pedidos de
100 personas en menos de 2 horas?

La solución es la siguiente: Tenemos E ( X ) = 1,5 = 1 / λ , donde λ = 2 / 3 . Entonces la v.a.


X ~ exp(λ = 2 / 3) , y además la varianza es V ( X ) = 1 / λ2 = 9 / 4 . Considerando una muestra
aleatoria de 100 personas X1,X2,...,X100 anotamos P (∑ X i < 120 ) = P (X < 1,2 ) . Utilizando el
teorema central del límite para n=100,

21
 σ 2 9 / 4  X − 1,5
X ~& N  µ = 1,5 , =  ⇒ ~& N (0,1) .
 n 100  3 / 20
1,2 − 1,5 
Así, la probabilidad pedida sería P Z <  = P( Z < −2) = 0,02275 .
 3 / 20 

Responda lo siguiente: Suponga que los tiempos que tarda un cajero en procesar el
pedido de cada persona son variables aleatorias independientes de población
desconocida, con una media de 1,5 minutos y una desviación estándar de 1 minuto.
¿Cuál es la probabilidad aproximada de que se puedan procesar los pedidos de 100
personas en menos de 2 horas?

n
Ahora estudiaremos la distribución muestral tanto como para S n = ∑ X i como para X
i =1
cuando la muestra aleatoria es seleccionada de una población distribuida Normal,
para ello asumimos que tanto µ como σ 2 son conocidas.
Es bueno recordar que cuando estudiamos alguna característica de interés, desde el
punto de vista estadístico la asumimos como variable aleatoria y la denotamos por la
letra X y cada valor de su recorrido es una medida sobre algún objeto y lo denotamos
por xi.
Ahora suponga que X es variable aleatoria costos de mantención de una flota de buses,
de esta forma x1 será el costo de mantención de un bus 1, x2 el costo de mantención de
n
un bus 2, y así sucesivamente, xn el costo del n-ésimo bus, de esta forma S n = ∑ X i
i =1

corresponde al costo total de mantención de los n buses observados y X el costo de


mantención promedio por bus.

Teorema 1: Sean X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población


n

n
Sn ∑X i
normal con media µ y varianza σ 2 , y sea S n = ∑ X i y X = = i =1
el total y la
i =1 n n
media de la muestra aleatoria respectivamente. Entonces se cumple:
i) Sn ~ N ( nµ ; nσ 2 )

ii) (
X ~ N µ; σ
2

n )
S n − nµ
Observe que la estandarización para Sn es dada por Z = y para X su
nσ 2
X −µ
estandarización es Z =
σ
n

22
Demostración: Se realizará sólo para X , quedando como ejercicio para Sn.
Sabemos que toda función de probabilidad tiene una única función generadora de
momento por lo tanto conocida la función generadora de momentos podremos conocer
la función de probabilidad de la variable aleatoria:
1
Sabemos que si X ~ N ( µ ; σ )
µ t + t 2σ 2
2
entonces MX = e 2
, es decir cada vez que
1 2 2
encontremos una exponencial elevado al formato diremos que la variable µt + t σ
2
aleatoria sigue una distribución normal, identificando la media como acompañante de la
variable t y la varianza como acompañante de 12 t 2 .
Ahora
t t t
x1 x2 xn t t t
M x (t ) = E ( e ) = E ( e
xt n
) ⋅ E (e n
) ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ E (e n
) = M x1 ( ) ⋅ M x 2 ( ) ⋅ ⋅ ⋅ ⋅ ⋅ ⋅M xn ( )
n n n
n
 µ t +σ 2 t

2 2
n σ 2 t2
=  M xi ( ) 
t  = e µt + n 2 , la cual es una exponencial elevado al
= e n n 2
 n   
 
formato µ t + 2 t σ , luego como t está acompañada por µ y 12 t 2 está acompañada por σ
1 2 2 2

n
vemos que la f.g.m. desarrollada corresponde a una distribución normal, donde
σ2 σ2
E (X ) = µ y V (X ) = , así X ~ N (µ , )
n n

ACTIVIDAD 11. La prueba WAIS (wechsler adult intelligence scale) es una prueba de
inteligencia para adultos. La distribución de los resultados de la prueba WAIS para
personas mayores de 16 años tiene distribución normal con media 100 y desviación
estándar 15.
Nota: (algo acerca de la prueba WAIS). Puntajes de más de 115 se considera
inteligencia brillante. Más de 130 comienza la clasificación de superdotación intelectual
con sus grados de moderada a profunda para los que alcanzan más de 175. Personas con
puntajes bajo 60 se consideran con inteligencia muy baja.

a) ¿Cuál es la probabilidad de que un individuo escogido aleatoriamente tenga un


resultado de 105 o superior?
b) ¿Cuáles son la media y la desviación estándar del promedio X de los resultados
en la prueba WAIS de una muestra aleatoria de 60 personas?
c) ¿Cuál es la probabilidad de que el promedio de los resultados en la prueba
WAIS de una muestra aleatoria de 60 personas sea de 105 o superior?
d) Entre que valores debe encontrarse la media de la muestra aleatoria de
tamaño 60 para que se encuentre a dos desviaciones estándar de la
verdadera media.
e) Entre que valores debe encontrarse la media de la muestra aleatoria de
tamaño 60 para que se encuentre a 1.96 desviaciones estándar de la
verdadera media.

Solución:
Lo primero que definimos es la variable aleatoria a considerar como también su
distribución.
Sea X v.a puntaje de la prueba de inteligencia WAIS para personas > de 16 años.

23
X ~ N (100; 225)
105 − 100
a) P( X ≥ 105) = 1 − P ( Z < ) = 1- Fz (0,33) = 0.3707
15
[ ]
b) E X =100 y V X = 3,75 [ ]
c) Esta pregunta nos obliga a definir una nueva variable aleatoria

X v.a puntaje medio de la prueba de inteligencia WAIS para personas > de 16 años
en muestra de tamaño 60.
X ~ N (100; 3.75) donde 3.75 = 225 = σ
2
= σ X2
60 n
105 − 100
P( X ≥ 105) = 1 − P( Z < ) = 1- Fz (2,58) = 0.00494
1.9365
d) Sabemos por regla empírica que aproximadamente un 95,4% de todos los datos
deben estar a dos desviaciones estándar de la verdadera media, usando la
tabla normal estándar es de 0.9545, es decir P ( −2 ≤ Z ≤ 2 ) = 0.9545 , o
 X − 100 
P  −2 ≤
1.9365
( )
≤ 2  = 0.9545 con esto P 96.13 ≤ X ≤ 103.87 = 0.9545 .
 
Esto nos indica que valores de medias muestrales mayores o iguales a 96.13 y
menores o iguales a 103.87 se encontraran a dos desviaciones estándar de la
media verdadera. Otra forma de ver esto, la verdadera media puede encontrarse
entre 96.13 y 103.87 con una probabilidad de 0.9545

e) Siguiendo la misma resolución de la letra (d) vemos de la tabla normal que


P ( −1.96 ≤ Z ≤ 1.96 ) = 0.950004 ≈ 0.95
 X − 100 
P  −1.96 ≤
1.9365
( )
≤ 1.96  = 0.95 así P 96.20 ≤ X ≤ 103.92 = 0.95
 
Entendiendo que valores de medias muestrales mayores o iguales a 96.20 y
menores o iguales a 103.92 se encontraran a 1.96 desviaciones estándar de la
media verdadera o que la verdadera media, puede encontrarse entre 96.20 y
103.92 con una probabilidad de 0.95

Observe lo relevante de esta conclusión, al no conocer la media real, podemos tomar


una muestra aleatoria de dicha población, entonces calcular su media y a partir de esta y
de que tan confiable queramos mostrar dicho resultado, podemos proporcionar un rango
de valores donde se puede encontrar la media verdadera. La probabilidad que nos damos
recibe el nombre de nivel de confianza, y lo denotamos por 1- α , y el rango de valores
define lo que llamamos intervalo de confianza.
La conclusión que hemos obtenido nos lleva a dar la siguiente definición:

Definición de intervalo de confianza para µ media de una población distribuida


normal. Dada una variable aleatoria tal que X ~ N ( µ ; σ 2 ) , asumiendo que σ 2
conocida y dada una muestra aleatoria de tamaño n de esta población. Para un nivel de
confianza del 100(1- α )%, la verdadera media deberá encontrarse dentro del intervalo:
(
µ : X ± z0σ X )

24
Donde σ X es el error estándar de estimación de la media, σ X = σ
n
z0 es un valor tal que P ( − z0 ≤ Z ≤ z0 ) = 1 − α , esquemáticamente

  = 1− σ
Nota: El intervalo definido nos muestra que P  X − z0 σ ≤ µ ≤ X + z0 σ 
 n n 

o que P  − z0 σ ≤ X − µ ≤ z0 σ  = 1 − σ , es decir, la media de la muestra difiere

 n n
de la verdadera media en a lo más z0 σ unidades con una confianza del
n
100(1 − σ )% .
z0 σ define el error máximo que admitimos en que X difiere de µ con una
n
confianza del 100(1 − σ )%
Si llamamos d a este error máximo, observe que z0 σ = d define una ecuación que
n
nos indica que conocido tres de sus valores podemos determinar el cuarto, así

zσ 
2

n= 0  Para determinar tamaño de la muestra


 d 

z0 σ =d d n
z0 =   Para determinar nivel de confianza
n  σ 

d n
σ =   Para determinar la desviación estándar
 z0 

Si simulamos la construcción de 100 intervalos de confianzas para el ejemplo de la


prueba de inteligencia WAIS, en que X ~ N (100; 225) encontramos,
100 intervalos de confianzas del 95% para la media
110

108

106

104

102

100

98

96

94

92

90
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99

Media real L inf. L sup.

Media 100.5 104.6 98.7 100.5 100.2 98.5 102.7 97.5 102.1 100.8 100.2 99.1 102.1 99.2 100.8 103.5 100.4 99.4 104.1 101.7
L inf. 96.7 100.8 94.9 96.7 96.4 94.7 98.9 93.7 98.3 97 96.4 95.3 98.3 95.4 97 99.7 96.6 95.6 100.3 97.9
L sup. 104.3 108.4 102.5 104.3 104 102.3 106.5 101.3 105.9 104.6 104 102.9 105.9 103 104.6 107.3 104.2 103.2 107.9 105.5
Contiene 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1

25
Media 97.6 100 100.9 98.9 99 101.1 99.9 99.4 101.8 97.9 100.5 99.5 95.6 101.4 100.6 97.5 102.3 99.6 99.5 100.2
L inf. 93.8 96.2 97.1 95.1 95.2 97.3 96.1 95.6 98 94.1 96.7 95.7 91.8 97.6 96.8 93.7 98.5 95.8 95.7 96.4
L sup. 101.4 103.8 104.7 102.7 102.8 104.9 103.7 103.2 105.6 101.7 104.3 103.3 99.4 105.2 104.4 101.3 106.1 103.4 103.3 104
Contiene 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1

Media 98.4 98.4 99.9 100.7 99.1 101.7 101.1 102 98.1 100.4 98.6 99.4 98.7 98.3 97.5 99.7 97.8 98.9 98.7 97.5
L inf. 94.6 94.6 96.1 96.9 95.3 97.9 97.3 98.2 94.3 96.6 94.8 95.6 94.9 94.5 93.7 95.9 94 95.1 94.9 93.7
L sup. 102.2 102.2 103.7 104.5 102.9 105.5 104.9 105.8 101.9 104.2 102.4 103.2 102.5 102.1 101.3 103.5 101.6 102.7 102.5 101.3
Contiene 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

Media 100.1 99.7 100.2 101 99.4 97.1 95.9 99.7 97.9 103.3 97.5 100.3 99.8 96.8 101.3 102.1 102 97.8 99.1 98.6
L inf. 96.3 95.9 96.4 97.2 95.6 93.3 92.1 95.9 94.1 99.5 93.7 96.5 96 93 97.5 98.3 98.2 94 95.3 94.8
L sup. 103.9 103.5 104 104.8 103.2 100.9 99.7 103.5 101.7 107.1 101.3 104.1 103.6 100.6 105.1 105.9 105.8 101.6 102.9 102.4
Contiene 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1

Media 96.7 99.3 97.5 103.6 100.1 99.3 99.2 97.1 102.6 103.9 97.9 101.5 102.8 99.2 101.4 99.7 100.8 101.1 96.5 102.5
L inf. 92.9 95.5 93.7 99.8 96.3 95.5 95.4 93.3 98.8 100.1 94.1 97.7 99 95.4 97.6 95.9 97 97.3 92.7 98.7
L sup. 100.5 103.1 101.3 107.4 103.9 103.1 103 100.9 106.4 107.7 101.7 105.3 106.6 103 105.2 103.5 104.6 104.9 100.3 106.3
Contiene 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1

Para esta simulación encontramos que el 95% de los intervalos contienen a la verdadera
media, indicado como 1 en la fila Contiene de las tablas.
Como ejercicio, compruebe Ud. algunos resultados dados en la tabla

Una pregunta interesante que pudiéramos hacernos es si personas con estudios


superiores alcanzan mayores puntuaciones en la prueba WAIS que personas que no los
tienen. De ser afirmativa esta respuesta podemos distinguir dos poblaciones; los
puntajes obtenidos por personas sin estudios superiores y los que alcanzan estudios
superiores. Luego, si elegimos una persona al azar, que tan probable es que podamos
clasificarla adecuadamente observando sólo su puntaje, o si seleccionamos una muestra
aleatoria de tamaño n, podamos tener certeza que esta ha sido obtenida de una población
y no de la otra. Gráficamente esto podríamos verlo de la siguiente forma:
Gráfico de distribución Normal para distintos valores de la media
0.027

0.020
Densidad
Densidad

0.013

0.007

0.000

70 80 90 100 110 120 130

En este gráfico podemos ver en forma clara como se traslapan poblaciones con distintas
medias, para una misma varianza, lo que nos indica que tenemos un riesgo de clasificar
a un individuo en una población equivocada.

Supongamos que definimos el siguiente criterio:

Dada una muestra aleatoria de tamaño 60 puntajes de la prueba WAIS seleccionada de


la población con media 100, si X > 105 el adulto debería pertenecer a la población con
puntaje medio mayor a 100 en caso contrario a la población con puntaje medio 100
¿Qué tan probable es que esto ocurra?. Responder esta pregunta, es calculando:

105 − 100 
( 
P X > 105 / µ = 100 = P  Z >
 1,9365 
)
= P ( Z > 2.58 ) = 0.00494

26
Esto nos indica que es poco probable que una muestra aleatoria de tamaño con media
mayor a 105 pueda ser clasificada en una población con media 100, es decir la muestra
debería venir de una población con media mayor a 100.

Si observamos la tabla de los 100 intervalos simulados, la muestra que contiene el valor
promedio más alejado de 100 es 104.6 y

104.6 − 100 
( ) 
P X > 104.6 / µ = 100 = P  Z >
 1,9365 
= P ( Z > 2.38 ) = 0.008656 es decir la

muestra debería venir de una población con media mayor a 100.

Bueno, ¿qué probabilidad será aceptable para considerar que la muestra ha sido
seleccionada de una población con media mayor que 100?.
La literatura habla de valores no más de 0.1, en muchos casos no más de 0.05 indicarán
que la muestra viene de poblaciones con media distinta de la que fue extraída, es decir
probabilidades más de 0.05 o más de 0.1, dependiendo del valor considerado por Ud.
para estos análisis, indicarán que la muestra ha sido seleccionada de la población con
media correcta. Esta probabilidad establecida se llama nivel de significación y se
denota con α y la región establecida por el criterio, región critica o región de
rechazo, denotada por RC.

Observe, que en el análisis que hemos estado desarrollando estamos probando o


contrastando una suposición respecto de la muestra ha sido seleccionada de una
población con µ =100 o con µ >100, esta prueba o contraste se recibe el nombre de
prueba de hipótesis y la suposición respecto del valor del parámetro hipótesis
estadística, y que se denotan por H0 y H1, llamadas hipótesis nula y alternativa
respectivamente.

Ejercicio: Frente a la hipótesis H0 : µ = 100 v/s H1 : µ > 100 y dado un nivel de


significación α =0.05, ¿cuál debe ser la región de rechazo?

x − 100 
( ) 
Para α =0.05, P X > x0 / µ = 100 = P  Z > 0
 1,9365 
= 0.05 , de la tabla Normal

x0 − 100
1,9365
{ }
= 1.64 ⇒ x0 = 103.2 , luego, RC = ( x1 ,L x60 ) // X > 103.2

Es decir, si Ud. selecciona una muestra aleatoria de tamaño 60 y arroja una media
muestral mayor a 103.2 podrá concluir que la muestra ha sido seleccionada de una
población con media mayor a 100.
Repita el ejercicio para la hipótesis H0 : µ = 100 v/s H1 : µ < 100

27
ACTIVIDAD 12. Un promotor inmobiliario quien intenta construir un centro comercial
desea estimar en el área el ingreso promedio por familia como indicador de las ventas
esperadas. Una muestra de n = 100 familias da una media X = US$35.500. Se asume
que la desviación estándar poblacional es σ = US$7.200. Un intervalo del 95% de
confianza para estimar el ingreso medio poblacional por familia está dada por µ :
(34.088 , 36.911)

Interpretación 1: El promotor establece que tiene un “95% de confianza en que la media


poblacional real desconocida esté entre US$34.088 y US$36.911”. Aunque el valor real
para la media poblacional sigue siendo desconocido, el promotor tiene un 95% de
confianza en que esté entre estos dos valores.

Interpretación 2: Reconoce que se pueden desarrollar muchos intervalos de confianza


diferentes. Otra muestra probablemente produciría una media muestral diferente debido
al error de muestreo. Con una X diferente, el intervalo tendría límite superior e inferior
distintos. Por tanto, la segunda interpretación establece que si se construyen todas las
N
combinaciones C n de intervalos de confianza, el 95% de ellos contendrá la media
poblacional desconocida.

Si una segunda muestra da una media muestral de US$35.600 en lugar de US$35.500, el


intervalo es µ : (34.188 , 37.011). El promotor puede estar un 95% seguro de que la
media poblacional está comprendida entre US$34.188 y US$37.011. Si todos los
intervalos posibles se construyeran con base en todas las medias muestrales diferentes,
el 95% de ellas contendría la media poblacional desconocida.

En otras palabras, significa que el 5% de todos los intervalos estaría errado; no


contendría la media poblacional. Este 5%, denominado valor alfa, hallado como α = (1-
coeficiente de confianza), representa la probabilidad de error o la probabilidad de que
un intervalo dado no contenga la media poblacional desconocida.

Caso 2: No obstante lo anterior, si el tamaño de la muestra es grande (n ≥ 30) una


X −µ
aplicación del teorema central del límite permite establecer ~& N (0,1) .
S n
Luego, un I. de C. 1 - α para µ es:
S
µ : x ± Z (1 − α 2) ⋅
n

ACTIVIDAD 13. Carlos Daniel acaba de registrar las declaraciones de impuestos de sus
clientes. Desea estimar la cantidad promedio que deben al Servicio de Renta Interna. De
los 50 clientes que seleccionó en su muestra, la cantidad promedio que se adecuaba era
de US$652.68. Ya que la desviación estándar de todos sus clientes es desconocida,
Carlos debe estimar σ con la desviación estándar de la muestra de S = US$217.43.
Verifique que Carlos puede tener un 99% de confianza en que la cantidad promedio que
deben todos sus clientes al SRI está entre US$573.35 y US$732.01.
¿Qué pasaría a este intervalo si Carlos estuviera dispuesto a aceptar un nivel de
confianza del 95%?
Se obtendría un resultado entre US$592.41 y US$712.96.
Los resultados son tanto buenos como malos:

28
Las buenas noticias son que el intervalo del 95% es más estrecho y ofrece mayor
precisión. Un intervalo amplio no es tan útil. Entre más estrecho sea un intervalo, más
significativo es.
Las malas noticias son que Carlos ahora está el 95% seguro de que el intervalo contiene
en realidad µ. Aunque el intervalo es más preciso (más estrecho), la probabilidad de que
contenga µ se ha reducido del 99 al 95%. Carlos tuvo que abandonar algo de confianza
y ganar más precisión.

Caso para dos muestras. Un problema en ingeniería es comparar el rendimiento


promedio de dos máquinas, es decir, comparar las medias correspondientes a dos
muestras:
Consideremos dos variables aleatorias X 1 y X 2 correspondientes a dos poblaciones con
medias µ1 y µ12 y varianzas σ 21 y σ 2 2 . Si seleccionamos dos muestras aleatorias
de cada una de estas poblaciones de tamaños n 1 y n 2 , respectivamente. La variable
σ 12 σ 22
aleatoria X 1 − X 2 tiene por media µ x1 − x2 = µ1 − µ 2 y varianza σ x2 − x = + .
1 2 n1 n2

Corolario 1. Si se sacan al azar muestras independientes de tamaños n 1 y n 2 de dos


poblaciones normales con medias µ1 y µ2 y varianzas σ 21 y σ 2 2 respectivamente,
entonces la distribución muestral de la diferencia de medias X 1 − X 2 está distribuida
σ 12 σ 22
normal de media y varianza: µ x1 − x2 = µ1 − µ 2 y σ x21 − x2 = + .
n1 n2

Su estandarización es la siguiente: Z=
(x − x )− (µ − µ ) ~
1 2 1 2
N(0,1)
 σ 12
  σ 22

  
 n + n 
 1  2

ACTIVIDAD 14. Una muestra de tamaño n1 = 5 es obtenida aleatoriamente de una


población que tiene distribución normal con media µ1 = 50 y varianza σ 12 = 9 , y se
registra la media muestral x1 . Una segunda muestra aleatoria de tamaño n 2 =4 se
selecciona, independiente de la primera muestra, de una población diferente que
también está distribuida normalmente, con media µ 2 = 40 y varianza σ 22 = 4 y se
registra la media muestral x 2 . Determine la probabilidad P x1 − x2 < 8,2 . ( )
σ 12 σ 22
Solución: Según el corolario 1, µ x = µ1 − µ 2 = 10 y σ x2 −x = + = 2,8
1 −x 2 1 2 n1 n2
Luego, la distribución de las diferencias de medias muestrales es x1 − x 2 ~ N (10,2.8) . Así,

( ) 
P x1 − x2 < 8,2 = P z <

8,2 − 10 
2,8 
= φ ( −1,08) = 0.1401

Otra aplicación sería comparar las medias correspondientes a dos poblaciones mediante
estimadores de funciones de parámetros de dos o más distribuciones. Por ejemplo,
obtener un intervalo de confianza para la diferencia µ1 − µ 2 entre los valores medios de
dos distribuciones diferentes que se desean comparar. En este caso, al igual que en los
casos anteriores, debemos recurrir a un estadístico que naturalmente resulta ser X 1 − X 2

29
. Consideremos dos muestras aleatorias independientes de tamaños n1 y n2 ,
provenientes de dos poblaciones normales con varianzas σ 12 y σ 22 conocidas.
 σ2 σ2 
En tal situación la distribución del estadístico es X 1 − X 2 ~ N  µ1 − µ 2 , 1 + 2 
 n1 n2 

Por lo que un Intervalo de Confianza correspondiente es:
σ12 σ 22
µ1 − µ 2 : ( X1 − X 2 ) ± Z(1 - α/2) ⋅ +
n1 n2

Nota: Cuando σ 12 y σ 22 son desconocidas, pero los tamaños de muestra n1 y n2 son


suficientemente grandes reemplazamos en el intervalo de confianza dichas varianzas por
sus correspondientes estimadores S12 y S 22 .

DISTRIBUCIÓN DE PROBABILIDAD DE LA VARIANZA MUESTRAL

Recordemos que para v.a. independientes Z i con distribución normal N(0,1), la v.a.
k 2
∑ Zi tiene distribución Chi-Cuadrado con k grados de libertad.
i =1

Anotamos X ~ X k2 Además, E (X ) = k y V ( X ) = 2k .
Por ejemplo, Para X ~ X se tiene E ( X ) = 15 ; V ( X ) = 30 y P ( X > 25) = 0.05 . La
2
15
siguiente figura muestra la distribución Chi-Cuadrado para k = 2, 4 y 6 grados de
libertad.

La importancia de estos resultados se muestra en lo siguiente:

Considere X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal con
Xi − µ
media µ y varianza σ 2 . La variable aleatoria Z i = tiene distribución normal
σ

N(0,1), y entonces ∑
n (xi − µ )2 ~ X n2
i =1 σ2

Teorema 2. Sea X 1 , X 2 ,......., X n una muestra aleatoria extraída de una población normal
X ~ N ( µ,σ 2 ) y denotemos Y =
(n − 1)S 2 . Entonces, la variable aleatoria Y tiene
σ 2

distribución Chi-cuadrado con (n-1) grados de libertad. Las variables aleatorias de la


media x y la varianza s 2 son independientes.

30
n n
Demostración. Escribamos la descomposición: ∑(Xi − µ ) 2 = ∑ ( X i − X ) 2 + n ( X − µ ) 2 Dividamos
i =1 i =1
n n
∑(Xi − µ) 2
∑(Xi − X) 2
n( X − µ )2
cada término de la igualdad por σ 2 , i =1
= i =1
+ La expresión
σ2 σ2 σ2
n( X − µ )2
corresponde al cuadrado de una variable normal estándar con una distribución χ12 .
σ 2

n
− µ )2
Por otra parte, W =
∑( Xi
i =1
sigue una distribución χ n2 . Así, W =
(n − 1)S 2 + n ( X − µ ) 2 Si
σ2 σ σ 2 2

multiplicamos por un parámetro real t, aplicamos la función exponencial a ambos miembros, y


tomamos esperanzas, teniendo en cuenta la independencia de la media y la varianza muestral,
tenemos:
 (n −12)S t 
2

E (e ) = E  e σ
tw
e tz  donde W y Z tienen distribuciones chi-cuadrado con n y 1 grados de
 
 
 (n −1)S 2 
 t 1 1
E e σ =
2
libertad, por lo que podemos escribir: ;t < es la función generadora
  (1 − 2t )(n −1) / 2 2
 
 

de momentos de una χ n2−1 y en consecuencia: Y =


(n − 1)S 2 ~ χ n2−1
σ2

Observación: La demostración que las variables aleatorias de la media x y la varianza


s 2 son independientes no la presentaremos en este curso. Por otro lado, el número de
grados de libertad del estadístico resultante disminuye en una unidad por cada
parámetro que se ha estimado.

ACTIVIDAD 15. Una empresa de equipos computacionales, ha determinado que el precio


de costo de cada equipo es una variable aleatoria que se distribuye normal con media
$500 y desviación estándar de $50
a) Si se toma una muestra aleatoria de 5 equipos, ¿cuál es la probabilidad de que el
costo promedio esté entre $521 y $540.
b) Considerando una muestra aleatoria de tamaño 10 del precio de costo, ¿cuál es la
probabilidad que la desviación estándar muestral sea inferior a $68,56?

Solución: a) X: Precio de costo de equipos computacionales X ~ N (500,2500 )

(
Se pide P 521 < x < 540 = )  521 − 500
P
 50 / 5

≤Z≤
540 − 500 
50 / 5 
= φ (1,79) − φ (0,94) = 0,1369

b) P(
(n − 1)S 2 ≤
9 ⋅ 68,56 2
) = P X 92 ≤ 16,92  = 0.95
σ2 50 2  

ACTIVIDAD 16. Suponga que una muestra de 10 neumáticos nuevos tuvieron una
duración promedio igual a 75.000 kilómetros con una varianza estimada igual a 32.000
kilómetros. Suponiendo normalidad, calcular la probabilidad de que el estimador S 2
exceda a la verdadera varianza σ 2 en un 36% o más.

( )
Solución: Se pide P S 2 ≥ 1.36σ 2 = P (Y ≥ 12.24 ) = 0,20, donde Y ≈ X 92 . Se espera
que en 20 de cada 100 muestras ocurra este evento.

31
Así la variable aleatoria Y =
(n − 1)S 2 ~ χ n2−1 permite calcular probabilidades de la
σ2
forma P (a ≤
(n − 1)S 2 ≤ b) = 1- α para valores determinados de a y b. Este resultado
σ 2

permite a su vez construir un intervalo de confianza 1- α para σ2.


( n − 1) S 2
Un intervalo que con probabilidad 1- α contenga a 2
~ ℵ2n −1 tiene por extremos
σ
2
ℵ 2n −1 (1 − α / 2) y ℵ 2n −1 (α / 2) y entonces despejando σ :
(n − 1) S 2 (n − 1) S 2
P( ≤σ2 ≤ ) = 1- α
ℵ2n −1(1 − α / 2) ℵ2n −1(α / 2)

Así un intervalo de confianza para σ2 es de la forma:

(n − 1) S 2 (n − 1) S 2
≤σ2 ≤
ℵn2 −1 (1 − α / 2) ℵ2n −1 (α / 2)

Observación: Un intervalo de confianza para la desviación estándar σ se obtiene


tomando la raíz cuadrada en cada una de las dos desigualdades anteriores.

Distribución t- Student. Sea W una variable aleatoria distribuida normal estándar y V


otra variable aleatoria distribuida Chi- cuadrado con n grados de libertad, formemos el

cuociente T = W , donde T es una variable aleatoria con distribución t- Student,


V n

además, W y V son independientes. Entonces, consideremos el caso particular, para una

muestra con distribución normal, es posible demostrar que x es independiente de S 2 , y


por tanto podemos formar una variable aleatoria con distribución t-Student de la

siguiente forma: W =
x−µ
~ N (0,1) y V =
(n − 1)S 2 ~ X n2−1 variables aleatorias
σ/ n σ2

x−µ
σ/ n x−µ
independientes, entonces T = = ~ t-Student con (n-1) grados de libertad
(n − 1)S 2 S/ n
σ 2 ( n − 1)

La función de densidad de probabilidad de la variable t-Student es:


 n +1  n +1 

Γ   2  
f (t ) = 
2  1 + t   2  , t ∈ℜ
n  n 
Γ   nπ  
2
Propiedades:
1. f(t) es simétrica con respecto al eje de la ordenada, E(t)=0, pero su varianza es
mayor que 1 lo que resulta ser más achatada y de colas más altas que la normal.
2. Existe una curva para cada (n-1) grados de libertad.
3. P(t ≤ t 0 ) = FT (t 0 ) se encuentra tabulada para los distintos grados de libertad.

32
La muestra aleatoria es sacada de una población normal, pero los parámetros µ y σ 2
son desconocidos. La estandarización de la v.a. es de la forma:
X −µ
T= ~ t (n − 1)
S n

EJERCICIO 4. Sea X una variable aleatoria con distribución normal de promedio µ = 5,2
y varianza desconocida. Se obtiene una muestra aleatoria de 10 individuos,
obteniéndose los siguientes resultados: 5,3 6,5 2,1 4,3 3,9 7,8 9,0 1,2 5,0
8,1
a) Calcular la probabilidad de que la media de la muestra exceda en 4,987
 S2 
b) Calcular P ≤ 0,46  .
σ 2 
 

X −µ
De la expresión ~ t ( n − 1) podemos obtener un intervalo de confianza para el
S n
parámetro µ cuando σ2 es desconocido. La única diferencia con la expresión obtenida
antes es que ahora se utiliza S2 en lugar de σ2 y la distribución correspondiente es la
t(n-1) en lugar de la distribución normal estándar Z(0,1).

Un Intervalo 100(1 - α )% para la media poblacional µ es:


S
µ : x ± t n −1 (1 − α / 2) ⋅
n

EJERCICIO 5. Una empresa muestrea 23 paquetes para estimar el costo postal promedio.
La media muestral es de US$23.56, con S = US$4.65.
a) El editor espera mantener el costo promedio por debajo de US$23.00 Calcule e
interprete el intervalo de confianza del 99%. ¿El editor está satisfecho?
b) Compare los resultados de la parte a) con el intervalo del 95%. Explique la
diferencia.
c) Manteniendo S = US$4.65, compare los resultados de la parte a) con el intervalo del
95%. Explique la diferencia.

Caso de dos muestras. Consideremos las varianza poblacionales σ 12 y σ 22 son


desconocidas pero iguales y los tamaños de muestras n1 y n2 obtenidas de poblaciones
normales. En este caso, si σ 12 = σ 22 = σ 2 entonces
X 1 − X 2 − ( µ1 − µ 2 )
Z= ~ N (0,1)
1 1
σ⋅ +
n1 n 2

y σ 2 puede ser estimado por S p2 =


(n1 − 1) ⋅ S12 + (n 2 − 1) ⋅ S 22
n1 + n 2 − 2
. Además: E S p2 = σ 2 ( )
( n1 − 1) ⋅ S12 (n2 − 1) ⋅ S 22
Sabemos que: Y1 = ~ ℵ2( n1 −1) , Y2 = ~ ℵ(2n 2 −1)
σ2 σ2
( n1 − 1) ⋅ S12 ( n2 − 1) ⋅ S 22
Luego se tiene Y = Y1 + Y2 = + ~ ℵ(2n1 + n 2 − 2 )
σ2 σ2
Se puede probar que si Z e Y son variables aleatorias independientes entonces:

33
Z X 1 − X 2 − ( µ1 − µ2 )
T= = ~ t ( n1 + n2 − 2)
Y 1 1
Sp ⋅ +
n1 + n2 − 2 n1 n2

EJERCICIO 6. Se cree que un nuevo fertilizante aumentará la producción de un


determinado árbol frutal. Una muestra de la producción antes de aplicar el nuevo
fertilizante en kilos fue de 19.6, 17.5, 18.4, 17.5, 18.20, 18.8, 19.2. La producción de los
mismos árboles después de aplicar el nuevo fertilizante es 9.4, 18.8, 20.6, 17.6, 19.2,
20.9, 18.3, 20.4. Suponga que las dos muestras de árboles son independientes y que
ambas muestras tienen la misma varianza. Entonces, el estimador de la varianza
7 ⋅ 1.363 + 7 ⋅ 0.882
muestral ponderada es S 2p = = 1.123.
14
En base a antecedentes históricos se sabe que la diferencia entre la media poblacional
después de aplicar el fertilizante y la media poblacional antes de aplicarla resulta ser 2.
Obtener el valor de k dada la siguiente expresión P (X 2 − X 1 ≥ k ) = 0,025

En este caso, si σ 12 = σ 22 = σ 2 entonces σ2 puede ser estimado por


(n1 − 1) ⋅ S12 + (n 2 − 1) ⋅ S 22 X1 − X 2 − ( µ1 − µ 2 )
S p2 = Se puede probar que T = ~ t (n1 + n2 − 2) .
n1 + n 2 − 2 1 1
Sp ⋅ +
n1 n2
Por lo tanto, un Intervalo de Confianza 1- α, viene dado por:
1 1
µ1 − µ2 : ( X1 − X 2 ) ± t n1 + n2 − 2(1 - α/2) ⋅ S p ⋅ +
n1 n2

El resultado anterior no se puede extender fácilmente al caso en que las dos poblaciones
tienen varianzas distintas y desconocidas.

Distribución F- Fisher. Supongamos que se tienen dos muestras provenientes de dos


distribuciones normales con media y varianzas desconocidas.
U / n1
Sean U ~ X n2 , V ~ X n2 variables aleatorias independientes, luego F = ~ f ( n1 , n2 )
1 2 V / n2
con n1 grados de libertad en el numerador y n2 grados de libertad en el denominador.
Su función de densidad de probabilidad de la variable F- Fisher es:

 n + n2  n1  n +n 
Γ 1  n1
− 1 2 
 2   n1  2 −1 1 + n1 X   2 
, x>0
2
f ( x) =  X 
 n1   n 2   n 2 


 n2 

Γ Γ 
 2   2 
1
Propiedades: a) f 1−α (n1 , n 2 ) =
f α (n 2 , n1 )
b) X ≈ F (n1 , n 2 ) , luego P( X ≤ f 1−α (n1 , n2 )) = 1 − α , se encuentra tabulada.
c) Caso particular: Consideremos muestras provenientes de una distribución normal,
sabemos que: U =
(n1 − 1)S12 ~ X n2 −1 y V =
(n2 − 1)S2 2
~ X n2 −1 y son independientes.
σ12 1 σ2 2 2

S 2σ 2
Por lo tanto, la siguiente expresión: F = 1 2 ~ F (n1 − 1, n2 − 1)
S 22σ 12

34
A continuación, se muestra su representación gráfica para distintos valores de sus
grados de libertad.

EJERCICIO 7. Si S12 y S 22 representan las varianzas de variables aleatorias


independientes de tamaños n1 = 8 y n2 = 12, tomadas de poblaciones normales con
2
iguales varianzas, encuentre la P( S1 / S 22 > 4.89 ).

Una aplicación importante de la distribución F es que permite construir un intervalo de


confianza para el cociente de dos varianzas en muestras con distribución normal.
S12σ 22
Por medio de la expresión F = ~ F (n1 − 1, n2 − 1) obtenemos de la distribución de
S 22σ 12
Fisher los valores f (1 − α / 2) y f (α / 2) para (n1 - 1) y ( n 2 − 1) grados de libertad para el
numerador y denominador respectivamente, tal que un intervalo de confianza
100(1 − α )% para σ 12 / σ 22 está dado por:

σ 12  S12 S12 
: 2 , 2 
σ 22 S ⋅ f (1 − α / 2 ) S ⋅ f (α / 2 ) 
 2 ( n1 −1 , n 2 −1) 2 ( n1 −1 , n 2 −1) 

Los resultados hasta aquí están basados en una y dos muestras de la distribución normal.
Para otro tipo de distribuciones puede ser difícil encontrar la distribución exacta de los
estimadores. No obstante, algunos resultados asintóticos son posibles. A continuación,
mostraremos dos aplicaciones del teorema central del límite:
a. Estimación por intervalos de confianza del parámetro de la proporción p
de la distribución binomial
b. Determinación del tamaño adecuado de muestra aleatoria para estimar el
parámetro p.

Partimos señalando que para los percentiles z1 y z2 fijos cuando n es grande, la


aproximación Sn ~& N (np, npq) permite calcular la probabilidad aproximada que la suma
de v.a. se encuentre en un cierto intervalo,
( )
P np + z1 npq ≤ S n ≤ np + z 2 npq = FZ (z2 ) − FZ (z1 )

35
EJERCICIO 8. Compruebe que la probabilidad de que Sn esté dentro de los límites np ± 2
npq es alrededor de FZ(2) - FZ(-2) = 0,9545; para np ± 3 npq la probabilidad es
aproximadamente 0,9973.

Comente lo siguiente: En 104 lanzamientos de una moneda, la probabilidad de que el


número de caras se desvíe de la media 5.000 en más de 100 caras es menor de 0,0455.

A continuación, relacionaremos la suma con la proporción en la estandarización normal,


obteniendo el mismo intervalo anterior ahora como promedio.

Observación: Sea p la proporción de elementos de una población que poseen un


atributo determinado. Si p̂ es el estimador puntual máximo verosímil y consistente del
parámetro en una muestra grande de tamaño n, por el teorema central del límite,
pq S n − np pˆ − p
establecemos que, si pˆ = Sn / n entonces pˆ ~& N ( p, ). Luego Zn = = .
n np (1 − p ) pˆ qˆ
n
De igual forma podemos calcular la probabilidad que la proporción de elementos con
cierto atributo se encuentre entre dos valores límites, es decir,

( )
P p + z1 pq / n < pˆ < p + z 2 pq / n = FZ (z 2 ) − FZ (z1 )

Se propone la siguiente actividad para aplicar esta propiedad en un estudio sobre planes
de pensiones.

EJERCICIO 9. Una organización muy grande desea estimar a través de un intervalo de


confianza que porción de sus empleados prefieren planificar sus propios beneficios de
retiro en lugar de seguir un plan patrocinado por la compañía, para ello tomó una
muestra aleatoria de 75 empleados, encontrando que 30 de ellos están interesados en
seguir sus propios planes de retiro.
a. Encuentre un intervalo aproximado de 99% de confianza para la proporción
verdadera de empleados que desean seguir sus propios planes de retiro.
b. Si el verdadero valor en parte a) de p = 0,3, ¿Consideraría usted que la porción de
empleados que prefieren planificar sus propios beneficios de retiro es mayor?

El procedimiento de resolución para el apartado a) Definir p: proporción de empleados


que prefieren planificar sus propios beneficios de retiro. Según la muestra
pˆ = 0, 40, Z (0,995) = 2,58 . Aplicar el intervalo siguiente para un tamaño de muestra
grande:
pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ − Z (1 − α / 2) ⋅ ≤ p ≤ pˆ + Z (1 − α / 2) ⋅
n n
Un intervalo aproximado del 99% de confianza usando la información anterior, debe dar
el siguiente resultado (0,250; 0,546). En el apartado b) la respuesta es no, pues el
intervalo contiene a 0,3.

En resumen, un Intervalo de Confianza 100(1 − α )% para la proporción poblacional p es:


pˆ qˆ
p : pˆ ± Z (1 − α 2) ⋅
n

36
La siguiente actividad implica la construcción de intervalo de confianza de la diferencia
de proporciones en dos muestras.

ACTIVIDAD 17.
Construya un intervalo de confianza para la diferencia entre dos proporciones p1-p2

En conjunto desarrollemos una solución de forma simbólica:


Para n1 y n2 relativamente grandes, se tiene por el teorema central del límite que:
 p q   p q  ( pˆ 1 − pˆ 2 ) − ( p1 − p 2 )
pˆ 1 ~& N  p1 , 1 1  , pˆ 2 ~& N  p 2 , 2 2  Entonces, Z = ~& N (0,1)
 n1   n2  pˆ 1 (1 − pˆ 1 ) pˆ 2 (1 − pˆ 2 )
+
n1 n2
En este último estadístico las proporciones muestrales en el denominador p1 y p2 han
sido estimados por sus respectivos estimadores de máxima verosimilitud. Dado que los
valores de n1 y n2 son grandes las aproximaciones siguen siendo válidas.
Por lo tanto, un intervalo de confianza aproximado del 100(1 − α )% para p1- p2 es:
 pˆ 1 qˆ1 pˆ 2 qˆ 2 pˆ 1 qˆ1 pˆ 2 qˆ 2 
 pˆ − pˆ − Z (1 − α / 2) ⋅ + , pˆ 1 − pˆ 2 + Z (1 − α / 2) ⋅ + 
 1 2
n1 n2 n1 n2 
 
donde pˆ 1 y pˆ 2 son los estimadores máximo verosímiles de p1 y p2 respectivamente.
En resumen, un Intervalo de Confianza aproximado 100(1 − α )% para p1-p2 es:
pˆ1qˆ1 pˆ 2 qˆ2
pˆ1 − pˆ 2 ± Z (1 − α / 2) ⋅ +
n1 n2

Obtención de tamaños de muestras aleatorias


Una segunda aplicación del teorema central del límite consiste en determinar el tamaño
adecuado de muestra aleatoria para estimar el parámetro de una población binomial
con una precisión dada, en el contexto de estimar la proporción de fumadores.
Pretendemos descubrir que el número de unidades en la muestra depende de la precisión
con la cual se quiere estimar el parámetro de interés p, de la varianza de la población y
del valor del coeficiente de confianza utilizado para efectuar la estimación mediante un
intervalo. La variable a considerar es cualitativa y se estima la proporción de elementos
que tienen la característica indicada por dicha variable mediante el estimador p̂ . El
error absoluto de estimación es e = pˆ − p .
p (1 − p )
Como el intervalo de confianza 1-α es pˆ − p ≤ Z (1 − α / 2) ⋅ se obtiene una
n
2
 Z (1 − α / 2) 
fórmula de cálculo de tamaño adecuado mínimo, n =   ⋅ p (1 − p ) .
 e 
Como guía presentamos la situación siguiente:

EJERCICIO 10. Muestreo. Una fracción desconocida p de una población está compuesta
por fumadores, y vamos a utilizar el muestreo aleatorio con reemplazo para determinar
p. Se quiere encontrar p con un error no mayor de 0,005.
a. ¿Cuán grande debe ser el tamaño n de la muestra?
b. ¿Cuán grande debe ser el tamaño n de la muestra si se quiere un error a lo más 0,01?

37
Queremos conducirte a descubrir que la determinación del tamaño muestral está
condicionada al error muestral. Para ello discutamos la siguiente secuencia de algoritmo
de solución:
Sea p̂ la fracción de fumadores de la muestra. Es claro que ningún tamaño de muestra
puede garantizar de manera absoluta que pˆ − p < 0,005 . A lo más podemos considerar
muy improbable un error que exceda de la cota asignada de 0,005. Con este propósito,
se establecería un nivel de confianza arbitraria 1-α digamos 0,95, y elegiría una n tan
grande que el evento pˆ − p < 0,005 tenga probabilidad > 1-α.
Dado que Sn= nˆp puede interpretarse como el número de éxitos en n ensayos, tenemos
que P( pˆ − p < 0,005) = P( S n − np < 0,005n) ≥ 1 − α . Con apoyo de la aproximación normal y
observando sus valores en la tabla, sería necesario elegir una n tan grande que
0,005 n
≥ Z (1 − α / 2) ó n ≥ 40000 ⋅ p ⋅ q ⋅ Z 2 (1 − α / 2) .
pq
En esto interviene la probabilidad desconocida p pero, en cualquier circunstancia,
tenemos que pq ≤ 1 / 4 y, en consecuencia, será suficiente un tamaño de muestra
n ≥ 10000 ⋅ Z 2 (1 − α / 2) . En el nivel de confianza 1-α= 0,95, encontramos que
Z (1 − α / 2) = 1,96 , por lo que un tamaño muestral de n = 40000 es, desde luego,
suficiente.
En la parte b) Si solamente se requiere una precisión 0,01 sería suficiente un tamaño
muestral de 10000 (con el mismo nivel de confianza).

Observación:
a. Es preferible un intervalo más estrecho debido a la precisión adicional que
proporciona, y se controla el ancho del intervalo reduciendo el nivel de
confianza e incrementando el tamaño de la muestra. El tamaño de la muestra
juega un papel importante al determinar la probabilidad del error así como en la
precisión de la estimación.
2
Z (1 − α / 2) 
b. Si en el tamaño de muestra n =   ⋅ p (1 − p ) ; p no es conocido se
 e 
puede sustituir con una estimación p̂ / obtenida en un estudio piloto con una
muestra n / . En caso contrario, se sustituye p por el valor que hace máxima la
varianza p = 1/2
c. En la obtención del tamaño de la muestra para estimar µ, si se considera el error
absoluto de estimación o precisión e = X − µ y la variable normal estándar
X −µ
Z= , se puede reescribir algebraicamente, el tamaño muestral para
σ n
intervalos de la media poblacional con distribución normal y varianza conocida
2
 Z (1 − α / 2) ⋅ σ 
n=  . Note que Si σ es desconocida se estima por S de
 e 
una muestra piloto y se reemplaza en la expresión anterior.

38
ANEXOS DE LAS DISTRIBUCIONES MUESTRALES

ANEXO 1. SUMA DE VARIABLES ALETORIAS

Def. 1. Una muestra aleatoria (m.a.) de una población X es un conjunto de variables


aleatorias X 1 , X 2 ,......., X n independientes e idénticamente distribuidas cada una con la
distribución de X. La función de probabilidad conjunta de observaciones muestrales es:
n
f ( x1 , x 2 ,...., x n ) = C f X ( x i )
i =1

El objeto de muestrear una población es tener estimaciones de los parámetros


poblacionales mediante las observaciones obtenidas en una muestra aleatoria.

Def. 2. Un Estadístico es una función de los valores de la muestra que no depende del
parámetro de la población.
Un estadístico es una variable aleatoria; ésta tiene una distribución de probabilidad.

Si X 1 , X 2 ,......., X n es una muestra aleatoria de tamaño n, obtenemos los siguientes


estadísticos: el recorrido Rec, la suma Sn, la media X , la varianza S2 y desviación
estándar S de la muestra.

Sn : ℜn → ℜ X : ℜn → ℜ Re c : ℜ n → ℜ
n
n ∑ Xi
x → Sn = ∑ Xi x → X ( x) = i =1
x → Re c( x) = X máx − X mín
i =1 n

S 2 : ℜn → ℜ S : ℜn → ℜ

n

i =1
(X i −X )
2

x → S 2 ( x) = x → S ( x) = S 2 ( x)
n −1

Def. 3. La distribución de probabilidad de un estadístico se denomina Distribución


Muestral

Propiedad 1. E ( X1 – X2 ) = E ( X1 ) - E ( X2 )

Def. 4. La covarianza de dos variables aleatorias es frecuentemente usada como una


medida de cómo X y Y varían juntas, y es expresada de la siguiente forma:
Cov (X ,Y) = E (XY) - E(X) E(Y) = E [(X – E(X))(Y – E(Y)] = σXY
Observe que la covarianza puede tomar valores positivos y negativos y cero,
dependiendo en la forma en la cual X e Y varían juntos. La covarianza no es una medida
acotada, lo que complica saber qué valor de ella significa una alta relación entre las
variables. Se cumple que Cov (aX,bY) = ab Cov(X,Y)

Propiedad 2. Sean X e Y variables aleatorias cualesquiera entonces:


V(X ± Y) = V( X ) +V( Y ) ± 2 Cov (X ,Y)

39
Propiedad 3. Si X1, X 2 son independientes, V ( X 1 − X 2 ) = V ( X 1 ) + V ( X 2 )

Def. 5. Dada una colección de n v.a. X 1 , X 2 ,......, X n y n constantes numéricas


n
a1 , a2 , a3 ,......., an , la v.a Y = a1 X 1 + a2 X 2 + ..... ⋅ an X n = ∑ ai X i es llamada una
i =1

combinación lineal de las X i .

Propiedad 4. Considere que X 1 , X 2 ,......, X n tienen valores medios µ1, µ2 ,......, µn ,


respectivamente y varianza σ 12 ,σ 22 ,........., σ n2 respectivamente. Entonces:

1) Si las v.a. X i son o no independientes


E ( a1 X 1 + a2 X 2 + ..... ⋅ an X n ) = a1E ( X 1 ) + a2 E ( X 2 ) + ..... ⋅ an E ( X n )
= a1µ1 + a2 µ2 + ...... ... + an µn

2) Si X1 , X 2 ,......, X n son v.a. independientes.


V ( a1 X 1 + a2 X 2 + ..... ⋅ an X n ) = a12V ( X 1 ) + a22V ( X 2 ) + ..... + an2V ( X n )
= a12σ 12 + a22σ 22 + ..... + an2σ n2

Y la desviación estándar es: σ a X +a X


1 1 2 2 +.....⋅an X n
= a12σ 12 + a22σ 22 + ..... + an2σ n2

n n
3) Para X1 , X 2 ,......, X n , V ( a1 X 1 + a2 X 2 + ..... ⋅ an X n ) = ∑∑ ai a jCov( X i , X j )
i =1 j =1

4) Si X1 , X 2 ,......, X n son v.a. independientes e idénticamente distribuidas (v.a.i.i.d.)


n
entonces la f.g.m de Y = ∑ Xi es M Y (t) = (M X (t))n
i=1

Sea Sn = X 1 + X 2 +…..+ X n la suma de variables aleatorias independientes , i: 1,n . Por


tanto la v.a Sn tiene alguna distribución de probabilidades.
Existen 3 métodos para determinar la función de probabilidad de la variable aleatoria Sn
a) Utilizando la f.g.m. de Sn
b) Utilizando la función de distribución de Sn
c) Utilizando técnicas de cambio de variable.

Casos Particulares:
Consideremos X 1 ,X 2 ,…,X n variables aleatorias independientes e idénticamente
n
distribuidas (v.a.i.i.d.). Bajo condiciones se cumple para Sn = ∑ X i
i=1

(a) Si X ~ N (µ,σ²) entonces Sn ~ N (nµ ,nσ²)


(b) Si X ~ N (0,1) entonces Sn ~ N (0 ,n)
n
(c) Si X ~ Bin (n i ,p) entonces Sn ~ Bin ( ∑ n i ,p)
i=1

40
(d) Si X ~ P (µ) entonces Sn ~ P (nµ)
(e) Si X i ~ exp (λ) entonces Sn ~ Γ(n, λ)

(f) Sea Z v.a. distribuida normal estándar Z ~ N (0,1) entonces Z 2


tiene distribución Chi-cuadrado con 1 grado de libertad.

(g) Sean Z 1 , Z 2 ,…,Z n variables aleatorias independientes tal que Z i ~ N (0,1)


n
∀ i: 1,n ; entonces ∑ Z i2 ~ X (2n )
i=1

ANEXO 2. GLOSARIO

Estadística Inferencial: Parte de la estadística relativa a la extracción de conclusiones a


partir de los datos.
Población: Conjunto de elementos o individuos que cumplen ciertas propiedades
comunes.
Muestra: Subgrupo de la población que va a ser estudiado.
Muestra aleatoria de tamaño k: Muestra seleccionada de tal forma que todos los
subgrupos de tamaño k tienen la misma probabilidad de ser seleccionados.
Muestra aleatoria estratificada: Muestra obtenida tras dividir la población en distintas
subpoblaciones y elegir después muestras aleatorias en cada una de las subpoblaciones
citadas.
Estadístico: Magnitud numérica cuyo valor se puede determinar a partir de una muestra.
Media muestral: Media aritmética de los valores de un conjunto de datos.
Desviación: Diferencia entre un valor de dato y la media muestral. Si xi es el i-ésimo
valor de dato y ‫ ݔ‬es la media muestral, la diferencia xi - ‫ ݔ‬se denomina desviación i-
ésima.
Conjunto de datos normal: Aquél cuyo histograma es simétrico con respecto a su
intervalo central y que decrece a ambos lados de este intervalo siguiendo una forma
acampanada.
Conjunto de datos asimétrico: Aquél cuyo histograma no es simétrico con respecto al
intervalo de clase central. Se dice que es asimétrico por la derecha si su histograma
presenta una cola alargada hacia la derecha, y se dice que es asimétrico por la izquierda
si la cola alargada se sitúa hacia la izquierda.
Conjunto de datos bimodal: Distribución con dos modas.

41
Variable Aleatoria: Una magnitud cuyo valor viene determinado por el resultado de un
experimento probabilístico.
Variable aleatoria discreta: Una variable aleatoria cuyos posibles valores son una
sucesión de puntos distintos de la recta real.
Valor esperado de una variable aleatoria: Media ponderada
Varianza de una variable aleatoria: Valor esperado de las diferencias cuadráticas entre la
variable aleatoria y su valor esperado.
Desviación estándar de una variable aleatoria: Raíz cuadrada de la varianza.
Función de probabilidad: Corresponde a un modelo probabilístico del comportamiento
de la variable aleatoria, la cual es usada para evaluar probabilidades acerca de X.
Variable aleatoria binomial con parámetros n y p: Una variable aleatoria igual al
número de éxitos en n pruebas independientes, cuando la probabilidad de éxito en cada
prueba es igual a p.
Variable aleatoria continua: Variable Aleatoria que puede tomar cualquier valor
contenido en un intervalo.
Función densidad de probabilidad: Curva asociada a una variable aleatoria continua. La
probabilidad de que la variable aleatoria esté comprendida entre dos puntos es igual al
área bajo la curva entre dichos puntos.
Variable aleatoria normal: Tipo de variables aleatorias continuas cuyas funciones de
densidad de probabilidad son simétricas con formas acampanadas.
Variable aleatoria normal estándar: variable aleatoria normal con media 0 y varianza 1.
Percentil de orden 100p por ciento de una variable aleatoria continua: La probabilidad
de que la variable aleatoria sea menor que dicho percentil es p.
Teorema central del límite: Teorema que establece que la suma de una muestra de
tamaño n procedente de una población sigue Aproximadamente una distribución
normal, si n es grande.
Muestra aleatoria: Una muestra de n miembros de una población es una muestra
aleatoria si se extrae de tal forma que todos los posibles subconjuntos de n miembros de
la población tienen la misma probabilidad de constituir la muestra.
Distribución t-student con n grados de libertad: Distribución de probabilidad que surge
del problema de estimar la media de una población normalmente distribuida cuando el
tamaño de la muestra es pequeño, o la desviación estándar de la población es
desconocida.

42
Distribución chi-cuadrado con n grados de libertad: Distribución que sigue la suma de
los cuadrados de n variables aleatorias normales estándar e independientes.
Distribución F de Fisher: Distribución de probabilidad de la razón de dos varianzas
provenientes de dos poblaciones diferentes.
Grados de libertad: Número de datos que pueden variar libremente al calcular un
estadístico.
Estadístico: Es una función de los valores de la muestra que no depende del parámetro
de la población.
Estimador: Un estadístico utilizado para aproximar un parámetro de la población.
También, se le denomina estimador puntual.
Valor estimado: Valor observado del estimador.
Estimador insesgado: Estimador cuya esperanza coincide con el parámetro que se desea
estimar.
Error estándar de un estimador (insesgado): Desviación estándar del estimador. Es un
indicador de la diferencia que se puede esperar que exista entre el estimador y el
parámetro que se desea estimar.
Error Cuadrático medio: (ECM) Es el valor esperado de la desviación cuadrática entre
el estimador y el parámetro que estima.
Estimador por intervalo de confianza: Intervalo cuyos extremos se determinan a partir
de los datos muestrales. El parámetro está contenido en el intervalo con un grado
determinado de confianza. Por lo general, el punto medio del intervalo coincide con el
estimador puntual del parámetro.
Coeficiente de confianza: Es la proporción de todas las estimaciones por intervalo que
incluyen al parámetro que está estimándose.

43
ANEXO 3. MÉTODOS DE MUESTREO

La estadística es una disciplina que se preocupa de desarrollar técnicas y modelos que


permitan estudiar la forma como la incertidumbre de un fenómeno es alterada por
información disponible. El análisis de la información disponible en el contexto de un
modelo estadístico, para inferir aspectos relacionados con la incertidumbre de un
fenómeno, corresponde a lo que se denomina Inferencia Estadística. En muchos
problemas estadísticos, es necesario utilizar una muestra de observaciones tomadas de la
población de interés con objeto de obtener conclusiones sobre ella.
A continuación se mencionan las definiciones de población, muestra, muestra aleatoria,
enumerar tipos de muestra, estadístico. Ejemplos de distribución de la suma de dos o
más variables aleatorias discretas.
Una población está formada por la totalidad de las observaciones de las cuales se tiene
cierto interés. Una muestra es un subconjunto de observaciones seleccionadas de una
población. La muestra se define como la observación de n elementos de una población,
o el resultado de repetir n veces un experimento aleatorio.
Muestreo de la población. En muchos casos, el muestreo es la única forma de
determinar algo acerca de la población. Algunas razones por las que el muestreo es
necesario:

a. Con frecuencia la prueba destruye el elemento muestreado y no puede ser devuelto a


la población. Por ejemplo, si todo el alambre se sometieran a pruebas de resistencia a la
tensión no quedaría ningún producto para su venta o uso; los catadores de vino es otro
ejemplo en que no pueden beber todo el vino para evaluar la vendimia.
b. Puede ser imposible revisar o localizar a todos los elementos de la población. Por
ejemplo, las poblaciones de peces y aves son grandes y están en movimiento constante.
c. Es posible que resulte prohibitivo el costo de estudiar a todos los elementos de la
población. Por ejemplo, las organizaciones que realizan encuestas de opinión pública y
las que efectúan pruebas a consumidores.
d. Los resultados de una muestra pueden dar una estimación adecuada del parámetro de
población, lo que permite ahorrar, por tanto, dinero y tiempo.
e. Puede necesitarse demasiado tiempo para estar en contacto con todos los elementos
de la población. Por ejemplo, una candidata a un puesto público puede desear evaluar
las probabilidades de que la elijan, mediante una muestra de escrutinio y las entrevistas
de campo.

Métodos de muestreo de probabilidad. Para garantizar la representatividad de la


muestra, los elementos deben ser extraídos de la manera más objetiva posible, la
representatividad es cuando la extracción se realiza al azar, esto se conoce como
muestra probabilística o aleatoria.
Podemos extraer los elementos muestrales de dos maneras: con reemplazo o sin
reemplazo. El muestreo se lleva a cabo con reemplazo cuando una vez extraído un
elemento, y hechas sobre él las observaciones oportunas, se devuelve al colectivo, lo
que supone que la población no es modificada y el elemento puede ser elegido de nuevo
(la población no cambia). El muestreo tiene lugar sin reemplazo cuando el elemento
elegido se excluye del colectivo, y modifica de tal manera que la probabilidad de
extracción de un elemento depende de cuántas y cuáles hayan salido con anterioridad.
El muestreo con reemplazo conduce a que los elementos de la muestra sean
probabilísticamente independientes y se denomina muestreo aleatorio simple (m.a.s),
mientras que en el muestreo sin reemplazo no lo son.
En general, hay dos tipos de muestras: la muestra probabilística y la muestra no
44
probabilística. En el muestreo no probabilístico, la inclusión en la muestra se basa en el
criterio de la persona que realiza el muestreo, y pueden llevar a resultados con sesgo;
por ejemplo, entrevistas a la salida del metro.

Muestra probabilística: Muestra que se selecciona de modo que cada integrante de la


población en estudio tenga una probabilidad conocida (pero distinta de cero) de ser
incluido en la muestra.
No existe un método que sea “el mejor” para tomar una muestra probabilística de una
población. Sin embargo, tienen un propósito común, permitir que el azar determine los
elementos o personas que se incluirán en la muestra. Hay varios métodos de muestreo
de probabilidad.

Muestreo aleatorio simple: Muestra seleccionada de manera que cada integrante de la


población tengan la misma probabilidad de quedar incluido. Este tipo de muestreo se
suele hacer a través del uso de tablas de números aleatorios.
Por ejemplo, de una población que consta de N empleados seleccionar una muestra de n,
mediante papeletas numeradas de la población en una caja, para asegurar que cada uno
tenga la misma oportunidad de ser elegidos. Un método más adecuado de seleccionar
una muestra aleatoria es emplear el número de identificación de cada empleado y una
tabla de números aleatorios (medio eficiente para seleccionar elementos de una
muestra) dado en los textos o generados por un proceso aleatorio en programas
estadísticos. Para cada dígito de un número, la probabilidad de 0, 1, 2,…,9 es la misma.
Así, la probabilidad de que el empleado con número 011 sea elegido, es la misma que la
del laborante 722, o el 382. Por tanto quedan eliminados así los sesgos en el proceso de
selección.
De la lista de clase de estadística se seleccionarán a tres estudiantes al azar y se les
harán diversas preguntas acerca del método de enseñanza y el contenido previo de
probabilidades.
a) Se escriben a mano los números del 00 al 80 en papeletas y se colocan éstas en un
recipiente. Los tres números que se seleccionarán son 31, 7 y 25. ¿Qué estudiantes se
incluirán en la muestra? (rpta: Hugo, Paco y Luis)
b) Ahora utiliza la tabla de dígitos aleatorios para seleccionar su propia muestra. (rpta:
las respuestas variarán)
c) ¿Qué haría si encontrara el número 85 en la tabla de números aleatorios? (rpta: no se
considere, y pase al siguiente número aleatorio)

Muestra aleatoria sistemática: Los integrantes o elementos de la población se ordenan


en alguna forma, por ejemplo alfabéticamente, en un archivo según la fecha en que se
reciben, o por algún método. Se selecciona al azar un punto de partida, y después se
elige para la muestra cada k-ésimo elemento de la población.

Conviene utilizar en situaciones donde la población es grande, por ejemplo obtener una
muestra de 2000 facturas colocadas en gavetas de archivos. Se puede seleccionar una
factura de cada 20 de las que se encuentran en el archivo. La primera factura se elige
utilizando un proceso al azar como punto de inicio. Si se ha obtenido el 10, entonces la
muestra constará de las facturas números 10, 30, 50,..
No conviene utilizar si hay un patrón predeterminado en la población. Por ejemplo
donde hay tres compartimientos con distintos artículos. Lo más probable es seleccionar
una muestra sesgada.

45
Muestreo aleatorio estratificado: Una población se divide en subgrupos, denominados
estratos, y se selecciona una muestra de cada uno. (Una muestra estratificada garantiza
la representación de cada subgrupo)

Después de que la población se ha dividido en estratos, puede seleccionarse una muestra


proporcional, o no proporcional. Un procedimiento de muestreo proporcional requiere
que el número de elementos en cada estrato tenga la misma proporción que se encuentra
en la población. Por ejemplo, gastos de publicidad de las 352 compañías más grandes de
un país determinado. El objetivo es determinar si las empresas que pagan altos
dividendos (una medida de rentabilidad) gastan más por cada dólar de ventas en
propaganda, que lo que destinan a eso las compañías con bajos dividendos o en déficit.
Si se han de seleccionar 50 empresas para un estudio intensivo, entonces se estudiará la
siguiente organización de rentabilidad:

Estrato Ganancia Número de Porcentaje Cantidad


(dividendos) empresas del total muestreada
1 30% o superior 8 2 1
2 20 hasta 30% 35 10 5
3 10 hasta 20% 189 54 27
4 0 hasta 10% 115 33 16
5 Déficit 5 1 1
Total 352 100 50

Tiene la ventaja, en algunos casos, de reflejar con mayor precisión las características de
la población, que el muestreo aleatorio simple o el aleatorio sistemático.
Observar que 2% de las empresas pagan dividendos de 30% o más (estrato 1), y 1%
tiene déficit (estrato 5). Si se tomara una m.a.s. de 50, se podría por casualidad, no
tomar ninguna empresa de los estratos 1 o 5. Sin embargo, una muestra estratificada
aseguraría que al menos una empresa en el estrato 1 y una en el estrato 5, estuvieran
representadas en la muestra.

Muestreo por conglomerado: Se emplea con frecuencia para reducir el costo de


muestrear una población dispersa en un área geográfica grande.

46

También podría gustarte