Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura 6 Semana 7 Y 8
Lectura 6 Semana 7 Y 8
Dado que de una poblacin pueden tomarse o formarse varias muestras al considerar sus medias,
varianzas y proporciones observamos que varan segn la muestra elegida; luego stas son variables
aleatorias muestrales con las cuales podramos realizar conjeturas e inferencias acerca de la media,
la varianza y la proporcin de la poblacin, que por lo general son valores desconocidos. Como
dichos valores son variables aleatorias requeriremos establecer sus funciones o distribuciones de
probabilidad para efectuar las inferencias mencionadas.
C ONCEPTOSGENERALES
Muestreo
Existen dos clases de muestreo el probabilstico y no probabilstico, el muestreo probabilstico es
aquel mtodo en el que por medio de una tcnica de muestreo es posible definir el nmero de
muestras que se pueden formar con n elementos u observaciones cada una, para luego elegir una de
ellas segn una funcin de probabilidad. Por otra parte, el muestreo no probabilstico es aquel
cuyas muestras se seleccionan por conveniencia o bajo algn criterio para que los resultados
favorezcan a un grupo, persona, empresa o contexto.
El muestreo aleatorio puede llevarse a cabo con reemplazamiento y sin reemplazamiento; el
primero hace referencia a tomar una observacin para formar una muestra y devolverla a la
poblacin de modo que puede ser elegida de nuevo, y la segunda indica que se toma una
observacin y no se regresa a la poblacin de tal modo que slo aparecer una vez en la muestra.
Existen diversas tcnicas para elegir una muestra aleatoria de una poblacin, recordemos que una
muestra debe ser lo suficientemente representativa porque con ella se estimarn los parmetros de la
poblacin; el mtodo ms utilizado es el muestreo aleatorio simple, pero depende de si el nmero
de elementos en la poblacin es finito o infinito.
Una muestra aleatoria simple para una poblacin finita es aquella en la que todas las
muestras de tamao tienen la misma probabilidad de ser seleccionadas.
Una muestra aleatoria simple para una poblacin infinita es aquella en la que cada
elemento seleccionado para conformarla se toma de la misma poblacin y de forma
independiente.
Ejemplo 67
Supongamos que tenemos el listado de los 5000 empleados del rea de promocin y mercadeo de
cierta empresa y queremos realizar una evaluacin de la capacitacin de estos en cierto producto
para decidir si el proceso de capacitacin es adecuado y les permite conocer completamente el
producto. Si la empresa tiene sedes en Bogot, Barranquilla, Medelln y Cali, cmo podramos
obtener una muestra representativa?
Distribuciones Muestrales
El propsito del muestreo es indagar algo sobre la poblacin de estudio. Cuando se disea una
muestra, es importante considerar la informacin que se va a obtener y el grado de exactitud de lo
que se encuentre acerca de la poblacin. Con este propsito es importante que se analice claramente
la obtencin de la muestra y los resultados obtenidos a partir de ella, utilizando los conceptos
probabilsticos ya vistos.
Una distribucin muestral es una distribucin de probabilidad de un estadstico muestral calculado a
partir de todas las muestras posibles de tamao n, elegidas al azar en una poblacin determinada. En
trminos generales estamos interesados en conocer una o ms de las siguientes caractersticas:
Su forma funcional
Su media
Su desviacin estndar
Poblacin
Muestra
S2
P
Vamos a construir una distribucin muestral experimental de medias calculadas a partir de todas las
muestras posibles que se pueden obtener de una poblacin pequea, con el fin de comprender la
naturaleza de la distribucin muestral y esto lo haremos con el siguiente ejemplo.
Ejemplo 69
Consideremos una poblacin conformada por 5 personas (N=5). La variable de inters es el gasto
mensual en transporte (en miles de pesos). Los datos de la poblacin son:
{78, 67, 83, 56} y vamos a responder a cada literal teniendo en cuenta la notacin utilizada.
a. Calcular la media y la desviacin estndar de la poblacin
!"
!
78 + 67 + 83 + 56 284
=
= 71
4
4
Y la desviacin estndar es
( )!
b. De la poblacin vamos a seleccionar todas las muestras posibles de tamao n =2 sin orden y sin
repeticin. Cuntas muestras de dos elementos de la poblacin pueden formarse?
Como hay 4 elementos en la poblacin y queremos formar grupos de dos sin importar su orden
tenernos que calcular una combinacin:
4
4!
=6
=
2 2!(4 2)!
Es decir que podemos formar 6 grupos de dos elementos cada uno. Observmoslos
X 1 : (78, 67)
X 2 : (78,83)
X 3 : (78,56)
X 4 : (67,83)
X 5 : (67,56)
X 6 : (83,56)
c. Dichas muestras son de tipo aleatorio simple para poblacin finita o infinita?
Como cada una de estas muestras tiene la misma probabilidad de ser elegida entonces la
probabilidad de escoger una muestra estara dada por:
Muestra
X1
X2
X3
X4
X5
X6
Probabilidad
1
6
1
6
1
6
1
6
1
6
1
6
y por ende estamos en presencia de muestreo aleatorio simple para poblacin finita.
Como X
78 + 67
= 72.5
2
67 + 83
X4 =
= 75
2
X1 =
78 + 83
= 80.5
2
67 + 56
X5 =
= 61.5
2
78 + 56
= 67
2
83 + 56
X6 =
= 69.5
2
X2 =
X3 =
1
1
1
1
1
1
X1 + X 2 + X 3 + X 4 + X 5 + X 6
6
6
6
6
6
6
X + X 2 + X 3 + X 4 + X 5 + X 6 72.5 + 80.5 + 67 + 75 + 61.5 + 69.5 426
= 1
=
=
= 71
6
6
6
E ( X ) =
Ntese que el promedio de las medias muestrales es igual a la media poblacional, entonces podemos
decir que es una buen estimacin de .
Calculamos ahora la desviacin estndar de para las seis muestras posibles
(72.5 71) 2 + (80.5 71) 2 + (67 71) 2 + (75 71) 2 + (61.5 71) 2 + (69.5 71) 2
6
6.013
X =
!
1
Podemos decir entonces que si se seleccionan todas las muestras posibles de tamao n de una
poblacin dada entonces se tiene
()=
!!
! ! !!!
! !!!
El factor
!!!
!!!
!!
!
Intervalo de
la
media
muestral
Frecuencia
relativa
60 66, 29
66,3 75, 29
72, 6 78, 29
78,9 85, 2
1
6
3
6
1
6
1
6
Historgramadelasmediasmuestralesysu
frecuencia
Frecuencia
0,6
0,4
0,2
0
6066,29
66,372,59
72,678,89
78,985,2
Intervalosdemediamuestral
0,6
Polgonodefrecuenciasdelasmedias
muestrales
Frecuencia
0,5
0,4
0,3
0,2
0,1
0
6066,29
66,372,59
72,678,89
Intervalosdemediamuestral
78,985,2
Como vimos es muy importante poder establecer el tipo de distribucin que sigue la variable
aleatoria muestral porque con ella podremos decir si es muy probable o no que los valores de sta se
encuentren prximos a los parmetros poblacionales, adems en la semana de distribuciones de
probabilidad notamos que segn como sea sta podemos calcular el valor esperado y la varianza de
la misma, datos que son relevantes para hablar del sesgo de un estimador. El siguiente tema nos
presenta o expone algunas pautas para establecer cundo una variable aleatoria muestral se
distribuye normal.
TEOREMADELLMITECENTRAL
Para la cual
y varianza
es el promedio de las
Con todo lo anterior estamos preparados para estudiar las distribuciones muestrales y las
caractersticas de los estimadores puntuales ms usados en la inferencia estadstica. A continuacin
expondremos las variables aleatorias (con sus distribuciones de probabilidad) que ms se utilizan
para estimar los parmetros poblacionales media, varianza y proporcin y hacer inferencias de los
mismos.
es la media
X =
! =
X !!
!!
Ejemplo 70
Se realiz una prueba a un grupo de 80 aspirantes al cargo de administrador de cierta empresa y se
obtuvo que las calificaciones siguen una distribucin normal con calificacin promedio de 300
puntos y varianza muestral de 25 cuando se toma una muestra de 16 calificaciones de las pruebas.
a. Calcule el error tpico de la media de muestral.
b. Determine la probabilidad de que la media muestral sea superior a 280 puntos.
c. Para que el error tpico fuera 6, qu tamao de muestra debera seleccionarse?
Para responder cada literal utilizaremos la teora dada.
a. La varianza muestral es ( )2 , luego el error tpico de la media muestral es
X
X = 25 = 5 .
b. Con base al enunciado debemos calcular P ( X > 280) y esto lo logramos estandarizando la
variable aleatoria X .
X 280
280
280 300
20
P
>
= PZ >
= PZ >
= PZ >
= P ( Z > 4 )
5
5
X
X
Cabe resaltar que como la normal estndar es una distribucin para la cual los valores de la
probabilidad de una cantidad negativa es igual al valor de la probabilidad de la cantidad pero
positiva, es decir
6=
20
n
n=
= 20 y X
20
3.3
6
, por lo tanto
16
= 6.
= 20 .
n 3.32 = 11.1
Esto significa que necesitaremos tomar una muestra de tamao 11 o 12 para que el error tpico
sea aproximadamente 6.
Ejemplo 71
En cierta ciudad los gastos semanales en transporte para los habitantes, estn distribuidos
normalmente con media de $16500 y una desviacin estndar de $1500. Cul es la probabilidad de
que una muestra de 25 personas tengan un gasto promedio semanal superior a $15750
Vamos a identificar los datos que nos dan en el problema y a plantear la probabilidad
X: Gastos semanales en transporte
=$16500
=$1500
n = 25
P (>15760) = P
!!!
!/ !
>
!"#$%!!"#$$
!"##/ !"
! cuando se desconoce la
Distribucin muestral
de
distribucin de la poblacin.
Cuando la muestra no proviene de una distribucin normal, el tamao de la muestra desempea un
papel muy importante. Cuando n es pequea, la forma de la distribucin depende principalmente de
la forma de la poblacin. Sin embargo cuando n crece, uno de los teoremas ms importantes de la
inferencia estadstica establece que la forma de la distribucin muestral se aproxima a una
distribucin normal, independientemente de la distribucin que tenga la poblacin de origen.
(Teorema del lmite central).
La diferencia entre este enunciado y el anterior est en que no se requiere que la poblacin de
origen tenga distribucin normal cuando n es grande (n se considera grande si es mayor o igual que
30).
Ejemplo 72
La duracin de cierta marca de bombillas tiene una media de 900 horas y la desviacin estndar de
70 horas. Si se selecciona una muestra de 36 bombillas, determine la probabilidad de que dure entre
870 y 925 horas
Observe que no se hace ninguna mencin de la forma funcional de la distribucin, pero como el
tamao de muestra es grande (n30), por el teorema del lmite central entonces la distribucin es
aproximadamente normal.
X: tiempo de duracin de las bombillas
=900
= 70
n = 36
P (870 925) = P
!"#!!""
!"
!"
!!!
!
!
!"#!!""
!"
!"
El rea total bajo la distribucin t es igual a 1 y esta distribucin se encuentra tabulada para cada
valor (n-1) o grados de libertad denominados gl.
La tabla de la distribucin t tiene la siguiente tabla:
En la prctica, son muy utilizadas las inferencias sobre proporciones poblacionales. Por lo tanto la
distribucin muestral de una proporcin es de gran inters. En un estudio de mercados se puede
estar interesado en la proporcin o porcentaje de consumidores que estaran dispuestos a comprar
algn producto nuevo que se piensa lanzar al mercado. El jefe de personal puede estar interesado en
conocer el porcentaje de empleados que se ausentan en horas de trabajo.
Sea A el nmero total de elementos que presentan cierta caracterstica en una poblacin, entonces la
proporcin de aquellos que cumplen y no cumplen con dicha caracterstica est dada por la
expresin P =
A
NA
y 1 P =
respectivamente.
N
N
Obsrvese que cada observacin de este experimento es de tipo Bernoulli xito (cumple con la
caracterstica) y fracaso (no cumple con la caracterstica) y como se repite cierto nmero de veces
se convierte en una Binomial para la cual el valor esperado de la variable aleatoria proporcin de
individuos con la caracterstica es P y la varianza es P (1 P ) . Si el tamao de muestra es grande
por el teorema del lmite central esta binomial puede aproximarse a una normal con media P y
varianza P (1 P ) .
proporcinpoblacionaly!
!(!!!)
!
(1 )
!
eselerrorestndardelaproporcin.
Para tamao de muestra pequeo es decir que cumpla que np < 5 o n(1 p ) < 5 se tiene que la
) =
varianza y desviacin estndar estn definidas de la siguiente manera Var ( P
) = N n P(1 P) respectivamente a
Var ( P
N 1
n
N n P(1 P)
y
N 1
n
N n
se le conoce como factor de
N 1
Ejemplo 73
Se sabe que el 60% de los adultos de una zona del pas compran determinado producto. Se obtiene
una muestra de 150 adultos de esta rea. Cul es la probabilidad de que la proporcin muestral este
entre el 50% y el 70%?
P = P = 0.04
! = = 0,6
! =
(!,!)(!,!)
!"#
= 0,04
!,!"!!,!
!,!"
<
!!!
!!
<
!,!!!,!
!,!"
Autoestudio
Llego el momento de aplicar los temas tratados anteriormente, para reforzar nuestros conocimientos
es necesario practicar; por ello tal y como se indica en la gua de actividades semanal por favor
revise el libro sugerido en el mapa conceptual del autoestudio (Muestreo Estadstico) en l se
encuentran todos los temas que tratamos en esta seccin y en la siguiente. Luego realice la gua
prctica de esta semana.
Para acceder al mencionado debe ingresar a la biblioteca virtual en otra pgina de internet distinta a
la del mdulo. Las instrucciones para ingresar a la biblioteca aparecen a continuacin; por favor
sgalas y realice los ejercicios del libro, slo aquellos que cubran los temas tratados hasta ahora.
Para acceder al libro de la biblioteca
En la unidad 4, aparece un mapa conceptual; en el espacio en el que se despliega la bibliografa
acceda al libro siguiendo los siguientes pasos:
1. enlapginaprincipaldecampusvirtualdebajodelCAEdicebibliotecavirtual,declicken
estelink.
2. Allseabrelapginadelabibliotecaydebeescribirsuusuarioycontrasea.
3. Haganclickenlibroselectrnicoseingreseelusuarioylacontrasea.
4. Ahoradeclickenelibro,vuelvaalapginadelmapaconceptualydeclicksobreellibro
quedeseanconsultar.
Si sigui correctamente las instrucciones debe poder visualizar el libro indicado.
Adicionalmente puede revisar el libro Estadstica para Administracin y Economa de Anderson
que se encuentra en google (libros); busque en el ndice los temas tratados: muestreo y
distribuciones en el muestreo o distribuciones muestrales (captulo 7, desde la pgina 241). Luego
resuelva los ejercicios all propuestos.