Documentos de Académico
Documentos de Profesional
Documentos de Cultura
distribuciones
muestrales
CAPTULO 6
El problema de muestreo de
Electronics Associates.
Al director de personal de Electronics Associates, Inc. (EAI), se le ha
encargado la tarea de elaborar un perfil de los 2500 administradores
de la empresa. Las caractersticas a determinar son el sueldo medio
anual de los administradores y la proporcin de administradores que
ha terminado el programa de capacitacin de la empresa.
Con los 2500 administradores de la empresa como la poblacin para
este estudio, es posible hallar el sueldo anual y la situacin respecto
al programa de capacitacin de cada persona al consultar los
archivos del personal. Se calcula la media poblacional y la
desviacin estndar poblacional de los salarios anuales.
Media poblacional: = $51 800
varianza poblacional: $40
//
1,15
1,28
1,44
1,65
1,96
2,24
2,58
Nivel de
confianz 75%
a
80%
85%
90%
95%
97,5%
99%
Ejemplos
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas
compraran un producto y tenemos un error muestral del 5% comprarn
entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con
un error muestral del 3% y el 60% de los encuestados se muestran satisfechos
significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados
de la empresa lo estarn.
Ejemplo 3
si los resultados de una encuesta electoral indicaran
que un partido iba a obtener el 55% de los votos y el
error estimado fuera del 3%, se estima que el
porcentaje real de votos estar en el intervalo 52-58%
(55% +/- 3%).
Otra frmula:
n = el tamao de la muestra. N = tamao de la
poblacin.
: Desviacin estndar de la poblacin, que
generalmente cuando no se tiene su valor, suele utilizarse
un valor constante de 0,5.
Z Valor obtenido mediante niveles de confianza. Es un
valor constante que, si no se tiene su valor, se lo toma en
relacin al 95% de confianza equivale a 1,96 (como ms
usual) o en relacin al 99% de confianza equivale 2,58,
valor que queda a criterio
Caso EAI
Para seleccionar una muestra aleatoria simple de la poblacin finita de administradores de
EAI, primero se le asigna a cada administrador un nmero.
se les asignan los nmeros del 1 al 2500 en el orden en que aparecen sus nombres en el
archivo de personal de EAI. A continuacin se consulta la tabla de dgitos aleatorios que se
muestran en la tabla 7.1. Al consultar el primer rengln de la tabla se da cuenta que cada
dgito, 6, 3, 2, es un dgito aleatorio con la misma oportunidad de aparecer que cualquier
otro. Como el nmero mayor en la lista de la poblacin de administradores de EAI, 2500,
tiene cuatro dgitos, se seleccionarn nmeros aleatorios de la tabla en conjuntos o grupos
de cuatro dgitos. Aun cuando para la seleccin de nmeros aleatorios se puede empezar
en cualquier lugar de la tabla y avanzar sistemticamente
en una de las cuatro direcciones, aqu se usar el primer rengln de la tabla 7.1 y se
avanzar de izquierda a derecha. Los primeros 7 nmeros aleatorios de cuatro dgitos son
6327 1599 8671 7445 1102 1514 1807
Los nmeros aleatorios en la tabla aparecen en grupos de cinco para facilitar su lectura.
ejemplo
En la seleccin de una muestra aleatoria simple entre los clientes
de un restaurante de comida rpida, el primer requerimiento es
satisfecho por cualquier cliente que entra en el restaurante. El
segundo requerimiento es satisfecho seleccionando a los clientes
de manera independiente. El objetivo del segundo requerimiento
es evitar sesgos de seleccin. Habra un sesgo de seleccin, por
ejemplo, si cinco clientes consecutivos que se seleccionaran
fueran amigos. Es de esperar que estos clientes tengan perfiles
semejantes.
Dichos sesgos se evitan haciendo que la seleccin de un cliente no
influya en la seleccin de cualquier otro cliente. En otras palabras,
los clientes deben ser seleccionados de manera independiente.
McDonalds
El restaurante lder en comida rpida, realiz un muestreo
aleatorio simple precisamente en una situacin as. El
procedimiento de muestreo se bas en el hecho de que
algunos clientes presentaban cupones de descuento. Cada vez
que un cliente presentaba un cupn descuento, al siguiente
cliente que se atenda se le peda que llenara un cuestionario
sobre el perfil del cliente. Como los clientes que llegaban al
restaurante presentaban cupones de descuento aleatoria e
independientemente, este plan de muestreo garantizaba que
los clientes fueran seleccionados de manera independiente.
Por tanto, los dos requerimientos para un muestreo aleatorio
simple de una poblacin infinita fueron satisfechos.
Conclusin
Las poblaciones infinitas suelen asociarse con un
proceso que opera continuamente a lo largo del tiempo.
Por ejemplo, partes fabricadas en una lnea de
produccin, transacciones en un banco, llamadas que
llegan a un centro de asesora tcnica y clientes que
entran en las tiendas son considerados como
provenientes de una poblacin infinita. En tales casos
un procedimiento de muestreo creativo garantiza que
no haya sesgos de seleccin y que los elementos de la
muestra sean seleccionados en forma independiente.
Nmeros aleatorios
2436
300
1046
2088
908
1755
556
1736
1640
2454
2377 369
69 1268
1526 1284
2370 1173
1481 211
327
341
1245 1749
360
1012
1879 1218
492
1671
Estimacin puntual
Para estimar el valor de un parmetro poblacional, la caracterstica
correspondiente se calcula con los datos de la muestra, a lo que se
le conoce como estadstico muestral. Por ejemplo, para estimar
la media poblacional y la desviacin estndar poblacional de
los salarios anuales de los administradores de EAI, se emplean los
datos de la tabla 7.2 y se calculan los estadsticos muestrales;
media muestral y desviacin estndar muestral s. Con las frmulas
para la media muestral y la desviacin estndar muestral
presentadas en el captulo 2 se obtiene que la media muestral es
x = xi/n=1 554 420/30= $51 814
y la desviacin estndar muestral es
S = (xi x)2/(n -1) = 325 009 260/29 =$3348
Tabla 7.2
Salario Programa de Salario Programa de
anual capacitacin anual ($) capacitacin
x1 49 094.30 S x16 51 766.00 S
x2 53 263.90 S x17 52 541.30 No
x3 49 643.50 S x18 44 980.00 S
x4 49 894.90 S x19 51 932.60 S
x5 47 621.60 No x20 52 973.00 S
x6 55 924.00 S x21 45 120.90 S
x7 49 092.30 S x22 51 753.00 S
x8 51 404.40 S x23 54 391.80 No
x9 50 957.70 S x24 50 164.20 No
x10 55 109.70 S x25 52 973.60 No
x11 45 922.60 S x26 50 241.30 No
x12 57 268.40 No x27 52 793.90 No
x13 55 688.80 S x28 50 979.40 S
x14 51 564.70 No x29 55 860.90 S
x15 56 188.20 No x30 57 309.10 No
proporcin muestral
Para estimar p, la proporcin de administradores que han terminado
el programa de capacitacin, se usa la proporcin muestral
correspondiente . Sea x el nmero de administradores de la muestra
que han terminado el programa de capacitacin. De acuerdo con la
tabla 7.2, x = 19. Por tanto, como el tamao de la muestra es n = 30,
la proporcin muestral es p =x/n =19/30 = 0.63
Al hacer los clculos anteriores, se lleva a cabo el proceso estadstico
conocido como estimacin puntual. A la media muestral se le conoce
como el estimador puntual de la media poblacional , a la
desviacin estndar muestral s como el estimador puntual de la
desviacin estndar poblacional y a la proporcin muestral como el
estimador puntual de la proporcin poblacional p. Al valor numrico
obtenido de , s, o se les conoce como estimaciones puntuales
Distribucin muestral
En estadstica, la distribucin muestral es lo que resulta de
considerar todas las muestras posibles que pueden ser tomadas de
una poblacin. Su estudio permite calcular la probabilidad que se
tiene, dada una sola muestra, de acercarse al parmetro de la
poblacin. Mediante la distribucin muestral se puede estimar el
error para un tamao de muestra dado.
Consideremos todas las posibles muestras de tamao n en una
poblacin. Para cada muestra podemos calcular un estadstico
(media, desviacin tpica, proporcin,...) que variar de una a otra.
As obtenemos una distribucin del estadstico que se llama
distribucin muestral. Las dos medidas fundamentales de esta
distribucin son la media y la desviacin tpica, tambin
denominada error tpico.
Esquema
E(x) =
(7.1)
Desviacin estndar de x
x = desviacin estndar de x
= desviacin estndar de la poblacin
n = tamao de la muestra
N = tamao de la poblacin
Forma de la distribucin
muestral de x
La poblacin tiene distribucin normal. En muchas
situaciones es razonable suponer que la poblacin de la que
se seleccion la muestra aleatoria simple tenga distribucin
normal o casi normal. Cuando la poblacin tiene distribucin
normal, la distribucin muestral de est distribuida
normalmente sea cual sea el tamao de la muestra.
La poblacin no tiene distribucin normal. Cuando la
poblacin de la que se tom la muestra aleatoria simple no
tiene distribucin normal, el teorema del lmite central
ayuda a determinar la forma de la distribucin muestral de .
En la prctica
Desde el punto de vista de la prctica, ser conveniente saber qu
tan grande necesita ser el tamao de la muestra para que aplique
el teorema del lmite central y pueda suponer que la forma de la
distribucin muestral es aproximadamente normal. En las
investigaciones estadsticas se ha estudiado este problema en
distribuciones muestrales de de muy diversas poblaciones y para
muy diversos tamaos de muestras. Lo que se acostumbra hacer
en la prctica es suponer que, en la mayor parte de las
aplicaciones, la distribucin muestral de se puede aproximar
mediante una distribucin normal siempre que la muestra sea de
tamao 30 o mayor. En los casos en que la poblacin es muy
sesgada o existen observaciones atpicas, pueden necesitarse
muestras de tamao 50.
Distribucin muestral de x en el
problema EAI
En el problema de EAI, para el que ya previamente se
mostr que E(x ) = $51 800 y x= 730.3, no se cuenta
con ninguna informacin acerca de la distribucin de la
poblacin; puede estar o no distribuida normalmente. Si la
poblacin tiene una distribucin normal, la distribucin
muestral de x estar distribuida normalmente. Si la
poblacin no tiene una distribucin normal, la muestra
aleatoria simple de 30 administradores y el teorema del
lmite central permiten concluir que la distribucin muestral
de puede aproximarse mediante una distribucin normal.
Grficas
Ejemplo:
Las estaturas de 1000 estudiantes estn distribuidas
aproximadamente en forma normal con una media de
174.5 centmetros y una desviacin estndar de 6.9
centmetros. Si se extraen 200 muestras aleatorias de
tamao 25 sin reemplazo de esta poblacin, determine:
a.- El nmero de las medias muestrales que caen entre
172.5 y 175.8 centmetros.
b.- El nmero de medias muestrales que caen por debajo
de 172 centmetros.
Solucin a:
Solucin b:
Distribucin muestral de px
La proporcin muestral es el estimador puntual de la
proporcin poblacional p. La frmula para calcular la
proporcin muestral es
p = x/n
donde
x =nmero de elementos de la muestra que poseen la
caracterstica de inters
n = tamao de la muestra
La distribucin muestral de pp es la distribucin de probabilidad
de todos los posibles valores de la proporcin muestral p.
Diagrama
Caracterstica
Una poblacin binomial est estrechamente relacionada
con la distribucin muestral de proporciones; una
poblacin binomial es una coleccin de xitos y
fracasos, mientras que una distribucin muestral de
proporciones contiene las posibilidades o proporciones
de todos los nmeros posibles de xitos en un
experimento binomial
Generacin de la Distribucin
Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual
tiene 4 artculos defectuosos. Se van a seleccionar 5
artculos al azar de ese lote sin reemplazo. Genere la
distribucin muestral de proporciones para el nmero
de piezas defectuosas.
Como se puede observar en este ejercicio la Proporcin
de artculos defectuosos de esta poblacin es 4/12=1/3.
Por lo que podemos decir que el 33% de las piezas de
este lote estn defectuosas
Artculos
Malos
Proporcin de
artculos defectuoso
4/5=0.8
8C1*4C4=8
3/5=0.6
8C2*4C3=112
2/5=0.4
8C3*4C2=336
1/5=0.2
8C4*4C1=280
0/5=0
8C5*4C0=56
Total
792
Calculos:
Valor esperado de px
El valor esperado de px, la media de todos los posibles valores de px,
es igual a la proporcin poblacional p.
E( p) = p
Donde
E( p) = valor esperado de p
p = proporcin poblacional
Como E(px ) = p, es un estimador insesgado de p. Recuerde que en la
seccin .1 se encontr que en la poblacin de EAI p = 0.60, siendo p
la proporcin de la poblacin de administradores que han participado
en el programa de capacitacin de la empresa. Por tanto, el valor
esperado de px en el problema de muestreo de EAI es 0.60.
Desviacin estndar de px
Como en el caso de la desviacin estndar de xx la
desviacin estndar de px obedece a si la poblacin es
finita o infinita. Las dos frmulas para calcular la
desviacin estndar de px se presentan a continuacin.
(7.5)
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande
fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes.
Calcule la probabilidad de que la proporcin de la muestra de la gente que
fuma cigarrillos sea menor que 0.55.
Solucin 1
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x< 440) = ?
Media= np= (800)(0.60)= 480
Interpretacin
Observe que este valor es igual al obtenido en el mtodo de la
aproximacin de la distribucin normal a la binomial, por lo que
si lo buscamos en la tabla de "z" nos da la misma probabilidad
de 0.0017. Tambin se debe de tomar en cuenta que el factor
de correccin de 0.5 se esta dividiendo entre el tamao de la
muestra, ya que estamos hablando de una proporcin
La interpretacin en esta solucin, estara enfocada a la
proporcin de la muestra, por lo que diramos que la
probabilidad de que al extraer una muestra de 800
estudiantes de esa universidad, la proporcin de
estudiantes que fuman cigarrillos sea menor al 55% es
del 0.17%.
Ejemplo:
Un medicamento para malestar estomacal tiene la
advertencia de que algunos usuarios pueden presentar
una reaccin adversa a l, ms an, se piensa que
alrededor del 3% de los usuarios tienen tal reaccin. Si
una muestra aleatoria de 150 personas con malestar
estomacal usa el medicamento, encuentre la
probabilidad de que la proporcin de la muestra de los
usuarios que realmente presentan una reaccin
adversa, exceda el 4%.
Resolverlo mediante la aproximacin de la normal a la
binomial
Resolverlo con la distribucin muestral de proporciones
Solucin 1
n=150 personas
p=0.03
x= (0.04)(150) = 6 personas
p(x>6) = ?
Media = np= (150)(0.03)= 4.5
Ejemplo 4
Se sabe que la verdadera proporcin de los
componentes defectuosos fabricadas por una firma es
de 4%, y encuentre la probabilidad de que una muestra
aleatoria de tamao 60 tenga:
Menos del 3% de los componentes defectuosos.
Ms del 1% pero menos del 5% de partes defectuosas.
Solucin 1
n= 60 artculos
P=0.04 ; p= 0.03
p(p<0.03) = ?
Solucin 2
n= 60 artculos
P=0.04 ; p= 0.01 y 0.05
p(0.01<p<0.05) = ?
Insesgadez
Se denomina sesgo de un estimador a la diferencia entre la
esperanza (o valor esperado) del estimador y el verdadero valor
del parmetro a estimar. Es deseable que un estimador sea
insesgado o centrado, es decir, que su sesgo sea nulo por ser
su esperanza igual al parmetro que se desea estimar.
Si el valor esperado del estadstico muestral es igual al
parmetro poblacional que se estudia, se dice que el estadstico
muestral es un estimador insesgado del parmetro poblacional.
Por tanto, el valor esperado, o media, de todos los posibles
valores de un estadstico muestral insesgado es igual al
parmetro poblacional que se estudia.
Eficiencia
Diremos que un estimador es ms eficiente o ms preciso que otro
estimador, si la varianza del primero es menor que la del segundo.
Por ejemplo, si
y
son ambos estimadores de
diremos que es ms eficiente que un estimador
es ms
eficiente (ms preciso), por tanto, cuanto menor es su varianza.
La eficiencia de los estimadores est limitada por las
caractersticas de la distribucin de probabilidad de la muestra de
la que proceden
Si un estimador insesgado alcanza una cota mnima, entonces se
dice que el estimador es de mnima varianza dentro de los
estimadores insesgados, pudiendo existir estimadores sesgados
con varianza menor.
Consistencia
Si no es posible emplear estimadores de mnima
varianza, el requisito mnimo deseable para un
estimador es que a medida que el tamao de la
muestra crece, el valor del estimador tienda a ser el
valor del parmetro, propiedad que se denomina
consistencia. Existen diversas definiciones de
consistencia, ms o menos restrictivas, pero la ms
utilizada es la denominada consistencia
cuando en media
cuando
cuadrtica que exige que:
Robustez
El estimador ser un estimador robusto del parmetro
si la violacin de los supuestos de partida en los que se
basa la estimacin (normalmente, atribuir a la poblacin
un determinado tipo de funcin de distribucin que, en
realidad, no es la correcta), no altera de manera
significativa los resultados que ste proporciona.
Suficiencia
Se dice que un estimador es suficiente cuando resume
toda la informacin relevante contenida en la muestra,
de forma que ningn otro estimador pueda proporcionar
informacin adicional sobre el parmetro desconocido
de la poblacin. Por ejemplo, la media muestral sera un
estimador suficiente de la media poblacional, mientras
que la moda no lo sera.
Invarianza
Se dice que un estimador es invariante cuando el
estimador de la funcin del parmetro coincide con la
funcin del estimador del parmetro
Ejemplo 1
Se quiere realizar un estudio en una poblacin de 250
nios, tomando una muestra de 61 nios. Sin embargo
este estudio est directamente relacionada con la edad.
Sabiendo que 110 tienen menos de 4 aos, 70 nios
de 4-5 aos, 45 nios de 6-7 aos y 25 son de ms de
ocho aos, determine el nmero de cada grupo
ni=n*Ni/N
Para el primer estrato se tomar:
n=61, N=250, N1= 110
n1=61*110/250= 27
Para el segundo estrato se tomar:
n=61, N=250, N2= 70
n2=61*70/250 = 17
Para el tercer estrato se tomar:
n=61, N=250, N3= 45 --- > n3=11
Para el cuarto estrato se tomar:
n=61, N=250, N4= 25 --- > n4=6
Ejemplo 2
Estamos interesados en estudiar el grado de aceptacin que la
evaluacin a los docentes ha tenido entre los padres de una
determinada provincia. A tal efecto seleccionamos una muestra
de 600 sujetos. Conocemos por los datos del ministerio que de
los 10000 nios escolarizados en las edades que nos interesan,
6000 acuden a colegios pblicos, 3000 a colegios privados y
1000 a colegios religiosos. Como estamos interesados en que en
nuestra muestra estn representados todos los tipos de colegio,
realizamos un muestreo estratificado empleando como variable
de estratificacin el tipo de centro educativo.
solucin
Por consiguiente, calculamos que proporcin supone
cada uno de los estratos respecto de la poblacin para
poder reflejarlo en la muestra.
Colegios pblicos: 600x6000/10000=360 sujetos
Colegios privados: 600x3000/10000=180 sujetos
Colegios religiosos: 600x1000/10000= 60 sujetos
Muestreo sistemtico
Consistente en escoger un individuo inicial de forma aleatoria entre la
poblacin y, a continuacin, seleccionar para la muestra a cada ensimo
individuo disponible en el marco muestral.
1. Elaboramos una lista ordenada de los N individuos de la poblacin,
lo que sera el marco muestral.
2. Dividimos el marco muestral en n fragmentos, donde n es el tamao
de muestra que deseamos. El tamao de estos fragmentos ser K=N/n
donde K recibe el nombre de intervalo o coeficiente de elevacin.
3. Obtenemos un nmero aleatorio entero A, menor o igual al intervalo.
Este nmero corresponder al primer sujeto que seleccionaremos para la
muestra dentro del primer fragmento en que hemos dividido la poblacin.
4. Seleccin de los n-1 individuos restantes: A, A + K, A + 2K, A + 3K,
., A + (n-1)K
Ejemplo
Supongamos que tenemos un marco muestral de 5.000
individuos y deseamos obtener una muestra de 100 de
ellos. Dividimos en primer lugar el marco muestral en
100 fragmentos de 50 individuos. A continuacin
seleccionamosunnmero aleatorio entre 1 y 50, para
extraer el primer individuo al azar del primer
fragmento: por ejemplo el 24. A partir de este individuo,
queda definida la muestra extrayendo los individuos de
la lista con intervalos de 50 unidades, tal y como sigue
24, 74, 124, 174, , 4.974
Muestreo de conveniencia
Los mtodos de muestreo hasta ahora vistos se conocen
como tcnicas probabilisticas de muestreo.
Los elementos seleccionados de una poblacin tienen una
probabilidad conocida de ser incluidos en la muestra.
El muestreo de conveniencia es una tcnica de muestreo
no probabilistica. Como el nombre lo indica, la muestra se
determina por conveniencia. Los elementos se incluyen en la
muestra sin que haya una probabilidad previamente
especificada o conocida de que sean incluidos en la muestra.
Muestreo subjetivo
Otra tcnica de muestreo no probabilstica es el muestreo
subjetivo. En este mtodo la persona que ms sabe sobre un
asunto selecciona elementos de la poblacin que considera los
ms representativos de la poblacin. Este mtodo suele ser
una manera relativamente fcil de seleccionar una muestra.
Por ejemplo, un reportero puede seleccionar dos o tres
senadores considerando que estos senadores reflejan la
opinin general de todos los senadores. Sin embargo, la
calidad de los resultados muestrales depende de la persona
que selecciona la muestra. Aqu tambin hay que tener mucho
cuidado al hacer inferencias acerca de las poblaciones a partir
de muestreos subjetivos.