Está en la página 1de 103

E

Estadística Aplicada
Sesión N° 2: Distribuciones Muestrales
Diapositiva de recursos humanos 8

Introducción a las

distribuciones

muestrales
Ing. Ferly Urday Luna
Propiedad Reproductiva de la normal
•Sean
  las siguientes variables aleatorias:

Entonces, las variables aleatorias X+Y y X-Y, tienen las siguientes


distribuciones:

Ing. Ferly Urday Luna


Ejemplo N° 1
• Un producto cuyo peso se distribuye normalmente con un promedio de 250 gramos y una
desviación estándar de 10 gramos es embalado en cajas de 4 docenas cada una. Se supone
que el peso de las cajas vacías se distribuyen normalmente con un promedio de 350
gramos y una desviación estándar de 15 gramos. Si los pesos del producto y de la caja son
independientes, calcular:
a) La probabilidad de que una caja llena pese menos de 12.5 kg.

Ing. Ferly Urday Luna


Ing. Ferly Urday Luna
b) ¿Cuántas cajas llenas serán necesarias para que el peso total sea al
menos 86303.711 gramos con probabilidad del 78.23%?

Ing. Ferly Urday Luna


Muestreo Aleatorio

Ing. Ferly Urday Luna


Parámetros y Estadígrafos
• Parámetro.- son las diversas medidas con las cuales se analizan los
elementos de una población.
• Estadígrafo.- son las diversas medidas con las cuales se analizan los
elementos de una muestra.

Característica Muestra Población


(Estadístico) (Psrámetro)
Variable Cuantitativa
Media Aritmética x̄ m
Desviación estándar s s
Varianza s2
s2
Variable Categórica
Proporción pop
Ejemplo N° 2
• Sea X1, X2, …, Xn una muestra aleatoria de tamaño n de una población normal N(m,s2) y al
saber que n = 8, m = 32 y s2 = 25, calcular la probabilidad que:
a) P(X1 + X3 – X6 + X8) > 60

Ing. Ferly Urday Luna


b) La probabilidad de que al menos tres de las Xi, sea menor que 34.5
𝑦 𝑖 = 1 , 𝑠𝑖 𝑥 <34.5
 
{ 0 , 𝑠 ⅈ 𝑥 ≥ 34.5

Ing. Ferly Urday Luna


MUESTREO
DE UNA
POBLACION
A menudo utilizamos muestras en lugar de toda la población porque
el costo y el tiempo necesario para medir todos los elementos de la
población seria prohibitivos.- Además en algunos casos la medición
requiere la destrucción de los elementos.- En general, se consigue
una precisión mayor extrayendo con cuidado una muestra aleatoria
de la población, que dedicando los recursos a medir todos sus
elementos.- La precisión es mayor por dos razones:

En primer lugar, a En segundo lugar como


menudo es muy difícil veremos en esta Unidad,
obtener y medir a todos pueden utilizarse muestras
los elementos de una bien seleccionadas para
población, e incluso realizar estimaciones medidas
cuando es posible, el de las característica de la
costo es muy alto población que son muy
cuando la población es cercanas a los valores reales.-
grande.-
La forma como se selecciona una muestra se
llama Plan de Muestreo o Diseño Experimental y
determina la cantidad de información en la
muestra.-
Conocer el plan de muestreo usado en una
situación particular le permitirá medir la
confiabilidad o bondad de su inferencia.-

Las muestras ideales para este


fin es la:

MUESTRA ALEATORIA
SIMPLE.-
Muestra aleatoria simple.-

Supongamos que queremos seleccionar una muestra de


n objetos de una población de N objetos.- Se selecciona
una muestra aleatoria simple tal que todos los objetos
tienen la misma probabilidad de ser seleccionados y se
seleccionan independientemente, es decir, la selección
de un objeto no altera la probabilidad de que sean
seleccionados otros objetos.- Las muestras aleatorias
simples son el ideal.- En algunos estudios por muestreo
del mundo real, los analistas desarrollan métodos
alternativos para reducir el costo del muestreo.- Pero la
base para saber si estas estrategias alternativas son
aceptables es el grado en que los resultados se
aproximan a los de una muestra aleatoria.-
Veamos entonces que es
una DISTRIBUCION
MUESTRAL

La distribución de todos los valores posibles


que puede asumir un estadístico calculado a
partir de muestras del mismo tamaño,
seleccionado aleatoriamente de la población
se llama DISTRIBUCION MUESTRAL DE
ESE ESTADISTICO.-
DISTRIBUCIONES
DISTRIBUCIONES
MUESTRALES:
MUESTRALES:
Elaboración
Elaboración

Las distribuciones muestrales pueden construirse


empíricamente a partir de poblaciones finitas.- Para
ello, se procede como sigue:

1.- De una población finita de tamaño N, se extraen de manera


aleatorias todas las muestras posible de tamaño n.-
2.- Se calcula el estadístico de interés para cada muestra.-
3.- Se ordena en una columna los distintos valores observados del
estadístico y en otra columna, las frecuencias de ocurrencia
correspondientes de cada valor observado.-
Elaborar la distribución muestral es
una tarea muy complicada si la
población es de un tamaño muy
grande e imposible si la población
es infinita.- En último caso, es
posible obtener aproximaciones de
las distribuciones muestrales
tomando un gran número de
muestras de un tamaño dado.-
DISTRIBUCIONES
DISTRIBUCIONES
MUESTRALES:
MUESTRALES:
Características
Características
importantes:
importantes:

Normalmente para una distribución muestral se tiene


interés en conocer tres cosas:

Media
varianza

Forma funcional Desviación


(grafica) estándar
DISTRIBUCION
DISTRIBUCION DE
DE
LA
LA MEDIA
MEDIA DE
DE LA
LA
MUESTRA
MUESTRA
A CONTINUACIÓN VEAMOS UN EJEMPLO DE
CÓMO ELABORAR ESTA DISTRIBUCION
SIGUIENDO LOS PASOS ANTES MENCIONADOS:
(en la practica profesional nunca puede hacer esto)

Consideremos una población de tamaño N = 5, la cual


se compone de los años de antigüedad en la empresa de
cinco empleados.- Las antigüedades en años son las
siguientes; 6, 8, 10, 12, 14.-

Calculemos la media y la varianza de la población como


sabemos:

Σxi Σ (xi – μ)²


μ= = 10 σ² = =8
N N
Supongamos que elegimos todas las
posibles muestras de tamaño n = 2 de la
población de tamaño N = 5 que
determinamos antes.-
La tabla A muestra todas las posibles
muestras de tamaño 2.-
Las muestra que están arriba y debajo de
la diagonal principal resultan cuando el
muestreo es sin reemplazo.- Las medias
de las muestras están entre paréntesis.-
TABLA A
SEGUNDA SELECCION
6 8 10 12 14
1º 6 6;6 6,8 6;10 6;12 6;14
S (6) (7) (8) (9) (10)
E
L 8 8;6 8,8 8;10 8;12 8;14
E (7) (8) (9) (10) (11)
C 10 10;6 10,8 10;10 10;12 10;14
C (8) (9) (10) (11) (12)
I
O
12 12;6 12;8 12;10 12;12 12;14
N (9) (10) (11) (12) (13)
14 14;6 14;8 14;10 14;12 14;14
(10) (11) (12) (13) (14)
En este ejemplo se observa que cuando el muestreo se hace con
reemplazos, hay 25 muestras posibles.- En general, cuando el
muestreo se lleva a cabo con reemplazos, el número de muestras
posible es igual a N n
Puede construirse la distribución muestral de media ordenando los
diferentes valores de media en una columna y sus frecuencias de
ocurrencia en la otra, tal como mostramos a continuación:
MEDIAS FRECUENCIA FREC. RELATIVA
6 1 1/25
7 2 2/25
8 3 3/25
9 4 4/25
10 5 5/25
11 4 4/25
12 3 3/25
13 2 2/25
14 1 1/25
TOTAL 25 1,00
En la tabla se aprecian los datos que satisfacen los
requerimientos para la distribución de probabilidad.- Las
probabilidades individuales todas son mayores de 0 y la
suma de todas ellas me da 1,00.-
Se mencionó al principio que un interés principal radica
en la forma funcional de la distribución, su media y la
varianza.-
fx fx
Distribución
Distribución de muestral de x
la población

1
x
6 8 10 12 14 6 7 8 9 10 11 12 13 14
DISTRIBUCION MUESTRAL DE X: forma funcional

En las figuras anteriores observamos que el gráfico en la población


esta distribuido uniformemente, en la distribución muestral va
tomando una forma cada vez más similar a la normal.-

DISTRIBUCION MUESTRAL DE X: la media

El paso siguiente es calcular la media de la distribución muestral.-

Σ x
μ = = 250 = 10
x 25 25

Observamos que la media de la distribución


muestral me da igual a la media de la población,
esto no es casualidad, siempre es así.-
DISTRIBUCION MUESTRAL DE X: varianza.-

Σ ( x - μ )²
σ² = x = 100/25 = 4
x 25

También se puede advertir que la varianza de la


distribución muestral no es igual a la varianza de la
población, sin embargo, es interesante observar que la
varianza de la distribución muestral es igual a la varianza
de la población dividida entre el tamaño de la muestra
utilizada para obtener la distribución muestral.- Esto es:
σ² = σ² = 8/2 = 4
x n
A la raíz cuadrada de la varianza de la distribución
muestral, se le conoce como error estándar de la
media.-

σ σ
Entonces: σ² = σ x =
x
n n

Estos resultados no son coincidencia sino


ejemplos de las características de las
distribuciones muestrales en general, cuando el
muestreo es con reemplazo o cuando se
efectúan a partir de una población infinita.-
Para generalizar, se debe distinguir
entre dos situaciones;

Muestreo a partir de una población que


sigue una distribución normal

Muestreo a partir de una población que


no sigue una distribución normal.-
DISTRIBUCION MUESTRAL DE X:
muestreo a partir de poblaciones que
siguen una distribución normal.-

Cuando el muestreo se realiza a partir de una población


que sigue una distribución normal, la distribución de la
media de la muestra tiene las siguientes propiedades:

1.- La distribución de la media será normal.-


2.- La media de la media de la distribución muestral
será igual a la media de la población de la
cual proviene la muestra.-
3.- La varianza de la distribución muestral será igual
a la varianza de
la población dividida entre el tamaño de la muestra.-
DISTRIBUCION MUESTRAL DE X: muestreo a
partir de poblaciones que no siguen una
distribución normal.-
Cuando el muestreo se hace a partir de una población
que no sigue una distribución normal, se utiliza un
teorema matemático conocido como teorema central
del límite.- La importancia de este teorema en la
inferencia estadística se resume en el siguiente párrafo:

Dada
Dada una
unapoblación
población de de cualquier
cualquier forma
forma
funcional
funcionalno nonormal
normal con con una
unamedia
media μμyy
varianza
varianzafinita
finitaσ²,
σ²,la
la distribución
distribución muestral
muestral dedelala
media x,
media x,será
serácasi
casi normal
normalcon media μμxx yy
conmedia
varianza
varianza σ²/n
σ²/n cuando
cuandola lamuestra
muestraesesmuy
muy
grande.-
grande.-
Observamos que el Teorema Central del Limite permite
tomar muestras a partir de la poblaciones con distribución
no normal y garantizar que se obtengan
aproximadamente los mismos resultados que si la
población tuviera una distribución normal, siempre que se
tome una muestra grande.-
La importancia de esto se demostrara más adelante al
estudiar que una distribución muestral con distribución
normal es una herramienta importante en la inferencia
estadística.-

En el caso de la media de la muestra, se tienen la


seguridad de que la distribución muestral está
distribuida en forma al menos aproximadamente
normal con tres condiciones:
1.- Cuando se hace el muestreo a partir de una población
con distribución normal.-
2.- Cuando se hace el muestreo a partir de una población
que no exhibe una distribución normal y la muestra es
grande.-
3.- Cuando se hace el muestreo a partir de una
población cuya forma funcional se desconoce, siempre
que el tamaño de la muestra sea grande.-

Al llegar a este punto, nos surge una pregunta lógica

¿Qué tan grande debe ser la


muestra para que el teorema central
del límite sea aplicable?.-
No existe una sola respuesta, pues el tamaño de
la muestra depende de la condición de no
normalidad en la población.- Una regla empírica
establece que, en la mayoría de las situaciones
prácticas, una muestra de tamaño 30 es
suficiente.- Es decir,
n ≥ 30 normalidad
Muchos autores consideran n > 30

En general, la aproximación a la normalidad de la


distribución muestral de X llega a ser mucho
mejor a medida que crece el tamaño de la
muestra.-
MUESTREO SIN REEMPLAZO.-

Los resultados anteriores se han dado con la premisa de


que el muestreo es con reemplazo o que la muestra fue
extraída de una población infinita.- En general, no se
efectúan muestreo con reemplazo, y en muchos casos
prácticos, el muestreo debe hacerse a partir de una
población finita; por lo tanto, es necesario conocer el
comportamiento de la distribución muestral de la media
de la muestra con estas condiciones.-
Antes de hacer cualquier afirmación general, conviene
revisar nuevamente los datos de la tabla que vimos al
comienzo.- Las media de la muestra que resulta cuando
el muestreo es sin reemplazo se presentan sobre la
diagonal principal que son las mismas que se presentan
por debajo de dicha diagonal, siempre y cuando se
ignore el orden en que se hicieron las observaciones.-
Se observa que hay 10 muestras posibles.- En general,
cuando se extraen sin reemplazo muestras de tamaño n a
partir de una población finita de tamaño N y se ignora el
orden en que son extraídas las muestras, se obtiene el
numero posible mediante la combinación de N casos
tomados de n a la vez.- El siguiente ejemplo se tiene que:

N! 5!
n CN = = = 10
n! (N-n)! 2! 3!

La media de las 10 medias muestrales es:

Σx 7 + 8 + 9 + 10 + 9 + 10 + 11 + 11 + 12 +13 = 10
=
μx =
10 10
Nuevamente se aprecia que la media de la distribución
muestral es igual a la media de la población.-

La varianza de la distribución muestral se calcula como


sigue;
Σ ( xi - μx)²
σ²x = = 30/10 = 3
10

En esta ocasión se observa que la varianza de la


distribución muestral no es igual a la varianza de la
población dividida entre el tamaño de la muestra, sin
embargo, existe una relación interesante que se descubre
al multiplicar,
σ² x N-n = 8 x 5-2 = 3
n N-1 2 4
Este resultado indica que si se multiplica la varianza de la
distribución muestral que se obtendrá si el muestreo fuese
con reemplazo por el factor (N-n)/(N-1), se obtiene el valor
de la varianza de la distribución muestral que resulta
cuando el muestreo es sin reemplazo.- Es posible
generalizar estos resultados con el siguiente enunciado:

Cuando
Cuando el el muestreo
muestreo es es sinsin
reemplazo
reemplazo aa partirpartir dede unauna
población
población finita,
finita, la
la distribución
distribución
muestral de x
muestral de x tendrá
tendrá una
una media
media μμ
yyuna
unavarianza;
varianza; σ²
N-n
n N-1
Si el tamaño de la muestra es muy grande, el teorema
central del límite es aplicable y la distribución muestral de
la media será aproximadamente normal.-

Corrección por población finita

Al factor (N-n) / (N-1) se le llama factor de corrección


por población finita y se puede omitir cuando el
tamaño de la muestra es pequeño en comparación con el
tamaño de la población.- Cuando la población es mucho
mayor que la muestra la diferencia entre usar o no el
factor es insignificante.-
La mayoría de los Estadísticos no usamos el factor a
menos que la muestra sea de más de 5% de la
población.- Es decir, la corrección por población finita
generalmente se ignora cuando n/N ≤ 0,05
APLICACIÓN.- Como veremos en
Unidades siguientes, el conocimiento
y la comprensión de las distribuciones
muestrales son necesarias para
entender los conceptos de la
inferencia estadística.- La aplicación
más sencilla para la distribución
muestral de la media de la muestra es
el cálculo de la probabilidad de
obtener una muestra con una media
de alguna magnitud especificada.-
VEAMOS ESTE EJEMPLO:
Entel es una empresa de Telecomunicación que presta servicios en
ciertas ciudades.- Los funcionarios de la empresa han aprendido
que la transmisión satelital promedio es de 150 segundos con una
desviación estándar de 15 segundos.- Los tiempos parecen estar
distribuidos normalmente.- Plantea instalar nuevos equipos que
mejorarían la eficiencia de sus operaciones.- Sin embargo, antes
que los ejecutivos puedan decidir si dicha inversión será eficaz en
función de los costos debe determinar la probabilidad de que la
media de la muestra de n = 35,

a) Este entre 145 y 150


b) Sea mayor que 145
c) Sea menor que 155
d) Esté entre 145 y 155
e) Sea mayor que 155

SOLUCION
a) P(145 ≤ x ≤ 150).-

Calculamos

P(145 ≤ x ≤ 150) = 0.50 - F(-1,97) = 0.50 - 0.0244


= 0,4756
= 47.56%

145 150 X
b) P(x  145)

Calculamos

P ( x  145) = 1,00 - F (- 1,97) = 1,00 - 0,0244 = 0,9756 = 97.56%

145 150 X
Así, con el mismo criterio se
seguirán calculando el resto de los
incisos, quedando ellos para
ejercitación del alumno.-

Lo importante que con esta


información Entel puede tomar
decisiones más inteligente
respecto a la necesidad de nuevos
equipos.-
Veamos otro ejemplo del valor práctico
de la distribución muestral de la media.-
-.Para que los alumnos discutan.-

Al director de personal de cierta empresa multinacional muy


importante se le ha asignado la tarea de elaborar un perfil de los 2500
gerentes de la empresa.- Las características por identificar son, entre
otras, el sueldo anual promedio y la proporción de gerentes que
terminaron el programa de adiestramiento de la empresa.-
Si definimos a los 2500 gerentes como la población a estudiar,
podemos determinar el salario anual y el estado de adiestramiento en
el programa para cada individuo, consultando los registros del
personal que tiene la empresa.- Supongamos que ya se hizo lo
anterior y que contamos con información de todos los 2500 gerentes.-
Si empleamos las formulas que vimos en Unidades anteriores para
calcular la media de la población y la desviación estándar poblacional,
que resultaron ser:
μ = 51800 dólares y σ = 4000 dólares.-
Sabemos que tanto μ como σ , son parámetros (características de
la población).-
El asunto que deseamos considerar es como el director de personal
puede obtener estimados de esos parámetros poblacionales con una
muestra de gerentes, en lugar de hacerlo con los 2500 individuos
de la población.- Supongamos que se usara una muestra de 30
gerentes.- Es claro que el tiempo y el costo de desarrollar un perfil
para 30 gerentes serían mucho menores que para toda la población.-
Si el director de personal pudiera estar seguro de que la nuestra de
30 gerentes suministra la información adecuada sobre la población
de 2500 gerentes, preferirá trabajar con la muestra que con toda la
población.-
Empezará su investigación obteniendo la muestra de los 30
gerentes, aplicando un muestreo simple aleatorio (como hemos
visto).- Se calcula el valor de la media de la muestra para estimar ,
la media de la población, no podemos esperar que la media de la
muestra sea exactamente igual a la media de la población.-
Vimos que el valor absoluto de la diferencia entre
la media de la muestra y la media de la población
me daba el error muestral.-
La razón práctica de que nos interesa la
distribución muestral de x es que la podemos
usar para determinar información probabilística
acerca del tamaño del error de muestreo, ya que
no lo podemos calcular porque desconocemos la
media de la población.-.
Supongamos que el director de personal cree
que la media de la muestra será un estimado
aceptable de la media de la población si el
promedio muestral dista menos de 500$ del
promedio poblacional.-
En
En términos
términos de de probabilidad,
probabilidad, lolo
que
que le
le preocupa
preocupa en en realidad
realidad al
al
director
director es
es la
la siguiente
siguiente pregunta,
pregunta,

¿Cuál es la probabilidad de que la media


de la muestra que obtengamos de una
muestra aleatoria simple de 30 gerentes
esté dentro del intervalo de 500 dólares
alrededor de la media de la población?
Como hemos identificado las propiedades de la
distribución muestral de x, usaremos esa información
para contestar la pregunta.- La distribución muestral,
será;

X
51300 51800 52300

μX = 51800 dól.-


El director de personal pregunta sobre la probabilidad de
que la media de la muestra sea entre 51300 y 52300
dólares.- Si el valor de la media de la muestra de X esta
en ese intervalo, se aproximará a 500 dólares de la media
poblacional.- La probabilidad correspondiente es el área
de la distribución muestral que vimos en la figura
anterior.-
Como la distribución muestral es normal, con promedio
de 51800 y desviación estándar 730,30, podemos usar la
tabla de la distribución de probabilidad normal
estandarizada, para calcular el área.-
Tendremos;

P( 51300 ≤ x ≤ 52300) = 0,7518 - 0,2482 = 0,5036


Esto nos indica que una muestra aleatoria simple de 30
gerentes de la multinacional tiene una probabilidad de
0,50 de dar como resultado una media de la muestra que
quede a 500$ o menos de la media poblacional.-

En otras palabras, una muestra aleatoria simple de 30


gerentes tiene una probabilidad de 50 a 50 de quedar
dentro de los 500$ alrededor de la media poblacional.-
Quizás deba tomar la decisión de aumentar el tamaño
de la muestra para lograr obtener datos para tomar
decisiones más seguras.-

Seguramente al aumentar por ejemplo el tamaño de


muestra n =100, la probabilidad de obtener una media de
muestra dentro de los márgenes pedidos, respecto a la
media de la población sea mayor.-
EJERCICIO PARA HACER EN CLASE

Supóngase que los incrementos salariales porcentuales


anuales de los directores generales de todas las
empresas de tamaño medio siguen una distribución
normal que tiene una media de 12,2 por ciento y una
desviación estándar de 3,6 por ciento.- Se extrae una
muestra aleatoria de nueve observaciones de esa
población y se calcula la media muestral.- ¿Cuál es la
probabilidad de que la media muestral sea inferior a un
10 por ciento?.-
Solución
Resp: 0.0336
2.- Un fabricante de bujías sostiene que la duración de
sus bujías siguen una distribución normal que tiene una
media de 36000 kilómetros y una desviación estándar de
4000 kilómetros.- Una muestra aleatoria de 16 bujías
tenía una duración media de 34500 kilómetros.- Si la
afirmación del fabricante es correcta, ¿Cuál es la
probabilidad de obtener una media muestral de 34500 o
menos kilómetros?.-
Solución
Repta: 0,0668
3.- La duración de la enfermedad de Alzheimer desde el
inicio de los síntomas hasta la muerte varía de tres a
20 años; el promedio es ocho años con una
desviación estándar de cuatro años.- El administrador
de un centro médico selecciona al azar, de la base de
datos del centro médico, los expedientes de 30
pacientes que murieron de Aizheimer y anota la
duración media.-
Encuentre las probabilidades aproximadas para estos
eventos:
a) La duración promedio es menor que 7 años.-
b) Excede 7 años.-
c) La duración promedio queda dentro del intervalo de 1
año de la media poblacional 8.-
Rpta: a) 0.0853 b) 0.9147 c) 0.8294
4.- Para evitar dificultades con la Oficina de Protección al
Consumidor, un embotellador debe asegurarse que las
botellas de 12 onzas en realidad contenga esa cantidad
de bebida.- Para determinar si una máquina
embotelladora está trabajando satisfactoriamente, el
embotellador muestrea al azar 10 botellas por hora y
mide la cantidad de bebida en cada una.-La media x de
las 10 botellas de llenado se usa para decidir si se
reajusta la cantidad de bebida con que la máquina llena
cada botella.- Si en los registros se observa que la
cantidad de llenado por botella tiene una distribución
normal, con una desviación estándar de 0,2 onzas y si se
ajusta la embotelladora para producir un llenado medio
por botella de 12,1 onzas.-
¿Cuál es la probabilidad aproximada de que la media
muestral de las 10 botellas de prueba sea menor que 12
onzas?.-
LA
LA DISTRIBUCION
DISTRIBUCION
DE
DE LAS
LAS
PROPORCIONES
PROPORCIONES
MUESTRALES
MUESTRALES
Hasta ahora la discusión se concentro exclusivamente en
las media de los asuntos que se tratan en la
administración, negocios, economía, etc., muchas veces
en ellos interesa la proporción “P” de la población.-

Una firma de marketing puede querer averiguar si un


cliente compra o no un producto, un banco puede estar
interesado en determinar su un depositante pedirá o no un
crédito para auto, muchas firmas deben determinar la
probabilidad de que un proyecto para presupuestar
capitales generará o no un rendimiento positivo, etc.-

En todos estos casos se usa la proporción muestral p


para hacer inferencias sobre la proporción poblacional.
“P”.- Podemos predecir que en cada repetición del
proceso obtendremos un valor distinto de la proporción
muestral p.-
La distribución de probabilidad de todos los valores
posibles de esa proporción p se llama distribución de
la proporción muestral.-
La distribución de probabilidad binomial según vimos
implica determinar las probabilidades de diferentes
números de éxitos en un experimento binomial.- La
distribución binomial es una distribución de probabilidad
discreta que indica la probabilidad de “x” éxitos en “n”
pruebas de un experimento binomial, donde cada prueba
tiene dos resultados posibles, éxitos y fracasos.-
x
p = -------
n
Esta fórmula nos muestra que para una muestra de n
pruebas de un experimento binomial, la proporción de
éxitos, el estadístico p, se calcula dividiendo el número
de éxitos “x” entre el número de pruebas “n”.-
Para determinar lo cercano que esta la proporción
muestral p de la proporción poblacional “P”
necesitamos comprender las propiedades de la
distribución muestral de p, su valor esperado, su
desviación estándar y la forma de la distribución.-
El valor esperado de p, la media de todos los valores
posibles de p, se puede expresar como,

E (p) = P

La ecuación anterior nos expresa que la media de todos


los valores posible de p es igual a la proporción P de la
población y esto siempre es así.-
La desviación estándar de p se llama error estándar de
la proporción.- Igual que en caso de las medias de la
muestra x, el error estándar de la proporción depende si
la población es finita o infinita, entonces:
Al comparar estas dos fórmulas, vemos que la diferencia
es el empleo del factor de corrección para
poblaciones finitas.-
Como en el caso de la media de muestra x, vemos que
la diferencia entre las ecuaciones para poblaciones finitas
e infinita se hace despreciable si el tamaño de la
población finita es grande en comparación con el tamaño
de la muestra.- Seguiremos la misma regla que
recomendamos antes.-
Como ya conocemos el promedio y la
desviación estándar de la proporción muestral
p, debemos conocer ahora la forma de la
distribución.- Al aplicar el Teorema Central del
Límite a p se tiene que la distribución
muestral de p se puede aproximar con una
distribución normal de probabilidad, siempre
que el tamaño de muestra sea grande.- En el
caso de p, se puede considerar que el tamaño
de muestra es grande cuando se cumple las
dos siguientes condiciones:

nP  5 y n (1- P)  5
Esto es, si la población es
infinita y n/N ≤ 0,05 usamos el
error estándar de la proporción
sin el factor de corrección, sin
embargo, si la población es finita
y la relación es n/N  0,05, se
debe usar el factor de
corrección.-
Sabemos que la aproximación
normal puede mejorar con la
corrección por continuidad, un
mecanismo que hace un ajuste en el
caso de que una distribución
continua se aproxime a una
distribución discreta.- En el caso de
estudio de proporción de una
población, estas son muy grandes y
la corrección no aporta diferencia y
por lo tanto la podemos obviar.-
Veamos un ejemplo, con valores irreales solo para
entender los conceptos elementales vistos.- Recuerde que
esto en la práctica profesional no se puede hacer.-

Casa Garbarino pregunta a toda la población de


clientes N = 4, si vieron el anuncio de ofertas,
publicitado en el diario del día.- Se registra una
respuesta de SI como éxito y de NO como
fracaso.- Los cuatro clientes respondieron: S1 N2
N3 S4.-

La proporción poblacional de éxito es P = 0.50.- Si


tomamos muestras de tamaño n = 2, la cantidad de
muestras será igual a las combinaciones de cuatro
elementos tomados de a dos, que me da igual a 6, la
proporción de éxitos se registra como sigue en la
siguiente tabla:
Xi Nº de éxitos Proporción de éxitos

S1N2 1 0.50
S1N3 1 0.50
S1S4 2 1.00
N2N3 0 0.00
N2 S3 1 0.50
N2 S4 1 0.50
Total ---------------------- 3.00
El valor esperado, media de distribución muestral de la
proporción muestral es;

 p 3
μp = E(p) = ------------- = ------ = 0.50 = P
K 6

Tenemos que calcular ahora el error estándar de la


proporción muestral, que será;

P ( 1 - P)
s p
=
n
Observo si n / N  0.05 es este caso no necesito el
factor de corrección para poblaciones finitas, en
cambio si n / N  0.05 si lo debo usar al calcular el error
estándar de la proporción muestral.-

En nuestro caso n / N = 2 / 4 = 0.50  0.05


Luego:
Las herramientas recientemente desarrolladas
para las proporciones muestrales permiten
determinar las probabilidades que pueden ser
muy útiles en la toma de decisiones
importantes.- Esto se logra aplicando la
distribución normal a la distribución muestral
de proporciones muestrales, como veremos en
el punto siguiente.-

p - P
Z = -----------------
p
VALOR
VALOR PRÁCTICO
PRÁCTICO DE
DE
LA
LA DISTRIBUCION
DISTRIBUCION
MUESTRAL
MUESTRAL DE
DE LA
LA
PROPORCIÓN
PROPORCIÓN
MUESTRAL.-
MUESTRAL.-
Siempre que se selecciona una muestra aleatoria
simple y que el valor de la proporción de la
muestra p se usa para estimar el valor de la
proporción poblacional P, podemos predecir que
hay cierto error de muestreo.- En este caso, el
error de muestreo es el valor absoluto de la
diferencia entre el valor de la proporción
muestral p y la proporción poblacional P.-

El valor práctico de la distribución muestral de p


es que se puede usar para proporcionar
información probabilística acerca del error de
muestreo.-
Veamos un ejemplo.-
El director de personal de cierta multinacional se le ha
asignado la tarea de elaborar un perfil de los 2500
gerentes de la empresa.- La característica por identificar
es la proporción de gerentes que terminaron el programa
de adiestramiento administrativo de la empresa.- Si
definimos a los 2500 gerentes como la población a
estudiar y sabemos que 1500 han terminado el programa
de adiestramiento.- Se saca una muestra de 30 gerentes
y sabemos que de ellos 19 han terminado el programa de
adiestramiento.-
Supongamos que el director de personal desea conocer
la probabilidad de obtener un valor de p que se acerque
a 0,05 o más de la proporción poblacional de gerentes
que participaron en el programa de adiestramiento.-
Esto es, ¿Cuál es la probabilidad de obtener
una muestra con proporción muestral p entre
0,55 y 0,65?.-
Usando el hecho de que la distribución
muestral p se puede aproximar con una
distribución normal de probabilidad con
promedio P = 0.60 y p = 0,0894, entonces
será:
P( 0.55  p  0.65) = 0.7123 - 0.2877
= 0,4246

0,55 0,60 0,65 p

La probabilidad de seleccionar una muestra que


de cómo resultado una proporción muestral
más cercano que 0.05 a la proporción
poblacional P es del 42.46%
Veamos otro ejemplo práctico.- El 5% de los
cinescopio que la compañía Audio Films hace para
monitores de PC son devuelto por el fabricante de
monitores como defectuosos.- Este hecho preocupa a
Audio Films, en especial después de leer un artículo en la
revista PC Word, sobre la guía a los compradores de
monitores súper VGA.- Audio Films considera que es
esencial mejorar su desempeño de calidad si quiere
continuar suministrando cinescopios a la industria.-
Después de iniciar su programa de mejora de calidad,
Audio Films obtendrá una muestra de cinescopios para
verificar si la calidad se ha elevado.- Se elegirá una
muestra de 125 cinescopios del almacén durante unos
cuantos días.- ¿Cuál es la probabilidad de que más del
8% sean defectuosos, suponiendo que la tasa global de
unidades defectuosas es todavía el 5%?.-
Solución
0 .05 * 0.95
s p
=
125
= 0.0195 donde P = 0.05

p- P 0.08 - 0.05
Z = = = 1,54
s p
0.0195

P( p 0.08) = 1 - F(1,54) =
= 1 - 0.9382 = 0.0618

Hay una probabilidad de alrededor del 6.18% de


que el 8% de los cinescopios o más sean
defectuosos, suponiendo que la tasa de defectos
de la población es del 5%.-
EJEMPLO 3.- Rosales SRL, adquiere componentes para
sus teléfonos celulares en lotes de 200 de una firma en
Lima.- El componente tiene una tasa de defectos del 10%.-
Una política establecida recientemente por Rosales SRL
establece que si el siguiente envió tiene:
a) Más del 12 % de defectos, definitivamente buscará un
nuevo proveedor.-
b) Entre el 10 y el 12 % de defectos (inclusive),
considerará un nuevo proveedor.-
c) Entre el 5 y el 10% de defectos (inclusive),
definitivamente no conseguirá un nuevo proveedor.-
d) Menos del 5 % de defectos, incrementará sus
pedidos.-
¿ Cual decisión es más probable que tome Rosales
SRL?.-
Debido a que el tamaño de la población no se suministra,
se asume que Rosales SRL compra muchos componentes
y el tamaño de la muestra de n = 200 es menor que 0,05 N
y por lo tanto no se necesita el factor de corrección para
poblaciones finitas.-

σp = 0,1 0,9


= 0,021
200

a) P (p > 0,12) = 0,1711


b) P ( 0,10 ≤ p ≤ 0,12) = 0,3289
c) P ( 0,05 ≤ p ≤ 0,10) = 0,4913
d) P ( p < 0,05) = 0,0087

Como la parte c) tiene la probabilidad más alta. Rosales


SRL se quedará con su proveedor actual.-
EJEMPLO 4.- En una encuesta se pregunto a 500
madres y padres acerca de la importancia de los
deportes para muchachos y chicas.- De los padres
entrevistados, 60% estaba de acuerdo en que los
géneros son iguales y debían tener las mismas
oportunidades para participar en los deportes.-
Describa la distribución muestral de la proporción P de
padres que están de acuerdo en que los géneros son
iguales y deberían tener las mismas oportunidades.-
Suponga que la proporción P de padres e la población
es en realidad 0.55.- ¿Cuál es la probabilidad de
observar una proporción muestral tan grande como o
mayor que el valor observado p = 0.60?.-
ANEXO
(PARA LEER)
TIPOS DE METODOS DE MUESTREO

El proceso de muestreo comienza con localización de


las fuentes adecuadas de datos, como listados de
población, registros, directorios y otras fuentes
llamadas MARCOS.- Las muestras se extraen de estos
marcos.- Si el marco es inadecuado debido a que ciertos
grupos de individuos o de objetos en la población no se
incluyeron de manera apropiada, entonces las muestras
serán inexactas y sesgadas.-

Recordemos que las razones para obtener una muestra


son:
1.- Una muestra requiere menos tiempos que un censo.-
2.- Cuesta menos administrar una muestra que un censo.-
3.- Administrar una muestra es menos tedioso y más practico que
administrar el censo de una población estadística determinada.-
Tipos de muestras utilizadas

No Probabilísticas Probabilísticas

Muestra subjetiva Aleatoria simple

Sistemática
Muestra por cuota

Estratificada
Por grupo naturales
Por
conglomerados
MUESTRA ALEATORIA SIMPLE.-
Una muestra aleatoria simple, es aquella en la cual cada
individuo o elemento de una población tiene la misma
oportunidad de ser elegido.- Además, cada muestra de
un tamaño fijo tiene la misma probabilidad de ser
elegida, que cualquier otra muestra del mismo tamaño.-
El muestreo aleatorio simple, es la técnica de muestreo
aleatorio más elemental y constituye la base para otras
técnicas.-
En el muestreo aleatorio simple, se usa n para
representar el tamaño de la muestra y N para representar
el tamaño de la población.- Cada persona o elemento en
el marco se enumera de 1 a N.-
La probabilidad de seleccionar a cualquier miembro en
particular de la población la primera vez es igual a 1/N.-
Existen dos métodos básicos para seleccionar muestras:

n
Coon
C
mppl
reeem
re o
laazzo

Sin
Sin
reemplazo
reemplazo
El muestreo con reemplazo, implica que una vez
seleccionada una persona o elemento, se regresa al
marco donde tiene la misma probabilidad de ser elegida
de nuevo.- Imagine que tiene una urna con 500 tarjetas de
presentación.- Suponga que en el primer sorteo sale la
ficha de Juan Llanos.- La información pertinente se
registra y se regresa la tarjeta a la urna.- Después se
mezclan bien las tarjetas y se saca una segunda tarjeta,.
En esta segunda extracción Juan Llanos, tiene la misma
probabilidad de salir 1/N, de ser elegida de nuevo.- Se
repite el procedimiento hasta alcanzar el tamaño muestra
n deseado.- Sin embargo, suele considerarse más
adecuado tener una muestra de personas o elementos
diferentes en lugar de permitir la repetición de
mediciones de la misma persona o elemento.-
En el muestreo sin reemplazo, no se regresa la
persona o elemento al marco una vez seleccionado y por
lo tanto, no puede elegirse otra vez.- Como antes, en el
muestreo sin reemplazo la probabilidad de que algún
miembro específico de la población, por ejemplo Juan
Llanos, sea elegido en el primer intento es 1/N.- La
probabilidad de que, cualquier individuo no
seleccionado, salga elegido en el segundo intento será 1 /
N-1.- Este proceso continua hasta alcanzar el tamaño de
muestra n deseado.-

Sin importar si el muestreo es con o sin reemplazo,


los métodos de urna para elegir una muestra tienen
un gran inconveniente: la habilidad para revolver
perfectamente las tarjetas y elegir la muestra en
forma aleatoria.- Como resultado, los métodos de
urna no son muy útiles.- Son preferibles otros
métodos de selección con menos problemas y
mejor base científica.-
Uno de estos métodos utiliza una TABLA DE
NUMEROS ALEATORIOS, para obtener la
muestra.- Una tabla de números aleatorios esta
formada por una serie de dígitos que se generan
en forma aleatoria y se colocan en la secuencia
en que se generaron.- Hay muchas tablas de
números aleatorios, como la que veremos en
práctica.- De hecho, lo normal es que los
investigadores antes de usar una tabla de
números aleatorio verifiquen la aleatoriedad de
los dígitos generados antes de emplearlos.-
Debido a que cada dígito o secuencia de dígitos
de la tabla es aleatorio, se puede leer en sentido
horizontal o vertical.-
Para usar una tabla como la que vemos en práctica en
lugar de una urna para seleccionar una muestra,
primero debemos asignar números de códigos a los
miembros individuales de la población.- Entonces se
obtiene la muestra aleatoria leyendo la tabla y
seleccionando los elementos del marco de población
cuyos números de código coinciden con los dígitos
encontrados en la tabla.- Para entender mejor, hagamos
un ejemplo con el curso.-
Hoy gracias a los avances de los paquetes estadísticos
de PC, las tablas se usan menos.- Los programas tienen
una secuencia para generar los números aleatorios que
se necesita.-
MUESTRA SISTEMATICA.-
En una muestra sistemática, se dividen N individuos o
elementos del marco poblacional en k grupos, dividiendo
el tamaño de la población N entre el tamaño de la muestra
deseado n.- Es decir, k = N / n donde k se
redondea al entero más cercano.-
Para obtener una muestra sistemática, el primer individuo
o elemento se selecciona al azar entre los k individuos o
elementos del primer grupo del marco de población y,
para el resto de la muestra se elige un individuo o
elemento cada k en la lista completa de la población.-
Cuando el marco de población consiste en listados
predeterminados es más rápido y fácil obtener una
muestra sistemática que una muestra aleatoria simple.-
En estas situaciones la muestra sistemática es un
mecanismo conveniente para obtener los datos
deseados.-
Aunque su aplicación es más sencilla, en general los métodos de
muestreo aleatorio simple y de muestreo sistemático son menos
eficientes que otros métodos de muestreo probabilístico más
elaborado.- Es decir, para cualquier muestra que se adquiere
mediante muestra aleatorias simple o muestreo sistemático, los
datos obtenidos pueden o no ser buena representación de las
características fundamentales (parámetros) de la población.-
Aunque la mayor parte de las muestras aleatorias simples son
representativas de la población correspondiente, no es posible saber
si una muestra en particular es, de hecho representativa.-.-
Se presentan posibilidades todavía mayores de un sesgo en la
selección y una falta de representatividad de las características de la
población, en el muestreo sistemático.- Si existiera un padrón en el
listado del marco de población, podría ocurrir errores de selección
importantes.- Para evitar el problema potencial de la
representatividad desproporcionada de grupos específicos en una
muestra, se pueden usar los métodos de muestreo estratificado o
muestreo conglomerado.-
MUESTRA ESTRATIFICADA.-
En una muestra estratificada, primero se dividen los N individuos o
elementos de la población en sub poblaciones separadas, o estratos,
de acuerdo con algunas característica común.- Se realiza un
muestreo aleatorio simple en cada estrato y después se combinan
los resultados de las muestras aleatorias simple.-

Estos métodos de muestreo son más eficientes


que el muestreo aleatorio simple o el sistemático,
porque garantizan la representación de
individuos o elementos de toda la población, lo
que asegura una mayor precisión en las
estimaciones de los parámetros poblacionales
fundamentales.- Lo que proporciona la presición,
una vez combinados los estratos, es la
homogeneidad de individuos o elementos dentro
de cada estrato.-
MUESTRA CONGLOMERADA.-
En una muestra conglomerada, se divide los N individuos o
elementos de la población en varios conglomerados, de manera que
cada conglomerado sea representativo de la población completa.-
Después, se obtiene una muestra aleatoria de los conglomerados y
se estudian todos los individuos o elementos dentro de cada
conglomerado seleccionado.- Los conglomerados pueden ser
asignaciones naturales, como departamentos, ciudades, manzanas,
familias o edificio de departamento, etc.-

Los métodos de muestreo conglomerados pueden ser más eficientes


(con relación a su costo) que los métodos de muestreo aleatorio
simple, sobre todo si la población en cuestión se encuentra esparcida
en una vasta región geográfica.- Sin embargo, los métodos de
muestreo conglomerado tienden a ser menos eficientes que los
métodos de muestreo aleatorio simple o de muestreo estratificado, y
necesitan una muestra total más grande para obtener resultados tan
precisos como los que se obtienen con los procedimientos más
eficientes.-
EVALUACION DEL VALOR DE UNA ENCUESTA.-

Casi todos los días leemos o escuchamos hablar de resultados de


una encuesta.- Es evidente que los avances tecnológicos de las
comunicaciones han provocado una gran proliferación de
investigaciones mediante encuestas, sin embargo, no todas son
aceptables significativas e importantes.-

Para evitar encuestas carentes de objetividad o


credibilidad, debe evaluarse con sentido crítico
todo lo que se lee y escucha, además debe
examinarse el valor de la encuesta.- En primer
lugar se evalúa el propósito de la encuesta, por
que y para quién se realiza.-
En segundo lugar, se debe evaluar si esta basada
en una muestra probabilística o no.- Recuerde que
el único medio disponible para hacer inferencia
estadística correcta a partir de una muestra es que
esta sea probabilística.-
Las encuestas que emplean métodos no probabilísticos están
sujetas a errores importante, quizás no intencionales, que pueden
generar resultados sin sentido.-

ERRORES
ERRORES EN
EN LAS
LAS ENCUESTAS
ENCUESTAS
Aún
Aúncuando
cuandoen enlas
lasencuestas
encuestasse seutilicen
utilicen
métodos
métodosde demuestreo
muestreoprobabilístico
probabilísticoestán
están
sujetos
sujetosaaerrores
errorespotenciales.-
potenciales.-
Hay
Haycuatro
cuatrotipos
tiposdedeerrores
erroresde
deencuestas.-
encuestas.-
Con
Conlaslasencuestas
encuestascorrecta
correctase
sediseñan
diseñan
modelos
modelosparaparareducir
reduciroodisminuir
disminuirlos
los
diferentes
diferenteserrores
erroresdedelas
lasencuestas,
encuestas,loslos
cuales
cualessuelen
suelentener
tenerun
uncosto
costoconsiderable
considerable
Los errores de las encuestan son:

1.- Errores de cobertura.-


2.- Errores o sesgos de no respuestas.-
3.- Errores de muestreo.-
4.- Errores de medición.-

ERRORES DE COBERTURA.-
La clave para una selección apropiada en la muestra es un marco de
población adecuado o una lista actualizada, de todos los sujetos
que participarán en el muestreo.- El error de cobertura ocurre si se
excluyen ciertos grupos de sujetos de las lista de población, de
manera que no tienen oportunidad de ser seleccionado en la
muestra.- El error de cobertura conduce a un sesgo de selección.-
Si el listado es inadecuado porque no se incluyeron algunos
grupos o sujetos de la población, cualquier muestra probabilística
aleatoria proporcionará una estimación de las características del
marco, no de la población real.-
ERRORES DE NO RESPUESTA.-
No todas las personas están dispuestas a contestar una encuesta.-
De hecho, la investigación indica que los individuos de las clases
económicas alta y bajas tienden a responder con menos frecuencia
que los individuos de clase media.- El error de no respuesta surge
del fracaso al recopilar datos de todos los sujetos de la muestra y
el resultado es un error de no respuesta.- Como el general, no se
puede suponer que las personas que no responden son semejantes
a aquellas que si responden, es en extremo importante dar
seguimiento a las no respuestas después de un período específico.-
Deberán varios intentos, ya sea por correo, teléfono o con
encuestador, para convencerlos y que cambien de opinión.- Con
base a estos resultados, las estimaciones obtenidas con las
respuestas iniciales se combinan con las estimaciones obtenidas
con el seguimiento, de manera que la inferencias hechas a partir de
la encuesta sean válidas.- El modo de respuesta afecta la tasa de
respuesta.- La entrevista personal y por teléfono casi siempre
producen una respuesta más alta que la encuesta por correo, pero a
un costo más elevado.-
ERRORES DE MUESTREO.-
Existen tres razones principales para extraer una
muestra en lugar de hacer un censo completo: es más
rápido, menos costo y más eficientes.- Sin embargo, en
el marco de la población el azar determina quién estará
o quién no estará incluido.- El error de muestreo refleja
la heterogeneidad o las diferencias aleatorias, de una
muestra a otra según la probabilidad de que individuos
o elementos específicos sean seleccionados en una
muestra determinadas.- Como se observa los resultados
de sondeo que se publican en revistas y diarios, se
hacen referencia a un margen de error por ejemplo de ±
4 porciento del valor real.- Este margen de error es el
error de muestreo.- Este error se puede reducir con
tamaños de muestras más grande, aunque esto
incrementa el costo de la encuesta.-
EL ERROR DE MEDICIÓN.-
Cuando se quiere realizar una buena investigación por
medio de encuestas, se diseña un cuestionario que
permita reunir información importante.- Los datos
obtenidos deben ser válidos; es decir, las respuestas
correctas deben ser evaluadas y plantearse de manera
que arrojen medidas significativas.-
Pero existe un dilema, es más fácil decir que se obtienen
mediciones significativas que el simple hecho de
obtenerlas.- Por desgracia, las realizaciones de
mediciones está gobernada por lo que es conveniente,
no por lo que se necesita.- Con bastante frecuencia, las
mediciones que se obtienen son solamente más
aproximadas de las mediciones que se desean en
realidad.-
El error de medición se refiere a la falta de precisión
en las respuestas registradas, debido a fallas en la
redacción del enunciado de las preguntas, la influencia
del entrevistador en la persona que responde o por el
esfuerzo que realiza la persona que responde.- Se le
ha dado mucha atención al error de medición que
ocurre por fallas de redacción en el enunciado de las
preguntas.-
Una pregunta debe ser clara, no ambigua.- Debe
presentarse en forma objetiva y neutral, se debe evitar
la pregunta guiada.-
Existe tres fuentes de errores en la medición:
redacción ambigua de la pregunta, efecto halo, y
errores de la persona que contesta.-
El efecto halo se presenta cuando la
persona que responde se siente obligada
a complacer al entrevistador.- Este tipo de
error puede minimizarse con la
capacitación adecuada en la realización
de entrevistas.-
El error que proviene de la persona que
responde se produce cuando ésta realiza
un esfuerzo demasiado grande o
demasiado pequeño.- Existen dos formas
para minimizar esta clase de error: 1)
mediante una revisión cuidadosa de los
datos y un nuevo o visita a aquellos
individuos cuyas respuesta parecen raras
y 2) al establecer un programa de
llamadas aleatorias para verificar la
confiabilidad de las respuestas.-
EJERCICIOS
Resolver los siguientes ejercicios
Del libro de Anderson, el problema 8 de la página 273, con el uso de
Excel.
Tomar una muestra de 36 estudiantes de la encuesta desarrollada en
clase y hallar los estimadores de la media, la desviación y la varianza del
dinero medio semanal disponible.
Si tomaría una muestra considerando las secciones como serían los
cálculos del punto anterior.
Resolver en el cuaderno, del libro de Anderson
• De la página 288, los problemas 25 y 30.
• De la página 288, los problemas 37 y 40.
E
ADiapositiva de recursos humanos 10

Gracias

Ing. Ferly Urday Luna

También podría gustarte