Está en la página 1de 19

El problema de muestreo de Electronics Associates

Al director de personal de Electronics Associates, Inc. (EAI), se le ha encargado la tarea de


elaborar un perfil de los 2500 administradores de la empresa. Las características a determinar
son el sueldo medio anual de los administradores y la proporción de administradores que ha
terminado el programa de capacitación de la empresa.
Con los 2500 administradores de la empresa como la población para este estudio, es posible
hallar el sueldo anual y la situación respecto al programa de capacitación de cada persona al
consultar los archivos del personal.
Media poblacional Media muestral

Varianza poblacional Varianza muestral

Desviación estándar
poblacional Desviación estándar muestral

Con los datos de EAI y las fórmulas anteriormente, se calcula la media poblacional y la desviación
estándar poblacional de los salarios anuales.
Media poblacional: μ = $ 51 800
Desviación poblacional: σ = 4000
Los datos sobre la situación del programa de capacitación muestran que 1500 de los 2500
administradores han terminado el programa de capacitación. Si p denota la proporción de la
población que ha terminado el programa de capacitación, se tiene que p= 1500 / 2500 = 0.60. La
media poblacional (μ), la desviación estándar (σ) y la proporción poblacional (ρ). Son parámetros
de la población de administradores de EAI.
Ahora suponga que la información necesaria sobre todos los administradores de EAI no esté
disponible en la base de datos de la empresa. Asuma que se va a emplear una muestra de 30
administradores. Es obvio que el tiempo y el costo de la elaboración de un perfil será mucho
menor usando 30 administradores que la población entera. Si el director de personal tuviera la
certeza de que una muestra de 30 administradores proporciona la información adecuada acerca
de la población de los 2500 administradores, preferiría trabajar con una muestra que hacerlo con
toda la población.
Para seleccionar una muestra de una población hay diversos métodos; uno de los más comunes
es el muestreo aleatorio simple. Una muestra aleatoria simple de tamaño n de una población
finita de tamaño N es una muestra seleccionada de manera que cada posible muestra de tamaño
n tenga la misma probabilidad de ser seleccionada.
El número de muestras aleatorias simples distintas de tamaño n que pueden seleccionarse de
una población finita de tamaño N es:
N!
n ! ( N−n ) !
Estimación puntual
A continuación se presenta una muestra aleatoria simple de 30 administradores con sus
respectivos datos de sueldo anual y de participación en el programa de capacitación. La notación
x1, x2, etc., se usa para denotar el sueldo anual del primer administrador de la muestra, del
segundo, y así sucesivamente. La participación en el programa de capacitación se indica por un Sí
en la columna programa de entrenamiento.

Para estimar el valor de un parámetro poblacional, la característica correspondiente se calcula


con los datos de la muestra, a lo que se le conoce como estadístico muestral.
n = 30 administradores
ΣXi 1 554 420
x= = =51814
n 30
Y la desviación estándar es

s=
√ Σ(Xi−x )2
29
=

325 009 260
29
=3348

Para estimar ρ, la proporción de administradores que han terminado el programa de capacitación:


x
ρ= =0.63
n
Al hacer los cálculos anteriores, se lleva a cabo el proceso estadístico conocido como estimación
puntual de la media, desviación estándar y proporción poblacional. A los valores de x , s y ρ se les
conoce como estimadores puntuales.

Ahora suponga que el proceso de seleccionar una muestra aleatoria simple de 30 administradores
se repite una y otra y otra vez y que cada vez se calculan los valores de x y de ρ . A continuación,
se muestra una parte de los resultados obtenidos de 500 muestras aleatorias simples.

Distribución de frecuencias de x en 500 muestras aleatorias simples de 30 administradores


cada una de EAI

Histograma de las frecuencias relativas de los valores de x obtenidos en 500 muestras aleatorias
simples de 30 administradores cada una.
Histograma de las frecuencias relativas de los valores de ρ obtenidos em 500 muestras aleatorias
simples de 30 administradores cada una
Distribución muestral de x
La distribución muestral de x es la distribución de probabilidad de todos los valores de la media
muestral x .
Valor esperado de x
Como la variable aleatoria puede tener muchos valores diferentes, suele ser de interés conocer la
media de todos los valores de que se obtienen con diferentes muestras aleatorias simples. La
media de la variable aleatoria x es el valor esperado de x . Sea E( x ) el valor esperado de x y μ la
media de la población de la que se selecciona una muestra aleatoria simple. S e puede demostrar
que cuando se emplea el muestreo aleatorio simple, E( x ) y μ son iguales.

Cuando el valor esperado de un estimador puntual es igual al parámetro poblacional, se dice que
el estimador puntual es insesgado.
Desviación estándar de x
Ahora se definirá la desviación estándar de la distribución muestral de x . Se empleará la notación
siguiente.

σ
También se utiliza la fórmula σ x=
√n cuando la población sea finita y el
tamaño de la muestra sea menor o igual a 5% del tamaño de la
población; es decir n/N ≤0.05.
Para calcular σ x (error estándar ) se necesita conocer σ(desviación estándar poblacional), la
desviación estándar de la población. Para subrayar, aún más, la diferencia entre σ x y σ, a la
desviación estándar de x , σ x se le llama error estándar de la media.
σ = 4000
n = 30

4000
σ x= =730.3
√ 30

Valor práctico de la distribución muestral de x


Siempre que se seleccione una muestra aleatoria simple y se use el valor de la media muestral
para estimar el valor de la media poblacional μ, no se podrá esperar que la media muestral sea
exactamente igual a la media poblacional. La razón práctica por la que interesa la distribución
muestral de x es que se puede usar para proporcionar información probabilística acerca de la
diferencia entre la media muestral y la media poblacional. Para demostrar este uso, se retomará el
problema de EAI.
Suponga que el director de personal cree que la media muestral será una estimación aceptable de
la media poblacional si la primera está a más o menos de $500 de la media poblacional. Sin
embargo, no es posible garantizar que la media muestral esté a más o menos de $500 de la media
poblacional. Entonces hay que pensar en el requerimiento del director de personal en términos de
probabilidad. Es decir, al director de personal le interesa la interrogante siguiente: “¿Cuál es la
probabilidad de que la media muestral obtenida usando una muestra aleatoria simple de 30
administradores de EAI, se encuentre a más o menos de $500 de la media poblacional?”
Como ya se han identificado las propiedades de la distribución muestral de x , se usará la
distribución mostrada a continuación para contestar esta interrogante probabilística.
Ilustración 1 Distribución muestral de x para el sueldo anual de una muestra aleatoria simple de 30
administradores.
Como la media poblacional es $51 800, el director de personal desea saber cuál es la probabilidad
de que esté entre $51 300 y $52 300, se realizan los siguientes cálculos.
N = 2500
n = 30
σ = 4000

Área de cola izq.


1. En el problema de EAI, se mostró que con n =30, la probabilidad de que la media muestral no
difiriera más de $500 de la media poblacional era 0.503.
a. ¿Cuál es la probabilidad de que la media muestral no difiera más de $500 de la media
poblacional si se usa una muestra de tamaño 60?
Datos:
N = 2500
E(x) = 51800
σ = 4000
margen= ∓ 500
n = 60
Error estándar:
n 60
= =0.024< 0.05
N 2500
σ
σ x=
√n
4000
σ x= =516.398
√ 60
Cálculo de probabilidad
( X +margen de error )−(X ) ( 51800+500 )−51800
Z(total) =
error est .
= 516.398
=¿0.97

( X−margen de error )−( X) ( 51800−500 )−51800


Z(izq)= error est .
= 516.398 = - 0.97}
P(∓ 500)= 0.8340 – 0.1660 = 0.668
b. Responda el inciso a si el tamaño de la muestra es 120.
Datos:
N = 2500
E(x) = 51800
σ = 4000
margen= ∓ 500
n = 120
Error estándar:
n 120
= =0.048<0.05
N 2500
σ
σ x=
√n
4000
σ x= =365.148
√120
Cálculo de probabilidad:
(+ margen de error ) 500
Z(total) = = =1.37
error est . 365.148
(−margen de error ) −500
Z(izq) = = =−1.37
error est . 365.148
P(∓ 500) = 0.9147 – 0.0853 = 0.8294

2. Suponga que de una población en la que σ = 10 se toma una muestra aleatoria simple de
tamaño
n = 50. Halle el valor del error estándar de la media en cada uno de los casos siguientes (si es
necesario use el factor de corrección para una población finita).
a. El tamaño de la población es infinito.
10
σ x= =1.414
√50

b. El tamaño de la población es N = 50 000.


n 50
= =.001<.05
N 50000
10
σ x= =1.41
√50
c. El tamaño de la población es N = 5000.
n
= 0.01 < 0.05
N
σ x =1.41

d. El tamaño de la población es N = 500.


n
=0.1
N

σ x=
√ 500−50 )=
500−1
¿ 1.342

Distribución muestral de ρ
La proporción muestral ρ es el estimador puntual de la proporción poblacional ρ. La fórmula para
calcular la proporción es:
x
ρ=
n
Donde:
x = número de elementos de la muestra que poseen la característica de interés
n = tamaño de la muestra
Es necesario considerar a la proporción muestral ρ como una variable aleatoria y su distribución
de probabilidad se conoce como distribución muestral de ρ .
Distribución muestral de ρ : La distribución muestral de ρ es la distribución de probabilidad de
todos los posibles valores de la proporción muestral ρ .
Propiedades:
Valor esperado de ρ : El valor esperado de ρ (la media de todos los posibles valores de ρ ), es
igual a la proporción poblacional.

Desviación estándar de ρ : La fórmula para el cálculo de la población estándar obedecen a si la


población es finita o infinita.
Nota: Se seguirá la misma regla recomendada para la media poblacional. Es decir, si la población
es finita y n/N ≤ 0.05, entonces se deberá usar la fórmula sin factor de corrección (para población


infinita) σ ρ=
p (1− p)
n
En el caso de EAI se sabe que la proporción poblacional de administradores que han participado
en el programa de capacitación es ρ = 0.6. El error estándar se calcula de la siguiente forma:

n /N = ❑

Valor práctico de la distribución muestral de ρ : El valor práctico de la distribución muestral de ρ
es que permite obtener información probabilística acerca de la diferencia entre la proporción
muestral y la proporción poblacional.
Ejemplo: Suponga que el director de personal desea saber cuál es la probabilidad de obtener un
valor de ρ que no difiera en más de 0.05 de la proporción poblacional de los administradores que
han participado en el programa de capacitación.

Ilustración 2 Distribución muestral de p


Cálculo de probabilidad:
Con una muestra de 100 administradores de EAI, se calcula ahora la probabilidad de que la
proporción muestral tenga un valor que no difiera en más de 0.05 de la proporción poblacional.

Estimación por intervalo


Como no se puede esperar que un estimador puntual suministre el valor exacto del parámetro
poblacional, se suele calcular una estimación por intervalo al sumar y restar al estimador puntual
una cantidad llamada margen de error. La fórmula general de la estimación por intervalo es:
Intevalo=Estimación puntual ± Margen de error
El objetivo de la estimación por intervalo es aportar información de qué tan cerca se encuentra la
estimación puntual, obtenida de la muestra, del valor del parámetro poblacional.
La fórmula para obtener la estimación por intervalo para la media poblacional es:
Intevalo de xx % de confianza para la media=x ± Margen de error

La fórmula para obtener la estimación por intervalo para la proporción poblacional es:
Intevalo de xx % de confianza para la proporción= ρ± Margen de error
Resumen de procedimiento para la estimación por intervalo de la media poblacional

¿Se puede considerar


que se conoce la
SÍ NO
desviación estándar
poblacional σ?

Use la desviación estándar


Use: muestral para estimar σ
σ
x ± Z a/ 2
√n

Use:

s
x ± t a /2
√n
Nota: Z a/ 2es el valor de z que
proporciona un área α/2 en la cola
superior de la distribución de
probabilidad normal estándar.

Valores de Z a/ 2 para los niveles de confianza más usados


Para comprender los conceptos de margen de error y estimación por intervalo, imagine que
una tienda comercial se quiere determinar la cantidad promedio que cada cliente gasta en una
visita a la tienda. Para hacer la estimación, el administrador de la tienda tomó una muestra
aleatoria de 100 clientes de los cuales se obtiene una media muestral x = $82. La media muestral
de la cantidad gastada permite una estimación puntual de la media poblacional de la cantidad
gastada en cada visita, μ. La tienda supone que el valor conocido de la desviación es σ = 20.
El objetivo del administrador es calcular el margen de error para esta estimación y obtener una
estimación por intervalo de la media poblacional.
a) Suponiendo que se quiere tener un nivel de confianza del 95% = 0.95:

Error estándar:
σ 20
= =2
√n √100
Margen de error:
Margen de error = x ∓(Z a/ 2)(2)
a = 1 - .95 = 0.05
a a
=0.025 1- =¿ 0.975
2 2
Margen de error = ∓( 1.96)(2)
Margen de error = ∓ 3.92
Intervalo para 95% de confianza:
82 ± 3.92
78.08 a 85.92
b) Suponiendo que se quiere tener un nivel de confianza del 90%:
Error estándar:
σ 20
= =2
√n √100

Margen de error = ∓( Z a /2 )(2)

Margen de error = ∓(1.645)(2)


Margen de error = ∓ 3.29
Intervalo para 90% de confianza: 78.71 a 85.29
c) Intervalo para 99% de confianza:

Media poblacional σ desconocida


Cuando se calcula un intervalo de confianza para la media poblacional, suele no contarse con una
buena estimación de la desviación estándar poblacional. En tales casos se usa la misma muestra
para estimar μ y σ. Esta situación es el caso que se conoce como σ desconocida. Cuando se usa
s para estimar σ, el margen de error y la estimación por intervalo de la media poblacional se basan
en una distribución de probabilidad conocida como distribución t.
La distribución t es una familia de distribuciones de probabilidad similares; cada distribución t
depende de un parámetro conocido como grados de libertad. La distribución t para un grado de
libertad es única, como lo es la distribución t para dos grados de libertad, para tres grados de
libertad, etc. A medida que el número de grados de libertad aumenta, la diferencia entre la
distribución t y la distribución normal estándar se va reduciendo.
Los grados de libertad se refieren al número de valores independientes usados en el cálculo
grados de libertad = n -1.
Fórmula para estimación por intervalo de la media poblacional con σ desconocida:

s
x ± t a /2
√n
Suponga que se desea estimar la media del adeudo en las tarjetas de crédito en la población de
familias de una ciudad. Usando una muestra de 70 familias, se obtiene una media muestral
x=$ 9312 y una desviación estándar s = $4007. Ya que se desea obtener un intervalo del 95% de
confianza, los cálculos quedan de la siguiente forma:
° libertad = 69

a = 1 - .95 = 0.05
a/2 = 0.025
4007
Intervalo (95%) de confianza = 9312 ± 1.995
√70
Intervalo (95%) de confianza = 9312 ± 955.5
Intervalo (95%) de confianza = 8356.5 a 10267.5

ANEXOS:
Probabilidades acumuladas en la distribución normal estándar
Distribución t

Distribución t

También podría gustarte