Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CASTILLO VÀSQUEZ
Conceptos básicos
Para introducir los conceptos básicos consideremos el siguiente ejemplo:
Supongamos que estamos interesados en determinar el número medio de
televisores por hogar en la ciudad de Lima.
Para ello consideraremos primeramente:
Parámetro
Es cualquier característica de una población, como la media de la población, la
desviación de la población, etc.
Ej: Número promedio de televisores por hogar en toda la ciudad de Lima.
Estadístico
Es cualquier característica de una muestra, como la media de la muestra, la
desviación de la muestra, etc.
Ej: Número promedio de televisores calculado sólo a partir de los hogares que
fueron seleccionados en la muestra.
1
LUIS J. CASTILLO VÀSQUEZ
Muestreo
Proceso de selección de muestras, se utiliza cuando no es posible contar o
medir todos los elementos de la población objeto de estudio.
Tipos de Muestreo
Existen dos métodos para seleccionar muestras de poblaciones:
a) Muestreo no aleatorio o de juicio: Se emplea el conocimiento y la opinión
personal para identificar aquellos elementos de la población que deben
incluirse en la muestra.
b) Muestreo aleatorio o de probabilidad: En el cual todos los elementos de la
población tienen la oportunidad de ser escogidos para la muestra. Dentro
de este tipo de muestreo se encuentran:
b.1) Muestreo aleatorio simple: el cual es un método de selección de
muestras que permite que cada muestra posible pueda ser elegida con la
misma probabilidad. Por su parte cada elemento de la población tiene la
misma oportunidad igual de ser incluido en la muestra.
b.2) Muestreo sistemático: método en el cual los elementos que se
muestrearán se seleccionan de la población en un intervalo uniforme que
se mide con respecto al tiempo, al orden o al espacio.
b.3) Muestreo estratificado: método en el que la población se divide en
grupos homogéneos, o estratos, y después se toma una muestra aleatoria
simple de cada estrato.
Aquí la variabilidad dentro de cada grupo es pequeña y entre los grupos es
grande.
b.4) Muestreo de racimo: método en el que la población se divide en
grupos o racimos de elementos, y luego se selecciona una muestra
aleatoria de estos racimos. La variabilidad dentro de cada grupo es grande
y entre los grupos es pequeña; es como si cada racimo fuese un pequeña
representación de la población en si mima.
El seleccionar uno u otro tipo de muestreo depende del problema en
cuestión.
Analicemos nuestro ejemplo.
2
LUIS J. CASTILLO VÀSQUEZ
Error Muestral
Es la diferencia entre el parámetro de la población y el estadístico de la
muestra utilizado para estimar el parámetro.
Distribución muestral
Es una lista de todos los valores posibles de un estadístico y la probabilidad
asociada a cada valor. Se considerarán la distribución muestral de medias y la
de proporciones.
3
LUIS J. CASTILLO VÀSQUEZ
4
LUIS J. CASTILLO VÀSQUEZ
normal : x
n
n
Para población finita o muestreo sin reemplazo con 0.05 :
N
N n
x .
n N 1
N n
muestra. Al factor se le denomina factor de corrección
N 1
4. Teorema del límite central: es un teorema a través del cual se asegura que
la distribución de muestreo de la media se aproxima a la normal, al
incrementarse el tamaño de la muestra. Este teorema permite usar
estadística de muestra para hacer inferencias con respecto a los
parámetros de la población, sin saber nada sobre la forma de la
distribución de frecuencias de esa población más que lo que podamos
obtener de la muestra. Para efectos prácticos el tamaño de la muestra
debe ser n 30.
Nota: si la distribución de la población es bastante simétrica, la
distribución muestral de la media se aproxima a la normal si se
seleccionan muestras pequeñas.
Aplicaciones:
Una aplicación muy corriente y útil de la distribución muestral es
determinar la probabilidad de que la media de una muestra caiga dentro
5
LUIS J. CASTILLO VÀSQUEZ
1. Teorema del límite central: es un teorema a través del cual se asegura que
la distribución muestral de la proporción se aproxima a la distribución
normal, al incrementarse el tamaño de la muestra. Este teorema permite
usar estadística de muestra para hacer inferencias con respecto a los
parámetros de la población, sin saber nada sobre la forma de la
distribución de frecuencias de esa población más que lo que podamos
obtener de la muestra. Para efectos prácticos el tamaño de la muestra
debe ser n 50.
2. Aplicaciones: una aplicación muy corriente y útil de distribución muestral es
determinar la probabilidad de que la proporción de una muestra caiga
dentro de un intervalo determinado. Puesto que la distribución muestral
seguirá una distribución normal (ya sea porque la muestra se toma de una
distribución normal, o porque n 30, según otros autores) y np como n(1-
p) deben ser mayores a 5, (el teorema del límite central garantiza la
normalidad en el proceso de muestreo), se podrá utilizar la variable
tipificada para obtener la información necesaria en la toma de decisiones.
Observación:
En la terminología estadística, la distribución de muestreo que se obtendría
al tomar todas las muestras de un tamaño dado constituye una distribución
teórica de muestreo. En la práctica, el tamaño y el carácter de la mayor
6
LUIS J. CASTILLO VÀSQUEZ
Distribución Muestral
A partir de las muestras seleccionadas de una población pueden construirse
variables aleatorias alternativas, de cuyo análisis se desprenden interesantes
propiedades estadísticas. Las dos formas más comunes de estas variables
corresponden a las distribuciones muestrales de las medias y de las
proporciones.
Para cada una de estas muestras es posible una media muestral, que
denotaremos con el símbolo X . Un ejemplo de la tabla de muestras de
tamaño 2, tomada de la población {1, 3, 5}, con sus medias aritméticas
reflejadas, sería
Muestra 1;1 1;3 1;5 3;1 3;3 3;5 5;1 5;3 5;5
Media 1 2 3 2 3 4 3 4 5
7
LUIS J. CASTILLO VÀSQUEZ
E( X ) x E( X )
Población x x
Finita (N) x / n x ( / n ). ( N n) /( N 1)
8
LUIS J. CASTILLO VÀSQUEZ
Extracción
Con reemplazo Sin reemplazo
p p p p
Infinita p pq / n
Población p pq / n
p p p p
Finita (N) p pq / n p ( pq / n) ). ( N n) /( N 1)
x
z
/ n
9
LUIS J. CASTILLO VÀSQUEZ
10
LUIS J. CASTILLO VÀSQUEZ
EJERCICIOS RESUELTOS
1. EJEMPLO (resuelto)
El CI de los alumnos de un centro especial de se distribuye normalmente con
media 80 y desviación típica 10. Si extraemos una muestra aleatoria simple de
25 alumnos:
a) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga
como mínimo una puntuación en CI de 75?
b) ¿Cuál es la probabilidad de que su media aritmética sea mayor de 75?
c) ¿Cuál es la probabilidad de que su media aritmética sea como máximo 83?
d) ¿Qué valor debería tomar la media aritmética para que la probabilidad de
obtenerlo en esa muestra sea como máximo 0,85?
X N(80,10)
X N(80, 2)
11
LUIS J. CASTILLO VÀSQUEZ
2. EJERCICIO
La variable X se distribuye normalmente con media 50 y desviación típica 12.
Si extraemos una muestra aleatoria simple de 16 alumnos:
1. Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga al
menos una puntuación de 45?
2. ¿Cuál es la probabilidad de que su media aritmética sea menor de 58?
3. ¿Cuál es la probabilidad de que su media aritmética sea como mínimo 45?
4. ¿Qué valores debería tomar la media aritmética para que exista una
probabilidad de 0,38 de encontrar valores entre ellos?
5. ¿Qué tamaño tendría que tener la muestra para que la probabilidad de
encontrar medias superiores a 52 fuese 0,2578?
Solución
12
LUIS J. CASTILLO VÀSQUEZ
1) 0,6628
2) 0,9962 3) 0,9525
4) X; = 48,50 y X; = 51,50
5) n = 15 sujetos
EJEMPLO:
Distribución del número de aciertos en un test de 5 ítems con p = 0,50
Xi 0 1 2 3 4 5
F(xi) 0.031 0.156 0.312 0.312 0.156 0.031
X1
P Proporción de aciertos con probabilidad "
n
13
LUIS J. CASTILLO VÀSQUEZ
En el ejemplo:
Distribución de la proporción de aciertos en un test de 5 ítems con "=
0,50
Xi 0 1 2 3 4 5
Pi 0 0.20 0.40 0.60 0.80 1.00
F(xi) 0.031 0.156 0.312 0.312 0.156 0.031
Por tanto:
1) Probabilidad de que se acierten el 40% de los ítems:
P (P;=0,40)=P(X,=2)=0,312
2) Probabilidad de que se acierten como máximo el 60% de los ítems:
P (P; ≤ 0,60) = P(x, ≤ 3) = 0,811
4. EJEMPLO (resuelto)
Un psicólogo clínico afirma que con su terapia para tratar "el miedo a volar en
avión" se recupera el 80% de los pacientes. Si seleccionamos al azar 16
pacientes que han acudido a su consulta durante los últimos 3 meses por este
tema, ¿cuál es la probabilidad de que al menos el 75% se hayan recuperado y
puedan tomar aviones?
14
LUIS J. CASTILLO VÀSQUEZ
0,20 ≤ ≤ 0,80
Entonces la probabilidad de P se puede aproximar mediante el modelo normal
5. EJERCICIOS
1) Un partido político cree que el 60% del electorado está a favor de su
programa. Como su líder encuentra que esta predicción es demasiado
optimista decide hacer un sondeo con una muestra de 90 personas. ¿Cuál
será la probabilidad de que como máximo 60 personas estén a favor de su
partido?
2) Disponemos de los datos del I.N.E. (Instituto Nacional de Estadística) sobre
el aumento del empleo durante el año 98, el cual se encuentra en un 45%.
Si tomamos una muestra aleatoria de 200 ciudadanos. ¿Cuál es la
probabilidad de que más del 50% tenga empleo?
Soluciones: 1) 0,9192 2) 0,0869 (con corrección por continuidad).
6. Ejemplo
15
LUIS J. CASTILLO VÀSQUEZ
Considerar una población que consiste de 3, 4, 6, 8, 10, 11, 12, 15, 20.
Solución:
1) Calculamos la media y desviación estándar de dicha población.
Descripción Estadística
Variable N Nean Median Pr Nean S-Dex S3Hean
C1 9 3.09 13.00 9.89 5.42 1.81
Variable Min Max Q1 Q3
C3 3.00 20.00 5.00 13.50
16
LUIS J. CASTILLO VÀSQUEZ
7. Ejemplo
Según reportes del centro nacional para estadísticas de salud, alrededor del
20 % de la población masculina adulta de los Estados Unidos es obesa Se
elige al azar una muestra de 150 hombres adultos en los Estados Unidos.
¿Cuál es la probabilidad de que:
a) Haya a lo más 25 personas obesas?
b) Haya más de 22 pero menos de 35 obesos?
c) Haya por lo menos un 25% de obesos en la muestra?
Solución
Sea X el número de personas obesas en la muestra. Usando aproximación
normal a la Binomial se tiene que:
17
LUIS J. CASTILLO VÀSQUEZ
8. Ejemplo
El precio medio de ventas de casa nuevas en una ciudad americana es de
$115 000 con una desviación típica de $25 000. Se toma una muestra
aleatoria de 100 casas nuevas de esta ciudad.
a) ¿Cuál es la probabilidad de que la media muestral de los precios de venta
sea menor de $110 000?
X: Precios de venta de las casas.
Dado que el tamaño de muestra n=100 > 30 podemos utilizar el Teorema
Central del Límite, así que tenemos que:
9. Ejemplo
Se ha tomado una muestra de 16 directores de 100 oficinas de una ciudad con
el fin de estimar el tiempo medio diario que emplean en desplazarse hasta su
trabajo. Si la media de los tiempos es de 87 minutos y la desviación típica de
20 minutos, calcule la probabilidad de que la media muestral sea menor de
100 minutos.
Como la población es finita y la muestra es sin reemplazo, debemos verificar si
es o no necesario el empleo del factor de corrección para calcular el error
muestral.
18
LUIS J. CASTILLO VÀSQUEZ
Es realmente muy poco probable que el incremento medio porcentual esté por
debajo del 10%.
Distribución muestral de proporción
3. Definición: es la distribución de probabilidad de todos los valores posibles
de la proporción muestral ( p )
4. Media de las proporciones muestrales: es la media de todos los valores
posibles de las proporciones que se pueden generar mediante las diversas
muestras aleatorias simples. Se puede demostrar que la media de las
proporciones muestrales p será igual a (proporción de la población). El
valor esperado de las proporciones muestrales es igual a la proporción
poblacional; es decir, E ( p )=p.
5. Error estándar de la proporción: es la desviación estándar de la distribución
de muestreo de la proporción, por lo que mide el grado en que se espera
que varíen las proporciones de las diferentes muestras de la proporción de
la población, debido al error aleatorio en el proceso de muestreo.
La distribución de muestreo tiene un error estándar igual a:
Para población infinita con n>30 o muestreo con reemplazo:
19
LUIS J. CASTILLO VÀSQUEZ
20