Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La muestra se utiliza entonces para sacar conclusiones sobre la población que interesa. Cuando se confía en
una muestra para sacar alguna conclusión o inferencia sobre la población, se entra en el campo de la
Estadística Inferencial.
1.- Muestreo
Es la técnica o procedimiento empleado para seleccionar la muestra de una población estadística. La
experiencia ha determinado que una muestra, para que sea representativa de la población debe estar
comprendida entre 10% y 20%, ambos inclusive.
-Razones que justifican el uso del muestreo
a) Imposibilidad de revisar todos los elementos de la población: Una enumeración completa de la población
llamada Censo, puede ser económicamente imposible o no contar con el tiempo suficiente para hacerlo
b) Costo: Estos disminuyen al obtener los datos de una pequeña parte del total de la población, a los que se
tendrían si se realiza un censo
c) Tiempo: la recolección y resumen se harán con mayor rapidez al considerar una parte del total,
importante si se requiere la información con urgencia
d) Precisión: Las posibilidades de usar personal más compacto y supervisar el trabajo de campo y el
procesamiento de la información, inciden en la obtención de resultados más exactos
Solución: A lo largo de los tres últimos años ha habido más de 1000 clientes, (período seleccionado para el
estudio). Su muestra se elige a partir de una lista de estos clientes, inscritos en los archivos de la empresa, a
cada uno de los cuales se asigna un número de identificación consecutivo. Luego se utiliza una tabla de
números aleatorios para elegir una muestra del tamaño deseado. Usted le explicara al señor Pérez que esta
técnica produce una muestra de la población que tiene la misma probabilidad de ser elegida que cualquier
otra muestra de ese tamaño. Dada la aleatoriedad de esta selección, es de suponer que la muestra es
representativa de la población.
b) Muestreo Sistemático: Una muestra sistemática consiste en la selección de cada término enésimo de una
lista conformada por la numeración ordenada y sistemática de todos los individuos de la población.
Por ejemplo: una población compuesta por 5000 alumnos, se numera o codifica esa población ; después se
elige al azar un número entre el 1 y el 10 ( la muestra la conforman uno de cada 10 alumnos ). Seleccionado
el número se completa la muestra, tomando cada diez después del número elegido. Suponga que se elige el
número 5. La lista la conforman los alumnos numerados con los números 5,15, 25,35, 45, . ..
c) Muestreo Estratificado: En una muestra estratificada, la población se divide en un determinado número
de grupos o estratos, considerando ciertos criterios de clasificación. La finalidad de la estratificación, es
obtener un grupo homogéneo, respecto a la característica de estudio. De cada grupo o estrato se selecciona
una muestra aleatoria simple y estas submuestras se combinan en una gran muestra.
En el muestreo estratificado la muestra debe estar en proporción a la población total, lo que se quiere no es
comparar los números de sujetos, sino tratar grupos homogéneos.
Ejemplo 3: Un médico nutricionista realiza una encuesta a los estudiantes de la U.C (Universidad de
Carabobo), para hacer una estimación semanal de la comida que más gusta en el comedor. El analista
selecciona el 18% del total de una población de 2200 estudiantes.
a.- divida la población estudiantil en estratos (Básico y especialidad)
b.- tome una muestra proporcional a la población total. Por ejemplo si se establece que la muestra debe
contener el 18% de la población, habrá 396 estudiantes en ella.
c.- seleccione la muestra aleatoria simple por cada estrato, usando la tabla de números aleatorios
POBLACION MUESTRA
3.2.- Distribución Muestral. Es la lista de todos los valores posibles de un estadístico y la probabilidad
asociada a cada valor. La distribución muestral de un estadístico depende del:
- tamaño de al población
- tamaño de la muestra
- del método de selección de la muestra
∑𝑥
μ𝑥 = 𝑘
Nota 1: La media de las medias muestrales es igual a la media aritmética de la población. La media general
siempre será igual a la media poblacional. Si se tuviera que tomar cada muestra posible de tamaño n de una
población y se calculase cada media muestral, la media aritmética de esas medias muestrales sería igual a la
media de la población.
μ𝑥 = μ indica que la media de la distribución muestral de medias es igual a la media poblacional
El valor esperado delas medias muestrales es igual a la media poblacional. Es decir: 𝐸(𝑥) = μ
Nota 2: Es preciso tener cuidado de no confundir “ n”, número de observaciones de una muestra . con K
número de muestras posibles
2
(
∑ 𝑥−µ𝑥 )
σ𝑥 = 𝑘
Hallando la raíz cuadrada de la varianza de a distribución de estas medias muestrales, se tiene el error típico
de la distribución muestral. Por lo tanto
2
σ𝑥 = σ𝑥
Error típico. Es la medida de la variación de las medias muestrales en torno a la media general. Por tanto,
mide la tendencia a incurrir en error de muestreo en el intento de estimar el parámetro
Nota 3.- Se puede encontrar una aproximación suficiente de la varianza y del error típico con mucha más
facilidad mediante las expresiones:
2
2 σ σ
σ𝑥 = 𝑛
y σ𝑥 =
𝑛
Nota 4: σ𝑥 < σ debido a que las 𝑋 están menos dispersas que los datos originales. Es decir, el error típico
de la distribución muestral de medias , es más pequeño que la desviación típica de la población original
2
2 σ 𝑁−𝑛
σ𝑥 = ⎡⎢ 𝑛 ⎤⎥⎡ 𝑁−1 ⎤
⎣ ⎦⎣ ⎦
Y el error típico de la distribución muestral se convierte en:
σ 𝑁−𝑛 𝑁−𝑛
σ𝑥 = ⎡⎢ ⎤⎥ 𝑁−1 donde 𝑁−1
es el factor de corrección
⎣ 𝑛⎦
Esta expresión tiene en cuenta que N es finito y por lo tanto representa con más exactitud la variación
de la distribución muestral
Ahora bien, si n es pequeño en relación con N, el factor de corrección se aproxima a 1, entonces sólo se
utiliza si n es grande en relación con N. La regla práctica general consiste en utilizar el FPC sólo si n es
superior al 10% de N
Nota 5.-Si la población es infinita o si el muestreo es con reposición, los resultados anteriores se reducen a ,
σ
μ𝑥 = μ y σ𝑥 =
𝑛
Ejemplos de Ilustración
1.- Una población consta de los números 2, 3, 6, 8 y 11. Considere todas las muestras posibles de tamaño 2
que pueden tomarse con restitución de esa población. Hallar:
a) La media poblacional
b) La desviación típica poblacional
c) La media de la distribución muestral de medias
d) La desviación típica de la distribución muestral de medias
e) Resolver el problema para el caso de muestreo sin restitución
Solución:
∑𝑥
2+3+6+8+11
a) media poblacional (µ) ; N=5 datos μ = 𝑁
= 5
= 6 verifíquelo
2
∑(𝑥− μ) 2 2 2 2 2
2 2
b) varianza poblacional σ( ) σ = 𝑁
=
(2−6) +(3−6) + (6−6) +(8−6) + (11−6)
5
=10.8
2
desviación típica poblacional σ = σ = 3, 29 verifíquelo
Ahora se calculan las medias de las muestras, tal como lo aprendió en Estadística I, así para la muestra
2+2 2+3
(2,2)= 2
= 2 , ( 2, 3)= 2
= 2. 5 y así sucesivamente para todas las muestras
El resultado general de medias muestrales es el siguiente:
2 2. 4 5 6.
5 5
2. 3 4. 5. 7
5 5 5
4 4. 6 7 8.
5 5
5 5. 7 8 9.
5 5
6. 7 8. 9. 11
5 5 5
∑𝑥
Y la media de la distribución muestral de medias es μ𝑥 = 𝑘
2+2,5+4+5+6.5+2.5+3+4.5+5.5+7+4+4.5+6+7+8.5+5+5.5+7+…+11
μ𝑥 = 25
=6
2
(
∑ 𝑥−µ𝑥 )
d) La varianza de la distribución muestral de medias σ𝑥 = 𝑘
2 2 2 2 2 2 2 2
2 (2−6) +(2.5−6) +(4−6) +(5−6) +(6.5−6) +(2.5−6) +(3−6) …+(11−6)
σ𝑥 = 25
2 135
σ𝑥 = 25
= 5. 40 y por tanto σ𝑥 = 5. 40 = 2. 32
Observe que para poblaciones finitas y muestreo con reposición ( o para poblaciones infinitas)
2 2
2 σ σ 10.8
σ𝑥 = 𝑛
porque 𝑛
= 2
= 5. 40
e) En el caso del muestreo sin reposición
Se conservan la media poblacional μ = 6 y la desviación típica σ = 3. 29
El número de muestras se obtiene 5C2=10 ( en la calculadora con la tecla nCr) 10 muestras de tamaño 2
que se pueden elegir sin reposición de la población ( eso significa que sacamos un número y luego otro
distinto del anterior)resultando:
Muestras :(2,3), ( 2,6), (2,8), (2, 11), (3,6), (3,8), (3,11), (6,8),(6,11) y (8,11)
2
(
∑ 𝑥−µ𝑥 ) 2 2 2 2 2
(2.5−6) +(4−6) +(5−6) +2(7−6) +(8.5−6) +(9.5−6)
2
σ𝑥 = 𝑘
= 10
= 4. 05
2
2 σ 2
σ𝑥 = 2. 01 empleando σ𝑥 = ⎡⎢ 𝑛 ⎤⎡ 𝑁−𝑛 ⎤ σ𝑥 = ⎡
10.8 5−2
⎤⎡ 5−1 ⎤ = 4. 05 como se obtuvo anteriormente
⎥⎣ 𝑁−1 ⎦ ⎣ 2 ⎦⎣ ⎦
⎣ ⎦
𝑋−μ
Z= σ𝑥
𝑝(𝑋 ≤748) = 𝑝 𝑧≤
( 748−750
5
100
) (
= 𝑝 𝑧≤
−2
0.5 ) = 𝑝(𝑧≤ − 4) = 0.
Es improbable que el peso sea inferior a 748gr o menos. El inspector debería seleccionar otra muestra con las
precauciones necesarias para garantizar su representatividad y verificar el resultado
2.- En un servicio de atención al cliente, el tiempo de espera hasta recibir atención es una variable normal
de media 10min y desviación típica 2 min. Se toman muestras aleatorias del tiempo de espera de los clientes
que llegan un día concreto, Determine: La probabilidad de que el tiempo medio de espera de una muestra de
25 clientes no supere los 9 minutos.
Solución:
Datos: n=25 clientes μ = 10𝑚𝑖𝑛 σ = 2𝑚𝑖𝑛
𝑋 = tiempo medio de espera
(
𝑝(𝑋 ≤9) = 𝑝 𝑧≤
9−10
2
25
) (
= 𝑝 𝑧≤
−1
0.4 ) = 𝑝(𝑧≤ − 2. 5)=0.0062=0.62%
3.-La duración de las baterías de un determinado modelo de teléfono móvil tiene una distribución normal de
media 34,5 horas y desviación típica de 6.9 horas .Se toma una muestra aleatoria simple de 36 teléfonos
móviles ¿cuál es la probabilidad de que la duración media de las baterías de la muestra este comprendida
entre 32 y 33,5 horas?
Datos:
σ 6.9 6.9
μ = 34. 5 σ = 6. 9 n=36 σ𝑥 = = = 6
= 1. 15
𝑛 36
Por otra parte si el muestreo se hace sin restitución a partir de una población finita y n > 0.10 N , se
necesita el factor de corrección con población finita ,entonces:
π( 1−π) 𝑁−𝑛
σ𝑝 = 𝑛 𝑁−1
Ejemplo de ilustración:
1.- Venus Cosmético, vende un producto ideado para que las personas parezcan más atractivas al sexo
opuesto. Los datos de la empresa indican que el 75% de todos los clientes potenciales con quienes se
establece contacto por correo compran el producto.
Ramiro envía 200 cartas en las que ofrece vender el producto. Tiene que hacer 160 ventas como mínimo
para financiarse el viaje que tiene planeado a los Roques ¿Cuál es la probabilidad de que lo consiga?
Solución:
𝑠 160
n=200 π = 0. 75 s= 160 𝑝= 𝑛
= 200
= 0. 80 𝑛 > 50 nπ = 200(0. 75) = 150 se aproxima a
la distribución normal
(
𝑃(𝑝≥0. 8) = 𝑃 𝑧≥
0.80−0.75
0.75(1−0.75)
200
) 𝑝 = (𝑧≥1. 63) = 0. 0516 = 5. 16% No hay probabilidades de que
2 ) Se ha encontrado que el 2% de las piezas fabricadas en una cierta máquina son defectuosas ¿ Cuál es la
probabilidad de que en un envió de 400 piezas a) el 3% , o más y b) el 2% o menos , sean defectuosas?
Solución
π( 1−π)
Datos: π = 𝑝 = 0. 02 𝑛 = 400 σ𝑝 = σ𝑝 = 𝑛
La proporción es una variable discreta, usando la corrección 1/2n = ½(400)= 0.00125, se tiene:
a)𝑃(𝑝≥0. 03) = 𝑃 𝑧≥
( (0.03−0.00125)−0.02
0.02(1−0.02)
400
) 𝑃(𝑧≥1. 25) = 0. 1056 = 10. 56% es la probabilidad requerida
b) 𝑃(𝑝≤0. 02) = 𝑃 𝑧≤
( (0.02+0.00125)−0.02
0.02(1−0.02)
400
) 𝑃(𝑝≤0. 02) = 𝑃( 𝑧≤0. 18) = 0. 5714 = 57.14%de que el 2%
(
P( p≥0.5) =P 𝑧 ≥
(0.5025−0.46
0.0158 )= 𝑃(𝑧≥2. 69) = 0.0036= 0.36% de que en una muestra de 1000 votantes la
mayoría saliera a su favor.