Documentos de Académico
Documentos de Profesional
Documentos de Cultura
© Ediciones Roble, S. L.
Indice
Muestreo y estimación estadística 4
I. Introducción 4
II. Objetivos 4
III. Métodos de muestreo 4
3.1. Muestreo aleatorio simple 5
3.2. Muestreo sistemático 5
3.3. Muestreo estratificado 6
3.4. Muestreo por conglomerados 7
3.5. Otros tipos de muestreo: polietápico, por juicio, por conveniencia 8
IV. Estimación estadística 8
4.1. Estimación puntual 9
Ejercicio 1 10
Datos 10
Se pide 10
Solución 11
Ejercicio 2 11
Datos 11
Se pide 11
Solución 12
4.2. Estimación por intervalos de confianza 12
4.2.1. Intervalo de confianza para la media 14
Supuestos de partida: 14
Entonces: 14
Despejando se obtiene: 15
Un intervalo de confianza para la media poblacional μ es: 15
Otros intervalos son: 15
Ejercicio 15
Datos 15
Solución 15
4.2.2. Intervalo de confianza para una proporción 16
Utilizando el caso de la media, por similitud, se toma: 17
Luego por el teorema central del límite para un tamaño muestral n elevado se cumple aproximadamente que: 17
Se hace una aproximación: 17
Entonces: 17
Despejando, se obtiene: 18
Un intervalo de confianza para la proporción poblacional p es: 18
Ejercicio 18
Datos 18
Se pide 18
Solución 18
4.2.3. Intervalo de confianza para la varianza 19
Ejemplo 1 19
Datos 19
Solución 19
Ejemplo 2 20
Se pide 20
Solución 20
4.3. Determinación del tamaño muestral 20
2/30
Ejercicio 21
Datos 21
Se pide 21
Solución 21
V. Resumen 22
VI. Anexo 23
Ejercicios 25
Caso práctico 25
Datos 25
Se pide 25
Solución 25
Recursos 28
Bibliografía 28
Glosario. 29
3/30
Muestreo y estimación estadística
I. Introducción
En esta unidad didáctica se introducen las técnicas fundamentales de muestreo, como son el
muestreo aleatorio simple (M.A.S.), el muestreo sistemático, el muestreo estratificado, el muestreo por
conglomerados y el muestreo polietápico.
Además, se define el nivel de confianza y cómo determinar un tamaño muestral necesario para
disminuir el error de estimación. Se utiliza el software estadístico SPSS para facilitar la construcción de
los intervalos de confianza.
II. Objetivos
El análisis puede suponer la destrucción de cada uno de los elementos (análisis del tiempo de vida media
de un grupo de baterías, análisis forense de un cuerpo, estudio de la tensión de rotura de unos
neumáticos, etc.).
4/30
Muestreo y estimación estadística
Los objetos de análisis pueden existir conceptualmente, pero no en la realidad (cantidad de piezas
defectuosas que producirá una máquina en su vida útil, número de errores que se cometerán en un
informe técnico, etc.).
El análisis tardaría tanto tiempo que no sería práctico o incluso las propiedades de la población
variarían con el tiempo.
El muestreo aleatorio simple (M.A.S.) es el más importante y utilizado de todas las técnicas de
muestreo.
Es empleado siempre que los elementos de la población son homogéneos con respecto a la variable
de estudio y a priori no se dispone de información adicional sobre la población, pero se conoce su
tamaño N.
Cada uno de los elementos de la población tiene la misma probabilidad de ser escogido, se realiza
con reposición, de manera que la población es idéntica en todas las selecciones de los elementos para la
muestra.
Cuando el tamaño de la población N es muy grande con respecto al tamaño de la muestra n, resulta
indiferente realizar el muestreo con o sin reposición.
El primer paso consiste en enumerar todos los elementos de la población del 1 al N y tomar números
aleatorios de tantas cifras como tenga N, el valor del número aleatorio que sale de las tablas de números
aleatorios o de la computadora indicará el número del elemento a seleccionar.
5/30
Muestreo y estimación estadística
Se pueden dividir los elementos de la población en clases o estratos según los valores de alguna otra
variable (por ejemplo, según el sexo, la edad, la profesión, nivel cultural, ciudad de origen, tipo de delito
cometido, etc.).
6/30
Muestreo y estimación estadística
Si hay k estratos de tamaños N1, N2…, Nk, de manera que N = N1+N2+ … +Nk, la composición de
la muestra será: n = n1+n2+ … +nk, donde las cuotas ni se pueden determinar de dos formas distintas:
El muestreo por conglomerados se utiliza en los casos en los que los elementos de la población se
encuentran en conjuntos de agrupación física, ya sea en el espacio o en el tiempo, llamados
conglomerados, de los cuales que se sabe cuántos elementos contiene cada uno.
Por ejemplo, la población se distribuye en regiones, los habitantes de una ciudad se distribuyen
en barrios o distritos, etc.). Idealmente, los elementos dentro de cada conglomerado tienen que
ser tan heterogéneos como los de toda la población con respecto a la variable de estudio.
Pasos del muestreo por conglomerados: se parte de suponer que cada conglomerado es una
muestra representativa de toda población con respecto a la variable de estudio; primero, se seleccionan
al azar algunos de estos conglomerados y, dentro de cada uno de los conglomerados seleccionados, se
analizan todos sus elementos o, en caso de ser muy numeroso, se selecciona una muestra aleatoria
simple de sus elementos.
7/30
Muestreo y estimación estadística
El inconveniente principal de esta técnica es que, si los conglomerados son heterogéneos entre ellos,
como solo se analizan algunos, la muestra final puede que no sea representativa de la población.
Los estratos y los conglomerados se diferencian en que los primero son homogéneos internamente
pero muy diferentes entre unos y otros; mientras que los conglomerados son heterogéneos internamente,
dentro de cada conglomerado debe estar incluida toda la variabilidad de toda la población, pero muy
parecidos en su composición con el resto de los conglomerados.
Agrupar los conglomerados en estratos y seleccionar una muestra estratificada de los conglomerados.
Se repite el mismo proceso en caso de que dentro de cada conglomerado seleccionado haya otra
estructura de conglomerados o de estratos.
3
Tomar uno o varios elementos de la unidad final utilizando el muestreo aleatorio simple.
8/30
Muestreo y estimación estadística
Se utiliza la estimación estadística para hacer inferencias sobre los parámetros desconocidos de una
población, conociendo los parámetros de una muestra de esta, siempre que sea una muestra representativa
y bien seleccionada de la población.
Se desea estimar el gasto medio anual en investigaciones criminales en el país partiendo de una
muestra aleatoria simple del gasto en 50 investigaciones.
El valor promedio del gasto en la muestra es el parámetro de interés de este caso; otros
estadísticos relevantes serán la suma de los gastos de todas las investigaciones de la muestra, la
mediana, la varianza, los cuartiles, etc.
El estimador más razonable para la media del país será el promedio del gasto en la muestra. Si en
una muestra concreta el promedio de gasto anual es de 2750 dólares, entonces la estimación del
gasto familiar medio anual en el país será de 2750 dólares.
Estimadores puntuales
Los estimadores puntuales se pueden seleccionar intuitivamente, por ejemplo: valores equivalentes de
la muestra o, alternativamente, elección basada en propiedades de los estimadores.
Los estimadores puntuales dependen de la muestra elegida, en muestras diferentes los parámetros
obtenidos serán diferentes entre sí y la diferencia del estimador con el verdadero valor de la población
se denomina sesgo, que se define como la diferencia entre la media de un estimador y el valor del
parámetro poblacional. Si el parámetro es la media poblacional μ y el estimador es el promedio de las
medias muestrales μ*, su sesgo está dado por:
Estimadores insesgados
Los estimadores insesgados son aquellos que tienen sesgo igual a cero. En caso de que el parámetro
Para que un estimador puntual sea válido debe cumplir las siguientes propiedades:
9/30
Muestreo y estimación estadística
Eficiencia
Para que proporcione buenas estimaciones se requiere que tenga la varianza pequeña. Si la varianza es
pequeña, las distintas estimaciones que proporciona el estimador para las distintas muestras no difieren
mucho entre sí. Si un estimador es insesgado y tiene varianza mínima, entonces es eficiente.
Consistencia
Un buen estimador será aquel para el cual el riesgo de equivocación disminuye conforme aumenta el
tamaño de la muestra.
Suficiente
Un estadístico es suficiente para estimar un parámetro si recoge toda la información que, sobre dicho
parámetro, contiene la muestra.
Ventajas
Este método tiene la ventaja de que es preciso, proporciona un valor único para el parámetro
desconocido.
Inconvenientes
Pero también tiene el inconveniente de que no proporciona la probabilidad del error que se comete.
Ejercicio 1
Datos
Sean las ventas diarias (en miles de euros) de una empresa representadas por una variable aleatoria de la
que se desconoce su media. El parámetro por estimar es el volumen medio de ventas por día llamado μ.
Se pide
10/30
Muestreo y estimación estadística
Solución
n = 10 días (mientras mayor sea el tamaño de la muestra mejor será la estimación, pero no siempre es
posible tener suficientes datos).
Ejercicio 2
Datos
Se pide
11/30
Muestreo y estimación estadística
Obtener estimaciones puntuales para los parámetros de la población: media, varianza, desviación típica,
proporción de días con más de siete delitos.
2
Si los delitos cometidos en otro período de seis días han sido: 9, 8, 9, 10, 7, 10; calcular una estimación
para la diferencia de medias de los delitos cometidos en ambos períodos.
Solución
Obtener estimaciones puntuales para los parámetros de la población: media, varianza, desviación
típica, proporción de días con más de siete delitos.
Si los delitos cometidos en otro período de seis días han sido: 9, 8, 9, 10, 7, 10; calcular una
estimación para la diferencia de medias de los delitos cometidos en ambos períodos.
12/30
Muestreo y estimación estadística
Los estimadores puntuales permiten expresar mediante un único número la información disponible en la
muestra sobre el parámetro desconocido de la población; por lo general, es un valor cerca del verdadero,
pero no da información sobre la precisión con que se realiza la estimación.
Es conveniente construir un intervalo que contenga el verdadero valor del parámetro con alta
probabilidad, se denomina intervalo de confianza y la probabilidad de contener el valor del parámetro
1–α es el nivel de confianza.
El nivel de confianza 1–α, expresa las garantías que ofrece el intervalo de contener el verdadero valor
del parámetro poblacional q.
Un nivel de confianza del 95 % debe interpretarse como que el proceso de selección muestral tiene
una probabilidad de 0,95 de conducir a un intervalo que contiene el verdadero valor. Si se
pudiera considerar todas las posibles muestras del mismo tamaño y se obtiene para cada una de ellas un
intervalo de confianza en idénticas condiciones, aproximadamente 95 de cada 100 de dichos intervalos
contendrían al verdadero valor de q.
El intervalo será tanto más preciso cuanto menor sea su amplitud. La amplitud depende del nivel de
confianza: a mayor nivel de confianza (mayor seguridad) mayor amplitud y menor precisión.
Sea una población cuya característica en estudio está representada por una variable aleatoria ξ con
distribución de probabilidad f(x,θ), siendo θ un parámetro desconocido de la población; el objetivo es
encontrar los valores de a y b, que son los límites del intervalo, de forma que:
13/30
Muestreo y estimación estadística
Sea x1, x2…, xn una muestra aleatoria simple y la media muestral, considerado como el estimador
puntual. Primero, hay que disponer de información sobre la distribución de una variable que relacione la
media poblacional y la media muestral.
Luego hay que obtener dos valores, a y b, que definan un intervalo con la probabilidad deseada; a
partir de ellos, se define un intervalo para la media poblacional μ.
Se construye un intervalo de confianza con la probabilidad deseada para una distribución normal
estándar y se busca en la tabla de la distribución normal con media 0 y varianza 1, N(0,1), un valor de z
que cumpla:
Sea x1, x2…, xn una muestra aleatoria simple de una población con distribución normal, X∼N(μ,σ),
siendo la desviación típica σ conocida, se debe hallar un intervalo de confianza para la media de la
población.
Supuestos de partida:
Entonces:
14/30
Muestreo y estimación estadística
Despejando se obtiene:
Ejercicio
Datos
Para calcular un intervalo de confianza al 90 % del beneficio medio de una empresa, conocidos los
beneficios obtenidos por la empresa y asumiendo que siguen una distribución normal de media μ euros y
varianza σ2 = 1; se toma una muestra aleatoria simple de tamaño n = 20 beneficios (en miles de dólares) y
se tiene:
5,29; 3,66; 5,71; 6,62; 4,30; 5,85; 6,25; 3,40; 3,55; 5,57;
4,60; 5,69; 5,81; 5,71; 6,29; 5,66; 6,19; 3,79; 4,98; 4,84.
Solución
Nivel de confianza:
15/30
Muestreo y estimación estadística
Para construir intervalos de confianza, es necesario analizar si la variable aleatoria sigue una
distribución normal y conocer la desviación típica de la población; pero en muchos casos prácticos
no se conocen si la distribución es normal ni el valor de la desviación típica de la población, pero si el
tamaño de la muestra es grande (n>30), utilizando el teorema central del límite se pueden construir
intervalos de confianza aproximados.
Además, es necesario contar entre los supuestos iniciales (o de partida) que se dispone de una muestra
aleatoria simple de n observaciones y un tamaño de muestra suficientemente grande, para construir un
intervalo de confianza para la media poblacional μ o para la proporción poblacional p, con un nivel de
confianza dado 1–α.
E l teorema central del límite dice que para un tamaño muestral n elevado, aproximadamente se
cumple:
Para construir un intervalo de confianza que estime la proporción de una población que cumple
una cierta condición, se parte de los datos de una muestra y se construye el intervalo de
manera similar al de la media; por eso, la estimación de proporciones se considera un caso
particular de la media, pero los datos no tienen que ser necesariamente normales, en este caso, el
estimador será la proporción muestral.
En muchos casos en lugar de calcular un intervalo de confianza para la media o para una proporción
puede resultar más interesante conocer la dispersión estimada de los elementos de la población con
respecto a la media, para ello se puede construir un intervalo de confianza para la varianza y la desviación
típica poblacional, similar al método utilizado para la media y la proporción, partiendo de los datos
obtenidos en una muestra aleatoria simple; en particular, de la cuasivarianza o de la cuasidesviación típica.
16/30
Muestreo y estimación estadística
Sea la variable aleatoria Xi que representa si un miembro de la muestra aleatoria simple de tamaño n
cumple o no con la propiedad de interés y se considera que la probabilidad de cumplimiento o éxito es p;
entonces, Xi sigue una distribución de Bernoulli con parámetro p. El objetivo es estimar la proporción p en
Luego por el teorema central del límite para un tamaño muestral n elevado se cumple aproximadamente que:
Por último, se construye un intervalo de confianza que contiene la probabilidad deseada para una
Entonces:
17/30
Muestreo y estimación estadística
Despejando, se obtiene:
Ejercicio
Datos
Se pide
Solución
Nivel de confianza:
18/30
Muestreo y estimación estadística
Se concluye que entre un 11,9 % y un 26,1 % de los jóvenes de la población tienen antecedentes
penales.
En muchos casos en lugar de calcular un intervalo de confianza para la media o para una proporción
puede resultar más interesante conocer la dispersión estimada de los elementos de la población con
respecto a la media, para ello se puede construir un intervalo de confianza para la varianza y la desviación
típica poblacional, similar al método utilizado para la media y la proporción, partiendo de los datos
obtenidos en una muestra aleatoria simple; en particular, de la cuasivarianza o de la cuasidesviación típica.
Ejemplo 1
Datos
Para calcular un intervalo de confianza al 90 % del beneficio medio de una empresa, conocidos los
beneficios obtenidos y asumiendo que siguen una distribución normal de media μ euros y varianza
desconocida; se ha tomado una muestra aleatoria simple de tamaño n = 20 beneficios (en miles de dólares)
y mediante un análisis descriptivo se han obtenido la media y la cuasivarianza muestrales, tales que:
Solución
Nivel de confianza:
Se busca en la tabla t-Student con n-1 = 19 grados de libertad y que corresponde a la probabilidad 0,05.
19/30
Muestreo y estimación estadística
El intervalo de confianza para la media de la población con distribución y varianza desconocidas es:
Ejemplo 2
Se pide
Solución
20/30
Muestreo y estimación estadística
¿Cuál tendría que ser el tamaño de la muestra si se pretende obtener un intervalo de confianza
al (1-α) % con un error de estimación igual conocido ε?
Se define el error de una estimación por intervalos de confianza de nivel 1-α como la mitad de la
longitud o amplitud del intervalo obtenido; es el valor que se suma y se resta al parámetro muestral y
depende del valor de la varianza, del tamaño de la muestra y del nivel de confianza asumido. Para los
intervalos de confianza de la media y la proporción poblacional de una población normal y varianza
conocida es:
En la mayoría de los casos, dicha amplitud es el doble del error de estimación, por tanto, la precisión en
un intervalo de confianza cumple que:
A mayor desviación típica de la población, menos fiable será la estimación; el intervalo de confianza
será mayor.
A mayor tamaño de la muestra, más fiable será la estimación; el intervalo de confianza será menor o más
preciso.
A mayor nivel de confianza, mayor será el tamaño del intervalo y, por tanto, será menos preciso.
Ejercicio
Datos
Conocidos los elementos de una muestra aleatoria simple de una variable aleatoria de una población con
distribución normal y σ = 5.
Se pide
Calcular tamaño muestral mínimo para que el error de estimación no sea superior a 0,5 con un nivel de
confianza del 95 %
Solución
Se plantea que la semiamplitud del intervalo sea menor o igual que 0,5:
21/30
Muestreo y estimación estadística
Nivel de confianza:
V. Resumen
En esta unidad didáctica se ha procedido a explicar las técnicas de muestreo, los conceptos
fundamentales de la estimación puntual y por intervalos de confianza para la media poblacional,
para una proporción, para la varianza y cómo se puede extender para comparar poblaciones.
22/30
Muestreo y estimación estadística
VI. Anexo
23/30
Muestreo y estimación estadística
Formulario Final.pdf
24/30
Muestreo y estimación estadística
Ejercicios
Caso práctico
Datos
El alcalde propone prohibir el tráfico de vehículos en una parte del centro de la ciudad para disminuir el
nivel de contaminación ambiental. Para ello, encarga un sondeo sobre un total de 230 personas, de las que
69 contestan que están de acuerdo.
Se pide
Si el alcalde quisiera un intervalo de confianza al 90 % cuya longitud no excediera de 0,15, ¿cuál será
el tamaño muestral necesario?
Solución
25/30
Muestreo y estimación estadística
Nivel de confianza:
26/30
Muestreo y estimación estadística
En ese caso:
Nivel de confianza:
27/30
Muestreo y estimación estadística
Recursos
Bibliografía
Estadística aplicada :
Estadística :
Estadística :
Triola, M.F. México: Editorial Pearson Educación S.A; 2009. 10ª ed.
Excel y la estadística :
Fundamentos de estadística :
28/30
Muestreo y estimación estadística
Walpole, R.E.; Myers, R.H.; Myers, S.L.; Ye, K. México: Editorial Pearson Educación S.A.;
2012.
Glosario.
29/30
Muestreo y estimación estadística
30/30