Está en la página 1de 30

Muestreo y estimación estadística

© Ediciones Roble, S. L.
Indice
Muestreo y estimación estadística 4
I. Introducción 4
II. Objetivos 4
III. Métodos de muestreo 4
3.1. Muestreo aleatorio simple 5
3.2. Muestreo sistemático 5
3.3. Muestreo estratificado 6
3.4. Muestreo por conglomerados 7
3.5. Otros tipos de muestreo: polietápico, por juicio, por conveniencia 8
IV. Estimación estadística 8
4.1. Estimación puntual 9
Ejercicio 1 10
Datos 10
Se pide 10
Solución 11
Ejercicio 2 11
Datos 11
Se pide 11
Solución 12
4.2. Estimación por intervalos de confianza 12
4.2.1. Intervalo de confianza para la media 14
Supuestos de partida: 14
Entonces: 14
Despejando se obtiene: 15
Un intervalo de confianza para la media poblacional μ es: 15
Otros intervalos son: 15
Ejercicio 15
Datos 15
Solución 15
4.2.2. Intervalo de confianza para una proporción 16
Utilizando el caso de la media, por similitud, se toma: 17
Luego por el teorema central del límite para un tamaño muestral n elevado se cumple aproximadamente que: 17
Se hace una aproximación: 17
Entonces: 17
Despejando, se obtiene: 18
Un intervalo de confianza para la proporción poblacional p es: 18
Ejercicio 18
Datos 18
Se pide 18
Solución 18
4.2.3. ​Intervalo de confianza para la varianza 19
Ejemplo 1 19
Datos 19
Solución 19
Ejemplo 2 20
Se pide 20
Solución 20
4.3. Determinación del tamaño muestral 20

2/30
Ejercicio 21
Datos 21
Se pide 21
Solución 21
V. Resumen 22
VI. Anexo 23
Ejercicios 25
Caso práctico 25
Datos 25
Se pide 25
Solución 25
Recursos 28
Bibliografía 28
Glosario. 29

3/30
Muestreo y estimación estadística

Muestreo y estimación estadística

I. Introducción

En esta unidad didáctica se introducen las técnicas fundamentales de muestreo, como son el
muestreo aleatorio simple (M.A.S.), el muestreo sistemático, el muestreo estratificado, el muestreo por
conglomerados y el muestreo polietápico.

Se introducen los conceptos fundamentales de la estimación puntual y de la estimación por


intervalos de confianza para la media poblacional, para una proporción en la población, para la
varianza poblacional y para comparar poblaciones.

Además, se define el nivel de confianza y cómo determinar un tamaño muestral necesario para
disminuir el error de estimación. Se utiliza el software estadístico SPSS para facilitar la construcción de
los intervalos de confianza.

II. Objetivos

Identificar las técnicas fundamentales de muestreo.


Conocer los conceptos básicos de estimación puntual y de estimación por intervalos
para aplicarlos en el ámbito de la criminología.
Calcular un intervalo de confianza para estadísticos poblacionales desconocidos
utilizando un software específico e interpretar los resultados.

III. Métodos de muestreo


El muestreo estadístico es necesario porque en la práctica no es posible analizar cada uno de los
elementos de la población, por varias razones:

El análisis puede suponer la destrucción de cada uno de los elementos (análisis del tiempo de vida media
de un grupo de baterías, análisis forense de un cuerpo, estudio de la tensión de rotura de unos
neumáticos, etc.).

4/30
Muestreo y estimación estadística

Los objetos de análisis pueden existir conceptualmente, pero no en la realidad (cantidad de piezas
defectuosas que producirá una máquina en su vida útil, número de errores que se cometerán en un
informe técnico, etc.).

Puede ser demasiado costoso económicamente analizar a toda la población.

El análisis tardaría tanto tiempo que no sería práctico o incluso las propiedades de la población
variarían con el tiempo.

3.1. Muestreo aleatorio simple

El muestreo aleatorio simple (M.A.S.) es el más importante y utilizado de todas las técnicas de
muestreo.

Es empleado siempre que los elementos de la población son homogéneos con respecto a la variable
de estudio y a priori no se dispone de información adicional sobre la población, pero se conoce su
tamaño N.

Cada uno de los elementos de la población tiene la misma probabilidad de ser escogido, se realiza
con reposición, de manera que la población es idéntica en todas las selecciones de los elementos para la
muestra.

Cuando el tamaño de la población N es muy grande con respecto al tamaño de la muestra n, resulta
indiferente realizar el muestreo con o sin reposición.

El primer paso consiste en enumerar todos los elementos de la población del 1 al N y tomar números
aleatorios de tantas cifras como tenga N, el valor del número aleatorio que sale de las tablas de números
aleatorios o de la computadora indicará el número del elemento a seleccionar.

Enlaces: Contenidos recomendados


¿Qué es el muestreo aleatorio simple? Enciclopedia económica.

3.2. Muestreo sistemático

5/30
Muestreo y estimación estadística

Se utiliza cuando la población está ordenada en una lista.

Se elige al azar un individuo n1 entre los primeros f (factor de redondeo).

A continuación, se seleccionan los elementos n1+f, n1+2f…, hasta completar la muestra.

Si la lista está ordenada al azar es equivalente al muestreo aleatorio simple.

Si existe algún ciclo en la lista puede aparecer un sesgo de selección.

Enlaces: Contenidos recomendados


Muestreo sistemático. Enciclopedia económica.

3.3. Muestreo estratificado

El muestreo estratificado, como su nombre indica, se utiliza cuando se conoce alguna


característica de la población e interesa que la muestra tenga una composición similar a la población
y que cada estrato aparezca representado en la muestra.

Se pueden dividir los elementos de la población en clases o estratos según los valores de alguna otra
variable (por ejemplo, según el sexo, la edad, la profesión, nivel cultural, ciudad de origen, tipo de delito
cometido, etc.).

Pasos del muestreo estratificado:

1. Se asigna un número o cuota de miembros a cada estrato.


2. Dentro de cada estrato, se seleccionan los elementos por muestreo aleatorio simple.

6/30
Muestreo y estimación estadística

Si hay k estratos de tamaños N1, N2…, Nk, de manera que N = N1+N2+ … +Nk, la composición de
la muestra será: n = n1+n2+ … +nk, donde las cuotas ni se pueden determinar de dos formas distintas:

Proporcionalmente al tamaño de cada estrato:

Proporcionalmente a la variabilidad de cada estrato:

Enlaces: Contenidos recomendados


Muestreo estratificado. Enciclopedia económica.

3.4. Muestreo por conglomerados

El muestreo por conglomerados se utiliza en los casos en los que los elementos de la población se
encuentran en conjuntos de agrupación física, ya sea en el espacio o en el tiempo, llamados
conglomerados, de los cuales que se sabe cuántos elementos contiene cada uno.

Por ejemplo, la población se distribuye en regiones, los habitantes de una ciudad se distribuyen
en barrios o distritos, etc.). Idealmente, los elementos dentro de cada conglomerado tienen que
ser tan heterogéneos como los de toda la población con respecto a la variable de estudio.

Pasos del muestreo por conglomerados: se parte de suponer que cada conglomerado es una
muestra representativa de toda población con respecto a la variable de estudio; primero, se seleccionan
al azar algunos de estos conglomerados y, dentro de cada uno de los conglomerados seleccionados, se
analizan todos sus elementos o, en caso de ser muy numeroso, se selecciona una muestra aleatoria
simple de sus elementos.

7/30
Muestreo y estimación estadística

El inconveniente principal de esta técnica es que, si los conglomerados son heterogéneos entre ellos,
como solo se analizan algunos, la muestra final puede que no sea representativa de la población.

Los estratos y los conglomerados se diferencian en que los primero son homogéneos internamente
pero muy diferentes entre unos y otros; mientras que los conglomerados son heterogéneos internamente,
dentro de cada conglomerado debe estar incluida toda la variabilidad de toda la población, pero muy
parecidos en su composición con el resto de los conglomerados.

Las técnicas de estratificación y conglomerado son opuestas, la estratificación funciona mejor


cuanto mayor sean las diferencias entre estratos y los conglomerados funcionan mejor cuanto
menores sean las diferencias entre ellos.

3.5. Otros tipos de muestreo: polietápico, por juicio, por


conveniencia
Cuando se trata de estudiar poblaciones complejas o muy grandes se recomienda combinar distintos
métodos de muestreos, como el muestreo por estratos y el muestreo por conglomerados en un
procedimiento de muestreo polietápico, siguiendo los siguientes pasos:

Agrupar los conglomerados en estratos y seleccionar una muestra estratificada de los conglomerados.

Se repite el mismo proceso en caso de que dentro de cada conglomerado seleccionado haya otra
estructura de conglomerados o de estratos.

3
Tomar uno o varios elementos de la unidad final utilizando el muestreo aleatorio simple.

Enlaces: Contenidos recomendados


Muestreo probabilístico. Enciclopedia económica.
Muestreo no probabilístico. Enciclopedia económica.

IV. Estimación estadística

8/30
Muestreo y estimación estadística

Se utiliza la estimación estadística para hacer inferencias sobre los parámetros desconocidos de una
población, conociendo los parámetros de una muestra de esta, siempre que sea una muestra representativa
y bien seleccionada de la población.

Se desea estimar el gasto medio anual en investigaciones criminales en el país partiendo de una
muestra aleatoria simple del gasto en 50 investigaciones.

El valor promedio del gasto en la muestra es el parámetro de interés de este caso; otros
estadísticos relevantes serán la suma de los gastos de todas las investigaciones de la muestra, la
mediana, la varianza, los cuartiles, etc.

El estimador más razonable para la media del país será el promedio del gasto en la muestra. Si en
una muestra concreta el promedio de gasto anual es de 2750 dólares, entonces la estimación del
gasto familiar medio anual en el país será de 2750 dólares.

4.1. Estimación puntual


Los parámetros poblacionales de interés son la media y la varianza de una población, o la proporción
de la población que posee un determinado atributo.

Estimadores puntuales

Los estimadores puntuales se pueden seleccionar intuitivamente, por ejemplo: valores equivalentes de
la muestra o, alternativamente, elección basada en propiedades de los estimadores.

Los estimadores puntuales dependen de la muestra elegida, en muestras diferentes los parámetros
obtenidos serán diferentes entre sí y la diferencia del estimador con el verdadero valor de la población
se denomina sesgo, que se define como la diferencia entre la media de un estimador y el valor del
parámetro poblacional. Si el parámetro es la media poblacional μ y el estimador es el promedio de las
medias muestrales μ*, su sesgo está dado por:

Estimadores insesgados

Los estimadores insesgados son aquellos que tienen sesgo igual a cero. En caso de que el parámetro

sea la media de la población, entonces la media muestral tiene sesgo cero.

Para que un estimador puntual sea válido debe cumplir las siguientes propiedades:

9/30
Muestreo y estimación estadística

Eficiencia

Para que proporcione buenas estimaciones se requiere que tenga la varianza pequeña. Si la varianza es
pequeña, las distintas estimaciones que proporciona el estimador para las distintas muestras no difieren
mucho entre sí. Si un estimador es insesgado y tiene varianza mínima, entonces es eficiente.

Consistencia

Un buen estimador será aquel para el cual el riesgo de equivocación disminuye conforme aumenta el
tamaño de la muestra.

Suficiente

Un estadístico es suficiente para estimar un parámetro si recoge toda la información que, sobre dicho
parámetro, contiene la muestra.

La estimación puntual consta de las siguientes etapas:

1. Decidir el tamaño de la muestra.


2. Definir el estimador a utilizar.
3. Seleccionar la muestra.
4. Calcular el valor del estimador para la muestra concreta.

Ventajas

Este método tiene la ventaja de que es preciso, proporciona un valor único para el parámetro
desconocido.

Inconvenientes

Pero también tiene el inconveniente de que no proporciona la probabilidad del error que se comete.

Ejercicio 1

Datos

Sean las ventas diarias (en miles de euros) de una empresa representadas por una variable aleatoria de la
que se desconoce su media. El parámetro por estimar es el volumen medio de ventas por día llamado μ.

Se pide

Decidir el tamaño de la muestra.

Definir el estimador a utilizar.

10/30
Muestreo y estimación estadística

Seleccionar la muestra (ventas durante 10 días en miles de euros).

Calcular el valor del estimador para la muestra concreta.

Solución

Decidir el tamaño de la muestra:

n = 10 días (mientras mayor sea el tamaño de la muestra mejor será la estimación, pero no siempre es
posible tener suficientes datos).

Definir el estimador a utilizar “Principio de Analogía” μ* = (la media poblacional estimada es


igual a la media muestral calculada).

Seleccionar la muestra (ventas durante 10 días en miles de euros).

Calcular el valor del estimador para la muestra concreta.

Ejercicio 2

Datos

Se conocen los delitos cometidos en ocho días consecutivos: 8, 6, 11, 9, 8, 10, 5, 7.

Se pide

11/30
Muestreo y estimación estadística

Obtener estimaciones puntuales para los parámetros de la población: media, varianza, desviación típica,
proporción de días con más de siete delitos.

2
Si los delitos cometidos en otro período de seis días han sido: 9, 8, 9, 10, 7, 10; calcular una estimación
para la diferencia de medias de los delitos cometidos en ambos períodos.

Solución

Obtener estimaciones puntuales para los parámetros de la población: media, varianza, desviación
típica, proporción de días con más de siete delitos.

Si los delitos cometidos en otro período de seis días han sido: 9, 8, 9, 10, 7, 10; calcular una
estimación para la diferencia de medias de los delitos cometidos en ambos períodos.

Enlaces: Contenidos recomendados


Estimación estadística. Wikipedia.

4.2. Estimación por intervalos de confianza

12/30
Muestreo y estimación estadística

Los estimadores puntuales permiten expresar mediante un único número la información disponible en la
muestra sobre el parámetro desconocido de la población; por lo general, es un valor cerca del verdadero,
pero no da información sobre la precisión con que se realiza la estimación.

Es conveniente construir un intervalo que contenga el verdadero valor del parámetro con alta
probabilidad, se denomina intervalo de confianza y la probabilidad de contener el valor del parámetro
1–α es el nivel de confianza.

El nivel de confianza 1–α, expresa las garantías que ofrece el intervalo de contener el verdadero valor
del parámetro poblacional q.

Tales garantías deben atribuirse al procedimiento utilizado para construir el intervalo y no al


resultado particular obtenido.

Un nivel de confianza del 95 % debe interpretarse como que el proceso de selección muestral tiene
una probabilidad de 0,95 de conducir a un intervalo que contiene el verdadero valor. Si se
pudiera considerar todas las posibles muestras del mismo tamaño y se obtiene para cada una de ellas un
intervalo de confianza en idénticas condiciones, aproximadamente 95 de cada 100 de dichos intervalos
contendrían al verdadero valor de q.

El intervalo será tanto más preciso cuanto menor sea su amplitud. La amplitud depende del nivel de
confianza: a mayor nivel de confianza (mayor seguridad) mayor amplitud y menor precisión.

Sea una población cuya característica en estudio está representada por una variable aleatoria ξ con
distribución de probabilidad f(x,θ), siendo θ un parámetro desconocido de la población; el objetivo es
encontrar los valores de a y b, que son los límites del intervalo, de forma que:

Pasos que seguir para construir un intervalo de confianza:

1. Definir la variable aleatoria con su correspondiente distribución y la distribución sobre la


que se debe construir el intervalo de confianza.
2. Calcular los percentiles de esa distribución que aseguren el nivel de confianza fijado
desde el inicio.
3. Construir el intervalo de confianza para la variable aleatoria con distribución conocida.
4. Sustituir los valores obtenidos de la muestra.
5. Despejar el valor del parámetro en este intervalo para obtener los valores específicos de
los extremos del intervalo.

13/30
Muestreo y estimación estadística

Enlaces: Contenidos recomendados


Estimación estadística. Wikipedia.

4.2.1. Intervalo de confianza para la media

Sea x1, x2…, xn una muestra aleatoria simple y la media muestral, considerado como el estimador
puntual. Primero, hay que disponer de información sobre la distribución de una variable que relacione la
media poblacional y la media muestral.

Luego hay que obtener dos valores, a y b, que definan un intervalo con la probabilidad deseada; a
partir de ellos, se define un intervalo para la media poblacional μ.

Para el caso considerado, la distribución de la media muestral cumple que:

La distribución normal es conocida y relaciona ambas medias.

Se construye un intervalo de confianza con la probabilidad deseada para una distribución normal
estándar y se busca en la tabla de la distribución normal con media 0 y varianza 1, N(0,1), un valor de z
que cumpla:

Sea x1, x2…, xn una muestra aleatoria simple de una población con distribución normal, X∼N(μ,σ),
siendo la desviación típica σ conocida, se debe hallar un intervalo de confianza para la media de la
población.

Supuestos de partida:

Entonces:

14/30
Muestreo y estimación estadística

Despejando se obtiene:

Un intervalo de confianza para la media poblacional μ es:

Otros intervalos son:

Ejercicio

Datos

Para calcular un intervalo de confianza al 90 % del beneficio medio de una empresa, conocidos los
beneficios obtenidos por la empresa y asumiendo que siguen una distribución normal de media μ euros y
varianza σ2 = 1; se toma una muestra aleatoria simple de tamaño n = 20 beneficios (en miles de dólares) y
se tiene:

5,29; 3,66; 5,71; 6,62; 4,30; 5,85; 6,25; 3,40; 3,55; 5,57;
4,60; 5,69; 5,81; 5,71; 6,29; 5,66; 6,19; 3,79; 4,98; 4,84.

Solución

Nivel de confianza:

Se busca en la tabla N(0,1) el valor de z que corresponde a la probabilidad 0,05.

15/30
Muestreo y estimación estadística

El intervalo de confianza para la media de la población, conociendo la varianza (o la desviación típica) y


sabiendo que la distribución es normal:

Para construir intervalos de confianza, es necesario analizar si la variable aleatoria sigue una
distribución normal y conocer la desviación típica de la población; pero en muchos casos prácticos
no se conocen si la distribución es normal ni el valor de la desviación típica de la población, pero si el
tamaño de la muestra es grande (n>30), utilizando el teorema central del límite se pueden construir
intervalos de confianza aproximados.

Además, es necesario contar entre los supuestos iniciales (o de partida) que se dispone de una muestra
aleatoria simple de n observaciones y un tamaño de muestra suficientemente grande, para construir un
intervalo de confianza para la media poblacional μ o para la proporción poblacional p, con un nivel de
confianza dado 1–α.

E l teorema central del límite dice que para un tamaño muestral n elevado, aproximadamente se
cumple:

siendo S la cuasidesviación típica muestral.

Se construye un intervalo de confianza para la media poblacional μ con:

4.2.2. Intervalo de confianza para una proporción

Para construir un intervalo de confianza que estime la proporción de una población que cumple
una cierta condición, se parte de los datos de una muestra y se construye el intervalo de
manera similar al de la media; por eso, la estimación de proporciones se considera un caso
particular de la media, pero los datos no tienen que ser necesariamente normales, en este caso, el
estimador será la proporción muestral.

En muchos casos en lugar de calcular un intervalo de confianza para la media o para una proporción
puede resultar más interesante conocer la dispersión estimada de los elementos de la población con
respecto a la media, para ello se puede construir un intervalo de confianza para la varianza y la desviación
típica poblacional, similar al método utilizado para la media y la proporción, partiendo de los datos
obtenidos en una muestra aleatoria simple; en particular, de la cuasivarianza o de la cuasidesviación típica.

16/30
Muestreo y estimación estadística

Sea la variable aleatoria Xi que representa si un miembro de la muestra aleatoria simple de tamaño n
cumple o no con la propiedad de interés y se considera que la probabilidad de cumplimiento o éxito es p;
entonces, Xi sigue una distribución de Bernoulli con parámetro p. El objetivo es estimar la proporción p en

la población que cumple la condición, conociendo la proporción muestral

Sea la proporción muestral, una media muestral:

Se parte de la hipótesis de que se tiene una muestra aleatoria simple de n observaciones


dicotómicas, solo toman valores cero o uno, y con n suficientemente grande (n>30). El objetivo
es construir un intervalo de confianza aproximado, con un nivel de confianza determinado, para la
proporción poblacional p desconocida.

Utilizando el caso de la media, por similitud, se toma:

Luego por el teorema central del límite para un tamaño muestral n elevado se cumple aproximadamente que:

Se hace una aproximación:

Por último, se construye un intervalo de confianza que contiene la probabilidad deseada para una

distribución normal estándar N(0,1), buscando un valor de que cumpla:

Entonces:

17/30
Muestreo y estimación estadística

Despejando, se obtiene:

Un intervalo de confianza para la proporción poblacional p es:

Ejercicio

Datos

En una muestra de 200 jóvenes se ha observado que 38 tienen antecedentes penales.

Se pide

Se pretende calcular un intervalo de confianza al 99 % para la proporción de jóvenes en la población que


pueden tener antecedentes penales.

Solución

Se conoce la proporción muestral:

Nivel de confianza:

Se busca en la tabla N(0,1) el valor de z que corresponde a la probabilidad 0,005.

El intervalo de confianza para la proporción de la población:

18/30
Muestreo y estimación estadística

Se concluye que entre un 11,9 % y un 26,1 % de los jóvenes de la población tienen antecedentes
penales.

4.2.3. ​Intervalo de confianza para la varianza

En muchos casos en lugar de calcular un intervalo de confianza para la media o para una proporción
puede resultar más interesante conocer la dispersión estimada de los elementos de la población con
respecto a la media, para ello se puede construir un intervalo de confianza para la varianza y la desviación
típica poblacional, similar al método utilizado para la media y la proporción, partiendo de los datos
obtenidos en una muestra aleatoria simple; en particular, de la cuasivarianza o de la cuasidesviación típica.

Ejemplo 1

Datos

Para calcular un intervalo de confianza al 90 % del beneficio medio de una empresa, conocidos los
beneficios obtenidos y asumiendo que siguen una distribución normal de media μ euros y varianza
desconocida; se ha tomado una muestra aleatoria simple de tamaño n = 20 beneficios (en miles de dólares)
y mediante un análisis descriptivo se han obtenido la media y la cuasivarianza muestrales, tales que:

Solución

Como n = 20 es pequeño, se usa la distribución t-Student.

Nivel de confianza:

Se busca en la tabla t-Student con n-1 = 19 grados de libertad y que corresponde a la probabilidad 0,05.

19/30
Muestreo y estimación estadística

El intervalo de confianza para la media de la población con distribución y varianza desconocidas es:

Ejemplo 2

Se pide

Calcular un intervalo de confianza al 90 % para la varianza del rendimiento.

Solución

Sustituyendo los valores en el intervalo:

Enlaces: Contenidos recomendados


Distribución t de Student. Wikipedia.

4.3. Determinación del tamaño muestral


Con un tamaño de muestra y un nivel de confianza previamente fijados, se han obtenido intervalos de
confianza con un determinado nivel de precisión o error; de forma que si se pretende aumentar el nivel de
confianza con que se construye un intervalo, se aumenta la amplitud de este y se pierde precisión.

20/30
Muestreo y estimación estadística

¿Cuál tendría que ser el tamaño de la muestra si se pretende obtener un intervalo de confianza
al (1-α) % con un error de estimación igual conocido ε?

Se define el error de una estimación por intervalos de confianza de nivel 1-α como la mitad de la
longitud o amplitud del intervalo obtenido; es el valor que se suma y se resta al parámetro muestral y
depende del valor de la varianza, del tamaño de la muestra y del nivel de confianza asumido. Para los
intervalos de confianza de la media y la proporción poblacional de una población normal y varianza
conocida es:

La amplitud o longitud de un intervalo de confianza ofrece una medida de la precisión en la estimación.

En la mayoría de los casos, dicha amplitud es el doble del error de estimación, por tanto, la precisión en
un intervalo de confianza cumple que:

A mayor desviación típica de la población, menos fiable será la estimación; el intervalo de confianza
será mayor.

A mayor tamaño de la muestra, más fiable será la estimación; el intervalo de confianza será menor o más
preciso.

A mayor nivel de confianza, mayor será el tamaño del intervalo y, por tanto, será menos preciso.

Ejercicio

Datos

Conocidos los elementos de una muestra aleatoria simple de una variable aleatoria de una población con
distribución normal y σ = 5.

Se pide

Calcular tamaño muestral mínimo para que el error de estimación no sea superior a 0,5 con un nivel de
confianza del 95 %

Solución

Se conoce que X∼N(μ,σ) con σ = 5.

Se plantea que la semiamplitud del intervalo sea menor o igual que 0,5:

21/30
Muestreo y estimación estadística

Nivel de confianza:

Se busca en la tabla N(0,1) el valor de z que corresponde a la probabilidad 0,025.

Al sustituir los valores y despejar se obtiene:

V. Resumen

En esta unidad didáctica se ha procedido a explicar las técnicas de muestreo, los conceptos
fundamentales de la estimación puntual y por intervalos de confianza para la media poblacional,
para una proporción, para la varianza y cómo se puede extender para comparar poblaciones.

Finalmente, se ha hecho hincapié en el estudio de los conceptos de nivel de confianza y de cómo


determinar el tamaño muestral necesario para disminuir el error de estimación.

22/30
Muestreo y estimación estadística

Fórmulas de intervalos de confianza

Enlaces: Contenidos recomendados


Distribución chi cuadrado. Wikipedia.

VI. Anexo

23/30
Muestreo y estimación estadística

Formulario Final.pdf

24/30
Muestreo y estimación estadística

Ejercicios

Caso práctico

Datos
El alcalde propone prohibir el tráfico de vehículos en una parte del centro de la ciudad para disminuir el
nivel de contaminación ambiental. Para ello, encarga un sondeo sobre un total de 230 personas, de las que
69 contestan que están de acuerdo.

Se pide

Hallar un intervalo de confianza al 90 % para la verdadera proporción poblacional, indicando las


hipótesis asumidas.

Hipótesis asumidas: M.A.S. de una Bernoulli(p), y n = 230 grande.

Si el intervalo resultó ser (0,243; 0,357), ¿cuál es el nivel de confianza elegido?

La longitud del intervalo = 0,357 – 0,243 = 0,114.

Si el alcalde quisiera un intervalo de confianza al 90 % cuya longitud no excediera de 0,15, ¿cuál será
el tamaño muestral necesario?

Solución

Se conoce la proporción muestral:

25/30
Muestreo y estimación estadística

Nivel de confianza:

Se busca en la tabla N(0,1) el valor de z que corresponde a la probabilidad 0,005:

El intervalo de confianza para la proporción de la población:

Se concluye que existe entre un 25,03 % y un 34,97 % de intención de votos positivos.

Se trata de un intervalo al 94,12 %.

La amplitud del intervalo o longitud:

26/30
Muestreo y estimación estadística

El intervalo de confianza alcanzará su longitud máxima cuando:

En ese caso:

Nivel de confianza:

Se busca en la tabla N(0,1) el valor de z que corresponde a la probabilidad 0,05:

Se sustituyen los valores y se despeja, obteniendo:

Por tanto, se toma un tamaño muestral de n = 121 personas.

27/30
Muestreo y estimación estadística

Recursos

Bibliografía
Estadística aplicada :

Horra, J. Capítulos 7, 8 y 9. En: Madrid: Ediciones Díaz de Santos, S. A.; 2003.

Estadística básica en administración: conceptos y aplicaciones :

Berenson, M. L.; Levine, D. M. Editorial Prentice Hall; 1996.

Estadística inferencial 1 para ingeniería y ciencias :

Gutiérrez, E.; Vladimirovna, O. México: Grupo Editorial Patria; 2016.

Estadística aplicada a través de Excel :

Pérez, C. Madrid: Editorial Prentice Hall-Pearson Educación S.A.; 2007.

Estadística descriptiva e inferencial con Excel: estadística descriptiva e inferencial


práctica :

Alcocer, G. F. Editorial Académica Española; 2016.

Estadística para administración y economía :

Levin, R.; Rubin, D. Prentice Hall; 2011, 7ª ed.

Estadística para los negocios y la economía :

Newbold, P. Editorial Prentice Hall; 2009.

Estadística :

Spiegel, M.R.; Stephens, L.J. México: McGraw-Hill; 2009.

Estadística :

Triola, M.F. México: Editorial Pearson Educación S.A; 2009. 10ª ed.

Excel y la estadística :

Pérez, C. Madrid: Independiente; 2017.

Fundamentos de estadística :

Peña, D. Madrid: Alianza Editorial; 2008.

28/30
Muestreo y estimación estadística

Introducción a la probabilidad y estadística :

Lipschutz, S.; Schiller, J. J. Editorial McGraw-Hill; 1999.

Introducción a la estadística para las ciencias sociales :

Peña, D.; Romo, J. Madrid: McGraw-Hill; 1999.

Probabilidad y estadística para ingeniería y ciencias :

Walpole, R.E.; Myers, R.H.; Myers, S.L.; Ye, K. México: Editorial Pearson Educación S.A.;
2012.

Problemas resueltos de estadística :

Zubelzu, S.; Ercoreca, A.Madrid: Ediciones Pirámide; 2015.

Glosario.

CONSISTENCIA: Propiedad de un estimador puntual más cercano al parámetro


poblacional.

EFICIENCIA RELATIVA : Compara dos estimadores puntuales insesgados del mismo


parámetro poblacional, el que tiene menor varianza es más eficiente.

ERROR MUESTRAL: Diferencia entre el valor real del parámetro poblacional y su


estimación puntual.

ESTIMACIÓN POR INTERVALOS DE CONFIANZA : Se define un intervalo dentro del


cual se supone que está el parámetro poblacional con una probabilidad determinada.

ESTIMACIÓN PUNTUAL: Se escoge un valor numérico único de la muestra para estimar


un parámetro de la población.

INSESGO: Propiedad de un estimador puntual cuando su valor esperado es igual al


parámetro poblacional que estima.

MUESTREO ALEATORIO SIMPLE : Muestra seleccionada de manera que cada una de


las posibles de tamaño n tiene la misma probabilidad de ser seleccionada.

MUESTREO ESTRATIFICADO: Se divide la población en estratos y se toma una muestra


aleatoria simple de cada estrato.

29/30
Muestreo y estimación estadística

MUESTREO POR CONGLOMERADOS: Se divide la población en conglomerados y se


selecciona uno o más de ellos.

MUESTREO SISTEMÁTICO: Se selecciona al azar uno de los primeros k elementos y a


continuación cada k-ésimo elemento.

NIVEL DE CONFIANZA: Es la probabilidad de que el parámetro poblacional se encuentre


en el intervalo calculado.

PARÁMETRO: Característica numérica de una población, como la media, la varianza, una


proporción, etc.

30/30

También podría gustarte