Está en la página 1de 88

ASIGNATURA

ESTADÍSTICA APLICADA BLOQUE II. TEMA 1


Principios generales de la inferencia estadística

GRADO EN CRIMINOLOGÍA

BLOQUE II. TEMA 1


Principios generales de la
inferencia estadística

Autor: Josué Gutiérrez Barroso

1
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

Unidad didáctica.

Bloque II. Tema 1. Principios generales


de la inferencia estadística

INDICE

I. PRESENTACION ................................................................................................... 3
II. OBJETIVOS. ....................................................................................................... 4
III. ESQUEMA ......................................................................................................... 5
IV. CONTENIDO ...................................................................................................... 6
1. Introducción ............................................................................................. 6
2. Definición de estadística .............................................................................. 6
3. Clasificación de los fenómenos. ..................................................................... 6
4. Áreas de la estadística................................................................................. 7
5. El teorema central del límite (TCL)................................................................. 9
6. Definición de la Desviación Típica de la media o error muestral ........................... 10
V. RESUMEN ........................................................................................................ 11
VI. GLOSARIO ...................................................................................................... 12
VII. BIBLIOGRAFIA................................................................................................. 13
VIII. ACTIVIDADES ................................................................................................. 14
IX. ANEXOS ......................................................................................................... 17

2
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

I. PRESENTACION

En esta unidad didáctica nos ocuparemos de introducir al alumnado a la inferencia estadística. Así,
además de diferenciar entre la estadística inferencial y la descriptiva, nos adentraremos en
justificar la importancia de la primera sobre la segunda, ya que permite extrapolar resultados de
muestras a poblaciones. Para ello, también explicaremos la Teoría Central del Límite, clave para
que la estadística inferencial sea una herramienta clave para cualquier investigador/a.

Por tanto, este tema es introductorio de las técnicas que se verán en el resto del temario de la
asignatura.

3
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

II. OBJETIVOS.

Los objetivos de esta unidad didáctica son los siguientes:

‐ Introducir al alumnado en la estadística inferencial.


‐ Conocer las propiedades de la estadística inferencial.
‐ Esbozar el esquema de cómo se va a organizar la asignatura.

4
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

III. ESQUEMA

Estadística
Descriptiva
ESTADÍSTICA
Estadística Teorema Central
Inferencial del Límite

5
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

IV. CONTENIDO

1. Introducción

Durante la asignatura de Análisis de Datos I, analizamos todo lo relacionado con la estadística


descriptiva. Sin embargo, en la asignatura en la que nos adentramos estudiaremos algunas
cuestiones sobre estadística inferencial. Esta estadística se vale de la teoría de probabilidades
(estudiada en la asignatura Análisis de Datos I) como herramienta matemática para manipular la
incertidumbre. La forma en que la Estadística Inferencial trata de sacar conclusiones de una
población es estudiando un subconjunto de dicha población denominado muestra, esto se debe a
que normalmente no es posible o es muy costoso estudiar toda la población.

2. Definición de estadística

El término estadística procede del latín «status» ya que sus inicios se relacionan con la recogida y
cuantificación de la información referente al Estado, en situaciones tan diversas como las relativas
a cosechas, ganados, censos, etc.

Según la Real Academia Española, la Estadística es la rama de las matemáticas que utiliza grandes
conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.

3. Clasificación de los fenómenos.

Es fácil observar que un gran número de los fenómenos que ocurren a nuestro alrededor presentan
resultados diferentes a pesar de producirse en las mismas situaciones.

En este sentido, podemos decir que los fenómenos que se presentan en la naturaleza pueden ser de
dos tipos:

 Determinísticos o causales, cuando presentan los mismos resultados si se realizan en


condiciones idénticas. En este caso es posible conocer el resultado final si conocemos el
estado de partida y las condiciones.

Ejemplo

Si tengo un objeto sujeto y lo suelto, caerá siempre.

6
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

 Estocásticos, aleatorios o estadísticos, cuando no se puede predecir el resultado, aunque


se conozcan las condiciones. Estos fenómenos se encuentran afectados por la
incertidumbre.

Ejemplo

Resultado obtenido al lazar un dado, resultado de una encuesta realizada a unos clientes.

Los únicos fenómenos que tiene sentido analizar en Estadística son los del segundo grupo,
denominados aleatorios, estocásticos o estadísticos.

4. Áreas de la estadística.

La Estadística se divide en dos grandes áreas:

 Estadística Descriptiva: Parte de la estadística que se centra en el análisis y la


representación de los datos. Es el conjunto de métodos necesarios para la recogida,
clasificación, representación y resumen de los datos proporcionados por una experiencia. No
tiene valor inferencial alguno.

 Estadística Inferencial o Inferencia Estadística: Conjunto de técnicas que permiten realizar


generalizaciones o tomar decisiones, basándose en la información obtenida mediante
técnicas descriptivas y utilizando el cálculo de probabilidades. Así, permiten, a partir de los
resultados de una muestra, obtener conclusiones válidas para una población. Tiene como fin
llegar a conclusiones generales válidas.

Es decir, el paso de la estadística descriptiva a la estadística inferencial o inferencia estadística


necesita el uso del cálculo de probabilidades, el cual permite extraer conclusiones para la población
a partir de los resultados obtenidos con la estadística descriptiva para determinados elementos
seleccionados (muestra), siempre que éstos sean representativos de la población.

Cuando queremos estudiar un fenómeno aleatorio para una población, lo más habitual es que no
conozcamos su modelo teórico, pero sí que podamos observar dicho fenómeno, tomar una muestra y
utilizar la información proporcionada por la muestra. Esta es la principal función de la estadística
inferencial: extraer conclusiones de muestras para poblaciones.

7
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

La Estadística Inferencial o Inferencia Estadística se encuentra formada por dos grandes áreas:

• Estimación:

‐ Puntual: Asigna al parámetro poblacional (θ), un único valor aproximado, que depende
de la muestra.

‐ Por Intervalos de Confianza: Asigna un intervalo en el que se encontrará el parámetro


poblacional θ con un determinado nivel de confianza.

• Contraste de Hipótesis: Procedimiento inferencial que consiste en rechazar o no una


hipótesis estadística sobre una población, teniendo en cuenta la evidencia experimental
proporcionada por una muestra concreta obtenida de dicha población. Aquí podemos incluir
los contrastes paramétricos, no paramétricos y el procedimiento ANOVA.

Hemos dicho ya que el objetivo de nuestro estudio es poder extender a la población lo que
obtengamos de una muestra. Imaginemos que de la población formada por todos los alumnos del
instituto, extraemos aleatoriamente una muestra de 40 alumnos, y les preguntas por su edad,
encontrando que la edad media obtenida es de 15,8 años.

Pero, ¿qué ocurriría, si extrajéramos otra muestra? ¿Coincidirían las medias? ¿Y coincidirían con la
media de la población? Lo cierto es que parece lógico pensar que, aunque no tengan por qué
coincidir, si deberían estar bastante próximas. Pero, ¿cuánto de próximas?, ¿dependería esta
proximidad del tamaño de las muestras que elegimos? Estas preguntas serán contestadas por los
diferentes procedimientos de la estadística inferencial.

Parece necesario que estudiemos la variabilidad de las medias obtenidas de las muestras que
repetidamente se extraigan. Ello es lo que nos proponemos realizar con el análisis estadístico
inferencial.

8
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

5. El teorema central del límite (TCL)

Una cuestión fundamental, en la que se basa la estadística inferencial, es en el Teorema Central del
Límite.

Podemos imaginar que tienes una población con media µ y desviación típica  y que extraes
aleatoriamente todas las posibles muestras, todas ellas de tamaño n. Si se obtuvieran las medias de
todas estas muestras, y las consideráramos una distribución de datos (la distribución muestral de
medias), comprobarías que:

 La media de los datos, es la media µ de la población, es decir la media de las medias de las
muestras, es igual que la media de la población.
 Estas medias se distribuyen alrededor de la media de la población, con una desviación típica
(llamada desviación típica de la media) igual a la de la población dividida por la raíz de n,
es decir, la desviación típica de la media es:

 La distribución de las medias muestrales, es una distribución de tipo "normal", siempre que
la población de procedencia lo sea, o incluso si no lo es, siempre que el tamaño de las
muestras sea 30 o mayor.

En consecuencia, si una población tiene media µ y desviación típica , y tomamos muestras de


tamaño n ( de tamaño al menos 30, o cualquier tamaño, si la población es "normal"), las medias de
estas muestras siguen aproximadamente la distribución

De esta forma, cuanto mayor es el valor de n, mejor es la aproximación "normal".

9
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

6. Definición de la Desviación Típica de la media o error muestral

Es el grado de variabilidad de las medias muestrales y su fórmula es:

Cuanto menor sea, más ajustadas a la media de la población serán las medias que obtengamos de
una muestra. De su propia definición, es fácil darse cuenta de que cuanto mayor es el tamaño de la
muestra, menor es este grado de variabilidad, y por tanto más similar a la media de la población
será la media obtenida de la muestra.

En términos más coloquiales, lo que en definitiva establece el TCL es que la distribución de la


media, o de las sumas, de diferentes valores da como resultado una distribución normal. De ahí la
omnipresente aparición de distribuciones normales. Pensemos en los factores biológicos y
antropométricos: por ser el resultado de diferentes combinaciones genéticas y suma de muchos
diferentes factores, dan como resultados distribuciones normales. También por análogas razones
muchísimos parámetros sociológicos, económicos, físicos,.. siguen distribuciones de este tipo.

En esta asignatura analizaremos los siguientes aspectos de la estadística inferencial:

 Estimación puntual de parámetros.


 Estimación de parámetros por intervalos de confianza.
 Contrastes paramétricos y no paramétricos.
 Análisis de Varianza (ANOVA)
 Procedimientos de muestreo.

Con ello, tendremos una primera aproximación a la estadística inferencial. Estos procedimientos
que observaremos en esta asignatura son vitales para, posteriormente, poder realizar análisis
multivariantes.

10
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

V. RESUMEN

En esta unidad nos hemos introducido en el análisis estadístico inferencial, prestando atención a su
utilidad respecto a la estadística descriptiva y al papel clave del Teorema Central del Límite.

Aparte, hemos presentado los contenidos que se verán en siguientes temas de esta asignatura.

11
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

VI. GLOSARIO

Conjunto de N unidades de análisis que constituyen el objeto de estudio. Se


Población parte del hecho de que la población cuenta con una serie de propiedades (X, Y,
Z) que queremos estudiar a través de sus parámetros.

Conjunto de las n unidades de análisis (de muestreo, casos) seleccionadas entre


Muestra
las N unidades de la población

Conjunto de métodos necesarios para la recogida, clasificación, representación y


Estadística resumen de los datos proporcionados por una experiencia. No tiene valor
Descriptiva inferencial alguno.

Conjunto de métodos que permiten, a partir de los resultados de una muestra,


Estadística obtener conclusiones válidas para una población. Tiene como fin llegar a
Inferencial
conclusiones válidas.

Teorema Central Teoría que establece que la distribución de la media, o de las sumas, de
del Límite diferentes valores da como resultado una distribución normal.

12
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

VII. BIBLIOGRAFIA

Bibliografía Básica:

Amón, Jesús (1988): Estadística para Psicólogos 2 , Sexta edición, Madrid: Pirámide.

Peña, Daniel y Juan Romo (2003): Introducción a la estadística para las ciencias sociales, Madrid:
MC Graw Hill.

Rodríguez Morales, Jose Miguel (2007): Inferencia Estadística. Instituto Nacional de Tecnologías
Educativas y de Formación del Profesorado: Madrid. Recuperado de
(http://ntic.educacion.es/w3//eos/MaterialesEducativos/mem2001/estadistica/index2.htm)

Bibliografía complementaria:

Corbetta, P. (2007): Metodología y técnicas de investigación social, Madrid: McGraw Hill

13
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

VIII. ACTIVIDADES

A continuación se exponen una batería de preguntas tipo test en las que solamente hay una solución
correcta (soluciones más abajo).

1. La estadística es…
a. Una rama de las matemáticas que utiliza unos pocos datos para hacer únicamente
análisis descriptivos.
b. Una rama de las matemáticas que utiliza grandes conjuntos de datos numéricos para
obtener inferencias basadas en el cálculo de probabilidades.
c. Una rama de las matemáticas que utiliza unos pocos datos para hacer únicamente
análisis de las muestras, sin extrapolar a la población.

2. ¿Cuáles son los fenómenos que pueden ser analizados por al estadística?
a. Estocásticos.
b. Aleatorios
c. Ambas respuestas son correctas.

3. ¿Qué son los fenómenos estadísticos?


a. Aquellos sobre los que no se puede aplicar la estadística inferencial.
b. No existen fenómenos estadísticos.
c. Fenómenos en los que existe incertidumbre en cuanto a la predicción de resultados.

4. La estadística descriptiva es….


a. Conjunto de métodos necesarios para la recogida, clasificación, representación y
resumen de los datos proporcionados por una experiencia.
b. Conjunto de métodos que permiten, a partir de los resultados de una muestra,
obtener conclusiones válidas para una población. Tiene como fin llegar a
conclusiones válidas.
c. No existe la estadística descriptiva.

14
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

5. La estadística inferencial es….


a. Conjunto de métodos necesarios para la recogida, clasificación, representación y
resumen de los datos proporcionados por una experiencia.
b. Conjunto de métodos que permiten, a partir de los resultados de una muestra,
obtener conclusiones válidas para una población. Tiene como fin llegar a
conclusiones válidas.
c. No existe la estadística descriptiva.

6. ¿Cuáles son las dos grandes áreas de la estadística inferencial?


a. Estimación de parámetros (puntual y por intervalos de confianza) y contrastes de
hipótesis.
b. Estimación de parámetros puntual y por intervalos de confianza.
c. Estimación de contrastes de hipótesis.

7. ¿Qué es el Teorema Central del Límite?


a. Teoría que es muy útil para la estadística descriptiva.
b. Una teoría que nada tiene que ver con la estadística.

c. Teoría que establece que la distribución de la media, o de las sumas, de


diferentes valores da como resultado una distribución normal.

8. ¿Qué es la desviación típica de la media?


a. El cociente entre  y la raíz cuadrada de n.
b. El cociente entre la raíz cuadrada de n y .
c. No existe tal concepto.

9. Cuanto menor es la desviación típica de la media…


a. Menos ajustadas a la media de la población serán las medias que obtengamos de una
muestra.
b. Más ajustadas a la media de la población serán las medias que obtengamos de una
muestra.
c. Peor será la calidad del estudio.

15
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

10. Cuanto mayor es el valor de n (tamaño muestral)…


a. Mejor es la aproximación a la distribución normal.
b. Peor es la aproximación a la distribución normal.
c. La distribución deja de ser normal en todos los casos.

Soluciones a las preguntas:

Pregunta 1. B)

Pregunta 2. C)

Pregunta 3. C)

Pregunta 4. A)

Pregunta 5. B)

Pregunta 6. A)

Pregunta 7. C)

Pregunta 8. A)

Pregunta 9. B)

Pregunta 10. A)

16
BLOQUE II. TEMA 1
Principios generales de la inferencia estadística

IX. ANEXOS

17
ASIGNATURA

ESTADÍSTICA APLICADA
BLOQUE II. TEMA 2
El muestreo

GRADO EN CRIMINOLOGÍA

BLOQUE II. TEMA 2


El muestreo

Autor: Josué Gutiérrez Barroso

1
BLOQUE II. TEMA 2
El muestreo

Unidad didáctica.

Bloque II. Tema 2: El muestreo

INDICE

I. PRESENTACION ..................................................................................................... 3
II. OBJETIVOS. ........................................................................................................ 4
III. ESQUEMA .......................................................................................................... 5
IV. CONTENIDO ....................................................................................................... 6
1. Población y muestra .................................................................................... 6
2. Tipos de muestreo....................................................................................... 9
3. Sesgos del muestreo ................................................................................... 23
V. RESUMEN .......................................................................................................... 25
VI. GLOSARIO......................................................................................................... 26
VII. BIBLIOGRAFIA ................................................................................................... 27
VIII. ACTIVIDADES ................................................................................................... 28
IX. ANEXOS ........................................................................................................... 31
Anexo 1. Tabla de Números Aleatorios ........................................................................ 31

2
BLOQUE II. TEMA 2
El muestreo

I. PRESENTACION

En esta unidad didáctica nos ocuparemos de analizar cómo seleccionar una muestra a partir de una
población. Esta cuestión es importante en los estudios sobre psicología y salud, pues habitualmente
no es posible entrevistar a todos los miembros de una población, por lo que se suele recurrir al
empleo de muestras de la misma.

La validez de los resultados de toda investigación en psicología dependerá, además de los


instrumentos de medida, de los criterios con los cuales seleccionamos los sujetos objeto de estudio.
Por ello esta unidad didáctica es fundamental para no incurrir en errores de investigación
relacionados con la selección de sujetos.

Los contenidos que se verán en esta unidad didáctica serán las diferencias entre muestra y
población, así como las características de los diferentes tipos de muestreo probabilísticos y no
probabilísticos. Por último, también se prestará especial atención a los posibles sesgos que pueden
ocurrir en todo muestreo.

3
BLOQUE II. TEMA 2
El muestreo

II. OBJETIVOS.

Los objetivos de esta unidad didáctica son los siguientes:

- Conocer las diferencias entre el concepto de población y muestra.


- Conocer los diferentes tipos de muestreo más habituales, clasificándolos en probabilísticos y
no probabilísticos.
- Detectar los posibles sesgos a la hora de seleccionar la muestra para evitarlos en futuras
investigaciones.

4
BLOQUE II. TEMA 2
El muestreo

III. ESQUEMA

MUESTREO

Población y Tipos de Sesgos en el


muestra muestreo muestreo

5
BLOQUE II. TEMA 2
El muestreo

IV. CONTENIDO

1. Población y muestra

Los acontecimientos en que existe incertidumbre siempre han preocupado al hombre. Todo el
mundo querría saber cuántos años vivirá, cuántos hijos procrearán, si padecerán malformaciones, si
lloverá antes de que se agote la cosecha, cual es la prevalencia de una determinada enfermedad,
etc.

Tradicionalmente se han buscado respuesta en la magia. Actualmente la evolución científica de


muchas disciplinas ha contribuido a que algunas preguntas que antes eran inciertas, ahora se
puedan contestar. La estadística proporciona otro dictamen científico frente a los acontecimientos
inciertos. Consiste en estudiarlos colectivamente y predecir, en vez de los resultados individuales,
las características de las respuestas colectivas. Como no es magia, no se puede asegurar cuántos
años va a vivir determinada persona, pero sí puede afirmar que la esperanza de vida de los varones
de 46 años es 78 años. Tampoco se puede garantizar que una operación quirúrgica tendrá éxito,
pero sí que sólo 7 de cada 1000 fracasan, etc.

Antes de comenzar, es necesario aclarar varios conceptos clave para comprender la posterior
exposición de los tipos de muestreo y sus características.

La Población es el conjunto de N unidades de análisis que constituyen el objeto de estudio. Se parte


del hecho de que la población cuenta con una serie de propiedades (X, Y, Z) que queremos estudiar
a través de sus parámetros. Por ejemplo, la población puede tener una serie de parámetros como el
grado de inteligencia emocional (X), nivel de estudios (Y) o nivel de ingresos (Z).

La Muestra es el conjunto de las n unidades de análisis (de muestreo, casos) seleccionadas entre las
N unidades de la población. Esa selección ha de ser lo suficientemente reducida para que pueda ser
examinado con un coste razonable y lo suficientemente amplio para que pueda representar
adecuadamente las propiedades colectivas de la población. A partir de ella estimamos los
parámetros de la población. La estimación solo nos da un valor aproximado del parámetro, que es
un valor exacto.

6
BLOQUE II. TEMA 2
El muestreo

Para ver la diferencia entre muestra y población pueden observar la siguiente figura:

Población

Muestra

Figura 1. Población y muestra.

Tal y como se observa, la muestra forma parte de la población. La cuestión será cómo elegir una
muestra que sea lo más representativa posible respecto a la población.

El Marco muestral es una lista de elementos que componen la población que queremos estudiar y
de la cual se extrae la muestra. Estos elementos a investigar pueden ser individuos, pero también
pueden ser hogares, instituciones y cualquier otra cosa susceptible de ser investigada. Cada uno de
estos elementos presentes en el marco muestral se conoce como unidades muestrales.

El Diseño muestral es el establecimiento de la forma en la cual se va a seleccionar la muestra,


incluyendo el error muestral, nivel de confianza, número de elementos a seleccionar. Incluye otros
conceptos como:

 Fracción de muestreo: cociente entre el tamaño de la muestra y el de la población (n/N).

 Factor de Elevación: cociente entre el tamaño de la población y el de la muestra.


Representa el número de unidades que hay en la población por cada elemento de la
muestra.

7
BLOQUE II. TEMA 2
El muestreo

Como bien han explicado algunos autores (Peña y Romo, 2003:266), en la investigación social es
extremadamente habitual la selección de muestras sobre todo cuando las poblaciones son grandes.
Así, se seleccionan muestras por diversos motivos:

 Porque es inviable económicamente seleccionar a todos los individuos de una población.

 Porque, aunque sea viable económicamente, es inviable por el tiempo, ya que se tardaría
mucho tiempo en realizar un análisis de todos los elementos de una población y, a su vez, al
tardar tanto, el estudio es inútil ya que las sociedades están en permanente cambio.

 Porque toda la población no tiene por qué ser accesible, y se ha de aprovechar la


accesibilidad de algunos de los elementos de una población.

Por tanto, en toda investigación es necesario determinar las siguientes cuestiones:

Diseño muestral Tipo de Muestra


muestreo

• Cómo se • Forma de • Sujetos


realizará el selección de entrevistados
muestreo. los sujetos a que forman
• Nivel de entrevistar parte de la
confianza. población
• Tamaño
muestral.
• Marco
muestral
• Error
muestral.

Figura 2. Cuestiones determinantes en toda investigación.

8
BLOQUE II. TEMA 2
El muestreo

Cabe destacar que no siempre una muestra hay que medirla por el tamaño (n). Así, se pueden elegir
grandes muestras, pero con criterios de selección que hace que la selección de dicha muestra,
aunque tenga un tamaño representativo, en sus características no lo sea tanto. Así, el tamaño
muestral dependerá de cuestiones como el error de muestreo o el nivel de confianza.

2. Tipos de muestreo

Cuando las propiedades de las variables observadas en una muestra se desvían de las
correspondientes a la población, se dice que la muestra está sesgada o que tiene un sesgo (ver
último apartado de este tema).

Lo ideal es utilizar muestras que no tengan sesgo, pero a veces, por la forma en que se obtienen,
existen muestras que estás sesgadas. Por ejemplo, cuando se pregunta a través de internet por
alguna opinión, la encuesta está condicionada a personas que tienen internet y quieren contestar
dicha encuesta.

Para no incurrir en los sesgos proporcionados por estos tipos de muestreos, las técnicas estadísticas
exigen que la selección de la muestra se encomiende al azar. Pero, aún conforme en la idea de
seleccionar la muestra al azar, existen diversas maneras de proceder, unas más simples de analizar
que otras y con diversos grados de dificultad de aplicación. Es lo que denominaremos tipos de
muestreo.

Existen dos grandes tipos de muestreo que recogen a la vez subtipos. Estos dos grandes tipos de
muestreo son los probabilísticos y los no probabilísticos. Las diferencias entre ambos tipos de
muestreo las podemos encontrar en la tabla 1.

9
BLOQUE II. TEMA 2
El muestreo

Subtipos de
Tipos de muestreo Características
muestreo

Se conoce de forma
precisa la probabilidad de
selección para cada Muestreo Aleatorio
elemento, lo que se Simple
conoce como
probabilidad de inclusión.

Muestreo probabilístico Muestreo sistemático


Todos los elementos de la
Muestreo
población tienen una
Estratificado
probabilidad mayor de
Muestreo por
cero de ser seleccionados
conglomerados
en la muestra.
Muestreo polietápico

Se seleccionan elementos Muestreo por cuotas


para la muestra
Muestreo intencional
basándose en hipótesis
Muestreo no probabilístico relativas a la población
de interés, lo que se Muestreo por bola de
conoce como criterios de nieve
selección.

Tabla 1. Tipos de muestreo. Elaboración propia.

Parece sencillo observar que el muestreo probabilístico es más adecuado que el no probabilístico.
Pero no es sencillo cumplir con los requisitos impuestos por el muestreo probabilístico. Así, es
necesario disponer de un marco muestral, cosa que es poco habitual en estudios sobre valores,
consumo de productos, etc. Además, es importante que todos los sujetos de la población puedan
tener la posibilidad de ser seleccionados, cosa que también es complicada dado que hay unidades
de la población fuera de la cobertura del marco muestral (porque no se puede acceder a ellos por
ninguna vía, por ejemplo).

10
BLOQUE II. TEMA 2
El muestreo

En la realidad, lo que se suele dar es una combinación de tipos de muestreo, como ser verá por
ejemplo en el tipo de muestreo polietápico (probabilístico), cuya selección final de unidades puede
ser mediante cuotas (no probabilístico), por ejemplo.

2.1. Muestreos probabilísticos

2.1.1 Muestreo Aleatorio Simple (MAS)

En una población finita (es decir, una población del que sabemos el número de sus miembros), una
muestra aleatoria simple es aquella en que cada uno de los miembros que la componen se eligen al
azar de modo que cada elemento de la población tiene, en cada ocasión, la misma probabilidad de
ser elegido. Por tanto, es un proceso que garantiza, en cualquier momento del mismo, la misma
oportunidad de ser incluidos en la muestra a todos los elementos que pertenezcan a la población en
dicho momento (Amón, 1988:200).

En la práctica, para realizar un muestreo aleatorio simple de una población, hay que contar con una
relación exhaustiva de sus miembros, que pueden suponerse numerados de 1 a N, donde N es el
tamaño de la población. Con ello, para seleccionar cada elemento de la muestra basta con
seleccionar un número entre 1 y N e incluir en la muestra dicho elemento poblacional. Si el proceso
lo repetimos n veces se obtendrá una muestra aleatoria simple de tamaño n.

11
BLOQUE II. TEMA 2
El muestreo

Figura 3. Muestreo Aleatorio Simple. Otzen Manterola (2017, 229).

Las condiciones que son necesarias para que la extracción mediante un muestreo aleatorio simple
son dos (Peña y Romo, 2003):

 Cada elemento de la población tiene la misma probabilidad de ser elegido. Esto asegura la
representatividad de la población en la muestra.

 Los elementos se seleccionan de uno en uno.

12
BLOQUE II. TEMA 2
El muestreo

Muestreo aleatorio sin reemplazamiento y con reemplazamiento.

Una muestra aleatoria sin reemplazamiento es aquella en la que cada uno de los miembros que la
componen se elige al azar de los elementos de la población que no han sido previamente incluidos
en la muestra. Es lo más habitual en investigaciones sociales, pues lo que se trata es tratar de
captar la variabilidad de los sujetos de una población y evitar repeticiones.

Sin embargo, una muestra con reemplazamiento supone que se selecciona un miembro de la
población al azar, se analiza y antes de volver a extraer otro elemento de la población incluimos el
miembro que fue extraído anteriormente. De esta forma, cada elemento de la población tiene la
misma oportunidad de ser extraído en cada extracción.

Cabe destacar que cuando la población es grande, la diferencia entre extraer una muestra con
reemplazamiento y sin reemplazamiento es muy pequeña. Por ejemplo, si de 100.000 personas
elegimos a 100, realmente es muy improbable que elijamos a una misma persona.

Para elegir una muestra aleatoria simple de una población finita se utilizan frecuentemente los
números aleatorios (Peña y Romo, 2003: 269). Una tabla de números aleatorios es un conjunto de
números dispuestos de manera que cada dígito tiene la misma probabilidad de aparecer. Pueden ver
una tabla de números aleatorios en el anexo 1.

El procedimiento para seleccionar una muestra con ayuda de una tabla de números aleatorios es
numerar los elementos de una población de 1 a N, agrupar los números aleatorios en bloques de
tantos dígitos como tenga N y tomar n números aleatorios de la tabla. El valor del número aleatorio
indicará el elemento a seleccionar (Peña y Romo, 2003:269).

La Fórmula es la siguiente:

N = tamaño de la población Z = nivel de confianza, P = probabilidad de éxito, o proporción esperada


Q = probabilidad de fracaso D = precisión (Error máximo admisible en términos de proporción).

13
BLOQUE II. TEMA 2
El muestreo

2.1.2. Muestreo Sistemático

Un muestreo sistemático consiste en elegir a los miembros de una población que están ordenados en
listas. Así, la idea será en elegir los miembros de la muestra siguiendo un criterio de elección
relacionado con el orden en el que están situados los elementos.

Así, si queremos elegir a 10 personas de una población de 1000 siguiendo un muestreo sistemático,
tendremos una fracción de muestreo (porcentaje de la población que escogemos para la muestra)
de 0,01 (10/1000) y un factor de elevación (cuantos sujetos de la población representa cada sujeto
de la muestra) de 100 unidades. A continuación, se escogería un número aleatorio (por ejemplo, el
60) y a partir de ese número se escogerían el resto sumándole el factor de elevación. Así, se
obtendría una muestra de 10 unidades que serían: (60,160,260,360,460,560,660,760,860,960).

Por tanto, en el muestreo sistemático el orden en el que están dispuestos los sujetos es
fundamental, como se observa en la figura 4.

14
BLOQUE II. TEMA 2
El muestreo

Figura 4. Muestreo Sistemático. Otzen Manterola (2017, 229).

Otro ejemplo es el siguiente. Al salir del cine de una película a la que han asistido 200 personas se
pretende preguntar a 10 de ellas mediante un muestreo sistemático. Entonces se elige un número al
azar entre 1 y 20 (digamos el 7) y la muestra escogida estaría formada por las personas 7, 27, 47,
67, 87, 107, 127, 147, 167 y 187.

15
BLOQUE II. TEMA 2
El muestreo

2.1.3. Muestreo Estratificado

En un muestreo estratificado la población se divide en diversas capas o estratos (bien sea por
edades, por niveles de renta, por el tipo de patología que padecen, etc.) y después se selecciona
una muestra aleatoria (generalmente sin reemplazamiento) dentro de cada capa, de forma que, el
tamaño muestral total es la suma de los tamaños de estas pequeñas muestras.

En este caso, el muestreo en general es más preciso que el muestreo aleatorio simple, pues cuanto
más diferentes sean los estratos entre sí y más homogéneos sean internamente, más representativo
será utilizar el muestreo estratificado.

Figura 4. Muestreo estratificado. Fuente: Universos Fórmulas (2018)

16
BLOQUE II. TEMA 2
El muestreo

Aun así, este muestreo tiene el problema de cómo dividir el tamaño muestral n entre los estratos.
Existen dos criterios para tal asignación (Peña y Romo, 2003:273):

 Proporcionalmente al tamaño relativo del estrato de la población. Por ejemplo, si deseamos


extraer una muestra de 10 personas y en la población hay un 50% de hombres y otro 50% de
mujeres, habría que elegir 5 hombres y 5 mujeres. Es el procedimiento más habitual.

 Proporcionalmente a la variabilidad que tiene la característica que estudiamos dentro de


cada estrato. Si en una población hay más variabilidad en un estrato que en otro, es
preferible coger una mayor muestra del estrato con mayor variabilidad, para que éste sea
más representativo.

Cabe destacar, por último, que para elaborar un muestreo de este tipo se necesita tener
información precisa sobre la población objeto de estudio. La distribución de la muestra en función
de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

 Afijación Simple o no proporcional: A cada estrato le corresponde igual número de


elementos muéstrales.

 Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la


población en cada estrato.

17
BLOQUE II. TEMA 2
El muestreo

2.1.4. Muestreo por conglomerados

En este caso la población está divida en bloques o conglomerados. Estos bloques o conglomerados
no son de características homogéneas dentro de cada uno, como sucede con los estratos, sino que
constituyen una representación de todos los individuos de la población.

En el Muestreo por conglomerado no se eligen elementos al azar, sino que se seleccionan al azar
algunos conglomerados. Estos conglomerados realmente son agrupaciones físicas de las unidades de
la población en el espacio o en el tiempo, pues no tienen una característica común más allá de su
agrupación espacial o temporal. Así, se basa en que cada conglomerado es una parte representativa
de la población, por lo que, a diferencia del muestreo estratificado, nos interesa que el
conglomerado sea tan heterogéneo internamente como la población y tan homogéneos entre sí
como sea posible (Peña y Romo, 2003:274).

Figura 5. Muestreo por conglomerados. Fuente: Pérez Leal (2016)

18
BLOQUE II. TEMA 2
El muestreo

Este método simplifica enormemente la recogida de información, pero tienen el inconveniente de


que, si los conglomerados son heterogéneos entre sí, como sólo se analizan algunos de ellos, la
muestra final puede no ser representativa.

Por ejemplo, si queremos estudiar qué piensan los trabajadores/as que hay en los hospitales
españoles acerca del aborto. Los hospitales se considerarán conglomerados, pues son agrupaciones
físicas de trabajadores/as que son heterogéneos internamente (hay médicos, administrativos, etc.),
pero es esperable que cada hospital sea relativamente homogéneo con el resto (misma proporción
de médicos, administrativos/as, etc.) Así, seleccionaremos aleatoriamente los hospitales como si
fueran conglomerados.

2.1.5. Muestreo Polietápico

A veces es recomendable utilizar una combinación de diferentes estrategias de selección de


muestra, todo ello para ser más representativo. Así, de lo que se trata es de construir una muestra
mediante diferentes etapas y aplicando diferentes criterios de selección.

Por ejemplo, imaginemos que queremos hacer un estudio sobre los valores y actitudes de la
población española frente al aborto. A la hora de seleccionar la muestra podemos seguir las
siguientes etapas:

 Selección de una muestra estratificada de unidades primarias de muestreo (en este caso,
Comunidades Autónomas), de tal forma que cada Comunidad Autónoma sea representada
adecuadamente.

 Selección de una muestra estratificada de unidades secundarias dentro de cada unidad


primaria (municipio dentro de cada Comunidad Autónoma) de forma aleatoria.

 Selección de una muestra de forma aleatoria dentro de cada unidad secundaria (elegir
viviendas dentro de cada municipio de forma aleatoria).

El Centro de Investigaciones Sociológicas suele realizar muestreos de este tipo.

19
BLOQUE II. TEMA 2
El muestreo

2.2. Muestreos no Probabilísticos

Existen otros tipos de muestro que no son probabilísticos (mirar definición al principio del tema). En
este caso, se realizan estos muestreos cuando no es posible aplicar la aleatoriedad en la selección
de la muestra por diferentes dificultades que pueden aparecer (población de difícil acceso, etc.).
Entre otras, podemos encontrar el muestreo por cuotas, el intencional o la bola de nieve.

2.2.1. Muestreo por cuotas:

Se basa en que se conocen los estratos de la población y de los individuos más representativos. Se
mantiene de esta forma la semejanza con el muestreo estratificado, pero sin cumplir la
aleatoriedad, dado que se fijan cuotas de individuos que cumplen determinados requisitos. Por
ejemplo, se quieren elegir 20 sujetos de una población. Se conoce que el 50% son hombre sy el 50%
mujeres. Si los primeros 10 sujetos que se seleccionan son hombres, ya la cuota d ehombres está
cerrada, por lo que sólo podríamos seleccionar a mujeres (descartando los hombres que aparezcan).

2.2.2. Muestreo intencional

Se trata de seleccionar de una población sujetos que son típicos y a su vez que tienen fácil acceso.
Por ejemplo, si un profesor que quiere pasar un test emocional a alumnado de su Universidad, lo
pasará a los miembros de las asignaturas en las que imparta docencia, sin importar que haya otros
alumnos/as de otras asignaturas, rompiendo la aleatoriedad.

2.2.3. Bola de nieve

Se trata de localizar a individuos de una población que a su vez hace que consigamos otros
individuos de esa población y así sucesivamente. Este muestreo se aplica en los casos en que existen
muchas dificultades para localizar a los miembros de una población: personas con una determinada
enfermedad, delincuentes, colectivos que realizan actividades ilegales, etc.

Como tabla resumen, en la tabla 2 encontramos la descripción de los tipos de muestreo, con sus
ventajas e inconvenientes.

20
BLOQUE II. TEMA 2
El muestreo

Tipo Características Ventajas Desventajas


 Selección de una  Sencillo y de fácil  Requiere
muestra de tamaño compresión. listado
“n” a partir de una  Cálculo rápido de completo de
Aleatorio Simple población “N” medias y varianzas. toda la
unidades.  Existen paquetes población.
 Cada elemento tiene informáticos para  Al trabajar con
la misma analizar los datos. muestras
probabilidad de pequeñas
inclusión (n/N). puede no
representar de
forma
adecuada a la
población.
 Conseguir un listado  Fácil de aplicar  Si la constante
de los “N”  No siempre es de muestreo
elementos de la necesario tener un está asociada
Aleatorio población listado de la con el evento
Sistemático  Determinar el población. de interés, las
tamaño de la  Cuando la población estimaciones
muestra “N”. está ordenada, obtenidas a
asegura la cobertura partir de la
de unidades de todos muestra
los tipos. pueden
contener sesgo
de selección.
 En ciertas ocasiones  Tiende a asegurar  Se ha de
resultará que la muestra conocer la
conveniente represente distribución en
estratificar la adecuadamente la la población de
muestra según población en función las variables
Aleatorio variables de interés. de variables utilizadas para
Estratificado  Para ello se ha de seleccionadas. la
conocer la  Se obtienen estratificación.
composición estimaciones más
estratificada de la precisas.

21
BLOQUE II. TEMA 2
El muestreo

población objeto.  Su objetivo es


 Una vez calculado el conseguir una
tamaño de la muestra lo más
muestra, este se semejante a la
reparte entre los población en lo que
distintos estratos de a la o a las variables
la población usando estratificadoras se
una regla de tres. refiere.
 Se realizan varias  Eficiente en  El error
Aleatorio por fases de muestreo poblaciones grandes estándar es
conglomerados sucesivas. y dispersas. mayor que en
 La necesidad de  Es preciso tener un otros tipos de
listados de unidades listado de las muestreo.
se limita a unidades unidades primarias  El cálculo del
de muestreo de muestreo. error estándar
seleccionadas en la es complejo.
etapa anterior

Tabla 2. Resumen de tipos de muestreo. Otzen Manterola (2017, 231).

22
BLOQUE II. TEMA 2
El muestreo

3. Sesgos del muestreo

Existen cuestiones que pueden hacer que el procedimiento de muestreo para obtener una muestra
haga que la muestra seleccionada no sea representativa de la población. En este caso, siguiendo a
Peña y Romo (2003,267), encontramos dos sesgos muy habituales: el sesgo de selección y el sesgo
por no respuesta.

Sesgo de selección

Cuando algunos miembros de la población tienen una probabilidad más alta que los otros de estar
representados en una muestra se dice que existe el sesgo de selección. Ello implica que la muestra
no es representativa, esto es, que en el marco muestral las unidades de población no tienen la
misma probabilidad de ser seleccionados. Por ejemplo, si en una población hay un 50% de hombres y
un 50% de mujeres; al seleccionar la muestra encontramos un 70% frente a un 30%, se dice que la
muestra no es representativa.

Se puede evitar el sesgo de selección dividiendo la población en estratos para que la muestra se
ajuste más a la población.

Sesgo de no respuesta

La muestra que comienza siendo probabilística puede terminar no siéndolo por dos causas: a) Falta
de contacto con los sujetos seleccionados porque no se ha podido acceder a los mismos por
cuestiones como cambios de domicilio, cambios de número de contacto, etc. b) Rechazo de los
sujetos seleccionados a ser entrevistados (no respuesta total) o a contestar determinadas preguntas
(no respuesta parcial).

Ambas cuestiones pueden afectar a la representatividad de la muestra, pues, por ejemplo, si


queremos hacer un estudio sobre la población universitaria de España y solo nos contestan los que
sacan buenas notas, estamos incurriendo en un sesgo de no respuesta.

23
BLOQUE II. TEMA 2
El muestreo

Una solución “artificial” para evitar sesgos: la ponderación

Una posible solución para evitar los sesgos (sobre todo de selección) es la Ponderación. Este es el
procedimiento por el que se modifica artificialmente la composición de la muestra para hacerla más
próxima a la distribución real de la población.

De forma general, la ponderación consiste en asignar a cada caso un peso (o factor de ponderación)
que modifica su contribución al resultado general de la muestra. Por ejemplo, para solucionar el
sesgo de selección en el ejemplo anterior de mujeres y hombres, sería conveniente que en la
muestra recogida se pondere a la baja la población de hombres (es un 70% de la muestra cuando
debería de ser un 50%) y ponderar al alza la de mujeres (es un 30% en la muestra cuando debería de
ser un 50%).

Cabe destacar que el procedimiento de ponderar no soluciona directamente los sesgos de selección
y de no respuesta, si bien puede aminorar en parte los efectos del sesgo de selección.

24
BLOQUE II. TEMA 2
El muestreo

V. RESUMEN

En esta unidad nos hemos introducido en cómo seleccionar muestras a partir de poblaciones
concretas para que éstas sean representativas de la misma. Además, hemos visto procedimientos de
muestreo probabilísticos y no probabilísticos, con ejemplos concretos que podrían darse en la
realidad

Por último, se han presentado los posibles sesgos más comunes en la aplicación de técnicas de
muestreo, así como posibles medidas para tratar de evitarlos en la medida de lo posible.

25
BLOQUE II. TEMA 2
El muestreo

VI. GLOSARIO

Conjunto de N unidades de análisis que constituyen el objeto de estudio. Se


Población parte del hecho de que la población cuenta con una serie de propiedades (X, Y,
Z) que queremos estudiar a través de sus parámetros.

Conjunto de las n unidades de análisis (de muestreo, casos) seleccionadas entre


Muestra
las N unidades de la población

Muestreo en que cada uno de los miembros que la componen se eligen al azar
Muestreo Aleatorio de modo que cada elemento de la población tiene, en cada ocasión, la misma
Simple
probabilidad de ser elegido.

Muestreo en el que se divide en diversas capas o estratos (bien sea por edades,
Muestreo por niveles de renta, por el tipo de patología que padecen, etc.) y después se
Estratificado
selecciona una muestra aleatoria

Muestreo Muestreo que consiste en elegir a los miembros de una población que están
Sistemático ordenados en listas.

Muestreo en el que no se eligen elementos al azar, sino que se seleccionan al

Muestreo por azar algunos conglomerados. Estos conglomerados realmente son agrupaciones
Conglomerados físicas de las unidades de la población en el espacio o en el tiempo, pues no
tienen una característica común más allá de su agrupación espacial o temporal.

Muestreos no Tipos de muestreo en el que se conoce de forma precisa la probabilidad de


probabilísticos
selección para cada elemento, lo que se conoce como probabilidad de inclusión.

Sesgos en la Tipos de muestreo en el que no se conoce de forma precisa la probabilidad de


selección de una selección para cada elemento, lo que se conoce como probabilidad de inclusión.
muestra

26
BLOQUE II. TEMA 2
El muestreo

VII. BIBLIOGRAFIA

Bibliografía Básica:

Amón, Jesús (1988): Estadística para Psicólogos 2 , Sexta edición, Madrid: Pirámide.

Otzen, Tamara H. y Carlos Manterola (2017). “Técnicas de muestreo sobre una población a estudio”.
Int. J. Morphol., Vol. 1, n. 35, 227-232.

Peña, Daniel y Juan Romo (2003): Introducción a la estadística para las ciencias sociales, Madrid:
MC Graw Hill.

Bibliografía complementaria:

Corbetta, Piergiorgio (2007): Metodología y técnicas de investigación social, Madrid: McGraw Hill

Pérez Leal, Jose (2016): Estudios de Mercado. Recuperado de:


https://plepso.blogspot.com/2016/10/tecnicas-de-muestreo-y-marketing.html

Universo Fórmulas (2018): Muestreo Estratificado, Recuperado de:


https://www.universoformulas.com/estadistica/inferencia/muestreo-estratificado/

27
BLOQUE II. TEMA 2
El muestreo

VIII. ACTIVIDADES

A continuación se exponen una batería de preguntas tipo test en las que solamente hay una solución
correcta (soluciones más abajo).

1. ¿Es lo mismo la muestra que la población?


a. No, la población es una parte de la muestra, es decir, la población está extraída por
completo en la muestra.
b. No, la muestra es extraída de la población.
c. Sí, ambos conceptos son sinónimos.

2. La fracción de muestreo es….


a. Cociente entre el tamaño de la muestra y el de la población (n/N).
b. Cociente entre el tamaño de la población y el tamaño de la muestra (N/n).
c. El cociente entre el error muestral y el nivel de confianza.

3. ¿Qué es el marco muestral?


a. Lista de elementos que componen la población que queremos estudiar y de la cual
se extrae la muestra.
b. Lo contrario que unidad muestral.
c. La relación entre el nivel de confianza y el error muestral.

4. ¿Qué diferencia hay entre un muestreo probabilístico y no probabilístico?


a. En el no probabilístico se conoce la probabilidad de selección para cada elemento.
b. En el probabilístico se conoce la probabilidad de selección para cada elemento.
c. No hay diferencia alguna.

5. ¿Cuál de estos muestreos es no probabilístico?


a. Muestreo por cuotas.
b. Muestreo aleatorio por conglomerados.
c. Muestreo aleatorio estratificado.

28
BLOQUE II. TEMA 2
El muestreo

6. ¿Cuál de estos muestreos es probabilístico?


a. Muestreo por cuotas.
b. Muestreo por bola de nieve.
c. Muestreo aleatorio estratificado.

7. En el muestreo aleatorio simple, ¿cada elemento de la población tiene la misma


probabilidad de ser elegido?
a. No, porque no es necesario tal condición para este tipo de muestreo.
b. No, porque no existe el muestreo aleatorio simple.
c. Sí, porque es necesario que se cumpla tal condición.

8. ¿Qué diferencia hay entre el muestreo estratificado y el muestreo por conglomerados?


a. En el estratificado la población que se incluye en cada estrato es homogénea y en el
de conglomerados no.
b. En el de conglomerados la población que se incluye en cada conglomerado es
homogénea y en el estratificado no.
c. No existen diferencias entre ambos tipos de muestreo.

9. ¿Qué es el sesgo de selección?


a. Cuando algunos miembros de la población tienen una probabilidad más alta que los
otros de estar representados
b. Cuando todos los miembros de una población tienen la misma probabilidad de ser
seleccionados.
c. Lo mismo que el sesgo de no respuesta.

10. ¿Cuándo es útil utilizar el muestreo por bola de nieve?


a. Cuando es fácil localizar a los miembros de una población.
b. Cuando es difícil localizar a los miembros de una población.
c. No es recomendable en ningún caso.

29
BLOQUE II. TEMA 2
El muestreo

Soluciones a las preguntas:

Pregunta 1. B)

Pregunta 2. A)

Pregunta 3. A)

Pregunta 4. B)

Pregunta 5. A)

Pregunta 6. C)

Pregunta 7. C)

Pregunta 8. A)

Pregunta 9. A)

Pregunta 10. B)

30
BLOQUE II. TEMA 2
El muestreo

IX. ANEXOS

Anexo 1. Tabla de Números Aleatorios

86 15 94 27
35 84 66 80
73 42 92 19
90 36 76 63
1 31 47 7
29 4 75 54
72 45 57 5
65 65 90 25
25 19 48 47
39 72 61 62
59 38 79 29
96 31 39 52
32 35 29 54
44 39 66 43
71 20 31 69
44 86 6 24
76 34 27 42
37 51 59 47
58 30 6 4
3 62 75 10
74 30 10 76
93 23 39 47
57 42 43 95
32 69 37 5
78 40 71 90

31
ASIGNATURA

ESTADÍSTICA APLICADA BLOQUE II. TEMA 3


TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza
GRADO EN CRIMINOLOGÍA

BLOQUE II. TEMA 3


Estimación de parámetros.
Estimación puntual y por
Intervalos de Confianza

Autor: Josué Gutiérrez Barroso


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Unidad didáctica.

Bloque II. Tema 3: Estimación de


parámetros. Estimación puntual y por
intervalos de confianza

INDICE

I. PRESENTACION ................................................................................................................ 3
II. OBJETIVOS. .................................................................................................................... 4
III. ESQUEMA ...................................................................................................................... 5
IV. CONTENIDO ................................................................................................................... 6
1. Introducción .......................................................................................................... 6
2. Definición de un estimador ....................................................................................... 6
3. Estimación puntual de parámetros .............................................................................. 9
4. Estimación por intervalos de confianza ....................................................................... 10
5. Estimación de intervalos de confianza para la media ...................................................... 15
6. Intervalos de confianza para proporciones ................................................................... 21
7. Intervalos de confianza para una variable Poisson .......................................................... 25
8. Intervalos de confianza con dos poblaciones independientes ............................................ 28
VI. GLOSARIO .................................................................................................................... 33
VII. BIBLIOGRAFIA .............................................................................................................. 34
VIII. ACTIVIDADES ............................................................................................................... 35
IX. ANEXOS ....................................................................................................................... 39
Anexo 1. Intervalos de confianza para una población .................................................................. 39
Anexo 1. Intervalos de confianza para dos poblaciones independientes ........................................... 40
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

I. PRESENTACION

En esta unidad didáctica se expondrá cómo estimar los parámetros poblacionales a partir de estimadores
muestrales. Para ello, se propondrán dos tipos de cálculos de dichos parámetros: la estimación puntual y la
estimación por intervalos.

Para que los resultados de una investigación en psicología sean válidos, es vital poder saber qué error
cometemos al inferir resultados para la población a partir de una muestra, pues ello nos indicará la fiabilidad
que tiene los resultados obtenidos de una selección de individuos de una población a la hora de estimar cómo
se comporta la totalidad de una población.

Los contenidos que se verán en esta unidad didáctica serán la estimación puntual y por intervalos de confianza
tanto para las proporciones como para las medias muestrales, así como también nos detendremos en cómo
calcular tamaños muestrales para errores concretos.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

II. OBJETIVOS.

Los objetivos de esta unidad didáctica son los siguientes:

‐ Conocer cómo realizar la estimación puntual de parámetros poblacionales, tanto para la media como
para la proporción.
‐ Conocer cómo estimar los intervalos de confianza para la media y para las proporciones, así como
conocer las diferentes variantes según si se conoce o no la cuasi-varianza muestral o la varianza
poblacional.
‐ Introducirnos en la estimación de intervalos de confianza sobre dos poblaciones independientes.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

III. ESQUEMA

Estimación de
parámetros

Estimación
puntual Estimación por intervalos
de confianza

Sobre una
población
(Media,
Varianza, Sobre dos
proporciones) poblaciones
independientes
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

IV. CONTENIDO

1. Introducción

Una de las funciones principales de la estadística es realizar inferencias de las poblaciones (sus
parámetros) a través de las muestras extraídas de aquellas (a través de los estimadores).

En este tema veremos la estimación por intervalos, ya que trataremos de estimar un único valor
(parámetro) a través de los datos ofrecidos por una muestra.

2. Definición de un estimador

Un estimador es un estadístico (es decir, es una función de la muestra) usado para estimar un
parámetro desconocido de la población.

Las estimaciones puntuales de los parámetros se obtienen a partir de una muestra aleatoria simple
(X1, X2… ; Xn) de la variable X. Si calculamos el valor del estimador a partir de distintas muestras, los
resultados que obtendremos serán diferentes.

Por tanto, Se dispone de una muestra aleatoria (n) de una característica X de la población objeto de
estudio. Si esta característica puede ser modelizada mediante un modelo de probabilidad el cual
tiene función de masa Pθx (si nos encontramos en el caso discreto), o Fθ(x) (si nos encontramos en el
caso continuo), nuestro objetivo será conocer el valor del parámetro o parámetros desconocidos que
representamos por θ, es decir, encontrar estimaciones puntuales de dicho parámetro desconocido.

Es decir, los estimadores, al estar construidos a partir de muestras aleatorias, son aleatorios y en
consecuencia, tienen una distribución. La distribución de los estimadores se denomina distribución en
el muestreo.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

2.1. Propiedades de un estimador

Como ya se ha advertido, para un estadístico pueden existir diversos estimadores con el que
calcularlos. Se asemeja a una diana: el centro de la diana es el parámetro que debemos acertar y los
impactos alrededor son los estimadores realizados.

Medias muestrales

Medias del parámetro


de la población

Figura 1. Medias muestrales y media poblacional. Elaboración propia.

Por tanto, existen unos estimadores mejores y otros peores. Para saber cuál elegir, es importante que
un estimador cumpla una serie de propiedades como son las siguientes (Amón, 2003,245-248):

‐ Carencia de sesgo. El sesgo de un estimador es la diferencia entre la esperanza (o valor


esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual
al parámetro que se desea estimar. Por ejemplo, si estamos calculamos la media de una
población, la media aritmética de la muestra es el mejor estimador ya que su esperanza es la
media de la población.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

‐ Consistencia. Es un requisito mínimo deseable para un estimador: a medida que el tamaño de


la muestra crece, el valor del estimador tiende a ser el valor del parámetro, propiedad que se
denomina consistencia. Por tanto, la consistencia está definida para n tendiendo a infinito:
cuanto mayor es la n, más consistente será el estimador.
‐ Eficiencia. Dados dos estimadores, el más eficiente es el que tenga una varianza menor. Ello
se debe a que cuanto menor es la varianza, más certero será el estimador muestral respecto
al parámetro poblacional.
‐ Convergencia. A la hora de analizar las características de un estimador, también es necesario
saber si su comportamiento es estable a largo plazo, esto es, si su comportamiento es
asintótico. Así, cuanto más estable sea más más convergente será el estimador. Para ello es
necesario hacer muchas estimaciones a lo largo del tiempo.

2
Por ejemplo, si (X1… ; Xn) es una muestra aleatoria de una población n, con esperanza µ y varianza
entonces, si consideramos que el estimador cumple las propiedades anteriores:

La esperanza de la media muestral es la esperanza de la población.

La Esperanza de la varianza muestral es la varianza de la población.


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

3. Estimación puntual de parámetros

En este apartado se observarán los cálculos más habituales de los estimadores cuando se estiman de
forma puntual. Mediante esta operación, Cuando asignamos al parámetro poblacional desconocido el
valor numérico que toma el estadístico para una determinada muestra, decimos que dicho estadístico
es un estimador del parámetro poblacional.

Veremos los cálculos más importantes para estimar de forma puntual una proporción (cuando el
parámetro sigue una distribución Binomial (n, p)) y las medias y desviaciones típicas (cuando el
parámetro sigue una distribución Normal N(0,1))

Tabla 1. Estimadores puntuales. Elaboración propia.


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

El valor obtenido al aplicar el estimador puntual a los datos de la muestra es la estimación puntual
del parámetro poblacional.

Sin embargo, aunque la estimación puntual proporciona un valor aproximado para el parámetro
poblacional θ, no informa sobre la precisión con la que se estima el parámetro. Además, si tenemos
dos muestras extraídas de una misma población, es bastante probable que las estimaciones realizadas
a partir de cada una de ellas sobre un parámetro poblacional sean distintas.

Nos encontramos en este caso con un problema, ¿qué estimación consideramos? Este problema se
resuelve con el cálculo de parámetros a través de la estimación por intervalos de confianza

4. Estimación por intervalos de confianza

La estimación puntual de un parámetro no resulta de mucho valor si no se posee alguna medida del
posible error cometido en dicha estimación.

Estamos ante un caso similar al de las estimaciones puntuales: a partir de una muestra aleatoria
simple (X1….: ; Xn) de la variable X se quieren calcular los parámetros, pero esta vez teniendo den
cuenta que se quiere tener un nivel de confianza de que ese estimador representa al parámetro
poblacional.

Por tanto, Se dispone de una muestra aleatoria de una característica X de la población objeto de
estudio. Si esta característica puede ser modelizada mediante un modelo de probabilidad el cual
tiene función de masa Pθ(X) (si nos encontramos en el caso discreto), o Fθ (X) (si nos encontramos en
el caso continuo). Nuestro objetivo será conocer el valor del parámetro o parámetros desconocidos
que representamos por θ a través de un intervalo con un determinado nivel de confianza. Obsérvese
que no buscamos un punto, sino un intervalo en el que estemos relativamente “seguros” de que caerá
el parámetro poblacional.

Por tanto, en torno al parámetro se construye un intervalo de confianza. Podemos definir el Intervalo
de confianza como un rango de valores en el que esperamos que esté el parámetro poblacional, con
cierta probabilidad, que llamamos nivel de confianza. El nivel de confianza, por su parte, es la
probabilidad de que el parámetro poblacional esté entre dos valores en torno al estimador.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Figura 2. Curva normal con nivel de confianza. Elaboración propia

El intervalo de confianza depende dependerá de:

a) Margen de error €

Se puede fijar de forma arbitraria, en función del criterio del investigador. Lo más habitual, en el
muestreo de proporciones, es que esté entre ±1% y ±3%. En el muestreo de medias no hay una regla
estable, pues no se puede fijar previamente a la investigación.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

b) Nivel de confianza (1-α)

Es la probabilidad de que el parámetro estimado esté contenido en el intervalo construido a partir de


la estimación y del error probabilístico. Sabiendo que la distribución del error empírico es normal,
este rango se establece a partir de unidades de desviación típica, que en este caso es el error típico.
En las distribuciones normales, sabemos que a cada porcentaje de distribución normal corresponde
cierta cantidad deunidades de desviación típica. Por convención, los niveles de confianza empleados
(y su valor Z o errores típicos) son:

- al 90%, que corresponden 1,645 errores típicos

- al 95%, que corresponden 1,96 errores típicos

- al 95,5%, que corresponden 2 errores típicos

- al 99%, que corresponden 2,575 errores típicos

Si se aumenta el nivel de confianza, aumenta la amplitud del intervalo, por lo que tenemos más
seguridad de que el parámetro caerá en ese intervalo, pero ese intervalo es de gran amplitud por lo
que cuanto mayor es el intervalo más imprecisa es nuestra estimación.

c) Desviación típica

Depende de la población y lo mejor es que sea la menor posible. Con la desviación típica se calcula el
error estándar, que viene a ser el cociente entre la desviación típica y la raíz cuadrada de n, tal y
como se expuso en el tema 1.

Se mostrarán los cálculos de dos tipos de intervalos de confianza:

 Intervalos de confianza para la media. En esta tipología existen las particularidades de


cuando conocemos la varianza poblacional y cuando la desconocemos (y a su vez, esta última
en dos tipologías, cuando tenemos una n>30 y cuando tenemos una n<30).
 Intervalos de confianza para proporciones, cuando la distribución sigue una distribución
binomial.
 Intervalos de confianza para la distribución Poisson, cuando la distribución sigue una
distribución Poisson.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

De esta forma, a modo de resumen, queremos estimar los siguientes parámetros:

Tabla 2. Cantidades pivotales y condiciones. Elaboración propia.

Las cantidades pivotales son funciones de la muestra aleatoria que no dependen del parámetro y que
son fundamentales para el cálculo de los intervalos de confianza.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Y a su vez, sus cálculos de los intervalos de confianza serían los siguientes:


S2= Cuasivarianza muestral=

Tabla 3. Intervalos de confianza según distribución y parámetros conocidos. Elaboración propia.

De esta forma, los pasos para calcular el intervalo de confianza serían:

‐ Buscar ante qué población estamos (Normal, Binomial) y el tamaño de n.


‐ Buscar el nivel de confianza exigido.
‐ Buscar el parámetro a estimar (ojo con varianza y desviación típica, atentos a los datos que
nos dan)
‐ Aplicar el intervalo de confianza con las cantidades pivotales
‐ Interpretar los resultados.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

5. Estimación de intervalos de confianza para la media

5.1. Con µ desconocida y  conocida

Supongamos una muestra de cuatro observaciones {1,2; 3,4; 0,6; 5,6}, extraída de una población
normal de media desconocida µ y desviación estándar conocida 3. La media de las observaciones
muestrales es 2,7.

Queremos determinar los límites superior e inferior entre los cuales queda comprendido, con
bastante seguridad, el valor verdadero del parámetro μ con un nivel de confianza del 95%.

Aplicamos cantidad pivotal que sigue la distribución

μ , μ

√ √

Aplicamos el intervalo de confianza exigido:

∝/ μ ∝/
√ √

Calculamos los parámetros exigidos

Zα/2

1-α=0,95

α/2=0,025

Z0,975=1,96 => Buscado en la tabla Normal

Por lo que:

∝/ 1,96
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Aplicamos el Intervalo de Confianza exigido (despejando la µ utilizando la cantidad pivotal:

, , μ , , ,
√ √

, , μ , , =0,95

, μ , =0,95

Interpretar el resultado

El parámetro µ se situará en el intervalo [-0,24, 5,64] con un 95% de confianza, o lo que es lo


mismo, con un 95% de confianza.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

5.2. Con µ conocida y  desconocida

Se desea estimar con un nivel de confianza del 95 % la talla media de los hombres de 18 o más años
de un país. Suponiendo que desconocemos la desviación típica de las tallas en la población vale 4,
obtenga el intervalo de confianza con una muestra de n=15 hombres seleccionados al azar, cuyas
alturas son: 167 167 168 168 168 169 171 172 173 175 175 175 177 182 195.

Aplicamos cantidad pivotal que sigue la distribución

μ
~
/√

;∝/

Aplicamos el intervalo de confianza exigido

;∝/ μ ;∝/
√ √

Calculamos los parámetros exigidos

Media muestral:

= 173,47

Cuasidesviación típica de la muestra

S=7,36
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

T1-α/2

1-α=0,95

α/2=0,025

t14-1, 0,975=2,14 => Buscado en la tabla T student

Por lo que:

T1-α/2 2,14

Aplicamos el Intervalo de Confianza exigido (despejando la µ utilizando la cantidad pivotal:

;∝/ √ μ ;∝/ √ =

, ,
, , μ , ,
√ √

, ,
, , μ , ,
√ √

Interpretar el resultado

El parámetro µ se situará en el intervalo [169,4; 177,54] con un 95% de confianza, o lo que es lo


mismo, con un 95% de probabilidad.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

5.3. Cálculos de tamaños muestrales mínimos

También podemos utilizar las fórmulas dispuestas anteriormente para calcular el tamaño muestral
mínimo para no superar una determinada cota de error.

Supongamos el siguiente ejemplo:

Deseamos estimar un tamaño maestral mínimo de hombres para estimar la media poblacional con un
margen de error inferior a 0,5 cm., suponiendo que la suponiendo que la desviación típica de las
tallas en la población de hombres vale 4 cm y el nivel de confianza de un 99%.

Aplicamos la fórmula para calcular la cota de error (a partir de las fórmulas de la tabla 3):

∝/

Que a su vez nos sirve para calcular la fórmula de la n despejando:

∝/ ∗

Calculamos los parámetros exigidos

Zα/2

1-α=0,99

α/2=0,005

Z0,995=2,58 => Buscado en la tabla Normal

Por lo que:

∝/ 2,58
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Aplicamos la fórmula

∝/ ∗

, ∗
,

Interpretar el resultado

El tamaño muestral mínimo será 425 hombres (siempre se redondea la n calculada).


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

6. Intervalos de confianza para proporciones

Se utiliza para calcular las proporciones de poblaciones que siguen una distribución Binomial (n, p).

Ejemplo:

En una muestra de 105 comercios seleccionados al azar de una zona, se observa que 27 de ellos han
tenido pérdidas en este mes. Obtenga un intervalo de confianza para la proporción de comercios en
la zona con pérdidas a un nivel de confianza del 90 %.

Identificar el intervalo de confianza en cuestión

Calcular lo que falta en la fórmula:

Calcular p

é
,

Calcular

(1- )= 1-0,26= 0,74


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Calcular Zα/2

1-α=0,90

α/2=0,05

Z0,95=1,64 => Buscado en la tabla Normal

Por lo que:

∝/ 1,64

Sustituir en la fórmula

, ∗ , , ∗ ,
, , , ,

, , , ,

, , ]

Interpretación

La proporción poblacional de los comercios con pérdidas estará entre un 19% y un 33% con un 90% de
confianza.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

6.1. Cálculo de tamaños muestrales mínimos

También podemos utilizar las fórmulas dispuestas anteriormente para calcular el tamaño muestral
mínimo para no superar una determinada cota de error. En general, suele utilizarse un valor por
defecto de error, que es p=q=0,05, puesto que supone la mayor garantía de aleatoriedad del
fenómeno a estudiar.

Supongamos el siguiente ejemplo:

Determine el tamaño muestral necesario de una zona de comercios para que la cota de error no
supere el 1%, con un 80% de confianza.

Aplicamos la fórmula para calcular la cota de error (a partir de las fórmulas de la tabla 3)


∝/

Que a su vez nos sirve para calcular la fórmula de la n despejando:

∝/ ∗ ∗

Calculamos los parámetros exigidos

Zα/2

1-α=0,80

α/2=0,10

Z0,90=1,28 => Buscado en la tabla Normal

Por lo que:

∝/ 1,28
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Aplicamos la fórmula

∝/ ∗ ∗

, ∗ ∗ ∗ ∗
,

Interpretar el resultado

El tamaño muestral mínimo será 4096 comercios.


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

7. Intervalos de confianza para una variable Poisson

Se supone que el número de piezas defectuosos en una empresa a lo largo de un días sigue una
distribución de Poisson. Elegidos al azar 95 días en los que se ha editado dicho periódico, se
obtuvieron los siguientes resultados:

Número de
periódicos 0 1 2 3 4 5
defectuosos

Número de
40 30 15 7 2 1
días

Hallar el intervalo de confianza al 90% para el número medio de piezas defectuosas por día.

Tenemos una variable X que cuenta el número de periódicos defectuosos en la tirada de un día.

Esta variable X sigue una distribución de Poisson de parámetro λ, P(λ), y queremos dar un intervalo
de confianza para estimar el parámetro λ, que representa de la media de periódicos defectuosos
para esta población, en función de los datos obtenidos de forma experimental con la muestra
recogida, y con un nivel de confianza del 90%
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Identificar la fórmula del intervalo de confianza (para que sigue Poisson)

Calculamos los parámetros exigidos

Zα/2

1-α=0,9

α/2=0,05

Z0,95=1,645 => Buscado en la tabla Normal

Por lo que:

∝/ 1,645

Media de la muestra obtenida (media experimental)

∗ ∗ ∗ ∗ ∗ ∗ ∗
,
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Aplicamos la fórmula

, ,
, , , ,

, , , ,

, ,

Interpretación

Es decir, de cada 100 muestras que tomemos de esta población, en 90 de ellas la media λ se
encontrará en este intervalo, es decir, que la media de piezas defectuosas estará entre 0,82 y 1,15.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

8. Intervalos de confianza con dos poblaciones independientes

A veces también es útil conocer si las medias o proporciones de dos poblaciones son iguales o no.
Por ejemplo, si queremos calcular si la talla media de mujeres de España y mujeres de Portugal es
la misma, extraeremos dos muestras de mujeres de ambos países y las compararemos a través de la
inferencia estadística (utilizando intervalos de confianza).

Cuando se trata de dos poblaciones, con (X1, … , Xn), (Y1, … , Yn) muestras aleatorias independientes
de X e Y respectivamente, los más utilizados son:

Tabla 4. Intervalos de confianza para dos poblaciones independientes. Elaboración propia.


BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

En el caso de dos poblaciones, podemos considerar μ1 = μ2 o p1 = p2 cuando el intervalo de


confianza asociado en el caso correspondiente contiene al 0, y σ²l = σ²2 cuando el intervalo
asociado contiene al 1.

Veamos un ejemplo:

En un proceso de control de calidad se intenta comparar la producción media de 2 máquinas A y B.


Para ello se realiza un seguimiento de ambas máquinas durante 100 días obteniéndose
producciones medias de 12 y 9 unidades con varianzas de 6 y 4 respectivamente. Suponiendo
normalidad en las producciones, comparar si con una confianza del 95 % se puede asegurar que las
producciones medias en ambas máquinas coinciden o no.

Solución

Asignamos los datos relativos a la máquina A a la variable X y los relativos a la máquina B a la


variable Y.

Suponemos que los datos de cada población siguen una distribución Normal y queremos ver si
existe diferencia entre ambas producciones medias, para lo cual hallaremos el intervalo de
confianza para la diferencia de medias con dos poblaciones Normales e independientes y
consideramos las varianzas dadas con varianzas poblacionales conocidas.

Si dicho intervalo contiene al 0 diremos que no existe diferencia significativa entre ambas
medias, si es totalmente positivo diremos que la media correspondiente a la variable X es mayor
que la correspondiente a la variable Y, y si es totalmente negativo, diremos que la media
correspondiente a la variable Y es mayor que la correspondiente a la variable X.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Dicho intervalo viene dado por (Mirar Fórmulas Intervalos de Confianza Punto 4 del ANEXO)

En este caso, conocemos la 1 y 2, por lo que aplicaríamos las fórmulas correspondientes:

,
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

, , , ]

, , ,

Se puede afirmar, con un 95% de confianza, que la máquina A tiene una mayor producción que la
máquina b (puesta en segundo lugar), dado que en el intervalo no se encuentra el valor 0.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

V. RESUMEN

En esta unidad hemos procedido a comenzar a implementar la inferencia estadística. En primer lugar,
expusimos las propiedades de los estimadores para después realizar la estimación puntual de parámetros
poblacionales a raíz de una muestra extraída de la población. Dado que la simple estimación puntual no nos da
demasiada seguridad a la hora de interpretar los datos poblacionales, también procedimos a la explicación de
cómo calcular los intervalos de confianza donde se ubicaría el parámetro poblacional, todo ello para la media,
la varianza y las proporciones. Por último, establecimos cómo comparar parámetros poblacionales de dos
poblaciones independendie3ntes utilizando los intervalos de confianza.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

VI. GLOSARIO

Distribución
La distribución de un estadístico calculada a partir de los valores de la
muestral
muestra.

Es una función de los valores muestrales que no


Estadístico
depende de ningún parámetro desconocido. Los
estadísticos más utilizados son: media muestral,
varianza muestral y cuasivarianza muestral.

Es un número que se utiliza para aproximar el verdadero valor del


Estimador puntual
parámetro poblacional.

Es la probabilidad de que el intervalo contenga


Nivel de confianza al parámetro poblacional.
de un intervalo
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

VII. BIBLIOGRAFIA

Bibliografía Básica:

Amón, Jesús (1988): Estadística para Psicólogos 2 , Sexta edición, Madrid: Pirámide.

Aron, Arthur y Elaine Aron (2001): Estadística para la psicología, Segunda edición, Buenos Aries: Pearson.

Pérez López, César (2003): Estadística. Problemas resueltos y aplicaciones. Madrid Pearson Prentice Hall.

Quesada Paloma, V., Isidoro Martín, A., López Martín, L.A. (2005): Curso y ejercicios de estadística:
aplicación a las ciencias biológicas, médicas y sociales. Madrid: Alhambra.

Bibliografía complementaria:

Ruiz-Maya, L., Martín Pliego, F.J. (2001): Estadística. II, Inferencia. Editorial AC. Madrid.

Milton, J.S., Arnold, J.C. (2003): Probabilidad y estadística con aplicaciones para ingeniería y ciencias
computacionales. McGraw-Hill. México
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

VIII. ACTIVIDADES

A continuación se exponen una batería de preguntas tipo test en las que solamente hay una solución correcta
(soluciones más abajo).

1. Un estimador es….
a. Un estadístico utilizado para estimar parámetros que conocemos de la población.
b. Un estimador es un estadístico usado para estimar un parámetro desconocido de la población.
c. Una función logarítmica compuesta por dos factores.

2. Las características de un buen estimador son:


a. La única característica es que sea eficiente.
b. Realmente no se pueden obtener buenos estimadores.
c. Carencia de sesgo, consistencia, eficiencia y convergencia.

3. ¿Qué diferencia hay entre la estimación puntual y por intervalos de confianza de parámetros
poblacionales?
a. Que la estimación puntual nos ofrece un único valor para el parámetro poblacional y la
estimación por intervalos de confianza nos ofrece un valor del parámetro asociado a un error
de estimación
b. Que la estimación por intervalos de confianza nos ofrece un único valor para el parámetro
poblacional y la estimación puntual nos ofrece un valor del parámetro asociado a un error de
estimación
c. No hay diferencias perceptibles entre ambos tipos de estimación.

4. Un intervalo de confianza es…


a. Un rango de valores en el que esperamos que esté el parámetro poblacional, con cierta
probabilidad, que llamamos nivel de confianza.
b. Un rango de valores en el que esperamos que esté la media poblacional, pues para las
proporciones no es posible calcularlo.
c. Un tipo de muestreo.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

5. ¿De cuál de estos factores no dependerá el cálculo de un intervalo de confianza?


a. Margen de error.
b. Desviación típica.
c. Prueba U de Mann-Whitney.

6. ¿Qué es el nivel de confianza?


a. Es la probabilidad de que el parámetro estimado esté contenido en el intervalo construido a
partir de la estimación y del error probabilístico.
b. Es la confianza que tenemos en un investigador.
c. Es un parámetro que no tiene relación ni con el error ni con la estimación.

7. ¿Se pueden estimar los intervalos de confianza para las proporciones y las medias?
a. No, únicamente para las proporciones.
b. No, únicamente para las medias.
c. Sí, tanto para las proporciones como para las medias.

8. ¿Se pueden estimar intervalos de confianza para dos poblaciones independientes?


a. Sí ,para estimar si las medias o proporciones de dos poblaciones son iguales o no.
b. Sí, pero no para estimar si las medias o proporciones de dos poblaciones son iguales o no.
c. No, en ningún caso.

9. El sesgo de un estimador es…


a. La diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del
parámetro a estimar.
b. Una característica de un buen estimador.
c. El error al aplicar un muestreo estratificado.

10. ¿Qué es más útil en el cálculo de parámetros poblacionales: la utilización de intervalos de confianza o
la estimación puntual?
a. La estimación puntual, ya que nos da un valor exacto.
b. La estimación por intervalos de confianza ya que tenemos información sobre el error que
cometemos en la estimación.
c. Ninguno de los dos procedimientos es válido para estimar parámetros poblacionales.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Soluciones a las preguntas:

Pregunta 1. B)

Pregunta 2. C)

Pregunta 3. A)

Pregunta 4. A)

Pregunta 5. C)

Pregunta 6. A)

Pregunta 7. C)

Pregunta 8. A)

Pregunta 9. A)

Pregunta 10. B)

A continuación se muestran problemas sobre cálculo de intervalos de confianza para practicar:

1. Determinar el intervalo de confianza al 80% para la nota media de una asignatura si se sabe
que para una muestra de 30 alumnos la media ha sido 8.83 y la desviación típica 1.92.

2. Se supone que el nº de piezas defectuosas en una fábrica sigue una distribución de Poisson. Elegidos
al azar 95 días en los que ha habido producción de dichas piezas, se obtuvieron los siguientes
resultados:

Nº de piezas defectuosas: 0 1 2 3 4 5

40 30 15 7 2 1

Hallar el intervalo de confianza al 90% para el nº medio de piezas defectuosas por día.
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

3. En una población, la altura de los individuos sigue una distribución Normal (µ, σ = 5). Hallar
el tamaño de la muestra para estimar µ con un error inferior a ±2 cm. y un nivel de
confianza 0.9.

4. Se sospecha que existe una diferencia significativa entre los porcentajes de piezas
defectuosas elaboradas por 2 máquinas A y B en un proceso de producción industrial. Para
salir de dudas, se toma una muestra aleatoria de 300 piezas de la máquina A, de las cuales
27 han resultado defectuosas. Del mismo modo, tomamos una muestra de 400 piezas de la
máquina B, de las cuales 32 son defectuosas. ¿Qué nos indican estos resultados al 95% de
confianza?
BLOQUE II. TEMA 3
TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

IX. ANEXOS

Anexo 1. Intervalos de confianza para una población


TEMA 3
Estimación de parámetros. Estimación puntual y por intervalos de
confianza

Anexo 1. Intervalos de confianza para dos poblaciones independientes

40

También podría gustarte