Está en la página 1de 12

Unidad 1 / Escenario 1

Lectura Fundamental

Muestreo y distribuciones muestrales

Contenido

1 Introducción

2 Tipos de muestreo

3 Plan de muestreo y etapas de un estudio por muestreo

4 Teorema del lı́mite central

Referencias

Palabras Claves: muestra, población, teorema del lı́mite central.


1. Introducción

Algo que la mayorı́a de las personas hace cotidianamente es generalizar el conocimiento que tiene respecto a un tema
basado en las experiencias adquiridas. Por ejemplo, si una persona se desplaza de un punto a otro caminando y ve
a otras personas que se dirigen a su mismo punto de llegada tomar una ruta especı́fica, entonces esa persona podrı́a
intuir que ese camino es el que lo conduce más rápido a su destino. Sin embargo, esto presenta un inconveniente y es
que este tipo de conclusiones pueden estar parcializadas por el observador, pues está construyendo una conclusión
basada únicamente en las observaciones que hizo. Esto implica un reto cuando se quiere estandarizar (generalizar)
el conocimiento adquirido o experimentado por diferentes observadores que no pertenecen a las mismas disciplinas
y posiblemente habitan distintas regiones. Como una solución a este problema aparece la estadı́stica inferencial,
la cual emplea métodos y herramientas que permiten establecer conclusiones objetivas.

¿Cómo contribuir a la solución de este tipo de situaciones desde la estadı́stica?

Para resolver esta pregunta comenzaremos por dar unas definiciones básicas que serán nuestro soporte durante
todo el módulo y posteriormente presentaremos otros conceptos.

1.1. Conceptos generales

• Dato es lo que resulta de medir a un individuo (no necesariamente biológico) (Triola, 2004).
• Estadı́stica es una colección de métodos para planear experimentos, obtener datos y después organizar,
resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en dichos datos (Triola, 2004).
• Población es la colección completa de todos los elementos (puntuaciones, personas, mediciones, etc.) a
estudiar. Se dice que la colección es completa, pues incluye a todos los sujetos que se estudiarán (Triola,
2004).
• Censo es la colección de datos de cada uno de los miembros de una población (Anderson, Sweeney, &
Williams, 2008).
• Muestra es un subconjunto de miembros seleccionados de una población (Triola, 2004).
• Parámetro es una medida que resume información de la población (Anderson, Sweeney, & Williams, 2008).
• Estadı́stico es una medida que resume información en la muestra (Anderson, Sweeney, & Williams, 2008).

2. Tipos de muestreo

Existen dos paradigmas para seleccionar muestras: el muestreo aleatorio (o probabilı́stico) y el muestreo no aleatorio
(o no probabilı́stico). Estos tipos de muestreo se usan para estimar parámetros poblacionales que por lo general
corresponden al total, al promedio y a la proporción poblacional.

POLITÉCNICO GRANCOLOMBIANO 1
2.1. Muestreo aleatorio

Un muestreo aleatorio permite seleccionar muestras de tal forma que existe un mecanismo denominado proba-
bilı́stico. Según Bautista (1998), para denominarse de esta manera debe cumplir los siguientes requerimientos:

• Se puede definir el conjunto de muestras posibles que se derivan del proceso de selección propuesto.

• A cada muestra le corresponde una probabilidad de selección p(s) conocida.

• El proceso de selección garantiza que todo elemento de la población tiene una probabilidad mayor a cero de
ser incluido en alguna muestra.

• El proceso de selección propuesto consiste en un mecanismo aleatorio que garantiza que cada muestra s
recibe exactamente la probabilidad p(s) de ser seleccionada (p.3).

2.1.1. Muestreo Aleatorio Simple (MAS)

Muestreo aleatorio simple con reemplazamiento (MCR)

Este tipo de muestreo consiste en seleccionar n elementos de una población de tamaño N. Cada elemento tiene
la misma probabilidad de ser seleccionado y cada extracción que se haga tiene reemplazamiento, o sea que un
elemento que ha sido seleccionado se vuelve a incluir. Por lo tanto, cada elemento tiene una probabilidad de
extracción constante igual a 1/N (Bautista, 1998).

Ejemplo: se tiene un juego de loterı́a de tres cifras, en este caso N = 10 y n = 3. Hay 1000 muestras cada una con
probabilidad de selección 1/1000.

Ejemplo: se tiene una población de tamaño 5 de los tiempos de espera en minutos (5,15,18,30,20) en las estaciones
del sistema de trasporte público colectivo y se quieren tomar muestras de tamaño 2. La cantidad de muestras es
de 25 y la lista es la siguiente:

Tabla 1: muestras de tamaño 2, con reemplazamiento del tiempo de espera en minutos, en las estaciones
del sistema de transporte público.

Muestra X1 X2 Probabilidad
1 5 5 0,04
2 15 5 0,04
3 18 5 0,04
4 30 5 0,04
5 20 5 0,04
6 5 15 0,04
7 15 15 0,04

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 2
Muestra X1 X2 Probabilidad
8 18 15 0,04
9 30 15 0,04
10 20 15 0,04
11 5 18 0,04
12 15 18 0,04
13 18 18 0,04
14 30 18 0,04
15 20 18 0,04
16 5 30 0,04
17 15 30 0,04
18 18 30 0,04
19 30 30 0,04
20 20 30 0,04
21 5 20 0,04
22 15 20 0,04
23 18 20 0,04
24 30 20 0,04
25 20 20 0,04

Muestreo Aleatorio simple sin reemplazamiento (M.A.S)

Ahora, se pretende seleccionar n elementos de una población de tamaño 1, 2, .., N sin reemplazamiento. Esto
significa que para la primera extracción todos los elementos tienen una probabilidad de selección de 1/N , para la
segunda selección el primer elemento extraı́do tiene probabilidad cero y los demás tienen probabilidad 1/(N − 1).
Este proceso continúa de la
 misma manera hasta obtener los n elementos de la muestra. Todas la muestras tienen
N
probabilidad igual a 1/ n .

Ejemplo: consideremos una población correspondiente a los tiempos de transporte de 10 personas a su casa y
tomemos muestras de dos elementos. La cantidad de muestras que se va a obtener es de 45.

Tabla 2: muestras de tamaño 2 sin reemplazamiento, del tiempo de espera en minutos, en las estaciones
del sistema de transporte público.
Muestra X1 X2 Probabilidad
1 60 120 0,02
2 60 55 0,02
3 60 15 0,02
4 60 18 0,02
5 60 30 0,02
6 60 40 0,02
7 60 50 0,02
8 60 20 0,02

POLITÉCNICO GRANCOLOMBIANO 3
Muestra X1 X2 Probabilidad
9 60 25 0,02
10 120 55 0,02
11 120 15 0,02
12 120 18 0,02
13 120 30 0,02
14 120 40 0,02
15 120 50 0,02
16 120 20 0,02
17 120 25 0,02
18 55 15 0,02
19 55 18 0,02
20 55 30 0,02
21 55 40 0,02
22 55 50 0,02
23 55 20 0,02
24 55 25 0,02
25 15 18 0,02
26 15 30 0,02
27 15 40 0,02
28 15 50 0,02
29 15 20 0,02
30 15 25 0,02
31 18 30 0,02
32 18 40 0,02
33 18 50 0,02
34 18 20 0,02
35 18 25 0,02
36 30 40 0,02
37 30 50 0,02
38 30 20 0,02
39 30 25 0,02
40 40 50 0,02
41 40 20 0,02
42 40 25 0,02
43 50 20 0,02
44 50 25 0,02
45 20 25 0,02

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 4
Ejemplo: suponga una población de 15 ciudadanos y su tiempo (en minutos) en la espera de un bus del sistema
de transporte público.

Tabla 3: tiempo de espera en minutos para una población de 15 personas.


Número Tiempo (Minutos)
1 15
2 14
3 15
4 18
5 19
6 20
7 13
8 23
9 30
10 35
11 30
12 27
13 25
14 26
15 29

Fuente: elaboración propia


Con el objeto de seleccionar una muestra aleatoria de 5 trabajadores se procede de la siguiente forma:

• Se hace una enumeración de cada uno de los elementos de la población, en este caso de cada trabajador.

• Para la selección de los elementos que van a conformar la muestra, se utiliza la generación de números
aleatorios de Excel.

Figura 1: Captura de pantalla guía excel paso 1.


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 5
Para esto se elige la función fx , y aleatorio entre.

Figura 2: Captura de pantalla guía excel paso 2.


Fuente: elaboración propia

Aquı́ se genera el primer número aleatorio y el resultado se extiende hasta obtener los cinco números generados:

Figura 3: Captura de pantalla guía excel paso 2.


Fuente: elaboración propia

Los valores aleatorios corresponden a los datos:

Tabla 4: Muestra de 5 ciudadanos seleccionados de una población de 15 personas.


Número Tiempo (Minutos)
1 15
2 14
3 15
4 18
5 19

POLITÉCNICO GRANCOLOMBIANO 6
Número Tiempo (Minutos)
6 20
7 13
8 23
9 30
10 35
11 30
12 27
13 25
14 26
15 29

Fuente: elaboración propia

2.1.2. Muestreo por conglomerados

En el muestreo por conglomerados se tiene que los elementos que pertenecen a la muestra son subconjuntos
de la población, pero en este caso, a diferencia del muestreo estratificado, los elementos que pertenecen a cada
subconjunto no necesariamente deben ser parecidos entre sı́, pero sı́ se requiere saber cuáles son los elementos que
pertenecen al conglomerado (Bautista, 1998).

2.1.3. Muestreo estratificado

Este tipo de muestreo no se considera un tipo de muestreo como tal, pero es muy importante por su uso en
problemas cotidianos. Puede ver de la siguiente forma: se tiene una población que se divide en subconjuntos, con
una estructura donde los elementos que componen cada conjunto son muy parecidos, pero los subconjuntos a su
vez son diferentes entre sı́, es decir son disyuntos. En la siguiente gráfica se puede observar este comportamiento
(Bautista, 1998).

Figura 4: Muestreo estratificado.


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 7
2.2. Muestreo no aleatorio

El muestreo no aleatorio es aquel que no tiene un mecanismo probabilı́stico de selección de los elementos en la
muestra. Esto se debe a algunos casos particulares: estudios en los que no se puede realizar una selección aleatoria,
o donde los datos que se van a recolectar pueden generar sesgos en las respuestas, o en poblaciones en las que no
se sabe cuáles son todos los elementos que las componen. Por consiguiente, en el muestreo no aleatorio no se puede
hacer inferencias sobre la población basadas en la muestra que se tomó. Dentro de este tipo de muestreo tenemos
el muestreo por conveniencia y el muestreo subjetivo (Anderson, Sweeney, & Williams, 2008).

2.2.1. Muestreo por conveniencia

Este tipo de muestreo se denomina ası́ porque, como su nombre lo indica, los elementos que componen la muestra
no se escogen de manera aleatoria sino por conveniencia, es decir, dichos elementos se incluyen por el interés
que existe en medirlos. Por ejemplo, si se quiere saber qué personas consumen sustancias psicoactivas mientras
conducen un vehı́culo, difı́cilmente se sabrá al preguntar por medio de una encuesta a conductores. Por el contrario,
si el responsable de hacer el estudio conoce quiénes presentan este tipo de conducta, puede ir directamente a ellos
y caracterizar a los individuos de esta muestra (Anderson, Sweeney, & Williams, 2008).

2.2.2. Muestreo subjetivo

Este tipo de muestreo debe su nombre a que los elementos que se incluyen en la muestra se toman con base
en el criterio de quien recolecta los datos. Por ejemplo, si se está investigando cuáles son las caracterı́sticas
socioeconómicas de las personas que utilizan motocicleta en las ciudades, un investigador podrı́a entrevistar a los
que considera representan a los ciudadanos que utilizan este medio de transporte con base en la percepción que él
tiene de los motociclistas (Anderson, Sweeney, & Williams, 2008).

3. Plan de muestreo y etapas de un estudio por muestreo

El plan de muestreo está concebido como el proceso metodológico que se sigue para obtener una muestra. Es
necesario antes de esto tener claridad sobre los requerimientos del problema que se va a resolver y, una vez
establecido un plan, el proceso de recolección debe estar acompañado de una estrategia crı́tica que minimice los
sesgos y errores, los cuales pueden, en el peor de los casos, invalidar las conclusiones obtenidas. Es muy importante,
por ejemplo, tener en cuenta la tasa de no respuesta para ası́ poder hacer los ajustes correspondientes. En cuanto
a las formas de recolectar datos, cabe decir que una de las más comunes es por medio de encuestas (Bautista,
1998).

3.1. Etapas de un estudio por muestreo

Un estudio de muestreo puede resumirse en las siguientes etapas:

POLITÉCNICO GRANCOLOMBIANO 8
1. Definir los objetivos del problema a resolver.

2. Definir la población y las variables que se van a medir.

3. Hacer un presupuesto para garantizar que el estudio sea viable en términos de costos (tiempo, dinero)

4. Determinar el tipo de muestreo a utilizar.

5. Construir los instrumentos para recolectar los datos.

6. Recolección, procesamiento y difusión de la información obtenida.

4. Teorema del lı́mite central

Uno de los teoremas más importantes dentro de la estadı́stica es el teorema del lı́mite central. Su importancia
radica en que independientemente de la distribución bajo la cual se comporte un conjunto de datos, el promedio
de las muestras converge en una distribución normal. Por consiguiente, a través del promedio obtenido en las
muestras se puede llegar al promedio de la población (Anderson, Sweeney, & Williams, 2008).

Figura 5: Teorema del lı́mite central.


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 9
Referencias

[1] Montgomery, D. C. & Runger (1996). Probabilidad y estadı́stica aplicadas a la ingenierı́a.

[2] Walpole, R. E., Myers, R. H-& Myers, S. L. (1999). Probabilidad y estadı́stica para ingenieros.

[3] Anderson, D.R & Sweeney, D.J. (20018). Estadı́stica Para Administración y Economı́a.

POLITÉCNICO GRANCOLOMBIANO 10
INFORMACIÓN TÉCNICA

Módulo: Estadı́stica II
Unidad 1: Muestreo, distribuciones muestrales y estimación
de parámetros.
Escenario 1: Estimación puntual y por intervalo

Autor: Daniel Ernesto Santiago Garnica

Asesor Pedagógico: Diana Marcela Salcedo Dı́az


Diseñador Gráfico: Jully Amanda Guzman
Corrector de estilo: Felipe Garán
Asistente: Ginna Paola Quiroga

Este material pertenece al Politécnico Grancolombiano.


Por ende, es de uso exclusivo de las Instituciones
adscritas a la Red Ilumno. Prohibida su reproducción
total o parcial.

POLITÉCNICO GRANCOLOMBIANO 11

También podría gustarte