Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura Fundamental
Contenido
1 Introducción
2 Tipos de muestreo
Referencias
Algo que la mayorı́a de las personas hace cotidianamente es generalizar el conocimiento que tiene respecto a un tema
basado en las experiencias adquiridas. Por ejemplo, si una persona se desplaza de un punto a otro caminando y ve
a otras personas que se dirigen a su mismo punto de llegada tomar una ruta especı́fica, entonces esa persona podrı́a
intuir que ese camino es el que lo conduce más rápido a su destino. Sin embargo, esto presenta un inconveniente y es
que este tipo de conclusiones pueden estar parcializadas por el observador, pues está construyendo una conclusión
basada únicamente en las observaciones que hizo. Esto implica un reto cuando se quiere estandarizar (generalizar)
el conocimiento adquirido o experimentado por diferentes observadores que no pertenecen a las mismas disciplinas
y posiblemente habitan distintas regiones. Como una solución a este problema aparece la estadı́stica inferencial,
la cual emplea métodos y herramientas que permiten establecer conclusiones objetivas.
Para resolver esta pregunta comenzaremos por dar unas definiciones básicas que serán nuestro soporte durante
todo el módulo y posteriormente presentaremos otros conceptos.
• Dato es lo que resulta de medir a un individuo (no necesariamente biológico) (Triola, 2004).
• Estadı́stica es una colección de métodos para planear experimentos, obtener datos y después organizar,
resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en dichos datos (Triola, 2004).
• Población es la colección completa de todos los elementos (puntuaciones, personas, mediciones, etc.) a
estudiar. Se dice que la colección es completa, pues incluye a todos los sujetos que se estudiarán (Triola,
2004).
• Censo es la colección de datos de cada uno de los miembros de una población (Anderson, Sweeney, &
Williams, 2008).
• Muestra es un subconjunto de miembros seleccionados de una población (Triola, 2004).
• Parámetro es una medida que resume información de la población (Anderson, Sweeney, & Williams, 2008).
• Estadı́stico es una medida que resume información en la muestra (Anderson, Sweeney, & Williams, 2008).
2. Tipos de muestreo
Existen dos paradigmas para seleccionar muestras: el muestreo aleatorio (o probabilı́stico) y el muestreo no aleatorio
(o no probabilı́stico). Estos tipos de muestreo se usan para estimar parámetros poblacionales que por lo general
corresponden al total, al promedio y a la proporción poblacional.
POLITÉCNICO GRANCOLOMBIANO 1
2.1. Muestreo aleatorio
Un muestreo aleatorio permite seleccionar muestras de tal forma que existe un mecanismo denominado proba-
bilı́stico. Según Bautista (1998), para denominarse de esta manera debe cumplir los siguientes requerimientos:
• Se puede definir el conjunto de muestras posibles que se derivan del proceso de selección propuesto.
• El proceso de selección garantiza que todo elemento de la población tiene una probabilidad mayor a cero de
ser incluido en alguna muestra.
• El proceso de selección propuesto consiste en un mecanismo aleatorio que garantiza que cada muestra s
recibe exactamente la probabilidad p(s) de ser seleccionada (p.3).
Este tipo de muestreo consiste en seleccionar n elementos de una población de tamaño N. Cada elemento tiene
la misma probabilidad de ser seleccionado y cada extracción que se haga tiene reemplazamiento, o sea que un
elemento que ha sido seleccionado se vuelve a incluir. Por lo tanto, cada elemento tiene una probabilidad de
extracción constante igual a 1/N (Bautista, 1998).
Ejemplo: se tiene un juego de loterı́a de tres cifras, en este caso N = 10 y n = 3. Hay 1000 muestras cada una con
probabilidad de selección 1/1000.
Ejemplo: se tiene una población de tamaño 5 de los tiempos de espera en minutos (5,15,18,30,20) en las estaciones
del sistema de trasporte público colectivo y se quieren tomar muestras de tamaño 2. La cantidad de muestras es
de 25 y la lista es la siguiente:
Tabla 1: muestras de tamaño 2, con reemplazamiento del tiempo de espera en minutos, en las estaciones
del sistema de transporte público.
Muestra X1 X2 Probabilidad
1 5 5 0,04
2 15 5 0,04
3 18 5 0,04
4 30 5 0,04
5 20 5 0,04
6 5 15 0,04
7 15 15 0,04
POLITÉCNICO GRANCOLOMBIANO 2
Muestra X1 X2 Probabilidad
8 18 15 0,04
9 30 15 0,04
10 20 15 0,04
11 5 18 0,04
12 15 18 0,04
13 18 18 0,04
14 30 18 0,04
15 20 18 0,04
16 5 30 0,04
17 15 30 0,04
18 18 30 0,04
19 30 30 0,04
20 20 30 0,04
21 5 20 0,04
22 15 20 0,04
23 18 20 0,04
24 30 20 0,04
25 20 20 0,04
Ahora, se pretende seleccionar n elementos de una población de tamaño 1, 2, .., N sin reemplazamiento. Esto
significa que para la primera extracción todos los elementos tienen una probabilidad de selección de 1/N , para la
segunda selección el primer elemento extraı́do tiene probabilidad cero y los demás tienen probabilidad 1/(N − 1).
Este proceso continúa de la
misma manera hasta obtener los n elementos de la muestra. Todas la muestras tienen
N
probabilidad igual a 1/ n .
Ejemplo: consideremos una población correspondiente a los tiempos de transporte de 10 personas a su casa y
tomemos muestras de dos elementos. La cantidad de muestras que se va a obtener es de 45.
Tabla 2: muestras de tamaño 2 sin reemplazamiento, del tiempo de espera en minutos, en las estaciones
del sistema de transporte público.
Muestra X1 X2 Probabilidad
1 60 120 0,02
2 60 55 0,02
3 60 15 0,02
4 60 18 0,02
5 60 30 0,02
6 60 40 0,02
7 60 50 0,02
8 60 20 0,02
POLITÉCNICO GRANCOLOMBIANO 3
Muestra X1 X2 Probabilidad
9 60 25 0,02
10 120 55 0,02
11 120 15 0,02
12 120 18 0,02
13 120 30 0,02
14 120 40 0,02
15 120 50 0,02
16 120 20 0,02
17 120 25 0,02
18 55 15 0,02
19 55 18 0,02
20 55 30 0,02
21 55 40 0,02
22 55 50 0,02
23 55 20 0,02
24 55 25 0,02
25 15 18 0,02
26 15 30 0,02
27 15 40 0,02
28 15 50 0,02
29 15 20 0,02
30 15 25 0,02
31 18 30 0,02
32 18 40 0,02
33 18 50 0,02
34 18 20 0,02
35 18 25 0,02
36 30 40 0,02
37 30 50 0,02
38 30 20 0,02
39 30 25 0,02
40 40 50 0,02
41 40 20 0,02
42 40 25 0,02
43 50 20 0,02
44 50 25 0,02
45 20 25 0,02
POLITÉCNICO GRANCOLOMBIANO 4
Ejemplo: suponga una población de 15 ciudadanos y su tiempo (en minutos) en la espera de un bus del sistema
de transporte público.
• Se hace una enumeración de cada uno de los elementos de la población, en este caso de cada trabajador.
• Para la selección de los elementos que van a conformar la muestra, se utiliza la generación de números
aleatorios de Excel.
POLITÉCNICO GRANCOLOMBIANO 5
Para esto se elige la función fx , y aleatorio entre.
Aquı́ se genera el primer número aleatorio y el resultado se extiende hasta obtener los cinco números generados:
POLITÉCNICO GRANCOLOMBIANO 6
Número Tiempo (Minutos)
6 20
7 13
8 23
9 30
10 35
11 30
12 27
13 25
14 26
15 29
En el muestreo por conglomerados se tiene que los elementos que pertenecen a la muestra son subconjuntos
de la población, pero en este caso, a diferencia del muestreo estratificado, los elementos que pertenecen a cada
subconjunto no necesariamente deben ser parecidos entre sı́, pero sı́ se requiere saber cuáles son los elementos que
pertenecen al conglomerado (Bautista, 1998).
Este tipo de muestreo no se considera un tipo de muestreo como tal, pero es muy importante por su uso en
problemas cotidianos. Puede ver de la siguiente forma: se tiene una población que se divide en subconjuntos, con
una estructura donde los elementos que componen cada conjunto son muy parecidos, pero los subconjuntos a su
vez son diferentes entre sı́, es decir son disyuntos. En la siguiente gráfica se puede observar este comportamiento
(Bautista, 1998).
POLITÉCNICO GRANCOLOMBIANO 7
2.2. Muestreo no aleatorio
El muestreo no aleatorio es aquel que no tiene un mecanismo probabilı́stico de selección de los elementos en la
muestra. Esto se debe a algunos casos particulares: estudios en los que no se puede realizar una selección aleatoria,
o donde los datos que se van a recolectar pueden generar sesgos en las respuestas, o en poblaciones en las que no
se sabe cuáles son todos los elementos que las componen. Por consiguiente, en el muestreo no aleatorio no se puede
hacer inferencias sobre la población basadas en la muestra que se tomó. Dentro de este tipo de muestreo tenemos
el muestreo por conveniencia y el muestreo subjetivo (Anderson, Sweeney, & Williams, 2008).
Este tipo de muestreo se denomina ası́ porque, como su nombre lo indica, los elementos que componen la muestra
no se escogen de manera aleatoria sino por conveniencia, es decir, dichos elementos se incluyen por el interés
que existe en medirlos. Por ejemplo, si se quiere saber qué personas consumen sustancias psicoactivas mientras
conducen un vehı́culo, difı́cilmente se sabrá al preguntar por medio de una encuesta a conductores. Por el contrario,
si el responsable de hacer el estudio conoce quiénes presentan este tipo de conducta, puede ir directamente a ellos
y caracterizar a los individuos de esta muestra (Anderson, Sweeney, & Williams, 2008).
Este tipo de muestreo debe su nombre a que los elementos que se incluyen en la muestra se toman con base
en el criterio de quien recolecta los datos. Por ejemplo, si se está investigando cuáles son las caracterı́sticas
socioeconómicas de las personas que utilizan motocicleta en las ciudades, un investigador podrı́a entrevistar a los
que considera representan a los ciudadanos que utilizan este medio de transporte con base en la percepción que él
tiene de los motociclistas (Anderson, Sweeney, & Williams, 2008).
El plan de muestreo está concebido como el proceso metodológico que se sigue para obtener una muestra. Es
necesario antes de esto tener claridad sobre los requerimientos del problema que se va a resolver y, una vez
establecido un plan, el proceso de recolección debe estar acompañado de una estrategia crı́tica que minimice los
sesgos y errores, los cuales pueden, en el peor de los casos, invalidar las conclusiones obtenidas. Es muy importante,
por ejemplo, tener en cuenta la tasa de no respuesta para ası́ poder hacer los ajustes correspondientes. En cuanto
a las formas de recolectar datos, cabe decir que una de las más comunes es por medio de encuestas (Bautista,
1998).
POLITÉCNICO GRANCOLOMBIANO 8
1. Definir los objetivos del problema a resolver.
3. Hacer un presupuesto para garantizar que el estudio sea viable en términos de costos (tiempo, dinero)
Uno de los teoremas más importantes dentro de la estadı́stica es el teorema del lı́mite central. Su importancia
radica en que independientemente de la distribución bajo la cual se comporte un conjunto de datos, el promedio
de las muestras converge en una distribución normal. Por consiguiente, a través del promedio obtenido en las
muestras se puede llegar al promedio de la población (Anderson, Sweeney, & Williams, 2008).
POLITÉCNICO GRANCOLOMBIANO 9
Referencias
[2] Walpole, R. E., Myers, R. H-& Myers, S. L. (1999). Probabilidad y estadı́stica para ingenieros.
[3] Anderson, D.R & Sweeney, D.J. (20018). Estadı́stica Para Administración y Economı́a.
POLITÉCNICO GRANCOLOMBIANO 10
INFORMACIÓN TÉCNICA
Módulo: Estadı́stica II
Unidad 1: Muestreo, distribuciones muestrales y estimación
de parámetros.
Escenario 1: Estimación puntual y por intervalo
POLITÉCNICO GRANCOLOMBIANO 11