Está en la página 1de 8

Página 1 de 8

CAPÍTULO 2: MUESTREO

En el capítulo anterior hablamos de que para tomar decisiones en Estadística primero


debemos formular una hipótesis a partir de la teoría del investigador. Una vez formulada la
hipótesis vamos a necesitar recoger información para comprobar esa hipótesis. Los datos
pueden existir de antemano o usted tendrá que recogerlos, en cualquier caso, la calidad de
la decisión que usted va a tomar, dependerá de la calidad de los datos. Suponemos que los
datos son buenos cuando reflejan la realidad que estamos investigando.
En este capítulo estudiaremos el método de muestreo aleatorio simple (m.a.s.), como el
concepto más básico de muestreo. La idea central del muestro es que nos ayuda a obtener
información acerca del un todo examinando sólo una parte o muestra. Hay otros tipos de
muestreo que por tiempo no veremos en este curso: muestreo estratificado, sistemático,
por conglomerados, etc.

¿Por qué tomar muestras?


Si queremos conocer una población, ¿Por qué no tomar una muestra de toda la población?,
¿Por qué no hacer un censo?

 Ejercicio
Considere el proceso de corregir una lectura. Lea la siguiente frase una vez y determine
cuantas veces aparece la letra "f".

FINISHED FILES ARE THE RESULT OF YEARS OF SCIENTIFIC STUDY


COMBINED WITH THE EXPERIENCE OF MANY YEARS1

Número de “efes”: ______________

¿Cuántas efes encontró?, ¿Cuántas hay?

Definición: Un Censo es una muestra de toda la población.

En Chile se realizan censos de población cada diez años. ¿Cree usted que en el último censo
pueden haber existido errores? Si la población es grande un censo puede ser
extremadamente caro. También puede ocurrir que la demora en obtener información de un
censo haga que la información ya no sea válida cuando la tenemos. Para ejemplificar otra
situación imagine que queremos tener información de la duración de lavadoras. En este
caso además tenemos que destruir la unidad para obtener la información, por lo que un
censo tampoco es posible.

1
Fuente: "The Deming route to quality and productivity" William Scherkenbach. ASQC Quality Press, 1986.
Página 2 de 8

Lenguaje de Muestreo

Definiciones:

Población es el grupo entero de objetos o individuos bajo estudio, de los cuales queremos
obtener información.

Muestra es una parte de la población de la cual obtenemos información.

Unidad es un objeto individual o persona en la población.

Variable es una característica de interés medida en cada unidad de la muestra.

El tamaño de la población se denota por la letra mayúscula N.

El tamaño de la muestra se denota por la letra minúscula n.

Tamaño de la población: N = 16

Tamaño de la muestra: n = 4

Definiciones:

Parámetro es una medida numérica que se calcularía usando todas las unidades de la
población.

Estadística es una medida numérica que se calcula de las unidades de la muestra.


Página 3 de 8

 Ejemplos
Factor Rh.
En Chile el 5,3% de la población tiene sangre factor Rh(-). En una muestra aleatoria de 400
sujetos de esa población, se encuentra que un 8,8% tiene factor Rh(-).

a) ¿cuál es el valor del parámetro?

b) ¿cuál es el valor de la estadística?

Ampolletas.
Suponga que usted esta a cargo de recibir una carga de 1000 ampolletas. Para decidir si
acepta la carga revisa 20 ampolletas y cuenta el número de ampolletas que están falladas.

Defina en este contexto:

- Población
- Unidades
- Muestra
- Variable
- Parámetro
- Estadística

 Observación
Note que un parámetro es fijo y que la estadística puede variar.

Calidad de los datos2

En toda medición, pueden existir básicamente dos tipos de errores: aleatorios y sistemático.

Definiciones:

Se define sesgo como un error sistemático. Ej. Balanza mal calibrada.

Un método de muestreo se dice sesgado si los resultados que produce difieren


sistemáticamente de los verdaderos de una población.

Una muestra por conveniencia es una muestra que consiste en unidades de la población
que son fáciles de obtener.

Una muestra de voluntarios es una muestra que consiste en unidades de la población


que eligen responder.

Las muestras por conveniencia y de voluntarios son generalmente sesgadas.

2
Se recomienda leer Capítulo 3 del libro "Bioestadística" de Erica Taucher. Editorial Universitaria, 1997.
Página 4 de 8

Tipos de Sesgos

Sesgo de selección se produce un sesgo de selección cuando el procedimiento de


muestreo tiende sistemáticamente a incluir o excluir algún tipo de unidad de la población.

Sesgo de falta de respuesta es la distorsión que se provoca cuando gran parte de la


muestra seleccionada no responde o se niega a responder, y estas personas tienden a ser
diferentes de los que responden.

Sesgo por tipo de pregunta es la distorsión que afecta a la respuesta que se provoca ya
sea por la forma de hacer una pregunta o por la forma de preguntarla por parte del
entrevistador.

Métodos de muestreo

Definición:

Se llama muestreo probabilístico al método de muestreo que asigna a cada unidad en la


población una probabilidad (conocida y distinta de cero) de ser seleccionado para la
muestra.

Tipos de métodos:
• Muestreo aleatorio simple;
• Muestreo aleatorio estratificado;
• Muestreo sistemático;
• Muestreo por conglomerados, y
• Muestreo multietápico.

Una muestra aleatoria simple de tamaño n es una muestra de n unidades seleccionadas


de tal manera que cada muestra posible de tamaño n tiene la misma probabilidad de ser
seleccionada.

Muestras de distinto tamaño pueden tener diferentes probabilidades de ser seleccionadas.

Para asegurarnos que toda muestra aleatoria simple tenga la misma probabilidad de ser
seleccionada necesitamos algún dispositivo confiable de selección de las unidades. Existen
métodos alternativos como la selección de fichas de una urna, la selección de papeles
numerados de una bolsa y otros. Pero un sistema confiable y seguro que siempre funciona
es la tabla de números aleatorios.
Página 5 de 8

Tabla de Números aleatorios.

Una tabla de números aleatorios es una lista de dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 y tiene


las siguientes propiedades:

1. Cualquier dígito en cualquier posición de la tabla tiene la misma probabilidad de ser 0,


1, ..., 9.
2. Los dígitos en posiciones diferentes son independientes, en el sentido de que el
conocimiento de algunos números de la tabla no da información acerca de otros
números de la tabla.

Usaremos la tabla de números aleatorios para seleccionar una muestra aleatoria simple
(m.a.s.).

Suponga que tenemos N=50 unidades en la población, saque una muestra aleatoria simple
de tamaño n=5.

Paso 1: Asigne ETIQUETAS: Dé a cada unidad en la población un número, etiqueta o


identificación. Todas las etiquetas deben tener el mismo número de dígitos. Como tenemos
50 unidades y 50 tiene dos dígitos, todas las unidades tienen que tener dos dígitos.

Unidad Ident Unidad Ident Unidad Ident Unidad Ident Unidad Ident
Unidad 1 01 Unidad 11 11 Unidad 21 21 Unidad 31 31 Unidad 41 41
Unidad 2 02 Unidad 12 12 Unidad 22 22 Unidad 32 32 Unidad 42 42
Unidad 3 03 Unidad 13 13 Unidad 23 23 Unidad 33 33 Unidad 43 43
Unidad 4 04 Unidad 14 14 Unidad 24 24 Unidad 34 34 Unidad 44 44
Unidad 5 05 Unidad 15 15 Unidad 25 25 Unidad 35 35 Unidad 45 45
Unidad 6 06 Unidad 16 16 Unidad 26 26 Unidad 36 36 Unidad 46 46
Unidad 7 07 Unidad 17 17 Unidad 27 27 Unidad 37 37 Unidad 47 47
Unidad 8 08 Unidad 18 18 Unidad 28 28 Unidad 38 38 Unidad 48 48
Unidad 9 09 Unidad 19 19 Unidad 29 29 Unidad 39 39 Unidad 49 49
Unidad 10 10 Unidad 20 20 Unidad 30 30 Unidad 40 40 Unidad 50 50

Paso 2: Use la TABLA: Empezando en un lugar escogido al azar lea grupos de dígitos
(dependiendo del número de dígitos en las etiquetas) de izquierda a derecha, continuando
con la línea siguiente cuando se acabe la línea que está leyendo. Si el grupo de dígitos
corresponde a una de las etiquetas, ese número identifica a una de las unidades que será
seleccionada. Si el grupo de dígitos no corresponde a una de las etiquetas o si ya fue
seleccionado, se salta al grupo siguiente.

Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 5, columna 1:

FILA 5: 37570 39975 81837 16656 06121 91782 60468 81305 49684
60672 ...

37, 57 (salto), 03, 99 (salto), 75 (salto), 75 (salto), 81 (salto), 83 (salto), 71 (salto), 66


(salto), 56 (salto), 06, 12, y 19.

La muestra seleccionada serán las unidades o sujetos con etiquetas: 37, 03, 06, 12, y 19.
Página 6 de 8

 Ejemplo
Muestreo Aleatorio Simple.

Suponga que nos interesa estudiar la proporción de mujeres en


una población.

Formen grupos de 10 estudiantes.


La población de interés es su grupo.

Seleccione una muestra aleatoria simple de tamaño n=3 de su grupo.

Pasos:
1. Escriban los nombres de las personas en el grupo.
2. Asignen un número de identificación a cada persona del grupo.
3. Seleccione la muestra usando la tabla de números aleatorios.

Tabla: Suponga que la posición de partida de la tabla elegida al azar fue: fila 13, columna
1.

Denotaremos por P la proporción de mujeres en su población.

Número de mujeres en su población ___________ N = ______

número de mujeres
Calcule la proporción de mujeres en su población P = =
N

Resultados de la muestra aleatoria simple de tamaño n=3:

Número de mujeres en la muestra _____________

número de mujeres
Proporción de mujeres en la muestra, p̂ = =
n

 Pensemos

¿Parece simple seleccionar una m.a.s.?

¿Es siempre posible?

¿Cuándo es difícil?

¿Cómo será numerar las unidades si el tamaño de la población fuera 78? o 292? o 4000?

¿Será simple usar la tabla o la calculadora o computador?

El muestreo aleatorio simple es objetivo o insesgado, pero tiene la desventaja que


necesitamos tener una lista completa de la población y eso no es siempre posible. Si
quisiéramos tomar una muestra de la ciudad de Talca, ¿Qué lista de la población podríamos
usar?
Página 7 de 8

Muestreo aleatorio estratificado3

Un muestreo aleatorio estratificado se selecciona dividiendo o estratificando la


población en subgrupos mutuamente exclusivos (estrato) y tomando una muestra aleatoria
simple de las unidades de cada estrato. Para formar la muestra completa se combinan las
unidades muestreadas de cada estrato.

Subgrupos mutuamente exclusivos implica que cada unidad de la población pertenece a un


solo estrato.

 Ejemplo
Formen grupos de 10 estudiantes. Cada grupo necesita tener al menos una mujer o un
hombre. La población de interés es su grupo.

Pregunta de interés: ¿Cuánto calza?

Queremos averiguar el promedio del número de calzado en su población.

Pasos:
1. Escriba el nombre de las personas en su grupo.
2. Haga la pregunta a cada miembro de su grupo y escriba la respuesta al lado del
nombre.
3. Calcule el promedio de la respuesta en su población.

Promedio = SUMA = ____________________


N

¿Este número es un PARÁMETRO o un ESTADÍSTICO?

Tome una muestra aleatoria simple de tamaño n=4.

Pasos:
1. Asigne una identificación a cada nombre en la lista.
2. Use la tabla de número aleatorios (fila 22, columna 10).
3. ¿A quién seleccionó de su grupo y cuál son sus respuestas?
4. Calcule el promedio de las respuestas en su muestra aleatoria simple de tamaño n=2.

¿Este número es un PARÁMETRO o un ESTADÍSTICO?

Pero sabemos de las diferencias entre el número que calzan los hombres y las
mujeres.

3
Sección opcional
Página 8 de 8

Muestra aleatoria estratificada

Pasos:

1. Liste los hombres y las mujeres de su población separadamente, es decir, forme los
estratos. Incluya la respuesta a la pregunta en paréntesis.

MUJERES (Estrato 1) HOMBRES (Estrato 2)

2. Designe una identificación a cada unidad en cada estrato.

3. Seleccione una m.a.s. de tamaño n=2 de mujeres (fila 14, col 1) y una m.a.s. de
tamaño n=2 de hombres (fila 23, col 2).

Registre las respuestas de la muestra.

Respuestas de mujeres seleccionadas: ______________________

Respuestas de hombres seleccionados: ______________________

4. Calcule el promedio de las respuestas de cada estrato separadamente:

Estrato 1, Mujeres: Promedio estimado = SUMA = _____________


n
Estrato 2, Hombres: Promedio estimado = SUMA = ______________
n

5. Calcule la respuesta global combinando los promedios de los estratos

Promedio global:

 # unidades estrato1  promedio estimado   # unidades estrato 2  promedio estimado 


   +    =
 N  estrato1   N  estrato 2 

¿Este número es un PARÁMETRO o un ESTADÍSTICO?

¿Cómo es comparado con el promedio de toda la población?

¿Qué facilidades deportivas te gustaría que hubiera en la UTAL?

 Pensemos

¿Cuándo nos conviene tomar un tamaño muestral distinto en cada estrato?

Cuando formamos un estrato, ¿Cómo debe ser la variabilidad dentro de cada estrato y entre
los estratos?

¿Es el muestreo aleatorio estratificado un muestreo aleatorio simple?, Si o No, ¿Por qué?

También podría gustarte