Está en la página 1de 11
Módulo 2: El Muestreo Y Distribuciones Muestrales Unidad 2: Muestreo Y Distribuciones Muestrales
Módulo 2: El Muestreo Y Distribuciones Muestrales Unidad 2: Muestreo Y Distribuciones Muestrales

Módulo 2: El Muestreo Y Distribuciones Muestrales

Unidad 2: Muestreo Y Distribuciones Muestrales

2.1 Introducción Al Muestreo Una muestra es una porción o parte de la población de

2.1 Introducción Al Muestreo

Una muestra es una porción o parte de la población de interés. En muchos casos, el muestreo resulta más accesible que el estudio de toda la población. En esta sección se explican las razones principales para muestreary, en seguida, diversos métodos para elegir una muestra.

Razones para muestrear

Cuando se estudian las características de una población, existen diversas razones prácticas para preferir algunas partes o muestras de ella para observar y medir. He aquí algunas razones para muestrear:

1. Establecer contacto con toda la población requeriría mucho tiempo.

Un candidato para un puesto federal quizá desee determinar las posibilidades que tiene de resultar elegido. Una encuesta de muestreo en la que se utiliza el personal y las entrevistas de campo convencionales de una empresa especializada en encuestas tardaría de uno a dos días. Con el mismo personal y los mismos entrevistadores, y laborando siete días a la semana, se requerirían 200 años para ponerse en contacto con toda la población en edad de votar. Aunque fuera posible reunir a un numeroso equipo de encuestadores, quizá no valdría la pena entrar en contacto con todos los votantes.

2. El costo de estudiar todos los elementos de una población resultaría prohibitivo.

Por lo general, las organizaciones que realizan encuestas de opinión pública y pruebas entre consumidores, como Harris International, CBS News Polls y Zogby International, entran en contacto con menos de 2.000 de las casi 60 millones de familias en Estados Unidos. Una organización que entrevista a consumidores en panel cobra cerca de $40.000, por enviar muestras por correo y tabular las respuestas con el fin de probar un producto (como un cereal para el desayuno, alimento para gato o algún perfume). La misma prueba del producto con las 60 millones de familias tendría un costo de alrededor de $1. 000, 000,000.

3. Es imposible verificar de manera física todos los elementos de la población.

Algunas poblaciones son infinitas. Sería imposible verificar toda el agua del lago Gatún, en lo que se refiere a niveles de bacterias, así que se eligen muestras en diversos lugares de él. Las poblaciones de peces, aves, serpientes o mosquitos son grandes y se desplazan, nacen y mueren de manera continua. En lugar de intentar contar todos los patos que hay en Canadá o todos los peces del lago Pontchartrain, se hacen aproximaciones mediante diversas técnicas: se cuentan todos los patos que hay en un estanque, capturados al azar, se revisan las cestas de los cazadores o se colocan redes en lugares predeterminados en el lago.

4. Algunas pruebas son de naturaleza destructiva. Si los catadores devino de una ciudad de

4. Algunas pruebas son de naturaleza destructiva.

Si los catadores devino de una ciudad de productora, se bebieran todo el vino para evaluarla

vendimia, acabarían con la cosecha y no quedaría nada disponible para la venta. En el área de producción industrial: las placas de acero, cables y productos similares deben contar con una resistencia mínima a la tensión. Para cerciorarse de que el producto satisface la norma mínima, el departamento de control de calidad elige una muestra de la producción. Cada pieza se somete a tensión hasta que se rompe y se registra el punto de ruptura (medido en libras por pulgada cuadrada). Es obvio que si se sometieran todos los cables o todas las placas a pruebas de resistencia a la tensión no habría productos disponibles para vender o utilizar. Por la misma razón, sólo unas cuantas semillas se someten a pruebas de germinación en, antes de la temporada de siembra.

5. Los resultados de la muestra son adecuados.

Aunque se contara con recursos suficientes, es difícil que la precisión de una muestra de 100% — toda la población— resulte esencial en la mayoría de los casos. Por ejemplo, el gobierno federal utiliza una muestra de tiendas de comestibles distribuidas en Estados Unidos para determinar el índice mensual de precios de los alimentos. Los precios del pan, frijol, leche y otros productos de primera necesidad se incluyen en el índice. Resulta poco probable que la inclusión de todas las tiendas de comestibles de Estados Unidos influya significativamente en el índice, pues los precios de la leche, el pan y otros productos de primera necesidad no varían más de unos cuantos centavos de una cadena de tiendas a otra.

2.2 El Muestreo Aleatorio

Muestra seleccionada de manera que cada elemento o individuo de la población tenga las mismas posibilidades de que se le incluya.

A manera de ejemplo para el muestreo aleatorio simple y la selección, suponga que una

población consta de 845 empleados de Nitro Industries, de la cual se va a elegir una muestra de 52empleados. Una forma de asegurarse de que todos los empleados de la población tienen las mismas posibilidades de que se les elija consiste en escribir primero el nombre de cada empleado

en un papel y depositarlos todos en una caja. Después de mezclar todos los papeles, se efectúa

la primera selección tomando uno de la caja sin mirarlo. Se repite este proceso hasta terminar de

elegir la muestra de 52 empleados.

Existen dos tipos de métodos para seleccionar muestras poblacionales:

1. Muestreo no probabilístico (no aleatorio): En este tipo de muestreo, puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.

2. Muestreo probabilístico (aleatorio): En este tipo de muestreo, todos los individuos de la población pueden formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra. Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras investigaciones, por ser el riguroso y científico.

2

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad.

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

Muestreo aleatorio sistemático:

Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la población. Primero se calcula k, que es el resultado de dividir el tamaño de la población entre el tamaño de la muestra.

Esto quiere decir que si tenemos un determinado número de personas que es la población (N) y

queremos escoger de esa población un número más pequeño el cual es la muestra (n), dividimos

el número de la población por el número de la muestra que queremos tomar y el resultado de

esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden. Si tenemos una población N (60) y tenemos que seleccionar una muestra (n) de tamaño 12, tendríamos según formula: K= N/n = 60/12 = 5, este sería el número de intervalo.

K= N/n = 60/12 = 5, este sería el número de intervalo. Muestreo aleatorio estratificado: Una

Muestreo aleatorio estratificado:

Una población se divide en subgrupos, denominados estratos, y se selecciona al azar una muestra de cada estrato. Cuando una población se divide en grupos a partir de ciertas características, se aplica el muestreo aleatorio estratificado con el fin de garantizar que cada grupo se encuentre representado en la muestra. A los grupos también se les denomina estratos. Por ejemplo, los estudiantes universitarios se pueden agrupar en estudiantes de tiempo completo o de medio tiempo, por sexo, masculino o femenino, tradicionales o no tradicionales. Una vez definidos los estratos, se aplica el muestreo aleatorio simple en cada grupo o estrato con el fin de formar la muestra.

Muestreo conglomerado:

A menudo se emplea para reducir el costo de muestrear una población dispersa en cierta área

geográfica, el muestreo por conglomerados, la población se divide en conglomerados a partir de

los límites naturales geográficos o de otra clase.

A continuación se seleccionan los conglomerados al azar y se toma una muestra de forma

A continuación se seleccionan los conglomerados al azar y se toma una muestra de forma

aleatoria con elementos de cada grupo.

Suponga que desea determinar la opinión de los residentes de algún estado con referencia a las políticas federales y estatales de protección ambiental. Seleccionar una muestra aleatoria de residentes y ponerse en contacto con cada persona requeriría mucho tiempo y resultaría muy costoso. Sería mejor aplicar el muestreo por conglomerados y subdividir el estado en pequeñas unidades: condados o regiones. Con frecuencia se les conoce como unidades primarias.

Suponga que dividió el estado en 12 unidades primarias, seleccionó al azar cuatroregiones, 2, 7, 4 y 12, y concentró su atención en estas unidades primarias. Usted puede tomar una muestra aleatoria de los residentes de cada una de estas regiones y entrevistarse con ellos (observe que

se trata de una combinación de un muestreo por conglomerados y un muestreo aleatorio simple).

muestreo por conglomerados y un muestreo aleatorio simple). de Muestreo En estadística, la distribución muestral es

de

Muestreo

En estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se puede estimar el error para un tamaño de muestra dado.

2.3

Introducción

a

las

Distribuciones

La comprensión del concepto de la distribución de muestreo es fundamental para el correcto

entendimiento de la inferencia estadística. Una distribución de la población es la distribución de la totalidad de las medidas individuales de una población, en tanto que una distribución muestral es

la distribución de los valores individuales incluidos en una muestra.

En contraste con estas distribuciones de medidas individuales, una distribución de muestreo se refiere a la distribución de los diferentes valores que una estadística muestral, o estimador, podría adoptar en muchas muestras del mismo tamaño.

Así, aunque por lo general disponemos únicamente de una muestra aleatoria o subgrupo racional, reconocemos que la estadística muestral particular que determinamos, como la media o mediana de la muestra, no es exactamente igual al respectivo parámetro de la población.

Más aún, el valor de una estadística muestral variará de una muestra a otra, a

Más aún, el valor de una estadística muestral variará de una muestra a otra, a causa de la variabilidad del muestreo aleatorio, o error de muestreo. Ésta es la idea en la que se apoya el concepto de que toda estadística muestral es de hecho un tipo de variable cuya distribución de valores está representada por una distribución de muestreo.

Distribución muestral de medias: una distribución muestral de medias o una distribución en el muestreo de la media se define como el conjunto de todas las medias que se pueden calcular en todas las muestras posibles que se pueden extraer, con o sin reemplazo, de una determinada población. La cual se define con la siguiente fórmula: µ=Σx / N.

A continuación ejemplo de la representación de la distribución de la muestra: Tartus Industries cuenta con siete empleados de producción (a quienes se les considera la población).

 

Ingresos por

Ingreso por

Empleado

Hora

Empleado

Hora

Joe

7.00

Jan

7.00

Sam

7.00

Art

8.00

Sue

8.00

Ted

9.00

Bob

8.00

1. ¿Cuál es la media de la población?

2. ¿Cuál es la distribución muestral de la media de muestras de tamaño 2?

3. ¿Cuál es la media de la distribución muestral de la media?

4. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la media?

La media de la población es: µ=Σ x /N.= 7 +7 +8 +8 +7 +8 +9

7

= 7 . 21

Para obtener la distribución muestral de la media se seleccionó, sin reemplazos de la población, todas las muestras posibles de tamaño 2 y se calcularon las medias de cada muestra. Donde N = 7 es el número de elementos de la población, y n = 2, el número de elementos de la muestra. Hay 21 muestras posibles, que se calcularon con la fórmula:

Hay 21 muestras posibles, que se calcularon con la fórmula: El símbolo en la ecuación (!)

El símbolo en la ecuación (!) representa factorial, es decir que para el cálculo de la misma tendríamos que resolver de la siguiente manera:

A continuación se ilustran las 21 medias muestrales de todas las muestras posibles de tamaño
A continuación se ilustran las 21 medias muestrales de todas las muestras posibles de tamaño

A continuación se ilustran las 21 medias muestrales de todas las muestras posibles de tamaño 2 que pueden tomarse de la población. Estas 21 muestras se utilizan para construir una distribución de probabilidad, que es la distribución muestral de la media.

probabilidad, que es la distribución muestral de la media. Fig. 1. Distribución de muestras caso Tartus

Fig. 1. Distribución de muestras caso Tartus Industries. Estadística aplicada los Negocios y Economía.

Distribución muestral de la media con n=2

y Economía. Distribución muestral de la media con n=2 Fig. 2. Distribución muestral de la media

Fig. 2. Distribución muestral de la media caso Tartus Industries. Estadística aplicada los Negocios y Economía.

La media de la distribución muestral de la media se obtiene al sumar las medias muestrales y dividir la suma entre el número de muestras. La media de todas las medias muestrales se representa mediante µ x =. La µ recuerda que se trata de un valor poblacional, pues tomó en

cuenta todas las muestras posibles. El subíndice X indica que se trata de la distribución muestral

de la media.

en cuenta todas las muestras posibles. El subíndice X indica que se trata de la distribución
Para este ejemplo la media de la distribución muestral es igual a la media de

Para este ejemplo la media de la distribución muestral es igual a la media de la población, pudiera darse el caso que no sea igual.

2.4 La Relación Entre el Tamaño de la Muestra y el Error Estándar

Las muestras se emplean para determinar características de la población. Por ejemplo, con la media de una muestra se calcula la media de la población. No obstante, como la muestra forma parte o es una porción representativa de la población, es poco probable que su media sea exactamente igual a la media poblacional. Asimismo, es poco probable que la desviación estándar de la muestra sea exactamente igual a la desviación estándar de la población. Por lo tanto, puede esperar una diferencia entre un estadístico de la muestra y el parámetro de la población correspondiente. Esta diferencia recibe el nombre de error de muestreo.

La media muestral es el estimador usual de una media poblacional. Sin embargo, diferentes muestras escogidas de la misma población tienden en general a dar distintos valores de medias muestrales. El error estándar de la media (es decir, el error debido a la estimación de la media poblacional a partir de las medias muestrales) es la desviación estándar de todas las posibles muestras (de un tamaño dado) escogidos de esa población.

Además, el error estándar de la media puede referirse a una estimación de la desviación estándar, calculada desde una muestra de datos que está siendo analizada al mismo tiempo. En aplicaciones prácticas, el verdadero valor de la desviación estándar (o del error) es generalmente desconocido. Como resultado, el término "error estándar" se usa a veces para referirse a una estimación de esta cantidad desconocida. En tales casos es importante tener claro de dónde proviene, ya que el error estándar es sólo una estimación. Desafortunadamente, esto no es siempre posible y puede ser mejor usar una aproximación que evite usar el error estándar.

El error estándar de la media cuantifica las oscilaciones de la media muestral (media obtenida en los datos) alrededor de la media poblacional (verdadero valor de la media). Este se estima generalmente dividiendo la desviación estándar de la población entre la raíz cuadrada del tamaño de la muestra (asumiendo independencia estadística de los valores en la muestra)

Donde:

estadística de los valores en la muestra) Donde: s e s l a desviación estándar (es

s es la desviación estándar (es decir, la estimación basada en la muestra de la desviación estándar de la población).

n es el tamaño (número de individuos de la muestra)

σ es la verdadera desviación estándar de la población.

Esta estimación puede ser comparada con la fórmula de la verdadera desviación estándar de la

Esta estimación puede ser comparada con la fórmula de la verdadera desviación estándar de la media de la muestra:

Donde:

desviación estándar de la media de la muestra: Donde: 2.5 El Diseño de Experimento El Diseño

2.5 El Diseño de Experimento

El Diseño de Experimento se refiera a una prueba o serie de pruebas en las cuales se introducen cambios deliberados en las variables de entrada que forman el proceso, de manera que sea posible observar e identificar las causas de los cambios en la variable de salida.

las causas de los cambios en la variable de salida. Realizar un experimento es aplicar los

Realizar un experimento es aplicar los distintos niveles, o combinaciones de niveles cuando hay presentes más de un factor, a distintas unidades experimentales y se observa el valor de la variable respuesta.

Unidades experimentales: (personas, elementos físicos, etc.)

Factor: variable controlable por el experimentador (niveles del factor o tratamientos)

Variable de interés: variable respuesta

Error experimental o perturbación: variables no controlables por el experimentador

Tamaño del experimento: número total de observaciones

Los diseños de experimento tienen como objetivo estudiar el efecto que sobre la variable respuesta tiene un conjunto de otras variables que reciben el nombre de factores.

Los diseños de experimentos tienen una serie de etapas: 1) Diseñar un experimento con una

Los diseños de experimentos tienen una serie de etapas:

1) Diseñar un experimento con una estructura lo más adecuada posible a la situación que se desea estudiar y a los medios disponibles.

a) Planteamiento general del problema y de los objetivos que se persiguen.

b) Selección y definición de la variable respuesta.

c) Elección de los factores y niveles que han de intervenir en el experimento.

d) Determinación del conjunto de unidades experimentales incluidas en el estudio.

e) Determinación de los procedimientos por los cuales los tratamientos se asignan a las

unidades experimentales.

2) Realizar la experimentación de acuerdo con el plan previamente establecido en el diseño.

3) Analizar estadísticamente los resultados obtenidos y comprobar si las hipótesis establecidas y el modelo de diseño elegido se adecuan a la situación estudiada.

4) Realizar las modificaciones oportunas para ampliar o modificar el diseño.

5) Obtener las conclusiones apropiadas.

Los diseños de experimentos constan con principios básicos como:

Aleatorización: la asignación de las unidades experimentales a los distintos tratamientos y el orden en el que se realizan los ensayos se determinan al azar.

Replicación.

Homogeneidad del material experimental

Bibliografía •Aranda e m p r e s a r i a l . España:

Bibliografía

•Aranda

empresarial. España: P.P.U.

Gallego,

J.

y

Gómez

García,

J.

(2008).Introducción

a

la

estadística

económica

y

•Escuder Valles, R. (2010). Métodos estadísticos aplicados a la economía. España: Ariel Economía.

•García Barbancho, A. (2009).Estadística elemental moderna. España: Ariel Economía.

•Martin Pliego, F.J. (2011). Curso práctico de Estadística Económica. Puerto Rico: AC.

Peña, D. Y Romo, J. (2008). Introducción a la Estadística para las Ciencias Sociales.

McGraw-Hill.

México:

Perez Suarez, R.(2010). Análisis de datos económicos I. Métodos descriptivos. España: Pirámide.

•Rioboo Almanzor, J.M.; Pío del Oro Sáez, C. y otros. (2009).Representaciones gráficas de datos estadísticos. Puerto Rico: AC.