Está en la página 1de 54

Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución

muestral de estadísticos

Diseños Muéstrales y Distribución Muestral de Estadísticos


1. INTRODUCCIÓN

Hoy la Estadística está considerada como la teoría de la información, no solo como función descriptiva,
sino con el objeto básico de hacer estimaciones acerca de los valores estadísticos de la población o en la
comprobación de hipótesis de aquellas características que han sido investigadas.

De lo anterior se observa que la estadística cubre dos aspectos de gran importancia: la estadística
descriptiva, a través de la recolección, clasificación, presentación, ya sea en forma de cuadros o gráficas,
la aplicación de medidas como promedios, desviaciones, etc., y la interpretación y análisis de datos a fin
de obtener conclusiones. Se realiza un proceso deductivo de lo general a lo particular.

El segundo aspecto es la inferencia estadística o método inductivo, el cual mediante investigaciones por
muestreo, se logra obtener resultados considerados como estimadores de los valores estadísticos,
correspondientes a las características de las unidades que conforman la población.

Se podría afirmar que la tarea más importante de la estadística es la realización de inferencias acerca de
una población objetivo, con base en los resultados obtenidos a través de una muestra.

Sin el muestreo, la investigación de mercados no existiría como tal como la conocemos en la actualidad.
Virtualmente, todo estudio de investigación de mercados requiere la selección de algún tipo de muestra.

1. DEFINICIONES BÁSICAS DEL MUESTREO


1. Población o Universo. Es un conjunto de medidas o el recuento de todos los elementos que
presentan una característica común antes de la selección de la muestra. El término se usa
para denotar el conjunto de elementos del cual se extrae la muestra
Una población adecuadamente designada, debe definirse en términos de:
1) Elementos 2) Unidades de muestreo
3) Alcance 4) Tiempo

Es un agregado de unidades individuales, compuesto de personas o cosas, que se hallan en una temática
determinada. Las unidades individuales se llaman unidades elementales. Definir una población es limitar
el alcance de las unidades elementales de acuerdo al interés que se tiene respecto a alguna característica
de la población. Tanto la definición de una población como la característica a ser observada de sus
unidades elementales dependen de la naturaleza del problema.
Las poblaciones pueden ser infinitas y finitas.

Una población infinita es la que contiene un número infinitamente grande unidades elementales; la
cantidad de camisas producidas en el mundo; todos los posibles resultados al lanzar una moneda
continua e infinitamente.

Una población es finita, cuando tiene un número finito de unidades elementales. Por ejemplo los
estudiantes de la Universidad Dr. José Matías Delgado; el número de colegios privados de Santa Ana.

Elaborado y compilado por Carlos H. Vargas Página 1


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
2.2 Población del estudio. Es el conjunto de elementos del cual se saca la muestra.
Infortunadamente surgen dificultades prácticas que hacen que la muestra real se tome de una
población un tanto diferente de la que se definió a priori. Lo que sucede es que los elementos de
la población se omiten del marco muestral. Por ejemplo una lista de los miembros de un club
puede estar incompleta, algunas personas, tienen números telefónicos no registrados, es posible
que un mapa no incluya una calle nueva.
Entonces, la población del estudio se convierte en el conjunto de elementos del cual se selecciona
realmente la muestra. Es con respecto a esta población del estudio que podemos hacer inferencias
apropiadas, aun cuando nuestro interés real sea la población inicial

2.3 Diseños muéstrales. Son los distintos procedimientos que existen para extraer muestras de
poblaciones con el objeto de conocer sus características promedio. Es interesante saber cómo a
través del análisis de sólo una parte representativa de la población se puede inferir lo que está
ocurriendo en toda la población.
2.4 Los elementos. Son los que integran la población o muestra, pueden corresponder a personas,
objetos o cosas. Es la unidad acerca de la cual se solicita información. Además el elemento
puede ser una entidad simple (una persona) o una entidad compleja (una familia), que se
denomina unidad, la que, a su vez, puede estar compuesta de elementos o de unidades, que en
algunos casos se les define como conglomerados. Los elementos más comunes del muestreo en
investigación de mercados son los individuos. En otros casos, los elementos podrían ser
productos, almacenes, empresas, familia, etc.

2.5 Unidad de muestreo. Es el elemento o los elementos disponibles para su selección en alguna
etapa del proceso de muestreo. En el tipo de muestreo más simple, el de una sola etapa, las
unidades y los elementos de muestreo son los mismos.
Las unidades de muestreo son aquellos elementos o grupos de elementos que forman la base de una
selección de muestras. Pueden o no ser idénticas al listado de las unidades. Cuando se dispone de una
lista completa de elementos de la población, en general, es más conveniente extraer una muestra
directamente de la lista, en cuyo caso el muestreo sería lo mismo que el listado de unidades.
Un proceso de muestreo puede tener tantas etapas como el investigador desee. Todo lo que tiene que
hacer es especificar la unidad de muestreo en cada etapa. Por ejemplo, una muestra de cuatro etapas
podría ser:
a) Etapa 1. Ciudades con una población superior a 500,000 habitantes
b) Etapa 2. Manzanas de ciudades
c) Etapa 3. Familias
d) Etapa 4. Hombres de 50 años y más

2.6 Marco del muestreo: se denomina marco, marco muestral o marco de referencia, a la
lista, mapa o cualquier otro material aceptable, que contenga todas las unidades o elementos
perfectamente identificados y actualizados, de la cual se selecciona la muestra. El marco
muestral es un listado, actualizado, y revisado, de todos los elementos que constituyen la
población que va a ser objeto de investigación que se utilizarán para obtener una muestra. Es una
lista de todas las unidades de muestreo disponibles para su selección en una etapa del proceso

Elaborado y compilado por Carlos H. Vargas Página 2


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
de muestreo. Un marco puede ser una lista de alumnos, una lista de votantes, un directorio
telefónico, una lista de empleados o incluso un mapa.

2.7 Características: o caracteres, corresponden a ciertos rasgos, cualidades o propiedades, que


poseen los elementos que constituyen la población o muestra. Algunos caracteres son mesurables
y se describen numéricamente; por tal motivo se denominan caracteres cuantitativos o variables,
tales como: estatura, peso, ingreso, valor, producción, ventas, etc. Otros se expresan mediante
palabras por no ser mensurables pero sí cuantificables, tales como: profesión, cargo, marca,
calidad, etc., y se denominan caracteres cualitativos o atributos.
Por ejemplo, si el problema es “Carros para personas mayores de 50 años de edad” se trata de
determinar la cantidad de carros de diversos tipos y marcas. La población es todas las personas
mayores de 50 años. Una característica de interés podría ser los carros de cuatro puertas y tipo
sedanes.
2.8 Las variables o aspectos cuantitativos se clasifican en: variables discretas y continuas. La
primera se refiere a aquella que solo puede tomar unos determinados valores, siendo imposible
que llegue a tomar valores intermedios entre dos consecutivos, es decir, toma únicamente
valores enteros. En el segundo, se toman todos los valores infinitos posibles en un intervalo, es
decir, se admiten valores fraccionarios.
2.9 La muestra o investigación parcial, Se define como un conjunto de medidas o el recuento de
una parte de los elementos pertenecientes a la población. Los elementos se seleccionan
aleatoriamente, es decir, todos los elementos que componen la población tienen la misma
posibilidad de ser seleccionados. La representatividad de la muestra, implica que cada unidad de
la población tiene que tener iguales probabilidades de ser seleccionadas. En estas condiciones se
dice que la muestra es aleatoria.
Es una parte de la población, por ejemplo cuando se desea hacer un estudio relativo del
rendimiento académico de los estudiantes de la Matías, y se toma sólo un grupo de estudiantes
de esa universidad. Todos los estudiantes de ella son la población y el grupo escogido constituye
la muestra. Es importante hacer notar que para hacer una investigación mediante el análisis de
una parte de la población, o sea mediante una muestra, ésta tiene, necesariamente, que ser
representativa. La representatividad de la muestra, implica que cada unidad de la población,
tiene que tener iguales probabilidades de ser seleccionadas. En estas condiciones se dice que la
muestra es aleatoria.
La muestra, para que sea representativa de la población, requiere que todas las unidades de la
población tengan la misma probabilidad de ser seleccionadas, es decir, debe ser aleatoria, al azar
o probabilística.

2.10 La medición es la etapa intermedia que consiste en contar, medir y formular preguntas.

2.11 La estimación es el proceso de hacer deducciones sobre el grupo total, partiendo de la


información de la muestra. El muestreo y la estimación conforman el diseño de la muestra.

2.12 Las listas son un inventario de unidades de una población o subpoblación, que tiene una
correspondencia directa, uno a uno entre cada ítem listado y la unidad que representa. Un ejemplo

Elaborado y compilado por Carlos H. Vargas Página 3


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
de una lista son todos los clientes que tienen suscripción anual de la Prensa Gráfica, identificados
cada uno por su nombre.
2.13 La estructura de muestreo está constituida por los materiales y procedimientos utilizados para
contabilizar la población cuando no se dispone de una lista completa de elementos. La estructura
de muestreo consistirá, en general, de mapas, croquis, listas, fotografías e instrucciones sobre la
forma como estos elementos deben utilizarse. Se trata básicamente del procedimiento
operacional y de los materiales usados para esquematizar la población al diseñar la muestra.
Para que una muestra sea representativa de la población se requiere que las unidades
sean seleccionadas al azar.
2.14 Generalmente hay dos criterios para evaluar un diseño de muestreo: fiabilidad y efectividad.
Es de esperar que en el muestreo haya errores. Un error de muestreo es la diferencia entre
estadístico y parámetro, y se mide por su fiabilidad, o por la precisión del muestreo, la cual
está relacionada con la varianza del estadístico muestral. Cuanto mayor sea la varianza, menos
fiabilidad tendrá el resultado de la muestra. El criterio de efectividad está asociado al costo del
muestreo. Un diseño de muestreo se considera efectivo, si se obtiene el mismo grado de
fiabilidad al menor costo posible.
2.15 El muestreo es el proceso de seleccionar una parte del todo.
2.16 El proceso de muestreo: una visión general:
Paso 1. Definir la población meta. Por supuesto esto incluiría: a) los elementos, b) las
unidades de muestreo, c) el alcance y d) el tiempo.
Paso 2. Identificar el marco muestral.
PASO 3. Con los pasos 1 y 2, se debe conciliar las diferencias entre la población y el marco del
muestreo.
Paso 4. Seleccionar un procedimiento específico mediante el cual se seleccionará la muestra
(procedimiento de muestreo). Exactamente, ¿cómo se tomara la decisión con respecto a que
elementos de la población van a incluirse en la muestra?
Se debe seleccionar entre muestreo probabilístico y no probabilístico.
Paso 4. Decidir sobre el tamaño de la muestra. Aquí se determina el número de elementos a
incluir en la muestra. Decidir cuándo una muestra es demasiado grande o demasiada pequeña
es un problema difícil. Esto se analizará más adelante.
NOTA: en realidad los pasos 3 y 4 con frecuencia se realizan al mismo tiempo.
Paso 5. Seleccione físicamente la muestra con base en el procedimiento descrito en el paso 3.
Se realiza el muestreo.
Paso 6. Recolectar datos de los entrevistados.
Paso 7. Manejar el problema del público que no responde.
Paso 8. Generar la información para fines de toma de decisiones.
2.17 Parámetros. Son todas aquellas medidas que describen numéricamente la característica de una
población. También se les denomina valor verdadero, ya que una característica poblacional
tendrá un solo parámetro (media, varianza, etc.). Sin embargo, una población puede tener varias
características y, por tanto, varios parámetros. Algunos lo denominan como valor estadístico de
la población. . Es una descripción resumida de una medida de la población bajo estudio. Este es
el verdadero valor que obtendríamos si se realizase un censo que no tenga errores no

Elaborado y compilado por Carlos H. Vargas Página 4


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
muéstrales. Ejemplo: edad promedio de los estudiantes de una clase de Estadística 2 y el ingreso
promedio de los recién graduados en la escuela de administración.

2.18 Estimador o Estadígrafo. La descripción numérica de una característica correspondiente a los


elementos de una muestra, se denomina estadígrafo. También se le conoce como Estimador
Puntual si se trata de un promedio, varianza, proporción, etc. Como por lo general, existe una
diferencia entre el estimador y el parámetro, denominado error, es aconsejable utilizar el
estimador por intervalos, dentro del cual deberá estar contenido el parámetro con cierto
margen de seguridad, establecido por el investigador. El estimador puntual son las medidas
descriptivas numéricas aplicadas a las características en las unidades de la muestra. Se podrá
decir que el estimador es una norma o método para estimar una constante perteneciente a una
población. La estimación hace referencia a los valores numéricos de los parámetros
poblacionales desconocidos, a los cuales se llega mediante una muestra. Es una descripción
resumida de una medida en la muestra seleccionada. El estadístico muestral se utiliza para
estimar el parámetro de la población.

2.19 La diferencia entre el estimador puntual y el parámetro, se le denomina error de muestreo o de


estimación, y lo fija el investigador para determinar el tamaño de la muestra, con base en la
experiencia y el conocimiento que tenga sobre el comportamiento y, la variación que tenga la
característica relacionado con el objetivo mismo de la investigación. Cuando la estimación no
representa bien al parámetro, a pesar de estar perfectamente diseñada, nos referimos a errores
muéstrales. Los errores no muéstrales son ocasionados por el mal diseño del formulario, errores
cometidos en el proceso de recolección, procesamiento y análisis de datos.

2.20 El estimador por intervalos, es una regla que nos indica cómo calcular dos puntos o valores a
través de una muestra. La estimación por intervalos, es la estimación del parámetro mediante la
especificación de un intervalo de valores, determinado por un límite inferior y otro superior
(límites de confianza) dentro del cual estará comprendido el valor verdadero o parámetro
poblacional.
Se dice que un buen estimador debe ser:
a) Insesgado, es decir que no tenga sesgo, error, cuando el valor del estimado es igual al del
parámetro. En caso contrario la estimación es sesgada.
b) Consistente, es aquel estimador que, al aumentar el tamaño de la muestra, converge en
probabilidad al parámetro que estima.
c) Eficiente, es el estimador que tiene la menor varianza entre todos los estimadores posibles.
d) Suficiente, cuando incluye toda la información que la muestra puede proporcionar acerca del
parámetro.

2.21 El intervalo de confianza, corresponde a un intervalo de valores, dentro de los cuales se espera
que este el parámetro con cierto grado de confianza o con riesgo de error conocido; para ello es
necesario determinar primero la estimación puntual.

2.22 La probabilidad de que un intervalo de confianza contenga el parámetro que se estima, se


denomina coeficiente de confianza.

Elaborado y compilado por Carlos H. Vargas Página 5


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
. DISEÑO DE MUESTREO ALTERNATIVOS (Clasificación de las técnicas de muestreo).
Los diseños de muestreo se dividen en dos grandes grupos:
a) Muestreos aleatorios (probabilísticos) y
b) Muestreos no aleatorios (no probabilísticos).

El muestreo aleatorio se denomina también muestreo probabilístico, ya que se puede emplear las
leyes de la probabilidad. El termino muestreo aleatorio se utiliza para el proceso empleado para
seleccionar la muestra; por consiguiente, la aleatoriedad es una propiedad del procedimiento
muestral que puede entrar en un proceso de muestreo de distintas formas, y, por lo tanto, las
muestras aleatorias pueden ser de varios tipos.
El muestreo probabilístico es un proceso de selección de muestras en el cual los elementos son
escogidos por métodos aleatorios. Existen numerosas variaciones en el muestreo probabilístico,
pero todas comparten un rasgo común: la selección de las unidades para la muestra se realiza
por procedimientos al azar y con probabilidades conocidas.

El muestreo no aleatorio es un proceso de selección muestral sin intervención de la aleatoriedad; es


decir, una muestra no aleatoria se selecciona de acuerdo al juicio experto del investigador. El
investigador puede decidir de manera arbitraría o consciente qué elementos incluirá en la muestra.
Las muestras no probabilísticas pueden dar buenas estimaciones de las características de la
población; sin embargo, no permiten evaluar objetivamente la precisión de los resultados de la
muestra. Como no hay forma de determinar la probabilidad de que cualquier elemento particular
quede seleccionado para incluirse en la muestra, no es posible hacer una extrapolación estadística de
las estimaciones obtenidas a la población.

El muestreo no aleatorio incluye todos los métodos en que las unidades elementales de la
población no se seleccionan por procedimientos al azar.

1. MUESTREOS ALEATORIOS O PROBABILÍSTICOS.


El muestreo aleatorio realizado bajo ciertas condiciones y sometido a ciertos requisitos, se constituye
en un procedimiento práctico, económico y rápido para generalizar conclusiones obtenidas a través
de un a muestra, aplicables a toda la población de la que forma parte, dentro de ciertos límites de
confiabilidad, establecidos de antemano. Los muestreos probabilísticos permiten calcular la
probabilidad de obtener cada una de las posibles muestras.
Este tipo de muestreo implica cuatro consideraciones:

a) Se debe especificar la población meta. El grupo b) Se necesita desarrollar el método


acerca del cual se está buscando información. para seleccionar la muestra.
c) Debe determinarse el tamaño de la muestra, el d) Se debe considerar el problema de
cual dependerá de las necesidades de ausencia de respuesta.
exactitud, la variación dentro de la población y
el costo.

Las técnicas de muestreo probabilístico se clasifican con base en:

 Muestreo por elemento o por  Probabilidad igual de la unidad o

Elaborado y compilado por Carlos H. Vargas Página 6


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
conglomerados probabilidades desiguales
 Selección no estratificada o estratificada  Selección aleatoria o sistemática
 Técnicas de una sola etapa o de etapas
múltiples
Todas las combinaciones posibles de estos cinco elementos resultan 32 técnicas de muestreo
probabilístico diferentes.

De esas técnicas, se revisarán en detalle las siguientes:

4.1 Muestreo aleatorio simple (MAS) o muestreo aleatorio irrestricto. Es un procedimiento de


selección de una muestra por el cual todos y cada uno de los elementos de la población tienen igual
probabilidad de ser incluidos en la muestra; entonces, si toda unidad disponible para observación
(llamada unidad de muestreo) tiene la misma probabilidad de ser escogido, se dice que “toda
muestra aleatoria de igual tamaño, tomada de una población dada, ha de tener la misma
probabilidad de ser tomada”. El 90% de las empresas a escala internacional utilizan este tipo de
muestreo.
Partamos, por ejemplo, de la población de tres calificaciones N: 2,4 y 6. De esta población podemos
tomar muestras de tamaño n=2; con reemplazamiento o sin reemplazo. Con reemplazo significa que
se elige una unidad elemental de ella y luego se vuelve para tomar la siguiente. Sin reemplazo,
cuando, una vez escogida la unidad elemental, ésta ya no se vuelve.
Veamos el caso de muestreo con reemplazo, tomando todas las posibles muestras de n=2 que se
pueden tomar de la Población N: 2,4 y 6. El número de muestras a tomar es el resultado del
desarrollo de la potencia Nn = 32 = 9.

N = Número de elementos de la población; n = Tamaño de la muestra


Las muestras son: 2,2; 2,4: 2,6: 4,2: 4,4: 4,6: 6,2: 6,4: 6,6
Cada una de estas muestras tiene 1/9 de probabilidad de ser escogida.

Ahora veamos el caso de muestreo sin reemplazo. Tomemos siempre muestras de tamaño n=2. El
número de muestras a tomar, es el resultado del desarrollo del siguiente combinatorio:

N N! 3 3! 3 x 2 x1
  ; sustituyendo :    3
 n  n !( N  n)!  2  2!(3  2)! 2 x1x1

Sustituyendo:

Las muestras son: 2,4: 2,6: 4,6

Cada una de estas muestras tiene 1/3 de probabilidad de ser escogidas.


¿Cómo escoger una muestra aleatoria simple? Una de los métodos sencillos consiste en numerar
todos los elementos de la población, escribir los números en tarjetas o fichas o bolas, poner
luego en una caja o bolsa estos objetos numerados y mezclarlos completamente. Se determina
luego el tamaño de la muestra “n” y se sacan los objetos al azar, uno por uno, hasta tener el
número deseado de partidas para anotar.

Elaborado y compilado por Carlos H. Vargas Página 7


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Otro método más técnico y más confiable consiste en usar tablas de números aleatorio, las cuales
se encuentran en los libros de Estadística.

El MAS tiene muchas características convenientes, como el hecho de que es fácil de entender y
que los resultados de la muestra pueden extrapolarse a la población meta. La mayoría de las
técnicas de inferencia estadística suponen que los datos se recabarón usando un muestreo
aleatorio simple. Sin embargo este método sufre de al menos cuatro desventajas importantes:

a) A menudo resulta difícil construir un marco de muestreo que permita extraer una
muestra aleatoria simple.
b) El MAS llega a generar muestras muy grandes o extendidas en amplias zonas geográficas
lo cual incrementaría el tiempo y el costo de la recolección de datos.
c) El MAS a menudo produce menor precisión con mayores errores estándar que otras
técnicas de muestreo probabilístico.
d) Quizá el MAS no generé una muestra representativa.
Aunque en promedio las muestras obtenidas representarán bien a la población meta, una
muestra aleatoria simple determinada quizá no lo haga, lo cual es más probable si es pequeño el
tamaño de la muestra. Por estas razones, en la investigación de mercados no suele emplearse el
MAS. Son más populares procedimientos como el muestreo sistemático.

NOTA: Hacer ejemplos utilizando tabla de números aleatorio.

4.2 Muestreo aleatorio sistemático. La selección de las unidades se hace a intervalos regulares, en
un orden sistemático. Según el procedimiento sistemático, se obtiene una muestra tomando
cada “k-ésima unidad” de la población, tras enumerar las unidades elementales de la población o
haberlas ordenada de alguna manera. La “k” representa un número entero, que es
aproximadamente la “razón de muestreo” entre el tamaño de la población (N) y el tamaño de la
muestra “n”; es decir, K = N/n y, se redondea al número entero más cercano. Así, si la población
consta de 3,600 unidades de muestreo, y se desea tomar una muestra de tamaño n= 400
unidades, entonces, la razón de muestreo k = 3600/400 = 9, y la muestra se obtiene tomando
una unidad de cada 9 de la población. Para lograr la aleatoriedad, el instrumento debe empezar
al azar. Así como en nuestro ejemplo k = 9, se escriben en 9 papelitos números del 1 al 9: luego
se extrae uno al azar. Supongamos que salió el papelito con el número 5, ésta será la primera
unidad que formará la muestra; el siguiente es 5 + k o sea 5 + 9 = 14; el tercero es 14 + 9 = 23 y
así sucesivamente, hasta completar las 400 muestras.

La eficiencia de este tipo de muestreo depende del ordenamiento de la lista.


Antes de aplicar el muestreo aleatorio sistemático, debe observar con cuidado el orden físico de
la población.

Si la lista de elementos en el marco del muestreo se ordena de manera aleatoria (digamos


alfabéticamente), entonces la exactitud del muestreo sistemático puede ser igual a la del
muestreo aleatorio simple. Si los elementos (empresas) se ordenan en forma monotónica
(digamos, por incremento en ingresos de ventas), entonces la exactitud del muestreo sistemático
superará a la del muestreo aleatorio simple, debido a que la muestra será representativa (incluirá

Elaborado y compilado por Carlos H. Vargas Página 8


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
empresas de bajos y hasta elevados ingresos en ventas) de la población. Finalmente, si los
elementos se ordenan en forma cíclica (digamos, días de la semana) y se selecciona un intervalo
de muestreo de 7, entonces un investigador que esté estudiando las visitas de los clientes a un
cine estará recolectando datos del mismo día de la semana, dando por resultado una menor
exactitud que el muestreo aleatorio simple.

El muestreo sistemático es similar al MAS en el hecho de que cada elemento de la población


tiene una probabilidad conocida e igual de ser seleccionado. No obstante difiere del MAS en que
sólo las muestras permisibles de tamaño “n” que pueden extraerse tienen una probabilidad igual
y conocida de seleccionarse. La probabilidad de que el resto de las muestras de tamaño “n”
queden seleccionadas es cero.

Para hacer el MS, el investigador supone que los elementos de la población están ordenados de
alguna manera. En algunos casos, el orden (por ejemplo, la lista alfabética del directorio
telefónico) no tiene relación con las características de interés; pero en otros casos, el
ordenamiento está directamente relacionado con las características investigadas. Por ejemplo,
puede listarse a los clientes de tarjetas de crédito según el orden del saldo del acreedor, u
ordenarse a las empresas de un determinado sector de acuerdo a sus ventas anuales. Si el
ordenamiento de los elementos de la población no tienen relación con las características de
interés, el MS arrojará resultados muy similares al MAS.

Por otro lado, cuando el ordenamiento de los elementos está relacionado con las características
de interés, el MS incrementa la representatividad de la muestra. Si las empresas de un sector se
disponen en un orden ascendente de ventas anuales, la muestra sistemática incluirá algunas
empresas pequeñas y algunas grandes. Por ejemplo, una muestra aleatoria simple quizá no sea
representativa porque sólo incluye empresas pequeñas o una cantidad desmesurada de
empresas pequeñas.
Si el ordenamiento de los elementos produce un patrón cíclico, el MS puede disminuir la
representatividad de la muestra. Por ejemplo, considere el uso del MS para generar una muestra
de las ventas mensuales de una tienda departamental, a partir de un marco de muestreo que
contiene las ventas mensuales de los últimos 40 años. Si se elige un intervalo de muestreo de 12,
tal vez la muestra resultante no refleje la variación mensual en las ventas.

El MS es menos costoso y más sencillo que el MÁS, porque la selección aleatoria se hace sólo una
vez. Además, los números aleatorios no tienen que concordar con los elementos individuales
como en el MAS. Como algunas listas contienen millones de elementos, es posible ahorrar
mucho tiempo y reducir así el costo del muestreo. Si se dispone de información de la población
que esté relacionada con las características de interés, puede usarse el MS para obtener una
muestra más representativa y confiable (menor error de muestreo) que el MAS. Otra ventaja
relativa es que el MS puede usarse incluso sin conocer la composición (elementos) del marco de
muestreo. Por ejemplo, cuando se aborda a cada i-ésima persona que sale de una tienda
departamental o de un centro comercial. Por estas razones es frecuente el uso del MS en
encuestas a los consumidores por correo, telefónicas, en centros comerciales y por Internet.

Elaborado y compilado por Carlos H. Vargas Página 9


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Una situación en la que el MS es peligroso es en el muestreo de espacio de tiempo. Suponga que
la tarea consiste en estimar el flujo de tráfico semanal en una calle determinada. Si se
seleccionara cada decimosegundo período de 10 minutos, entonces el punto de muestreo sería
el mismo cada día, y los tiempos de viaje pico o bajo uso podrían pasarse por alto fácilmente.

4.3 Muestreo aleatorio estratificado (MAE). (Asignación igual, proporcional y óptimo). Es un proceso
de dos pasos en que la población se divide en subpoblaciones o estratos. Dentro de cada estrato
están los elementos situados de manera más homogénea con respecto a las características en
estudio. Los estratos tienen que ser mutuamente excluyentes y colectivamente exhaustivos, por
lo que cada elemento de la población debe asignarse a un único estrato sin omitir algún
elemento de la población. Para cada estrato se toma una submuestra a través del procedimiento
aleatorio simple, y la muestra global se obtiene combinando las muestras de todos los estratos.
Aunque en teoría sólo debe emplearse el MAS para seleccionar los elementos de cada estrato, en
ocasiones se emplea el MS y otros procedimientos de muestreo probabilístico.
Las variables utilizadas para dividir a la población en estratos se conocen como variables de
estratificación. Los criterios para la selección de estas variables incluyen homogeneidad,
heterogeneidad, relación y costo. Dentro de un estrato, es necesario que los elementos sean tan
homogéneos como sea posible, mientras que los elementos de los diferentes estratos requieren ser
tan heterogéneos como sea posible. Las variables de estratificación deben tener una relación
estrecha con las características de interés. Cuanto mejor se cumplen estos criterios, mayor será la
eficacia en el control de la variación externa al muestreo.
Las variables que suelen usarse para la estratificación incluyen características demográficas, tipo de
cliente, tamaño de la empresa o tipo de industria.
Es posible usar más de una variable para la estratificación, aunque por razones pragmáticas y de
costo rara vez se utilizan más de dos. El número de estratos a utilizar es cuestión de juicio, pero la
experiencia sugiere que no se usen más de seis. Con más de seis estratos, cualquier ganancia en
precisión se pierde por el mayor costo de la estratificación y el muestreo.

Puede ser más efectivo si se trata de poblaciones heterogéneas. Se garantiza la representatividad,


reduciendo el error de la muestra al formar grupos o subpoblaciones más o menos homogéneas, en
cuanto a su composición interna o heterogénea cuando se comparan los estratos entre sí.
Si la desviación típica de la característica observada de cada estrato es menor que la de toda la
población, como es lo usual, debido a la mayor uniformidad dentro del estrato resultará que la
fiabilidad aumenta para un tamaño de muestra dado o bien la efectividad para un grado de
fiabilidad.
El aumento de la fiabilidad y efectividad se puede incrementar clasificando todavía más los estratos
en subestratos, si ello fuese posible. Por ejemplo, al hacer una encuesta sobre una elección se puede
tomar como estratos los partidos políticos. Como las preferencias electorales están influidas a
menudo por factores como el sexo, la edad, la profesión, la religión, etc., se podría subdividir los
estratos tomando estos factores. Este procedimiento de doble clasificación se llama estratificación
cruzada. El muestreo por estratos es, por consiguiente, una combinación de submuestras de los
estratos.
La principal diferencia entre los diversos tipos de procesos de muestreo estratificado radica en la
selección de los tamaños de la muestra dentro de cada grupo. Los diferentes tipos de muestreo

Elaborado y compilado por Carlos H. Vargas Página 10


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
estratificado se describen a continuación. La escogitación de los elementos de cada estrato puede
ser proporcional o no.

Muestreo estratificado proporcional. En este tipo, el número de objetos o unidades de muestreo


elegidas de cada grupo es proporcional al número en la población. Este tipo de muestreo, se puede
clasificar a su vez en:
a) Muestreo estratificado directamente proporcional
b) Muestreo estratificado inversamente proporcional

Ejemplos de Muestreo estratificado directamente proporcional:


Suponga que un investigador está evaluando la satisfacción del cliente en relación con una bebida que es
consumida por un total de 600 personas. Entre estas, 400 son leales a la marca y 200 son de las que
buscan variedad. La investigación anterior indica que el nivel de satisfacción de los clientes está
relacionado con sus características propias, como ser leal a la marca o buscar variedad. Por lo tanto, debe
ser benéfico dividir la población de 600 consumidores en dos grupos de 400 y 200 unidades de muestreo,
respectivamente, y obtener una muestra aleatoria a partir de cada uno de los dos grupos. Si se desea un
tamaño de muestra de 60, entonces se emplea un muestreo estratificado directamente proporcional del
10%.

Tipo de consumidor Tamaño del grupo Tamaño de una muestra estratificada


directamente proporcional de 10%
Leales a la marca 400 40
Que buscan variedad 200 20
Total = 600 60

Supóngase, por ejemplo, que se desea implementar un seguro de vida para los maestros que laboran en
el país. Para tal propósito se tomara una muestra que represente el 10% de la población de maestros del
país. De acuerdo a datos del Ministerio de Educación el total de maestros por edades es el siguiente:

Edad en años No. de profesores


25 o menos 2,880
26 - 35 7,680
36 45 6,240
46 55 4,800
56 o más 2,400
Total 24,000

El tamaño de la muestra es: 24,000 x 10% = 2,400


El siguiente paso será un plan de muestreo de manera que cada grupo de edad quede representado
proporcionalmente. El diseño apropiado es el muestreo aleatorio estratificado proporcional.

Distribución por edades de los maestros de El Salvador y cálculos del porcentaje


por estratos y unidades elementales de las submuestras
Estratos No. de profesores Porcentaje % * Unidades por estrato
(submuestras) **

Elaborado y compilado por Carlos H. Vargas Página 11


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
25 o menos 2,880 12 288
26 - 35 7,680 32 768
36 - 45 6,240 26 624
46 - 55 4,800 20 480
56 o más 2,400 10 240
Total 24,000 100 n = 2,400
* El porcentaje de los estratos se calcula así: 2880/24000 x 100 = 12 % para el primer estrato.

**Las unidades muéstrales de cada estrato se obtuvieron así: multiplicando la proporción de


cada estrato por el tamaño de la muestra que es de n = 2,400. Por lo tanto para el primer estrato:
0.12 x 2,400 = 288 y así sucesivamente. Estas constituyen las submuestras.

Para escoger las unidades elementales de cada estrato se puede proceder así: Se puede hacer de dos
maneras: 1) por muestreo aleatorio simple, utilizando tablas de números aleatorios y 2) por muestreo
aleatorio sistemático.

La solución por el segundo método podría ser: para este diseño se numeran las subpoblaciones de los
estratos. Por ejemplo, para el estrato 26 – 35 años, se numeran así: 1,2,3,4,5,…., 7680; luego se establece
la razón de muestreo k = N 2 / n2 = 7680/768 = 10; seguidamente, se numeran 10 papelitos del 1 al 10,
luego se revuelven en una caja y se extrae un papelito. Supongamos que el papel tiene escrito el número
7, éste constituye, por tanto, la primera unidad muestral; la siguiente es 7 + k, o sea, 7 + 10 = 17; la
tercera 17 + 10 = 27 y así sucesivamente, hasta completar los 768 de este estrato. Lo mismo se hace con
el resto de los estratos.

Ejemplos de Muestreo estratificado inversamente proporcional:

Ahora suponga que, de los 600 consumidores en la población, del ejemplo 1 del tema anterior, 200 son
bebedores habituales y 400 son bebedores ocasionales. Si un investigador valora más la opinión de los
primeros, con relación a la de los segundos, se tendrán que muestrear más personas del grupo de
bebedores habituales. En estas circunstancias, se podrá utilizar un muestreo estratificado inversamente
proporcional. Si se desea un tamaño de muestra de 60, se emplea un muestreo estratificado
inversamente proporcional de 10%.

En este caso las probabilidades se calculan de la siguiente manera:

Denominador:
600 / 200      600 / 400    3  1.5  4.5
Proporción y tamaño de la muestra de bebedores habituales:
3 / 4.5  0.667;   0.667   60    40

Proporción y tamaño de la muestra de bebedores ocasionales:


1.5 / 4.5  0.333;   0.333   60    20

Elaborado y compilado por Carlos H. Vargas Página 12


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Tipo de consumidores Tamaño del grupo Tamaño de una muestra estratificada
inversamente proporcional de 10%
Bebedores habituales 200 40
Bebedores ocasionales 400 20
Total = 600 60

Muestreo estratificado no proporcional.


En el muestreo estratificado, cuando el tamaño de la muestra en cada grupo no es proporcional a los
tamaños respectivos de los grupos, el muestreo se conoce como muestreo estratificado no
proporcional. Cuando se comparan múltiples grupos y sus tamaños de grupo respectivos son pequeños,
un muestreo estratificado proporcional no producirá un tamaño de muestra suficientemente grande
como para hacer comparaciones significativas; por ello es mejor utilizar el muestreo estratificado no
proporcional. Una forma de seleccionar tamaños de muestra dentro de cada grupo consiste en tener
tamaños iguales de grupos en la muestra. En el ejemplo de los bebedores habituales y ocasionales, un
investigador podrá seleccionar a 30 personas de cada uno de los dos grupos.

4.4 Muestreo por conglomerados, por áreas o geográfica (Diseño de etapas múltiples).
Es lo contrario al muestreo por estratos. Consiste en seleccionar, primero, al azar grupos, llamados
conglomerados de elementos individuales de la población, mutuamente excluyentes y colectivamente
exhaustivos. Luego se selecciona una muestra aleatoria de conglomerados con base en una técnica de
muestreo probabilístico, acá se toman luego todos los elementos o una submuestra de ellos dentro de
cada conglomerado, para constituir así la muestra global. El área total se divide en pequeñas áreas las
que son muestreadas. Cada área seleccionada podrá ser subdividida y enumerada para una nueva
selección, si es necesario, y así sucesivamente dando origen al muestreo por etapas o polietápico. Para
lograr los mejores resultados en el plan de muestreo por conglomerados, las diferencias entre ellos se
hacen tan pequeñas como sea posible; en tanto que, las diferencias entre los elementos individuales
dentro de cada conglomerado se hacen tan grandes como sea posible. Lo ideal sería que cada
conglomerado fuera una miniatura de toda la población y así un solo conglomerado sería una muestra
satisfactoria.
Con frecuencia los conglomerados se llaman unidades de muestreo primario. Si todos los elementos o
unidades elementales de los conglomerados seleccionados se incluyen en la muestra, el procedimiento
se llama muestreo de una etapa. Si se saca una submuestra aleatoria de elementos de cada
conglomerado seleccionado, se tiene lo que se llama muestreo en dos etapas o bietápico. Si intervienen
más de dos etapas en la obtención de la muestra total, se dice que es un muestreo de etapas múltiples o
multietápico.

Por ejemplo, en una encuesta sobre actitudes de los estudiantes de una Universidad de El Salvador, se
toman como conglomerados las distintas facultades (que constituyen unidades de muestreo primarias).
Esta es la primera etapa. La segunda etapa podría ser la selección de departamentos dentro de cada
facultad. Por último, en la tercera etapa, se toman estudiantes de todos los departamentos seleccionados
para construir la muestra global. Desde luego, los métodos de muestreo se emplean en cada etapa.

Elaborado y compilado por Carlos H. Vargas Página 13


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

Como se muestra en la figura anterior,


existen dos tipos de diseños de dos etapas. Uno implica al MAS, tanto en la primera etapa (por ejemplo,
el muestreo de las manzana de casas) como en la segunda (por ejemplo, el muestreo de las casas dentro
de la manzanas). Este diseño se llama muestreo por conglomerados simple de dos etapas. En este diseño,
la fracción de elementos seleccionados (por ejemplo, las casas) en la segunda etapa es la misma para
cada conglomerado de la muestra (por ejemplo, manzanas seleccionadas).
Este diseño es adecuado cuando los conglomerados son del mismo tamaño, es decir, cuando contienen
más o menos el mismo número de unidades de muestreo. Pero si difieren mucho en el tamaño, el
muestreo por conglomerados simple de dos etapas podría generar estimaciones sesgadas.
En el muestreo probabilístico proporcional al tamaño, los conglomerados se muestran con una
probabilidad proporcional al tamaño. El tamaño de un conglomerado se define en términos del número
de unidades de muestreo que contiene. Por lo tanto, en la primera etapa los conglomerados grandes,
tienen mayor probabilidad de ser incluidos que los conglomerados pequeños. En la segunda etapa, la
probabilidad de seleccionar una unidad de muestreo de un conglomerado seleccionado varía
inversamente con el tamaño del conglomerado. Por ende, la probabilidad de que cualquier unidad de
muestreo específica se incluya en la muestra es igual para todas las unidades, porque las probabilidades
desiguales de la primera etapa se equilibran con las probabilidades desiguales de la segunda etapa. Lac
cantidades de las unidades de muestreo incluidas de los conglomerados seleccionados son
aproximadamente iguales.

Generalmente es muy aplicado cuando no se dispone de un marco de referencia completo.


El muestreo por conglomerados tienes dos grandes ventajas: viabilidad y la gran reducción de costos.
Cuando se hacen muestreos de una población distribuida geográficamente, se toman como unidades
primarias de muestreo las regiones geográficas; este procedimiento se conoce como muestreo por zonas.
El muestreo por conglomerados se utiliza a menudo en control de calidad estadístico. Primero se
seleccionan lotes o tandas de producción al azar como conglomerados; si el muestreo es de una etapa
todas las unidades de los lotes seleccionados pueden ser comprobadas; o bien se puede tomar una
submuestra de cada lote para su comprobación, lo cual constituye un muestreo en dos etapas.

Ejemplo (tomado del libro Investigación de mercados de David A. Aaker, V. Kumar y George S. Day).
Suponga que se necesita muestrear el estado de California. El primer paso consiste en desarrollar un
muestreo por agrupamientos de condados del estado. Cada condado tiene una probabilidad
proporcional a su población de estar en la muestrea de agrupamientos. Así, el condado más grande “el
de Los Ángeles” será más probable que esté en la muestra que un condado rural. El segundo paso

Elaborado y compilado por Carlos H. Vargas Página 14


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
consiste en ordenar un muestreo de agrupamientos de ciudades de cada condado seleccionado.
Nuevamente, cada ciudad se selecciona con una probabilidad proporcional a su tamaño. El tercer paso
consiste en seleccionar un muestreo de agrupamientos de manzanas de cada ciudad, nuevamente
ponderando cada manzana por el número de casas en ella. Finalmente, se selecciona una muestra
sistemática de casas de cada manzana, y se obtiene una muestra aleatoria de miembros de cada casa. El
resultado es una muestra aleatoria del área, en la que cada casa tiene una probabilidad igual de estar en
la muestra. Observe que los individuos que viven solos tendrán una mayor probabilidad de estar en la
muestra que los individuos que viven en casa con otras personas.
Para ver como se obtiene una muestra de agrupamientos de ciudades de manera que la probabilidad de
que se seleccione cada una sea proporcional a su población, considere el siguiente ejemplo.
Suponga que hay seis ciudades en el condado de Ajax. En la siguiente tabla, se muestran las ciudades,
además se enlistan los tamaños de su población y la “población acumulada”. Esta última sirve para
asociar a cada ciudad con un bloque de números iguales al tamaño de su población. La población total
del condado de Ajax es de 100,000 personas. La tarea consiste en seleccionar una ciudad del condado,
con una probabilidad de selección proporcional a la población de la ciudad.

Tabla: Ciudades del condado de Ajax


Ciudad Población Población acumulada
Concord 15,000 1 – 15,000
Mountain View 10,000 15,001 – 25,000
Filmore 60,000 25,001 – 85,000
Austin 5,000 85,001 – 90,000
Cooper 2,000 90,001 – 92,000
Douglas 5,000 92,001 – 97,000
Área rural 3,000 97,001 – 100,000

El enfoque consiste en obtener un número aleatorio entre 1 y 100,000. Para ello se utiliza la tabla de
números aleatorios. Suponga que se selecciona el número 89,701. Este número se localiza en la
columna de Población acumulada y se observa que corresponde a la ciudad de Austin.
Claramente, la ciudad más grande, Filmore, tendrá la mejor oportunidad de ser seleccionada (de
hecho una probabilidad del 60%) y la ciudad de Cooper la de menor probabilidad (solo del 2%).

OTRAS TÉCNICAS DE MUESTREO PROBABILÍSTICO

4.5 Muestreo por agrupamiento. En este caso la eficiencia se mejora disminuyendo el costo a una
tasa más rápida que la exactitud. Al igual que el muestreo estratificado, este es un proceso de
dos pasos. A diferencia del muestreo estratificado, el proceso de muestreo por agrupamiento
implica dividir a la población en subgrupos, que aquí se denominarán agrupamientos en lugar de
estratos. Sin embargo, en este caso se selecciona una muestra aleatoria de subgrupos o
agrupamientos y se entrevista a todos los miembros de los subgrupos. Aun cuando el muestreo
por agrupamientos es muy eficaz en costos, tiene sus limitaciones. Da por resultado muestras
relativamente imprecisas, y es difícil formar agrupamientos heterogéneos debido a que, por
ejemplo, las familias de una calle tienden a ser similares más que diferentes.

Elaborado y compilado por Carlos H. Vargas Página 15


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Este muestreo es útil cuando pueden identificarse subgrupos que son representativos de toda la
población.
Suponga que se necesita una muestra de los estudiantes de segundo año de bachillerato que tomaron
clase de ciencias naturales en el departamento de Santa Ana. Hay 200 grupos de ciencias naturales cada
uno de los cuales contiene una muestra bastante representativa con respecto a las opiniones de los
estudiantes acerca de temas medio ambientales que es el tema de estudio. Una muestra de
agrupamiento selecciona aleatoriamente un número de salones de clase, digamos 15, e incluye a todos
sus miembros en la muestra. La gran ventaja del muestreo por agrupamiento es el menor costo. Los
subgrupos o agrupamientos se seleccionan de tal manera que el costo de obtener la información
deseada dentro del agrupamiento es mucho más pequeño que si se obtuviera una muestra aleatoria
simple. Si el grupo de ciencias naturales promedio tiene 30 estudiantes se puede obtener una muestra de
450 estudiantes contactando sólo a 15 clases. Si se fuera a obtener una muestra aleatoria simple de 450
estudiantes de todos los grupos de ciencias naturales, es probable que el costo sería considerablemente
mayor. La pregunta fundamental, por supuesto, es sí los grupos son representativos de la población. Si los
grupos de las zonas de altos ingresos tienen opiniones diferentes acerca del tema medio ambiental que
los grupos con más estudiantes de bajos ingresos, entonces la suposición en que se basa el enfoque no
sería válida.

Las diferencias entre el muestreo estratificado y el muestreo por agrupamiento son sorprendentes y se
muestran en el siguiente cuadro.

Muestreo estratificado Muestreo de agrupamiento


Homogeneidad dentro del grupo Homogeneidad entre grupos
Heterogeneidad entre grupos Heterogeneidad dentro de los
grupos
Todos los grupos incluidos Selección aleatoria de los grupos
La eficiencia del muestreo se mejora La eficiencia del muestreo se
incrementando la exactitud a una mejora disminuyendo el costo a
tasa más rápida que el costo una tasa más rápida que la
exactitud

4.6 Muestreo por fases. En ocasiones es conveniente y económico recoger cierta información de
elementos de la población muestreándolos varias veces. En la primera fase se selecciona una
muestra y se reúne alguna información de todos sus elementos. En la segunda fase, se extrae una
submuestra de la muestra original y se obtiene información adicional de los elementos de la
submuestra. El procedimiento puede extenderse a tres o más fases, las cuales pueden ocurrir al
mismo tiempo o en diferentes momentos. Cuando se hacen dos fases se le llama muestreo doble
y es útil cuando no se dispone de un marco de muestreo para la selección final de las unidades
de muestreo, pero se sabe que los elementos del marco están incluidos en un marco de
muestreo mayor.
Por ejemplo, un investigador desea seleccionar hogares que consumen jugo de manzana en una
determinada ciudad. Los hogares de interés están contenidos dentro del conjunto de todos los
hogares, pero el investigador no sabe cuáles son. Al aplicar el muestreo doble, en la primera fase el
investigador podría obtener un marco de muestreo de todos los hogares, comprándolo o

Elaborado y compilado por Carlos H. Vargas Página 16


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
construyéndolo a partir del directorio de la ciudad. Luego obtendría una muestra de hogares, usando
el muestreo aleatorio simple, para determinar la cantidad de jugo de manzana consumido. En la
segunda fase, los hogares que consumen jugo de manzana se seleccionarían y estratificarían de
acuerdo con la cantidad de jugo de manzana consumido. Luego se obtendría una muestra aleatoria
estratificada y se plantearían preguntas detalladas concernientes al consumo de jugo de manzana.

4.7 Muestreo por secuencia. Los elementos de la población se muestrean en secuencia, en cada
etapa se realizan la recolección y el análisis de los datos, y se decide si deben muestrearse
elementos adicionales de la población. No se conoce de antemano el tamaño de la muestra, pero
antes de iniciar el muestreo se establece una regla de decisión. En cada etapa, esta regla indica si
el muestreo debe continuar o si se ha obtenido suficiente información. El muestreo por
secuencia se ha utilizado para determinar las preferencias por dos alternativas rivales. En un
estudio se preguntó a los encuestados cuál de las dos alternativas preferían y el muestreo
terminó cuando se acumuló evidencia suficiente para validar una preferencia. También se ha
empleado para establecer el precio diferencial entre un modelo estándar y un modelo de lujo de
un artículo de consumo duradero.

HOJA DE EJERCICIOS No.1. “Fundamentos del Muestreo”

1. Desarrolle una lista de población o un marco de muestreo para un estudio de actitudes cuando la
población meta está constituida por:
a. Todos aquellos que usaron un sistema de transporte público durante el mes pasado.
b. Tiendas al menudeo de artículos de deportes.
c. Tiendas que venden televisores.
d. Espectadores de televisión en la noche.
e. Familias de elevados ingresos.
f. Adultos de más de 18 años en San Salvador.
2. Para la pregunta 1 examine como podrían estratificarse las diversas poblaciones.
3. Un fabricante desea obtener las opiniones de 4,000 propietarios de almacenes que venden sus
refrigeradores, para conocer qué características son más importantes para ellos. Un colega
proporcionó una lista de tales almacenes, divididos en 400 almacenes grandes y 3,600 almacenes
pequeños. Tomo una muestra aleatoria de 200 almacenes y quedó desilusionado al descubrir
sólo 19 almacenes grandes en la muestra, ya que representaban más de 30% del volumen
potencial. Un amigo le sugirió que tomará una segunda muestra. ¿Qué recomienda usted? ¿Qué
otros elementos de información le gustaría tener?
4. Se planea una encuesta por teléfono para determinar qué tanto se recordaban al siguiente día de
varios comerciales de prueba que se van a lanzar en el país. Diseñe un plan de muestreo de
teléfonos.
5. Los propietarios de una cadena de siete farmacias desean hacer una muestra de compradores de
su cadena y de compradores de una cadena competidora para poder aplicar un cuestionario de
10 minutos. Desarrolle planes de muestreo alternativos. Recomiende uno y fundamente su
decisión.
6. Explique las diferencias entre el muestreo estratificado y el muestreo de agrupamientos.
7. Describa brevemente el concepto de eficiencia del muestreo y explique las formas en que
podrían mejorarse.

Elaborado y compilado por Carlos H. Vargas Página 17


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
8. La eficiencia del muestreo en el muestreo sistemático puede ser mayor que, menor que, o igual a
un muestreo aleatorio único. Explique.
9. Identifique una situación en donde estaría a favor de usar un método no probabilístico sobre un
método de muestreo probabilístico.
10. Discuta las diferencias entre un muestreo estratificado proporcional y otro no proporcional.

5 DISTRIBUCIONES MUESTRALES
Corresponden a una distribución de todas las muestras que pueden ser escogidas conforme a un
esquema de muestreo especificado, que implique selección al azar y, a una función de un número fijo de
variables aleatorias independientes.
De una población a estudiar, se selecciona una sola muestra posible de igual tamaño, con el fin de
obtener conclusiones sobre la población, no sobre la muestra.
La selección de las unidades que van a conformar la muestra debe hacerse al azar, mediante un
generador de números aleatorios, usando cualquier método (es muy utilizado las tablas de números
aleatorios).

5.1 DISTRIBUCIÓN DE MEDIAS MUESTRALES

Una distribución muestral de medias o una distribución en el muestreo de la media se definen como
el conjunto de todas las medias que se pueden calcular en todas las muestras posibles que se pueden
extraer, con o sin reemplazo, de una determinada población.
La distribución muestral de es la distribución de probabilidad de todos los valores de la media
x

muestral .
x

Simbología a ser utilizada:

Medidas Población Muestra


Media aritmética o promedio de una variable µ x

Varianza de una variable σ2 s2


Desviación típica o estándar σ s
Tamaño N n
Proporción que responde “si” o proporción de éxito P p
Proporción que responde “no” o proporción de no éxito Q q

Para Poblaciones: Para Muestras:


el número de
N
el número de
x i
 x ; Donde : n 
 i 1
; Donde : N  X i

N n

elementos de la población elementos de la muestra

Elaborado y compilado por Carlos H. Vargas Página 18


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
N

 xi s
 (x  x )
i
2

 i n 1
N

= Media de todas las medias muéstrales


x

= Desviación típica de todas las medias muéstrales (error estándar de la


 distribución muestral de media) o desviación estándar de la distribución de
x 
n muestreo de medias, que depende de la dispersión de la población y del
tamaño de la muestra.
= Varianza de todas las medias muéstrales
 x2

M= Número de muestras posibles


Proporción muestral número de observaciones de la
= x
p  ; donde : x 
n
muestra que cumplen cierta condición

N N!
M    ; cuando   la   selección   se   hace   sin  reposición
 n  ( N  n)!.n !

M  N n ; cuando   la   selección   se   hace   con   reposición

x 
x i

La media de todas las medias muéstrales es igual a la media
poblacional.
M

X  E(x ) 
 f .x La media de las medias muéstrales
Donde f: frecuencias en las clases
f

En Estimación Puntual:

x Es la media muestral y se le conoce como “el estimador puntual” de la media


poblacional µ
s Es la desviación estándar muestral y, se le conoce como el estimador puntual de la
desviación estándar poblacional σ
p Proporción muestral, es el estimador puntual de la proporción poblacional P

Elaborado y compilado por Carlos H. Vargas Página 19


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Nota: al valor numérico obtenido de se les conoce como “estimaciones puntuales”.
x , s   ó   p

HOJA DE EJERCICIOS No.2


“Diseños Muéstrales y Distribución Muestral de Estadísticos”

1. Dada un población finita que tiene cinco elementos A, B, C, D y E seleccione 10 muestras aleatorias
simples de tamaño 2. Asuma muestreo sin reposición.
a. Enumere las 10 muestras empezando con AB, AC y así en lo sucesivo.
b. Usando el muestreo aleatorio simple, ¿cuál es la probabilidad que tiene cada muestra de
tamaño 2 de ser seleccionada?
c. Si el número aleatorio 1 corresponde a A, el número 2 corresponde a B y así sucesivamente.
Enliste la muestra aleatoria de tamaño 2 que será seleccionada al usar los números aleatorios
siguientes: 8-0-5-7-5-3-2.
2. Suponga que una población finita tiene 350 elementos. A partir de los últimos tres dígitos de cada
uno de los siguientes números aleatorios de cinco dígitos (por ejemplo: 601, 022, 448,…), determine
los primeros cuatro elementos que se seleccionarán para una muestra aleatoria simple. 98601-
73022-83448-02147-34229-27553-84147-93289-14209.
3. A continuación se presentan las 10 acciones más activas en la Bolsa de Nueva York del 6 de enero del
2011. AAT&T; Pfizer; Lucent; Texas Instruments; Nortel; General Electric; Qwest; iShrMSJpn; Bell
South; LSI Logic. Las autoridades decidieron investigar las prácticas de negociación usando una
muestral de tres de estas acciones.
a. Empezando en el primer número aleatorio de la columna seis de la tabla anexa de números
aleatorio, lea los números descendiendo por esa columna para seleccionar una muestra
aleatoria simple de tres acciones para las autoridades. Considere los últimos dígitos del
número en la tabla.
b. Con la información dada en la primera nota y comentario, determine cuantas muestras
aleatorias simples diferentes de tamaño 3 pueden seleccionarse de una lista de 10 acciones.
4. El centro nacional de estadística cuenta con información de los 3,139 poblados de un país. Suponga
que para un estudio nacional se recogerán datos de 30 poblados seleccionados aleatoriamente. De la
última columna de la tabla de números aleatorios anexa extraiga números aleatorios de cuatro
dígitos para determinar los primeros 10 poblados seleccionados para la muestra. Ignore los primeros
dígitos y empiece con los números aleatorios de cuatro dígitos.
5. Suponga que se va a tomar una muestra aleatoria simple de 4 alumnos de los 25 alumnos que
componen la clase de Estadística 2. De la tabla de números aleatorios anexa use al azar cualquier
columna de datos para determinar números aleatorio de dos dígitos a fin de establecer cuáles serán
los alumnos (preguntar el primer nombre) para la muestra.
6. Indique si las poblaciones siguientes se consideran finitas o infinitas.
a. Todos los votantes registrados en el departamento de San Salvador.
b. Todos los equipos de TV que pueden ser producidos en una determinada fábrica.
c. Todas las órdenes que pueden ser procesadas por Allentow Company.
d. Todas las llamadas de emergencia que pueden ser recibidas en una estación de policía.
e. Todas las pizzas producidas por Pizza Hut, en el segundo turno de trabajo del día 10 de mayo.
7. Los datos siguientes provienen de una muestra aleatoria simple: 5 – 8 – 10 – 7 – 10 - 14.
a. ¿Cuál es la estimación puntual de la media poblacional? R: 9.
b. ¿Cuál es la estimación puntual de la desviación estándar poblacional? R:3.1
8. Como respuesta a una pregunta de una encuesta a 150 individuos de una muestra se obtuvieron 75
sí, 55 no y 20 personas no dieron su opinión.

Elaborado y compilado por Carlos H. Vargas Página 20


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
a. ¿Cuál es la estimación puntual de la proporción de la población que responde sí? R: 0-5
b. ¿Cuál es la estimación puntual de la proporción de la población que responde No? R: 0.3667.
9. La siguiente información son datos obtenidos de una muestra aleatoria de las unidades vendidas de 5
meses: mes 1 = 94; 2= 100; 3 = 85; 4 = 94; 5 = 92.
a. Calcule una estimación puntual de la media poblacional del número medio de unidades
vendidas por mes. R: 93
b. Calcule una estimación puntual de la desviación estándar del número de unidades vendidas
por mes. R: 5.39
10. En una muestra de 50 empresas de la Cámara Centroamericana de Comercio que aglutina a las 500
más grandes, 5 se encontraban en Guatemala, 6 en El Salvador, 2 en Honduras y 1 en Costa Rica.
a. Dé una estimación de la proporción de empresas de la Cámara Centroamericana de
Comercio que se encuentran en Guatemala. R: 0.1
b. De una estimación del número de empresas que se encuentran en Honduras. R: 20 empresas
c. De una estimación de la proporción de empresas de la Cámara Centroamericana de
Comercio que no se encuentran en ninguno de estos países. R: 0.72.

5.2 PROPIEDADES DE LA DISTRIBUCIÓN MUESTRAL DE .


x

a) El valor esperado de la distribución muestral de es igual a la media de la población de la que se


x

tomó la muestra.
E( x )  

Dónde:
E ( x )  valor   esperado   de   x ;     media   poblacional

Esto enseña que usando el muestreo aleatorio simple, el valor esperado o media de la
distribución muestral de es igual a la media de la población.
x

Cuando el valor esperado de un estimador puntual es igual al parámetro poblacional, se dice


que el estimador puntual es “insesgado”. Por tanto la ecuación de este literal muestra que
x

es un estimador insesgado de la media poblacional.

b) Desviación estándar de la distribución muestral de


x

Calculo de la desviación típica o estándar de la distribución muestral de medias (error estándar de las
medias)
i. Muestreo con reemplazamiento (Población infinita)

x   f .( x  x )
i
2

; x 
n
f i

Elaborado y compilado por Carlos H. Vargas Página 21


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

ii. Muestreo sin reemplazamiento (Población finita)


Dónde: N = Tamaño de la población
x   f .( x  x )
i
2

 N n
f i
x  .
n N 1

n = Tamaño de la muestra
Siendo para muestras grandes o sea n > 30 y se
x   (x  ) i
2


 x
M n
denomina: error estándar de la media.
Esta relación nos dice que la desviación típica o estándar de la distribución muestral de medias es
directamente proporcional a la desviación típica poblacional e inversamente proporcional a la raíz
cuadrada del tamaño de la muestra. Esta fórmula es de gran utilidad para la Inferencia Estadística.

Nota: el muestreo sin reemplazo genera poblaciones finitas, de tal manera que para calcular la
desviación típica de la distribución muestral de medias, o sea, el error estándar de las medias, en
muestreo sin reemplazo, se tiene que introducir el factor de corrección finita
( N  n)
N 1

Al analizar la formula anterior se ve que el factor se requiere cuando la población es finita,


N n
N 1

pero no cuando es infinita. A este factor se le conoce como “factor de corrección para una población
finita. En muchas de las situaciones prácticas de muestreo, se encuentra que aunque la población sea
finita, es “grande”, mientras que el tamaño de la muestra es pequeña. En estos casos el factor de
corrección para una población finita es casi igual a 1. Por tanto, la diferencia entre el
 N n
x  .
n N 1

valor de la desviación estándar de en el caso de poblaciones finitas o infinitas se vuelve despreciable.


x

Entonces, es una buena aproximación a la desviación estándar de , aun cuando la población


 x
x 
n

sea finita. Esta observación lleva al siguiente lineamiento, o regla general, para calcular la desviación
estándar de :
x

USO DE LA EXPRESIÓN SIGUIENTE PARA CALCULAR LA DESVIACIÓN ESTÁNDAR DE :


x 
x 
n

Elaborado y compilado por Carlos H. Vargas Página 22


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Siempre que:
a) La población sea infinita; o
b) La población sea finita y el tamaño de la muestra sea menor o igual a 5 % del tamaño de la
población; es decir,
n
 0.05
N

NOTA: en los casos en que para calcular deberá usarse la versión para poblaciones finitas;
n sx
 0.05
N

 N n
x  .
n N 1

Nota: lo anterior también se puede aplicar cuando el tamaño de la muestra es mayor del 5% de la
población. Para calcular se necesita conocer . Para subrayar aún más, la diferencia entre y ,
x  x 

a la desviación estándar de ,( ) se le llama error estándar de la media. En general, el término error


x x

estándar se refiere a la desviación estándar de un estimador puntual.

c) Forma de la distribución muestral


x
Se considerarán dos casos: cuando la población tiene distribución normal y cuando la población no tiene
distribución normal.
a) La población tiene distribución normal. En muchas situaciones es razonable suponer que la
población de la que se seleccionó la muestra aleatoria simple tenga distribución normal o
casi normal. Cuando la población tiene distribución normal, la distribución muestral de
x

está distribuida normalmente sea cual sea el tamaño de la muestra.


b) La población no tiene distribución normal. Cuando la población de que la que se tomó la
muestra aleatoria simple no tiene distribución normal, el teorema del límite central ayuda a
determinar la forma de la distribución muestral de . El enunciado del teorema del límite
x

central aplicado a la distribución muestral de dice lo siguiente:


x

TEOREMA DEL LÍMITE CENTRAL

Elaborado y compilado por Carlos H. Vargas Página 23


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
“Cuando se seleccionan muestras aleatorias simples de tamaño n de una población, la
distribución muestral de la media muestral puede aproximarse mediante una distribución
x

normal a medida que el tamaño de la muestra se hace grande.

Este se cumple, cuando independientemente de la población origen, la distribución de las medias


aleatorias se aproximan a una distribución normal a medida que el tamaño de la muestra crece. Se podrá
decir también, que si las muestran provienen de una población que no es normal, es de importancia
tener en cuenta el tamaño de la muestra, si el tamaño muestral es pequeño, la distribución obtenida con
sus medias muéstrales tendrán un comportamiento similar al de la población de donde se extrajeron. Por
el contrario, si el tamaño muestral es grande, el comportamiento de estas medias muéstrales será igual al
de una distribución normal (la distribución muestral de la media tiene una distribución aproximadamente
normal), independientemente de la población de donde fueron extraídas.

Observaciones generales con respecto al teorema del límite central:


1. Para la mayor parte de las distribuciones poblacionales, sin importar su forma, la distribución
muestral de la media tiene una distribución aproximadamente normal cuando se seleccionan
muestras de por lo menos 30 elementos.
2. Si la distribución poblacional es bastante simétrica, la distribución muestral de la media es
aproximadamente normal en muestras tan pequeñas como las de 5 elementos.
3. Si la población tiene una distribución normal, la distribución muestral de la media también
tiene una distribución normal, independientemente del tamaño de la muestra.

d) Valor práctico de la distribución muestral de


x

Siempre que se seleccione una muestra aleatoria simple y se use el valor de la media muestral para
estimar el valor de la media poblacional µ, no se podrá esperar que la media muestral sea exactamente
igual a la media poblacional. La razón práctica por la que interesa la distribución muestral de es que se
x
puede usar para proporcionar información probabilística acerca de la diferencia entre la media muestral y
la media poblacional.

De acuerdo con el teorema del límite central, la variante estadística para distribuciones de

medias muéstrales será:


X  X 
Z 
x 
n

Por lo se considera que se aproxima a una distribución normal. Dónde:


x = Media Muestral (estadístico)

µ = Media Poblacional (parámetro)


x = Error estándar de la media

Elaborado y compilado por Carlos H. Vargas Página 24


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Desde el punto de vista de la práctica, será conveniente saber que tan grande necesita ser el tamaño de
la muestra para que aplique el teorema del límite central y pueda suponer que la forma de la distribución
muestral es aproximadamente normal.
Lo que se acostumbra hacer en la práctica es suponer que, en la mayor parte de las aplicaciones, la
distribución muestral de se puede aproximar mediante una distribución normal siempre que la
x
muestra sea de tamaño 30 o mayor. En los casos en que la población es muy sesgada o existen
observaciones atípicas, puede necesitarse muestras de tamaño 50. Por último si la población es discreta,
el tamaño de muestreo necesario para la aproximación normal suele depender de la proporción
poblacional.

Observaciones: cuando se ha analizado una población y las muestras extraídas de esa población, se
puede decir que:
a. El intervalo de las medias es igual 1/N. Por lo tanto, cuando el tamaño de la muestra se hace más
grande, el intervalo de clase se vuelve más y más pequeño, de tal manera, que si se hace la
gráfica de las distribuciones de las medias, mediante histogramas y unimos, por segmentos de
recta, los puntos medios de la parte superior de las barras, la poligonal se suaviza formando una
curva normal.
b. La media de las medias es siempre igual a la media de la población, es decir, =
X E( X )

c. Cuando el tamaño de las muestras extraídas de una población se aumenta, la dispersión de las
medias muéstrales con respecto a la media poblacional disminuye. La relación

x 
n

Es un concepto importante para encontrar el tamaño adecuado de la muestra en

población no conocida
d. La distribución muestral de medias acusó tendencia normal.
A continuación ver figura de la Distribución Normal.

f(x)

f(x)

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Elaborado y compilado por Carlos H. Vargas Página 25


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
EJEMPLOS DE APLICACIÓN.

Ejemplo 1. De muestreo con reemplazamiento. Sea la siguiente población de 5 calificaciones de cinco


estudiantes: 4, 5, 6,7 y 8, calcular:
a) La media, varianza y desviación típica de la población
b) Las medias de todas las muestras de tamaño 2 (n = 2) que se pueden extraer de esa población,
con reemplazamiento.
c) Transformar la serie de medias, en una distribución muestral de medias.
d) La media de las medias muéstrales.
e) La desviación típica o estándar de la distribución muestral de medias (error estándar de las
medias
f) Las probabilidades de las medias muéstrales.
g) Las gráficas de la distribución poblacional y de la distribución muestral de medias.

Ejemplo 2. Muestreo sin reemplazamiento. Con la misma población de las calificaciones de 5 estudiantes,
conteste las mismas preguntas del ejemplo 1.

Ejemplo 3. Efecto producido al aumentar el tamaño de la muestra. Tomemos muestras de n = 3


calificaciones de la población que estamos analizando en los ejemplos anteriores y conteste
las mismas preguntas.

HOJA DE EJERCICIOS No.3


“Diseños Muéstrales y Distribución Muestral de Estadísticos”

1. La media de una población es de 200 y su desviación estándar es de 50. Se va a tomar una muestra
aleatoria simple de tamaño 100 y se usará la media muestral para estimar la media poblacional.
a. ¿Cuál es el valor esperado de la media muestral? R: 200
b. ¿Cuál es la desviación estándar de la media muestral? R: 5
c. Muestre la distribución muestral de la media muestral
d. ¿Qué muestra la distribución muestral de la media muestral?
2. La media de una población es 200 y su desviación estándar es 50. Suponga que se selecciona una
variable aleatoria simple de tamaño 100 y se usa la media muestral para estimar la media
poblacional.
a. ¿Cuál es la probabilidad de que la diferencia entre la media muestral y la media poblacional
no sea mayor que más o menos 5? R: 0.6826
b. ¿Cuál es la probabilidad de que la diferencia entre la media muestral y la media poblacional
no sea mayor que más o menos 10? R: 0.9544
3. Suponga que la desviación estándar poblacional es de 25. Calcule el error estándar de la media, con
muestras de tamaño 50, 100,150 y 200. ¿Qué puede decir acerca del error estándar de la media
conforme el tamaño de la muestra aumenta?
4. Al director de personal de la empresa Negocios S.A de C.V., se le ha encargado la tarea de elaborar un
perfil de los 2,500 administradores de la empresa. Las características a determinar son el sueldo
medio anual de los administradores y la proporción de administradores que ha terminado el
programa de capacitación de la empresa. Considere que la media poblacional del salario anuales es
de $51,800 y que la desviación estándar de la población es de $4,000. Los datos sobre el programa
de capacitación muestran que 1,500 de los 2,500 administradores han terminado el programa de
capacitación. Determine:
a. La proporción de la población que ha terminado el programa de capacitación. R: 0.60
b. Establezca los parámetros de la población que se conocen.

Elaborado y compilado por Carlos H. Vargas Página 26


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
c. ¿Cuál es la probabilidad de que la media muestral no difiera más o menos de $500 de la
media poblacional si se usa una muestra de tamaño 60? R: 0.668. Considerando población
finita la respuesta es 0.6729.
d. ¿Cuál es la probabilidad de que la media muestral no difiera más o menos de $500 de la
media poblacional si se usa una muestra de tamaño 120? R: 0.8294
5. El costo medio de la colegiatura en una universidad estatal en EEUU es de $4,260 anuales. Considere
este valor como media poblacional y asuma que la desviación estándar poblacional es de $900. Si se
selecciona una muestra aleatoria de 50 universidades, encuentre:
a. La distribución muestral de medias como media muestral de la colegiatura en las 50
universidades.
b. ¿Cuál es la probabilidad de que la muestra aleatoria simple proporcione una media muestral
que no difiera de la media poblacional en más o menos de $250? R: 0.95
c. ¿Cuál es la probabilidad de que la muestra aleatoria simple proporcione una media muestral
que no difiera de la media poblacional en más o menos de $100?
6. La siguiente lista incluye a los estudiantes que se matricularon en un curso de introducción a la
estadística administrativa. Se elige al azar a cinco estudiantes a quienes se formulan varias preguntas
relacionadas con el contenido del curso y el método de enseñanza.
a. Se escriben a mano los números 01 a 50 en papeletas y se colocan en un recipiente. Los cinco
números seleccionados son 31, 7, 42, 15 y 24. ¿Qué estudiantes se van a incluir en la
muestra?
b. Ahora utilice la tabla de números aleatorios proporcionada en clase, para seleccionar su
propia muestra.
c. ¿Qué haría si localizara el número 59 en la tabla de números aleatorios?
d. Una muestra incluirá cada quinto estudiante. Se selecciona 02 como punto de partida. ¿Qué
estudiantes se incluirán en la muestra?
e. Una muestra consta de cuatro alumnos y una alumna. Seleccione una muestra adecuada.
f. Seleccione una muestra aleatoria de siete alumnos. Los números aleatorios son: 05-52-59-
21-31-72-66-08-21-91-00-41-34-75-09-15. ¿Qué alumnos se incluirán en la muestra?
g. Utilice su propia tabla de números aleatorios para seleccionar 7 estudiantes.
h. Una muestra constará de cada séptimo estudiante. El número 04 se selecciona como punto
de partida. ¿Qué estudiantes se incluirán en la muestra?

Alumnos matriculados en el curso de Introducción a la Estadística Administrativa


No. Apellidos Nombre No. Apellidos Nombre
1 Ayala Morales Karla María 26 Meléndez Prudencio Carlos José
2 Bracamonte Rodríguez Tania Sofía 27 Meléndez Rivera Roció Ernestina
3 Cartagena Martínez Ricardo Enrique 28 Mendoza Guardado Claudia Marisol
4 Castillo Guandique Rubén Ernesto 29 Montenegro Machuca Rodrigo Javier
5 Castillo Guillen Bárbara 30 Murcia Jiménez Graciela Alejandra
6 Cruz Sandoval Laura Gabriela 31 Orellana Harold Sumner
7 Erroa Murcia Rolando Ernesto 32 Osorio Ortega Sandra Beatriz
8 Estrada Fuentes Bryan Emilio 33 Posada Jesús Roberto
9 Flores Arriaza Jacqueline Iveth 34 Ramírez Ceciliano Miguel Leonardo
10 Fuentes Franco Juan Carlos 35 Ramírez Osorio Keiry Michel
11 Galán Ramírez Dina Esther 36 Reyes Medrano Eugenia Patricia
12 Garay Andrade Rafael Antonio 37 Rivera Ruiz Mauricio Rafael

Elaborado y compilado por Carlos H. Vargas Página 27


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

13 García Sosa Hugo Robert 38 Rodríguez Díaz Gabriela Sarai


14 Gómez Suarez Diego Alberto 39 Rosales Martínez Edwin Antonio
15 González Guzmán David Arturo 40 Somoza Barrera Fredy Noel
16 González Martínez José óscar 41 Tapia Cerrato Diego Javier
17 Gutiérrez Cornejo Laura Melisa 42 Torres Alfaro Néstor David
18 Henríquez Alba Luis Alberto 43 Torres Bonilla Sandra Argentina
19 Lazo Rodríguez Adriana Yamileth 44 Urquía Grande Jonathan José
20 Linares Mancía Gloria Teresa 45 Velásquez Rodrigo
21 López Crespín Edward Antonio 46 Ventura Escobar Zenia Marcela
22 López Ruiz Jesús Alberto 47 Vides Sarmiento José Vladimir
23 Martínez Medrano Gerardo José 48 Villacorta Brizuela Krisia Carolina
24 Meléndez Escobar Rodrigo Mauricio 49 Zelaya Díaz Jessica María
25 Meléndez Hidalgo Damaris Meléndez 50 Zepeda Salazar Carla Lorena

7. Se desea estudiar los gastos en publicidad de las 352 empresas más grandes de un país. Suponga que
el objetivo del estudio consiste en determinar si las empresas con altos rendimientos sobre el capital
(una medida de rentabilidad) gastan en publicidad la mayor parte del dinero ganado en ventas que
las empresas con un registro de bajo rendimiento o déficit. Para asegurar que la muestra sea una
representación imparcial de las 352 empresas, éstas se agrupan de acuerdo con su rendimiento
porcentual sobre el capital. La siguiente tabla incluye los estratos, la probabilidad y el número de
empresas en cada estrato. Considere una selección de 50 compañías para llevar a cabo el estudio
minucioso. Determine:
a. Las frecuencias relativas de cada estrato.
b. ¿Considera que el muestreo aleatorio simple o el sistemático son los más adecuados para
aplicar en el ejemplo? Razone su respuesta, en base a los resultados del literal anterior.
c. Aplicar el muestreo aleatorio sistemático para seleccionar la muestra.

Estrato Probabilidad Número de


(recuperación de capital) empresas
1 30% y más 8
2 De 20% a 30% 35
3 De 10% a 20% 189
4 De 0% a 10% 115
5 Déficit 5
Total 352

8. La empresa Tacos S.A. de C.V. cuenta con siete empleados de producción (a quienes se les considera
la población). En la siguiente tabla se incluyen los ingresos por hora de cada empleado.

Empleado Ingreso por hora ($) Empleado Ingreso por hora ($)
Juan 7 Arturo 7
Carlos 7 Pedro 8
Rodrigo 8 Ricardo 9
Mario 8
a. ¿Cuál es la media de la población? R: $7.71
b. ¿Cuál es la distribución muestral de media para muestras de tamaño 2, sin reemplazo?
c. ¿Cuál es la media de la distribución muestral de la media? R: $7.71
Elaborado y compilado por Carlos H. Vargas Página 28
Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
d. Elabore la gráfica de la distribución poblacional y la de la distribución muestral de la media
e. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la
media?
9. Los tiempos de servicio de los ejecutivos que laboran en el Banco Agrícola, se muestran en el
siguiente cuadro. Determine:
a. ¿Cuántas muestreas de tamaño 2 sin reemplazamiento son posibles? R: 10
b. Elabore una lista de todas las muestras posibles de 2 ejecutivos de la población y calcule las
medias.
c. Organice las medias en una distribución muestral.
d. Compare la media poblacional y la media de las medias muéstrales.
e. Compare la dispersión en la población con la dispersión de la distribución muestral de la
media.
f. Elabore una gráfica con los valores de la población. ¿Tienen los valores de población, una
distribución normal (en forma de campana).
g. ¿Comienza la distribución muestral de la media que se calculo en el inciso “c” a indicar una
tendencia a adoptar forma de campana?
Nombre Años Nombre Años Nombre Años
Juan Martínez 20 Karla Estrada 22 Eduardo Zárate 26
Carlos Vásquez 24 Pedro Chaín 28

10. El departamento de control de calidad de Cola, INC., conserva registros sobre la cantidad de bebida
de cola en su botella gigante. La cantidad real de bebida en cada botella es de primordial
importancia, pero baría en una mínima cantidad de botella en botella. La empresa, no desea llenar
botellas con menos líquido del debido, pues tendría problemas en lo que se refiere a la confiabilidad
de la etiqueta. Por otra parte, no puede colocar líquido de más en las botellas porque regalaría
bebida de cola, lo cual reduciría sus utilidades. Los registros indican que la cantidad de bebida de cola
tiene una distribución de probabilidad normal. La cantidad media por botella es de 31.2 onzas, y la
desviación estándar de la población, es de 0.4 onzas. El día de hoy a las 8 de la mañana, el técnico de
calidad seleccionó al azar 16 botellas de la línea de llenado. La cantidad media de bebida en las
botellas es de 31.30 onzas. Determine: a) El error muestral, b) El error estándar de la distribución
muestral de la media, c) El error muestral en unidades estándar, d) La probabilidad de que la media
muestral sea mayor o igual de 31.38 onzas, e) ¿Es un resultado poco probable? ¿Es probable que el
proceso permita colocar demasiada bebida en las botellas? En otras palabras, ¿es poco común el
error de muestreo de 0.18 onzas (31.38-31.2)? R: 0.18; 0.1; 1.80; 0.0359.

HOJA DE EJERCICIOS No.4


Ejemplos de aplicación con la distribución normal (cálculo de Z)

Ejercicio 1: La altura media de los alumnos de un plantel de secundaria es de 1.50 metros, y su desviación
típica es de 0.25 metros. Determine la probabilidad de que en una muestra de 36 alumnos, la media sea
superior o igual a 1.60 metros. R: 0.0082

Ejercicio 2. Se tiene para la venta un lote de pollos, con un peso promedio de 3.50 kg y una desviación
estándar de 0.18 kg, ¿Cuál es la probabilidad de que en una muestra aleatoria, de 100 pollos de esta
población, estos pesen entre 3.53 y 3.56 kg? R: 0.0481

Ejercicio 3. Un fabricante de cierto champú para el cabello distribuye el tamaño profesional de su


producto en 100 salones de belleza de la ciudad capital. Se ha determinado que el consumo promedio de
su producto es de 2,800 mensuales de este tamaño profesional, con una desviación estándar de 280. Si

Elaborado y compilado por Carlos H. Vargas Página 29


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
se toma una muestra probabilística de 36 salones, ¿Cuál es la probabilidad de que el consumo promedio
en un mes sea de 2,700 o menos? R: 0.0038

Ejercicio 4. Si en el ejemplo 1 se considera que dicho plantel de secundaria tiene un total de 400
alumnos, ¿Cuál es la probabilidad, en una muestra de 36 alumnos, de que la media sea igual o superior a
1.60 metros? R: 0.006

Ejercicio 5. Si en el ejemplo 2, se considera que el lote de pollos que se tiene a la venta es de 1,000, ¿cuál
es la probabilidad de que en una muestra aleatoria de 100 pollos de esta población, estos pesen entre
3.53 y 3.56 kg? R: 0.039

Ejercicio 6. Se sabe que la media del rendimiento académico de los alumnos de la facultad de derecho de
una universidad es de 72, con una desviación típica de 8. Determine:
a) La probabilidad de que al extraer una muestra aleatoria simple de 100 calificaciones, tomadas del
registro académico, tengamos una media igual o mayor que 71. R: 0.8944
b) Si asumimos que los puntajes del rendimiento académico, tienen tendencia normal, ¿Cuál es la
probabilidad de que el puntaje de un estudiante cualquiera, escogido al azar, sea igual o menor a
70? R: 0.4013
c) La probabilidad de que la muestra de tamaño 100, tenga una media igual o menor a 70. R:
0.0062
d) La probabilidad de que de la muestra de 100, se tenga una media comprendida entre 69.8 y 73.
R: 0.8914

Ejercicio 7. Se sabe que el peso medio de los estudiantes varones de una universidad acusa tendencia
normal con media de 145 libras y una desviación típica de 15 libras. ¿Cuál es la probabilidad de que el
peso medio de una muestra aleatoria de 400 estudiantes varones de esa universidad sea?: a) Superior a
143 libras: b) Inferior a 142.8 libras; c) Entre 144 y 146.8 libras; d) Inferior a 143.5 ó superior a 146.7; e)
La probabilidad de que un alumno escogido al azar tenga un peso de 125 libras o más. R: 0.9962; 0.0017;
0.90; 0.0344; 0.9082.

Ejercicio 8. Si los pesos de todas las personas que viajan en TACA en vuelos regulares de San Salvador a
Miami, acusan tendencia normal con una media de 164 libras y una desviación típica de 14 libras,
determine: a) la probabilidad de que los pesos combinados de una muestra de 30 personas en uno de
tales vuelos den más de 5,000 libras, b) la probabilidad de que los pesos combinados de una muestra de
64 personas de uno de esos vuelos den a lo sumo 10,300 libras. R: 0.1492; 0.0401.

Ejercicio 9. Se sabe que la distribución de los ingresos mensuales de los 6,400 estudiantes de una
universidad tienen una media de $ 950.00 y una desviación típica de $ 185.00. Si se extraen 80 muestras
del mismo tamaño de 36 de esa población sin reemplazo, determine: a) el valor esperado de la
distribución muestral de medias. R: 950. b) el error estándar de la distribución muestral de medias. R:
30.75. c) cuantas muestras de la distribución tendrán medias superiores a $900. d) cuantas muestras
tendrán medias entre $975 y $1025. R: 16. e) que porcentaje de las 80 muestras que se han tomado
arrojará promedios menores a $890. R: 2.56%.

Ejercicio 10. Una fábrica de café envasa su producto en frascos de distintas capacidades entre los cuales
hay uno con un peso neto de 113 gramos de percafé. Para controlar el proceso de envasado se utiliza el
siguiente criterio: cada 30 minutos se seleccionan 49 frascos llenos, si su peso medio es inferior a un
valor crítico “K”, se detiene el proceso y se reajusta; en caso contrario, se continúa el envasado sin
detener el proceso. Determine el valor de “K” de modo que haya una probabilidad de detener el proceso
de solo 0.07 cuando la máquina está envasando a un promedio de 115 gramos con una desviación típica
de 8 gramos. R: 113.31.
Elaborado y compilado por Carlos H. Vargas Página 30
Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
5.3 DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

En los estudios estadísticos no solo se trabaja con medias aritméticas, ya que se puede estar
interesado en conocer la proporción de algún acontecimiento en la población. Como la mayor parte
de las investigaciones, se hacen partiendo del análisis de una parte de la población (muestreo),
necesitamos conocer las relaciones que guardan las proporciones poblacionales y la distribución
muestral de proporciones.

La distribución muestral de proporciones, es el conjunto de proporciones de todas las muestras


posibles, del mismo tamaño, que se pueden extraer de una determinada población.

En el análisis de una característica cualitativa o atributo, se emplea la proporción de éxitos y no el


número de éxitos como en la distribución Binomial.

Anteriormente se definió la proporción de éxitos como:


Número de casos favorables o éxitos
p =
Total de casos posibles

Ahora en vez de expresar la variable en términos de éxitos (x) nos referiremos, al número de
atributos en la muestra (a) y lo dividimos por el tamaño de la muestra (n). La proporción muestral
p

es el estimador puntual de la proporción poblacional P. La fórmula para calcular la proporción


muestral es:
p Σ ai Número de éxitos
= =
n Tamaño de la muestra
ó : x= número de elementos de la muestra que poseen la característica de interés.
x
p  ; donde
n

n = tamaño de la muestra.
“p” es una variable aleatoria.
La proporción muestral de
La distribución muestral de “p” es la distribución de probabilidad de todos los posibles valores de la
proporción muestral.

Simbología a utilizar en Proporciones Poblacionales

A = Σ Ai = N.P Total de elementos que presentan la característica investigada en la


población
=P= ; P = A/N Proporción de elementos que presentan la característica investigada en la
P P población. Proporción Poblacional.

= ΣAi/N
Q = (N – A)/N = 1 - P Proporción de elementos que no presenta la característica estudiada
P+Q=1
= P.Q Varianza de la proporción en la población

Elaborado y compilado por Carlos H. Vargas Página 31


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

= Desviación estándar de la población


P P.Q

P P.Q Error estándar de la proporción


P  
n n

= a/n = Σai/n; Proporción muestral =


p p

= p.q Varianza de una proporción muestral


2
s p

= Desviación estándar proporcional en la muestra


sp p.q

Simbología a utilizar en Proporciones Muéstrales

= a/n = Σai/n; Proporción muestral =


p p

= p.q Varianza de una proporción muestral


s 2p

= Desviación estándar proporcional en la muestra


sp p.q

Para determinar qué tan cerca está la proporción muestral “p” de la proporción poblacional P, se
necesita entender las propiedades de la distribución muestral de “p”: el valor esperado de “p”, la
desviación estándar y la forma de la distribución muestral de “p”.

Propiedades de la distribución muestral de proporciones

a) Valor esperado de p = E (p)

El valor esperado de “p”, la media de todos los posibles valores de “p”, es igual a la proporción
poblacional “P”.

Dónde: E (P) = Valor esperado de “p”.

Elaborado y compilado por Carlos H. Vargas Página 32


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
b) Desviación estándar de o Error estándar de la proporción
p

Como en el caso de la desviación estándar de la desviación estándar de obedece a si la población es


x p

finita o infinita. Las dos fórmulas para calcular la desviación estándar de se presenta a continuación:
p

Población finita ; y si
( P.Q ) N  n n
p  .  0.05
n N 1 N

Población infinita ; y ,
p ( P.Q ) n
 0.05
p   N
n n

c) Formas de la distribución muestral de “p”.

En una muestra aleatoria simple de una población grande, el valor de x es una variable aleatoria binomial
que indica el número de elementos de la muestra que tienen la característica de interés. Como n es una
constante, la probabilidad x/n es la misma que la probabilidad de x, lo cual significa que la distribución
muestral de “p” también es una distribución de probabilidad discreta y que la probabilidad de cada x/n
es la misma que la probabilidad de x.

Se ha estudiado que una distribución binomial se aproxima mediante una distribución normal siempre
que el tamaño de la muestra sea lo suficientemente grande para satisfacer las dos condiciones siguiente:
n.p > 5 y n. (1-p) > 5.

Suponiendo que se satisfacen estas dos condiciones, la distribución de probabilidad de “x” en la


proporción muestral, x , puede aproximarse por medio de una distribución normal. Y como “n” es
p
n

una constante, la distribución muestral de “p” también se aproxima mediante una distribución normal.
Esta aproximación se formula como sigue:

“La distribución muestral de “p” se aproxima mediante una distribución normal siempre que

n.p > 5 y n. (1-p) > 5”.

Elaborado y compilado por Carlos H. Vargas Página 33


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
NOTA: en las aplicaciones prácticas, cuando se requiere una estimación de la proporción
poblacional, casi siempre se encuentra que el tamaño de la muestra es suficientemente grande
para poder usar la aproximación normal para la distribución muestral de
p.

En muchos casos, podemos utilizar la distribución normal para evaluar la distribución muestral de
proporciones, siendo:
p  p pP
Z 
p P.Q
n
En donde:
P = Proporción poblacional de la ocurrencia de algo
p = Proporción muestral de la ocurrencia de ese algo
p Error estándar de la proporción

Aproximación de la distribución normal a la binomial.


En muchos problemas, se trabaja con muestras grandes y esto hace que utilizar la distribución
binomial consuma demasiado tiempo en los cálculos, por ello un enfoque más eficiente consiste
en aplicar la aproximación.
¿Cuándo utilizar la aproximación normal? La distribución de probabilidad normal constituye una buena
aproximación de la distribución de probabilidad Binomial cuando n.p ≥ 5 y n. (1 – p) son ambos ≥ 5.
Sin embargo antes de aplicar la aproximación normal, debe estar seguro de que la distribución de interés
es en verdad una distribución binomial. De acuerdo con lo estudiado en la distribución binomial, se
deben satisfacer cuatro criterios:
a) Solo existen dos resultado mutuamente excluyentes en un experimento: éxito o fracaso.
b) La distribución resulta del conteo del número de éxitos en una cantidad fija de pruebas.
c) La probabilidad de un éxito, “p”, es la misma de una prueba a otra.
d) Cada prueba es independiente.

NOTA 1: en los ejercicios de aplicación, si se desea obtener una buena aproximación a la distribución
normal, algunos autores, realizan la corrección en la variable discreta, siendo igual a 1/2n y se
le sumara o restara al valor “p” en el numerador en la fórmula de Z, según las siguientes
reglas:
a) Si se va a obtener un área a la derecha y se incluye el límite, se resta la corrección 1/2n.
b) Si se va a obtener un área a la derecha y no se incluye el límite, se suma la corrección 1/2n.
c) Si se va a obtener un área a la izquierda y se incluye el límite, se suma la corrección 1/2n.
d) Si se va a obtener un área a la izquierda y no se incluye el límite, se resta la corrección 1/2n.

Elaborado y compilado por Carlos H. Vargas Página 34


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Formula general usando la corrección:
 1  1
 p  2n    p  p  2n   P
Z 
p P.Q
n

El proceso que debe llevarse a cabo para realizar análisis estadísticos y pruebas de hipótesis (unidad 3),
con proporciones es prácticamente igual al que se sigue para promedios. En el caso de proporciones
deben utilizarse los valores correspondientes a esta medida. En seguida se desarrollan algunos ejemplos.

HOJA DE EJERCICIOS No.5


“Ejercicios de Distribución Muestral de Proporciones”

Nota: las respuestas de los ejercicios de esta hoja que se muestran son el resultado de trabajar
los ejercicios usando la corrección de la variable discreta.

Ejercicio 1. Si se tiene que el 4% de las piezas producidas por cierta máquina son defectuosas, ¿cuál es la
probabilidad de que en un grupo de 200 piezas, el 3% o más sean defectuosas? R: 0.8159. Respuesta sin
corrección: 0.7612.

Ejercicio 2. Se desea estudiar una muestra de 49 personas para saber la proporción de las mayores de 40
años; sabiendo que la proporción en la población es 0.4. ¿Cuál es la probabilidad de que la proporción en
la muestra sea menor de 0.5? R: 0.8997. Respuesta sin corrección: 0.9236.

Ejercicio 3. Cuarenta y seis por ciento de los sindicatos del país están en contra de comerciar con la China
Continental; ¿cuál es la probabilidad de que una encuesta a 100 sindicatos muestre que más del 52%
tengan la misma posición? R: 0.0918.
Ejercicio 4. Para decidir si acepta o no un pedido de 500 pares de zapatos, el dueño de una tienda adopta
el siguiente criterio. Selecciona al azar una muestra de 50 pares, y si el 5% o más tienen defectos rechaza
todo el pedido; en caso contrario, lo acepta. ¿Cuál es la probabilidad de que el dueño de la tienda: a)
Rechace el pedido, si realmente en los 500 pares de zapatos el 3 % es defectuoso? R: 0.33. b) ¿Acepte el
pedido, si realmente en los 500 pares de zapatos el 8% es defectuoso? R: 0.1357.

Ejercicio 5. Para controlar la operación de un proceso de producción de cierto tipo de piezas electrónicas,
se utiliza el siguiente criterio. Se toma una muestra aleatoria de 49 piezas, si el porcentaje de piezas
defectuosas en la muestra es proporción de éxitos (p%) o más se detiene el proceso. Determine el valor
“p” de modo que haya una probabilidad de 0.95 de que sea detenido un proceso que esté produciendo
un 15 por ciento de piezas defectuosas. R: 6.6%.

Ejercicio 6. Se sabe que un proceso productivo de cierto tipo de piezas electrónicas está produciendo un
15% de piezas defectuosas. ¿Cuál es la probabilidad de que, al tomar una muestra aleatoria de 49 piezas,
produzca un 6.6% o más de piezas defectuosas? R: 0.9505.

Elaborado y compilado por Carlos H. Vargas Página 35


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Ejercicio 7. Si se toma una muestra aleatoria de tamaño 100 de la línea de producción de un proceso en
el que el 15% de las piezas salen defectuosas, ¿cuál es la probabilidad de que 12 piezas o menos salgan
defectuosas de la muestra? R: 0.242.

Ejercicio 8. El departamento de ingeniería de una fábrica de productos electrónicos sabe que el 5% de los
componentes producidos son defectuosos. Si la fábrica envía 800 lotes, con 100 componentes en cada
lote, ¿en cuántos de estos lotes podemos esperar? a) Menos de 92 componentes buenos. R: 42.96 = 43
lotes. b) 97 o más componentes buenos. R: 196 lotes. c) entre 90 y 98 componentes buenos inclusive. R:
0.9404.

Ejercicio 9. De las 200,000 familias de San Salvador, el 48% está suscrito al periódico La Prensa, ¿Cuál es
la probabilidad de seleccionar una muestra aleatoria de 1,200 familias, con una proporción de
suscriptores de La Prensa del 50% o más? R: 0.0823.

Ejercicio 10. Para el control de la operación de un proceso de producción de cierto tipo de piezas, se
utiliza la siguiente regla de decisión: Tomar una muestra aleatoria de 36 piezas, si el porcentaje de piezas
defectuosas en la muestra es P% o más se detiene el proceso; en caso contrario se continua el proceso.
Determinar el valor de P de modo que haya una probabilidad de 0.90 de que sea detenido un proceso
que está produciendo un 10% de piezas defectuosas en promedio. R: 0.036.

5.4 DISTRIBUCIÓN MUESTRAL DE LA VARIANZA

El propósito fundamental que se persigue al analizar la distribución muestral de la varianza es ilustrar una
característica a la que se denomina “sesgo”. En las dos distribuciones muéstrales anteriores (de la media
y de la proporción) se llegó a la conclusión de que la media de la correspondiente distribución muestral
era igual al parámetro de la población.
Se vio también que cuando se extrae una muestra y se utiliza el correspondiente estadístico muestral
para la estimación de su parámetro correspondiente, se dice que el estadístico se convierte en
“estimador”. Así, cuando se utiliza la media de una muestra para estimar la media de la población, se usa
el estadístico muestral como estimador; de la misma manera, se emplea como estimador de la
proporción poblacional a la proporción de la muestra. En muchos estudios por muestreo no se conoce la
varianza de la población y, por ello, es necesario estimarla con base en la varianza de la muestra, y es por
esto último que se vuelve importante revisar la distribución muestral de la varianza con el propósito de
averiguar la forma en la que se hará la estimación.
Para enfatizar este importante punto:
 La media de la distribución muestral de la media es igual a la media poblacional.-
 La media de la distribución muestral de la proporción es igual a la proporción de la población.
Estas características son las que permiten definir la media y la proporción como estimadores insesgados.
Por otro lado, como no se cumple que la media de la distribución muestral de la varianza es igual a la
varianza de la población, se dice que la varianza es un “estimador sesgado”.

Ejemplo. Suponga que se tiene una población de 5 familias y la variable que se estudia es el número de
hijos de cada familia. Los datos correspondientes aparecen en las 2 primeras columnas de la siguiente
tabla.

Número de hijos

Elaborado y compilado por Carlos H. Vargas Página 36


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Familia Hijos X ( X  ) ( X   )2

Pérez 2 -4 16
Gómez 4 -2 4
Durán 6 0 0
Hidalgo 8 2 4
Juárez 10 4 16
Totales 30 0 40
A continuación calculamos la media poblacional y la desviación estándar poblacional.

   i  6
X 30
N 5

 (X i   )2

40
 8  2.8284271
N 5
 82

Ahora construiremos la distribución muestral de la varianza calculando la varianza de cada una de las
muestras de tamaño 2.
En la siguiente tabla se presentan estos datos.

La distribución muestral de la varianza


X Varianzas Varianzas
Muestra Hijos
muéstrales S2 modificadas
Pérez, Gómez 2,4 3 1 2
Pérez, Durán 2,6 4 4 8
Pérez, Hidalgo 2,8 5 9 18
Pérez, Juárez 2,10 6 16 32
Gómez, Durán 4,6 5 1 2
Gómez, Hidalgo 4,8 6 4 8
Gómez. Juárez 4,10 7 9 18
Durán, Hidalgo 6,8 7 1 2
Durán, Juárez 6,10 8 4 8
Hidalgo, Juárez 8,10 9 1 2
Total 60 50 100

La columna de las varianzas muéstrales (columna 3; la distribución muestral de la varianza) se calculó de


la siguiente manera tomando por ejemplo la varianza de la primera muestra, la correspondiente a las
familias Pérez y Gómez y que es igual a 1:

s 2

(X i  X )2

(2  3) 2  (4  3) 2
1
n 2
Las demás varianzas fueron calculadas de manera similar.
Ahora calculamos la media de la distribución muestral de la varianza, usando el total de la columna 4
anterior:

 s2   i   5
S 50
n 10

Elaborado y compilado por Carlos H. Vargas Página 37


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Al comparar este valor de la media de la distribución muestral de la varianza (5), se observa que no es
igual a la varianza de la población (8)
Por esta característica se dice que la varianza muestral es un “estimador sesgados” de la varianza de la
población, mientras que la proporción y la media son “estimadores insesgados” de sus correspondientes
parámetros.
Para utilizar la varianza muestral como estimador de la varianza de la población se utiliza una forma
modificada de la varianza. La modificación consiste en dividir la suma de los cuadrados de las diferencias
entre N-1, en vez de dividirla entre N o, equivalentemente, dividirla entre n-1, en vez de dividir entre n,
según corresponda al caso de una población o de una muestra, respectivamente.
Así, cuando la fórmula de la varianza de una población es:

2 
(X i
.
  )2
N
La  var ianza  mod ificada  dela
   población  es :

 2

(X i   )2
N 1
Se tiene entonces que la varianza modificada de la población es:
 2

(X i   )2

40
 10
N 1 4
Consecuentemente, la varianza modificada de cada una de las muestras es: .
s2 
 ( X i   )2
n 1
En la última columna de la tabla anterior aparecen las varianzas muéstrales modificadas. Por ejemplo, la
varianza modificada de la primera muestra se calculó de la siguiente manera:

s2 
(X i  X )2

2
2
n 1 1
Entonces resulta que los últimos valores de la última columna constituyen la distribución muestral de la
varianza modificada.
Calculando ahora la media de la distribución muestral:
 s2   m 
s 2 100
 10
m
n 10
Con este cálculo se puede apreciar la conclusión a la que se quería llegar, que la media de la distribución
muestral de la varianza modificada sí es igual a la varianza modificada de la población o, en otras
palabras, la varianza muestral modificada es un estimador insesgado de la varianza poblacional
modificada. Se resumen los resultados anteriores en la siguiente tabla:

Tabla resumen de los resultados de la distribución


muestral de la varianza
Varianza de la población, 8
2

Elaborado y compilado por Carlos H. Vargas Página 38


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Media de la distribución muestral de la 5
varianza para n = 2
Varianza modificada de la población 10
Media de la distribución muestral de la 10
varianza modificada para n = 2

Como puede verse en estos datos, la media de la distribución muestral de la varianza, 5 subestima en 3
unidades a la de la población, 8, o 3/8 = 0.375 (37.5%), en tanto que la correspondiente a la varianza
modificada, 10, la sobreestima, pero sólo en 2 unidades, que son 2/8 = 0.25, o sea 25%.

HOJA DE EJERCICIOS No. 6


Distribución muestral de la varianza y estimadores sesgados e insesgados

Ejercicio 1. En la siguiente tabla se encuentra el número de errores mecanográficos cometidos por 5


secretarias.

Secretaria # de errores
Lorena 3
Marta 5
Marina 7
Alejandra 9
Karla 11

Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución


muestral de la varianza para n = 2, d) la distribución muestral de la varianza modificada para n = 2, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S 2 )   s2   2 ? ¿ E ( Sm2 )   s2   m2 ?
m

Ejercicio 2. Se tiene una población de 6 artículos y se determinó el número de defectos de fabricación de


cada uno de ellos:

Artículo # de defectos
A 0
B 1
C 2
D 3
E 4
F 5
Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución
muestral de la varianza para n = 3, d) la distribución muestral de la varianza modificada para n = 3, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S )   s2   ?
2 2
¿ E ( S )  s2   ?
2
m
2
m
m

Elaborado y compilado por Carlos H. Vargas Página 39


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Ejercicio 3. En la siguiente tabla se muestra el número de faltas que tuvieron 6 telefonistas de un centro
de atención al cliente durante el último mes.

Telefonista Faltas Telefonista Faltas


Arturo 0 Marta 1
Carolina 4 José 5
Ernesto 2 Mario 4

Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución


muestral de la varianza para n = 3, d) la distribución muestral de la varianza modificada para n = 3, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S 2 )   s2   2 ? ¿ E ( Sm2 )   s2   m2 ?
m

Ejercicio 4. En un conjunto de consultorios médicos trabajan 8 especialistas; a continuación se muestra el


número de consultas que atendieron durante la última semana.

Especialistas Consultas Especialistas Consultas


Cardiólogo 4 Neurólogo 2
Dermatólogo 12 Oftalmólogo 18
Fisioterapeuta 2 Radiólogo 22
Ginecólogo 8 Psicólogo 10

Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución


muestral de la varianza para n = 2, d) la distribución muestral de la varianza modificada para n = 2, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S 2 )   s2   2 ? ¿ E ( Sm2 )   s2   m2 ?
m

Ejercicio 5. En un parque de diversiones se venden 4 tipos de entradas; a continuación se muestra


cuántas se vendieron durante los últimos 15 días.

Tipo Ventas
Adulto 90
Familiar 45
Infantil 65
Promociona 80
l

Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución


muestral de la varianza para n = 3, d) la distribución muestral de la varianza modificada para n = 3, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S 2 )   s2   2 ? ¿ E ( Sm2 )   s2   m2 ?
m

Elaborado y compilado por Carlos H. Vargas Página 40


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Ejercicio 6. Un café internet renta las 6 computadoras con las que cuenta; en la siguiente tabla se
muestra el número de minutos que las rentaron los clientes el pasado día.

Computadora Minutos Computadora Minutos


A 60 D 30
B 180 E 120
C 210 F 150

Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución


muestral de la varianza para n = 4, d) la distribución muestral de la varianza modificada para n = 4, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S 2 )   s2   2 ? ¿ E ( Sm2 )   s2   m2 ?
m

Ejercicio 7. En una granja pequeña se tienen 7 vacas, las cuales se ordeñan diariamente. En la siguiente
tabla se muestra el número de litros que produjo cada una de ellas.

Vaca Litros de leche Vaca Litros de leche


A 18 E 33
B 12 F 27
C 3 G 24
D 21

Determine: a) la varianza de la población, b) la varianza modificada de la población, c) la distribución


muestral de la varianza para n = 5, d) la distribución muestral de la varianza modificada para n = 5, e) el
valor esperado de la varianza, f) el valor esperado de la varianza modificada, g) se cumple que
, h) se cumple que .
¿ E ( S 2 )   s2   2 ? ¿ E ( Sm2 )   s2   m2 ?
m

5.5 DISTRIBUCIÓN MUESTRAL DE DIFERENCIAS ENTRE DOS MEDIAS MUESTRALES

Si se tienen dos poblaciones normales e independientes, identificadas la primera por “X“ y la segunda
por “Y”, de tamaño N1 y N2, cuyas medias poblacionales se simbolizan por µ x y µy, y sus desviaciones
típicas poblacionales por σx y σy. Si se obtiene un número (M) de pares de muestras posibles podemos
determinar las medias muéstrales de la primera población y se identifican por: y las
x1 , x2 , x3 , x4 ,...xM

muestras de la segunda variables se identifican por . Las desviaciones típicas


y1 , y2 , y3 , y4 ,... yM

muéstrales respectivas serán: y,


sx 1 , sx 2 , sx 3 , s x 4 ,..., sx M s y1 , s y2 , s y3 , s y4 ,..., s ym

Población 1 = Población X Población 2 = Población Y


X1 , X2 , X3 , …..XN Elementos de la población X Y1 , Y2 , Y3 , …..YN Elementos de la población Y

Elaborado y compilado por Carlos H. Vargas Página 41


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Nx Tamaño de la población X Ny Tamaño de la población Y
µX Media poblacional de la µY Media poblacional de la
población X población Y
σX Desviación estándar de la σY Desviación estándar de la
población X población Y

Muestra X Muestra Y
x1 , x2 , x3 , …..xN Elementos de la muestra X y1 , y2 , y3 , …..yN Elementos de la muestra Y
nx Tamaño de la población X ny Tamaño de la población Y
xx Media muestral de la yx Media muestral de la
muestra X muestra Y
sX Desviación estándar de la sY Desviación estándar de la
muestra X muestra Y
Ahora si consideramos las diferencias para cada par, la media aritmética de dichas diferencias se
simbolizará por donde
x  y

 (x  y )  (x  y )  (x
i i 1 1 2  y2 )  ( x3  y3 )  ( x4  y4 )  ...  ( xM  yM )
x  y M M
=

x  y   i   i
x y
M M

Se puede demostrar que la media de las diferencias de todos los pares de medias posibles, es igual a la
diferencia entre las medias poblacionales.
x  y  x   y

La desviación típica de las diferencias entre los pares de medias muéstrales se simboliza por: y se
 xy

calcula mediante la siguiente fórmula:

 xy 
 [( x  y )  (
i i x   y )]2
M

La desviación típica de las diferencias entre los pares de medias muéstrales, denominado también como
error estándar de las diferencias entre las medias muéstrales es igual a:
Siendo:  x2 = σx2  y2 σy2
n1 = n2

 x2  y
2

 x  y   x2   y2  
n1 n2

Elaborado y compilado por Carlos H. Vargas Página 42


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Suponiendo que la distribución de diferencias entre las medias muéstrales tengan un comportamiento
similar a la distribución normal, la variante estadística estará dada por la fórmula:
( x  y )  (x  y ) (x  y )  (x   y ) ( x1  x2 )  ( 1  2 )
Z  
 x y  x2  y
2
 12  22
 
n1 n2 n1 n2

Utilizamos la distribución normal como una aproximación, para resolver problemas de distribuciones de
diferencias entre dos medias muéstrales.
Se puede aplicar esta distribución cuando no se conocen las varianzas poblacionales las cuales pueden
ser sustituidas por varianzas muéstrales siempre y cuando sean mayores que 30. Hay autores que
consideran su utilización si n1 + n2 > 30. Siendo su fórmula:

( x  y )  (x   y ) ( x1  x2 )  ( 1  2 )
Z 
2
sx2 s s12 s22
 y

n1 n2 n1 n2

xy

x   y

HOJA DE EJERCICIOS No.7


“Distribución de diferencias entre dos medias muéstrales”

Ejemplo 1. Se tienen dos poblaciones normales e independientes, donde la media de la segunda


población es 0.65 menor que la de la primera; si se seleccionan muestras de tamaño 100 y 120 y si las
respectivas desviaciones típicas poblacionales son 12 y 8, se pide determinar la probabilidad de que, en
un par de muestras, la diferencia entre ambas medias muéstrales sea superior a 1 en valor absoluto. R:
0.5223. En Minitab: R: 0.5217.

Ejemplo 2. Se obtiene una muestra aleatoria de 100 elementos de una población normal, que tiene
media 50 y desviación estándar 8. Luego se selecciona otra muestra aleatoria de 400 elementos de una
población normal, que tiene media 40 y desviación estándar 12. Encontrar la probabilidad de que: a) la
media de la primera muestra exceda a la de la segunda en 8 o más. R: 0.9772. b) ambas medias difieran,
en valor absoluto, en 12 o más. R: 0.0228.

Ejemplo 3. En un restaurante, el consumo medio por desayuno es de $4,980.00 con una desviación
estándar de $950.00. En un segundo restaurante las correspondientes cifras son $4,238.00 y $820.00. Si
se eligen al azar 80 boletas de pago del primer restaurante y una muestra aleatoria de 60 del segundo,

Elaborado y compilado por Carlos H. Vargas Página 43


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
¿cuál es la probabilidad de que la diferencia entre los consumos medios de ambas muestras sea mayor
que $1,000 en valor absoluto? R: 0.0409.

Ejemplo 4. Dos marcas, A y B de tabletas antiácidas efervescentes registran el mismo promedio de


disolución en agua, con desviación estándar de 12 segundos para la marca A y 24 segundos para la marca
B. Suponiendo que el tiempo de disolución esté normalmente distribuido, ¿cuál es la probabilidad de
que, con una muestra de 36 tabletas de cada marca, las tabletas B registren un promedio de tiempo de
disolución, cuando menos 5 segundos más rápido que A? R: 0.1314.

Ejemplo 5. En promedio, los estudiantes de la Universidad A se levantan 50 minutos después de la salida


del sol, con una desviación estándar de 15 minutos. Los estudiantes de la Universidad B se levantan 60
minutos después de la salida del sol, con una desviación estándar de 18 minutos. Un grupo de 25
estudiantes de la Universidad A realiza un viaje junto con 20 alumnos de la B. Encontrar la probabilidad
de que la hora media de levantada del grupo de la Universidad B sea más temprana que la del grupo de
la Universidad A. R: 0.0233.

Ejemplo 6. Las empresas A y B fabrican dos tipos de cables, que tienen una resistencia media a la rotura
de 4,000 y 4,300 libras, con desviaciones estándar de 980 y 850 libras, respectivamente. Si se prueban 70
cables de A y 40 cables de B, ¿cuál es la probabilidad de que la media de resistencia a la rotura de A sea,
al menos, 300 libras más que B? R: 0.0004.

Ejemplo 7. Dos fábricas A y B productoras de bombillas afirman que el promedio de duración de ellas es
de 1,500 y 1,450 horas, respectivamente, con desviaciones típicas de 90 y 100 horas. Si se compran 100
bombillas de cada fábrica, ¿cuál es la probabilidad de que la diferencia en duración entre las dos marcas
sea mayor de 40 horas? R: 0.7704.

Ejemplo 8. Dos marcas de bombillas de alumbrado público, A y B tienen una duración promedio de 1,400
y 1,200 horas, respectivamente, y sus varianzas de 40,000 y 10,000 horas respectivamente. Se extrae una
muestra aleatoria de 125 de cada marca. Determine la probabilidad de que: a) La marca A tenga una vida
media de por lo menos 160 horas más que B. R: 0.9773. b) La marca A tenga una vida media de por lo
menos 250 horas más que B. R: 0.0062.

Ejemplo 9. El tiempo promedio requerido para ejecutar un determinado trabajo es de 2 horas, mientras
que para otro trabajo, otro grupo de trabajadores, gasta una hora y cuarenta y cinco minutos. Se sabe
que la desviación estándar para cada uno de estos trabajos es de 30 y 20 minutos respectivamente. ¿Cuál
es la probabilidad, si se toman dos muestras de 30 trabajadores cada una, de que el promedio requerido
para ejecutar el segundo trabajo sea mayor que el primero? R: 0.011.

Ejemplo 10. El promedio de los obreros, en una fábrica textil, es de 34 años con desviación estándar de 6
años, además el promedio de edad de las obreras es de 30 años con desviación estándar de 4 años. ¿Cuál
es la probabilidad, al tomar muestras de 20 obreros de cada sexo, de que el promedio de edad de las
mujeres resulte mayor que el de los hombres? R: 0.0066.

5.6 DISTRIBUCIÓN MUESTRAL DE DIFERENCIAS ENTRE DOS PROPORCIONES MUESTRALES

En el caso de dos poblaciones independientes, de tamaño N 1 y N2, distribuidas binomialmente, con


parámetros, medias proporcionales P1 y P2 (también se puede representar las medias por )y
 p1 y  p2

Elaborado y compilado por Carlos H. Vargas Página 44


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
desviaciones proporcionales y siendo: y . El error estándar de las
 p1  p2  p1  P1.Q1  p2  P2 .Q2

diferencias entre las dos medias proporcionales estará dado por siendo:
 p1  p2

P1.Q1 P2 .Q2
 p1  p2  
Cuando son parámetros o valores poblacionales
n1 n2

Recordar: Las proporciones P1 y P2 SON POBLACIONALES, Y SE SIMBOLIZAN CON LETRAS MAYÚSCULAS.


Luego cuando p1 y p2 son muéstrales se utilizan letras minúsculas.

Cuando n1 y n2 corresponden a muestras grandes, es decir, ambas superiores a 30, se tendrá, que el error
estándar de las diferencias entre dos proporciones es:
p1.q1 p2 .q2
s p1  p2  
n1 n2

La media de las diferencias entre dos medias proporcionales, se simboliza; indistintamente por:
 p1   p2   p1  p2  P1  P2

La variante estadística “Z” está dada en la misma forma que fue presentada para la diferencia entre dos
medias muéstrales:
( p1  p2 )  (  p1   p2 ) ( p1  p2 )  ( P1  P2 )
Z 
P1.Q1 P2 .Q2 P1.Q1 P2 .Q2
 
n1 n2 n1 n2

HOJA DE EJERCICIOS No.8


“Distribución muestral de diferencias entre dos proporciones muéstrales”

Ejercicio 1. Consideremos dos máquinas que producen un determinado artículo; la primera produce por
término medio un 14% de artículos defectuosos, en tanto que otra, produce el 20% de artículos
defectuosos; si se obtienen muestras de 200 unidades en la primera y 100 unidades en la segunda, ¿cuál
es la probabilidad de que difiera A de B en 8% o más en valor absoluto? R: 0.335.

Ejercicio 2. Dos fábricas A y B, producen artículos similares. La producción de A contiene 7% de


defectuosos, y la B contiene, 5%. Si se extrae una muestra aleatoria de 2,000 de cada una de las
producciones de las fábricas, ¿cuál es la probabilidad de que las dos muestras revelan una diferencia en
el número de los defectuosos del 1% o más en valor absoluto? R: 0.9082.

Ejemplo 3. Se sabe que cierta marca de crema para las manos satisface el 65% del mercado. ¿Cuál es la
probabilidad de que dos muestras aleatorias de 200 usuarios cada una, muestre una diferencia mayor del
10% en las proporciones del uso de la crema en valor absoluto? R: 0.0358.

Ejercicio 4. Suponga que una máquina A produce, por término medio, un 12% de piezas defectuosas, en
tanto que la máquina B, el 18% de piezas con defectos. Se desea hallar la probabilidad de que el

Elaborado y compilado por Carlos H. Vargas Página 45


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
promedio de defectuosas de una muestra de 600 unidades, tomada de la máquina A, no difiera en más
de un 8% de otra muestra de 400 unidades, de la máquina B. R: 0.8051.

Ejercicio 5. Ciertas encuestas a televidentes, revelan que el 25% de los hombres y 33% de las mujeres de
clase media, ven la telenovela de las 11 y ½ de la mañana. ¿Cuál es la probabilidad de que en dos
muestras aleatorias de 150 hombres y 100 mujeres respectivamente, pertenecientes a dicho estrato
social, se encuentre que la proporción de hombres que han visto el programa sea igual o mayor que la
proporción de mujeres? R: 0.0869.

Ejercicio 6. Ciertas encuestas realizadas en una ciudad de la costa, revelan que el 25% de los hombres y el
33% de las mujeres escuchan cierto programa radial. ¿Cuál es la probabilidad de que en dos muestras de
150 hombres y 100 mujeres respectivamente, domiciliadas en dicha ciudad, se encuentre que la
proporción de mujeres que escuchan el programa sea menor o igual a la proporción de hombres? R:
0.0869.

Ejercicio 7. En dos fábricas A y B, que producen camisas para hombres, se sabe que el 17% y 15% de la
producción es defectuosa. Si se extrae una muestra de 200 camisas de cada lote producido en las
fábricas. ¿Cuál es la probabilidad de que las dos muestras revelan una diferencia superior al 3%? R:
0.4821.

Ejercicio 8. Ciertas encuestas sobre un programa de televisión revelan que el 28% de los hombres y el
38% de las mujeres de clase media, ven dicho programa. ¿Cuál es la probabilidad de que en dos muestras
aleatorias de 150 hombres y 100 mujeres respectivamente, pertenecientes a dicho estrato, se encuentre
que la proporción de hombres que han visto el programa sea igual o mayor que la proporción de
mujeres? R: 0.0505.

Ejercicio 9. Se sabe que cierto producto satisface el 72% del mercado. Seleccionamos dos muestras
(independientes) de la misma población, de tamaño 150 cada una. ¿Hallar la probabilidad de que revelen
una diferencia: a) mayor del 6%?, b) en la segunda muestra la diferencia sea superior en un 5%? R: 0.166.

Ejercicio 10. Es sabido que los porcentajes de familia con ingresos superiores a $570,000 en las ciudades
A y B son de 25% y 20%, respectivamente. Se seleccionan a azar dos muestras de 100 familias en cada
una de las dos ciudades y se comparan las proporciones muéstrales de las familias con ingreso superior a
$570,000. ¿Cuál es la probabilidad de que la proporción muestral correspondiente a la ciudad B sea: a)
mayor que la de A en 3% o más? R: 0.3669. b) ¿Menor que la de A en 3% o más? R:

6. TEORÍA DE LAS MUESTRAS PEQUEÑAS

Se dice que una muestra es grande, si el número de unidades es mayor que treinta y es pequeña si es
menor o igual a treinta.
En el caso de que se desconozca la desviación típica poblacional, se le podrá reemplazar por la desviación
típica muestral, siempre que la muestra sea grande.
Cuando n > 30 (muestra grande), la desviación típica se simboliza por “s” y se considera como un buen
estimador de la desviación típica poblacional, debido a que existe una mayor probabilidad de que los
valores extremos que toma la variable, queden incluidos en el cálculo de la varianza en la muestra, tal
como ocurre al obtener la varianza poblacional.
Siendo: s = σ la fórmula para calcular “s” será:

También se
puede expresar
como

Elaborado y compilado por Carlos H. Vargas Página 46


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

s
 (x  x )
i
2

s
x
2
i  n.x 2
n n 1

Si n ≤ 30 (muestra pequeña), la desviación típica se simboliza por “ŝ” cuando no se ha efectuado ninguna
corrección. Se considera que “ŝ” por lo general es menor que σ, debido a la poca posibilidad de que se
incluyan valores extremos de la variable poblacional en la muestra. Por lo tanto se hace necesario
efectuar algunas correcciones en su cálculo, con el fin de convertirla en un buen estimador de la
desviación típica poblacional.
A pesar de las correcciones que se le puedan hacer a las deviaciones típicas, no es efectiva en todas las
muestras, por tal razón la distribución de todas las medias muéstrales, no tiene un comportamiento
similar a la distribución normal, a pesar de ser una distribución continúa. A esta distribución se le conoce
como distribución “t” de Student, en honor del estadístico irlandés William Sealy Gosset. Gosset
trabajaba en una fábrica de cerveza, Guiness, que prohibía a sus empleados la publicación de artículos
científicos debido a una difusión previa de secretos industriales. De ahí que Gosset publicase sus
resultados bajo el seudónimo de Student. Fue enunciada en 1908 y ligeramente modificada por R.A.
Fisher (1925).
En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge
del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la
muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias
entre dos medias muéstrales y para la construcción del intervalo de confianza para la diferencia entre las
medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser
estimada a partir de los datos de una muestra.
Al igual que la distribución Z es una distribución continua, tiene una media de cero, es simétrica respecto
de la media y se extiende de menos infinito a más infinito. Esta distribución se expresa en forma de
campana y simétrica, pero más achatada y con más área en los extremos, es decir, las áreas que
corresponden a las regiones críticas o de rechazo. No hay una distribución t, sino una "familia" de
distribuciones t. todas con la misma media cero, pero con su respectiva desviación estándar diferente de
acuerdo con el tamaño de la muestra n. Existe una distribución t para una muestra de 20, otra para una
muestra de 22, y así sucesivamente.
La distribución t es más ancha y más plana en el centro que la distribución normal estándar como
resultado de ello se tiene una mayor variabilidad en las medias de muestra calculadas a partir de
muestras más pequeñas. Sin embargo, a medida que aumenta el tamaño de la muestra, la
distribución t se aproxima a la distribución normal estándar.
. La función de distribución “t” es:
t 2  r 21
Y  C.(1  )

Distribución t de Student (función de densidad de probabilidad)

Elaborado y compilado por Carlos H. Vargas Página 47


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

Grados de libertad ( ). Esta expresión fue introducida por Fisher; dice que los grados de libertad de un

conjunto de observaciones, están dados por el número de valores que pueden ser asignados
arbitrariamente, antes de que el resto de las variables queden completamente determinadas. Ejemplo: si
tengo cuatro valores: 8 + 10 + 6 + 20 = 44, se observa que puedo asignar tres (3) valores arbitrariamente:
16 + 4 + 10 + 14 = 44, pero el cuarto debe ser 14 y no lo puedo asignar libremente pues la suma debe ser
44. Por lo tanto ν = n – 1 = 4 – 1 = 3 “ ” se lee “un” o “niu” y se emplea para simbolizar los grados de

libertad.
NOTA: Es necesario observas que algunos textos consideran que las muestras son pequeñas si n 1 + n2 son
menores o iguales a 30, pero en el curso vamos a considerar que son pequeñas si n 1 y n2 son menores o
iguales a 30.

PROPIEDADES DE LA DISTRIBUCIÓN T-STUDENT


1. La distribución “t” está distribuida con media igual a 0.
2. La distribución “t” está distribuida simétricamente con respecto a la media.
3. La variancia de la distribución “t” es mayor que 1, pero tiende a uno al incrementarse el tamaño
“n” de la muestra.
4. La distribución “t” tiene una función de densidad muy similar a la normal estándar, pero su
gráfica es menos esbelta en la media y más amplia en las extremidades o colas.
5. La distribución “t-student” se aproxima a la distribución normal a medida crece el tamaño
muestral.
6. Para todas las distribuciones “t” con 30 o más grados de libertad, se pueden utilizar los
correspondientes valores críticos de Z de la distribución normal estándar.

6.1 DISTRIBUCIÓN DE MEDIAS MUESTRALES (muestras pequeñas)

Cuando el problema nos da la desviación típica muestral y, el tamaño de la muestra es menor o igual a
30, se considera que está sin corregir, procediendo a su corrección para ser aplicada en la variante
estadística “t”. Simbolicemos a: ŝ (desviación típica sin corregir) y s (desviación típica corregida).

s  sˆ.
n
;s 
 ( xi  x ) 2

 xi2  n.x 2
;    x   :  En esta fórmula se puede 
n 1 n 1 n 1
corregir directamente,  al calcular la variante estadística  

Elaborado y compilado por Carlos H. Vargas Página 48


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

ANEXO UNIDAD 1

7. MUESTREO NO ALEATORIO (NO PROBABILÍSTICOS), CIRCUNSTANCIALES O ERRÁTICOS


Son métodos cuyos resultados o estimaciones no son de ninguna manera confiables, dado que la
selección de las unidades que conforman la muestra, se realiza en forma caprichosa o por
conveniencia, primando el juicio personal del investigador. En estos muestreos no es posible calcular
la probabilidad de obtener cada una de las posibles muestras. No deben usarse cuando el
investigador desea determinar la precisión de las estimaciones.

Se usa normalmente en situaciones como:


a) Las etapas exploratorias de un proyecto de investigación;
b) La prueba preliminar de un cuestionario;
c) El manejo de una población homogénea;
d) Cuando un investigador carece de conocimiento estadístico;
e) Cuando se requiere facilidad operativa.

7.1 Muestreo dirigido, adaptado, a juicio, intencional u opinático (subjetivo) o de criterio.


Consiste en seleccionar las unidades elementales de la población según el juicio u opinión de los
encuestadores (de un experto) quienes creen que las unidades seleccionadas gozan de
representatividad. En este muestreo la probabilidad de que una unidad elemental sea elegida, es
desconocida; en consecuencia, no se pueden construir intervalos de confianza; sino que sólo se
pueden hacer estimaciones puntuales. Tampoco se pueden aplicar los principios de la teoría del
muestreo. Sin embargo, en muchas situaciones, resulta más ventajoso echar mano de este tipo de
muestreo que de cualquier tipo de muestreo aleatorio. La selección aleatoria simple puede perder
los elementos más importantes, mientras que el muestreo dirigido con seguridad las incluiría en la
muestra. Un estudio de industrias de bebidas en el país sería dudoso, si no se toma en cuenta a “La
Constancia”.

Este muestreo bien manejado puede ser de utilidad práctica para resolver problemas comerciales
cotidianos y para tomar decisiones de política pública. Los ejecutivos, los funcionarios y los políticos a
menudo están presionados por el tiempo y las circunstancias y no pueden esperar para emplear
diseños probabilísticos. El muestreo dirigido es, entonces, el único método práctico, ya que permite
disponer rápidamente de las estimaciones para llegar a decisiones sobre problemas urgentes. Es
mejor tomar decisiones en estas condiciones que tomarlas sin ningún dato estadístico.

Cuando queremos estudiar algunas particularidades desconocidas de una población, podemos


estratificar esa población de acuerdo con esas propiedades conocidas y seleccionar las unidades
muéstrales de cada estrato, basándonos en el juicio personal. Es aconsejable utilizar este muestreo
para realizar estudios pilotos o de sondeo. La confiabilidad de los resultados muéstrales en el
muestreo dirigido depende de la calidad de los conocimientos o del juicio del investigador.

Elaborado y compilado por Carlos H. Vargas Página 49


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Por ejemplo, en una prueba de marketing se hace un juicio con respecto a que ciudades constituirían
las mejores para probar el potencial de venta de un nuevo producto. En la investigación de mercado
industrial, la decisión de entrevistar a un agente de compras acerca de un determinado producto
constituye una muestra por juicios. Este agente debe considerarse como un representante de la
compañía por la persona que diseña la muestra.

En estos casos se desconoce el grado y la dirección del error, y las afirmaciones definitivas no son
significativas. Sin embargo, si el juicio del experto es válido, la muestra resultará mejor que al utilizar
una muestra por conveniencia. En la práctica comercial alrededor del 49% de las empresas utilizan el
muestreo por juicios.

También es aconsejable su uso cuando:

a) Existen situaciones en que el muestreo probabilístico no es factible o es excesivamente


costoso. Por ejemplo, tal vez sea imposible conseguir una lista de vendedores ambulantes, y
un muestreo de criterio podría ser apropiado en este caso.
b) Si el tamaño de la muestra tiene que ser muy pequeño, por ejemplo, menor de 10, este tipo
de muestreo generalmente será más confiable y representativo que un muestreo
probabilístico. Suponga que se van a usar una o dos ciudades de tamaño medio para
representar a un total de 100 ciudades. Entonces sería apropiado escoger, con base en el
criterio, dos ciudades que parecieran ser las más representativas por ciertas características
externas.
c) En ocasiones es útil obtener una muestra deliberadamente desviada. Por ejemplo, si se va a
evaluar la modificación de un producto o servicios, podría ser posible identificar a un grupo
que, por su misma naturaleza, debería estar dispuesto a la modificación. Si se descubre que
no les gusta, entonces podrá suponerse que el resultado de la población tendrá, por lo
menos, la misma reacción negativa. Si les gusta, probablemente se requerirá más
investigación.

7.2 Muestreo de bola de nieve.


Es una forma de muestreo de criterio que resulta muy conveniente cuando es necesario
llegar a poblaciones pequeñas y especializadas. Suponga que un grupo de planeación a largo
plazo quiere obtener una muestra de personas que son muy conocedoras de una nueva
tecnología especializada, como el uso de rayos láser en la construcción. Incluso las revistas
especializadas tendrían un pequeño porcentaje de lectores en esta categoría. Además, el
grupo a alcanzar podría estar empleado por diversas organizaciones, como el gobierno,
universidades, organizaciones de investigación y empresas industriales. Bajo un diseño de
bola de nieve, a cada encuestado, después de realizar la entrevista, se le pide que
identifique a uno o más miembros del campo en particular. El resultado puede ser una
muestra muy útil. Este diseño puede usarse para llegar a cualquier población pequeña,
como los buzos en aguas profundas, personas confinadas a sillas de ruedas, propietarios de
vehículos ligeros para playa y arena, familias con trillizos, etc. Un problema es que las
personas que son visibles tienen más probabilidad de ser seleccionadas.

Elaborado y compilado por Carlos H. Vargas Página 50


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
7.3 Muestreo por cuotas. Es una técnica de uso corriente en encuestas de opinión pública. Es un
muestreo de criterio con la restricción de que la muestra incluye un número mínimo de cada
subgrupo especificado en la población. Al usar esta técnica el entrevistador selecciona, de
acuerdo, con su criterio, un número determinado de individuos u objetos (cuota), de cada
uno de los varios sectores de la población.

Con frecuencia se basa en datos demográficos como ubicación geográfica, edad, sexo, educación e
ingresos. Como resultado de ello, el investigador sabe que la muestra “corresponde” a la
población con respecto a estas características demográficas. Este hecho es tranquilizante y
elimina algunos sesgos importantes que podrían ser parte de una muestra de criterio; sin
embargo con frecuencia existen otros sesgos graves que no son controlados por el enfoque de
muestreo por cuotas. Los entrevistadores contactarán a las personas que resulten más
accesibles, a las que se encuentren en casa, a las que tengan tiempo disponible o que posean
una apariencia aceptable, etc., lo cual provocará algunos sesgos. Por supuesto, una muestra
aleatoria con una tasa de ausencia de respuesta de 15 o 20 por ciento o más tendrá muchos de
los mismos sesgos. Por lo tanto, el muestreo por cuotas y otros enfoques de criterio, que son
más rápidos y baratos, no siempre deberán descartarse bajo el supuesto de que son inferiores.

Ejemplos: se le puede pedir que entreviste a 25 señoras de los mercados, 30 amas de casa, 20
estudiantes universitarios, 25 obreros de la construcción, etc. Otro ejemplo, para control de
calidad, puede ser examinar 5 unidades cada 30 segundos en un proceso de producción. Otro
ejemplo, suponga que desea una muestra de 1,000 personas de una ciudad y se sabe cómo está
distribuida geográficamente la población de la ciudad, en este caso a los entrevistadores se les
podrían pedir que realizarán 100 entrevistas en la zona este, 300 en la zona norte, etc.

7.4 Muestreo deliberado. Consiste en tomar un segmento o fracción de la población por su


cómoda accesibilidad. Por ejemplo, una muestra obtenida de listas fácilmente disponibles,
como las guías de teléfonos, constituyen una muestra deliberada. Por la comodidad o
facilidad en tomar la muestra se sacrifica cierto grado de representatividad de las
características poblacionales; sin embargo, este tipo de muestreo puede ser de alguna
utilidad para estudios pilotos o de sondeo.
7.5 Muestreo voluntario. Donde el informante, voluntariamente, suministra información sin ser
seleccionado.

7.6 Muestreo por prorrateo. Son un tipo especial de muestras intencionales. En este caso, el
investigador emprende pasos explícitos para obtener una muestra que sea similar a la
población en algunas características de “control” anteriormente especificadas. Por ejemplo,
un entrevistador puede estar capacitado para llevar a cabo la mitad de las entrevistas con
personas de 30 años o más, y la mitad con personas menores de 30 años. En este caso, la
característica de control es la edad de los encuestados. Por supuesto, especificar esta
afirmación particular de control implica que el investigador sepa que la población de interés
está dividida en forma equivalente entre personas de 30 años o más, y personas menores de
30 años. Obviamente este es un ejemplo simple, ya que sólo se ha utilizado una característica
de control.

Elaborado y compilado por Carlos H. Vargas Página 51


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
Para ser más realista y obtener pruebas más representativas de una población tendríamos que
“controlar” varias características. Por tanto, para seleccionar apropiadamente una muestra por
prorrateo debemos: 1) especificar una lista de características de control relevantes, 2) conocer la
distribución de estas características a través de nuestra población.
Veamos un ejemplo. Supongamos que tenemos dos características de control de interés, edad, y raza,
como sigue:
1. Edad: dos categorías: menores de 30 años y mayores de 30 años
2. Raza: dos categorías: blancos y no blancos
Tenemos entonces cuatro celdas de muestreo de interés que son: a) menores de 30 años y
blancos, b) 30 años o más y blancos, c) menores de 30 años y no blancos y d) 30 años o más y no
blancos. Lo que debemos saber es la proporción de la población en cada una de esas celdas.
Existen algunos problemas con las muestras por prorrateo.
a) La proporción de encuestados asignada a cada celda debe ser exacta y actualizada. Con
frecuencia, esto es difícil o imposible.
b) Deben seleccionarse las características de control “apropiadas”; es decir, deben incluirse
todas las características que se relacionen con las medidas de interés.
c) El tercer problema se relaciona con las dificultades prácticas asociadas a la inclusión,
cada vez más, de características de control.
d) Una cuarta dificultad está relacionada con la selección por parte del entrevistador de los
encuestados reales a entrevistar. Al buscar personas que se ajusten a la descripción
deseada, el entrevistador puede dejar de lado personas que parezcan poco amistosas,
que vivan en casas deterioradas, etc.
Las muestras por prorrateo son útiles en las etapas preliminares de la investigación y, si se
elaboran con mucho cuidado, pueden suministrar respuestas más definitivas. Sin embargo, es
probable que este tipo de muestreo sea más valido que un muestreo probabilístico. En la práctica
comercial, este muestreo se utiliza en alrededor del 86% de las empresas.

7.7 Muestreo por conveniencia.


Donde se eligen los elementos que están más al alcance del investigador (se toman por su
accesibilidad). Se seleccionan con base en la conveniencia del investigador. Por ejemplo, cuando
un profesor de una universidad que realiza una investigación suele solicitar alumnos voluntarios
que participen en un estudio, estos alumnos participan en la muestra sólo porque son alumnos
del profesor. Entre otros ejemplos se incluyen: 1) Pedir a las personas que colaboren
voluntariamente para probar productos y luego utilizar esas mismas personas, 2) solicitar la
opinión de personas que transitan en un centro comercial, 3) usar estudiantes o grupos
religiosos para realizar un experimento, 4) hacer que una estación de televisión realice
“entrevistas con personas de la calle”, 5) Para muestrear un cargamento de naranjas, el
investigador tomará de manera aleatoria naranjas de varias cajas ya que no sería práctico
etiquetar todas las naranjas del cargamento, 6) Estudios sobre la flora y fauna salvajes , 7) Los
paneles de voluntarios en los estudios de mercado, etc. En cada caso, la unidad de muestreo o el
elemento se autoselecciona o se ha seleccionado debido a su fácil disponibilidad. En todos los
casos no es claro de qué población se saca la muestra real. Se desconoce la diferencia entre el
valor de la población de interés y el valor de la muestra, en términos de tamaño y dirección. No
podemos medir el error muestral, y sin duda no podemos hacer afirmaciones definitivas o
Elaborado y compilado por Carlos H. Vargas Página 52
Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos
concluyentes acerca de los resultados de tal muestra. Sin embargo, las muestras por
conveniencia pueden justificarse con mayor facilidad en la etapa exploratoria de una
investigación, como una base para generar hipótesis, y para estudios concluyentes donde el
gerente está dispuesto a aceptar el riesgo de que los resultados del estudio puedan tener
grandes inexactitudes. En la práctica, cerca del 53% de las empresas utiliza el muestreo por
conveniencia.
Es una manera relativamente sencilla de seleccionar una muestra y obtener los datos deseados,
pero es imposible estimar “la bondad” de los estadísticos muéstrales obtenidos como
estimaciones de los parámetros poblacionales que interesan. Puede o no dar buenos resultados;
no hay ningún procedimiento estadísticamente justificado que permita hacer inferencias
muéstrales a partir de los resultados muéstrales.
Con frecuencia se utiliza para la prueba preliminar de un cuestionario.

RESUMEN DE FÓRMULAS
PROBLEMA

Elaborado y compilado por Carlos H. Vargas Página 53


Asignatura: Estadística 2 Tema: Diseños muéstrales y distribución
muestral de estadísticos

Varianza

Se conoce la varianza No se conoce la varianza poblacional


poblacional
2
2
, pero si se conoce la varianza muestral
s2

No importa el Muestra grande n > 30 Muestra pequeña n <


tamaño de la 30
muestra
Se utiliza la distribución t

Se utiliza la Se utiliza la x 
t
distribución Z distribución Z sˆ
n 1

xy
x  x  t
Z Z (n1  1) s  ( n2  1) s y2
2
 s 1 1
x
. 
n n n1  n2  2 n1 n2

pP
xy xy t
Z Z p.q
 x2  y
2 2
 sx2 s y n 1

n1 n2 n1 n2

t
xy
siendo " s 2
"
 (x  x )   ( y
1
2
1  y )2
s2 s2 n1  n2  2
p1  p2 
Z n1 n2
p1.q1 p2 .q2

n1  1 n2  1

Elaborado y compilado por Carlos H. Vargas Página 54

También podría gustarte