Está en la página 1de 27

1

Dra. Yeanny Marcano

Estadística II

CAPITULO I
MUESTREO

En esta unidad se hace un repaso de algunas definiciones básicas, necesarias para una
mejor comprensión del tema y, en general, de los procedimientos estadísticos de selección de
muestras.

Dra. Yeanny Marcano


2
Dra. Yeanny Marcano

Estadística II

Una vez que el investigador ha diseñado la estrategia de la investigación y ha elaborado sus


instrumentos de recolección de datos, debe resolver el problema de identificar a los sujetos con
los que trabajará o cuál será el objeto de estudio, para saber a quiénes o dónde aplicará los
instrumentos, ya sea de medición, de observación o simplemente de acopio de información.

En esta etapa el investigador debe definir la unidad de análisis que, en el caso de


investigaciones de la ciencias sociales pueden ser personas, organizaciones, locales, métodos
didácticos, otros. Una vez establecida la unidad de análisis, debe delimitar la población que
será estudiada. Sobre esta población el investigador tratará de generalizar los resultados de su
trabajo a partir de la muestra.

1. DEFINICIÓN DE TÉRMINOS BÁSICOS EN ESTADISTICA.

Estadística. Definición. La estadística es comúnmente considerada como una colección de


hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilados
a partir de otros datos numéricos.

Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística
como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimación de parámetro de
determinada población; es decir, una función de valores de muestra.

"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos
de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos
más simples llamados individuales o particulares". (Gini, 1953.

Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar
decisiones razonables basadas en tal análisis.

"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los


hechos sujetos a una apreciación numérica como base a la explicación, descripción y
comparación de los fenómenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la


estadística, debido al gran campo de aplicación que posee.

La Estadística está constituida por un conjunto de métodos de análisis de datos que pueden
agruparse en tres categorías: La Estadística Descriptiva, el Análisis Exploratorio de Datos y la
Inferencia Estadística, que se describen a continuación:

Estadística descriptiva. Es un conjunto de procedimientos que tienen por objeto resumir


masas de datos por medio de números calculados a partir de ellos, o medidas de resumen,
tablas y gráficos.

Análisis exploratorio de datos. Conjunto de procedimientos que tienen por finalidad la


búsqueda de estructuras en una masa de datos, que conduzcan a la percepción de las
características que posee la fuente de donde provienen.

Inferencia estadística. Conjunto de procedimientos que permiten confirmar o concluir


propiedades de una población fuente de información, de la cual sólo conocemos una parte
representativa, o muestra.

Dra. Yeanny Marcano


3
Dra. Yeanny Marcano

Estadística II

Fenómeno Aleatorio o Experimento Aleatorio: Es aquel cuyo resultado final es


impredecible, es decir, no se pueden predecir los resultados con exactitud ya que estos
dependen del azar. Por ejemplo, cuando un cliente visita una tienda de ropa, no se puede
afirmar si éste comprará o no; al lanzar una moneda no sabemos si caerá cara; cuando se
lanza un dado no sabemos si caerá el cinco; si va a nacer un niño no sabemos a qué hora, o
que día nacerá, ó que sexo tendrá, etc. Todos estos son ejemplos de fenómenos aleatorios.
Estos fenómenos aleatorios son el objeto de estudio de la estadística, buscando disminuir esa
incertidumbre propia de sus resultados.

Espacio muestral: Es el conjunto de todos los posibles resultados de un experimento


aleatorio.

Datos estadísticos: Son las cifras ó números, clasificados y otras informaciones que se
obtienen mediante experimentos, encuestas, observaciones personales, etc. Por ejemplo, una
persona contestó “SI” en una encuesta, un vehículo usa cauchos “X”; una persona resulto de
sexo “M” y de estatura “1.73”, se lanzo un dado 10 veces y en la séptima vez salió “Cara”.

Variable aleatoria: Nombre que se da a las diferencias en el comportamiento de todo


fenómeno observable que se repite bajo iguales condiciones, debidas a cambios en factores no
controlables, que influyen sobre él. Estas diferencias pueden ser casi imperceptibles, como en
el caso de experimentos de laboratorio, donde hay un alto grado de control sobre los factores
que influyen sobre el fenómeno; pueden ser pequeñas, como en el caso de en procesos
industriales, y pueden ser grandes, como en el caso de fenómenos en que está involucrado el
comportamiento humano, como los fenómenos sicológicos, sociológicos y económicos.

Una variable aleatoria, es una función puntual que asigna un número real a cada elemento
de un espacio muestral (resultados de un experimento aleatorio). Generalmente, las variables
aleatorias se simbolizan con las ultimas letras del alfabeto, como X, Y y Z y los valores que
toman se denotan con las correspondientes letras minúsculas x, y, z. sus resultados no son
predecibles con exactitud.

La variabilidad existente en los fenómenos se puede reducir, se puede explicar


parcialmente, pero no se puede eliminar.
Tipos de variables.
Las variables estadísticas se agrupan básicamente en dos grupos: las numéricas o
cuantitativas y las no numéricas o cualitativas. Las primeras a su vez se dividen en discretas y
continuas.
Variables Cualitativas: Son atributos que se expresan mediante nombres, letras, etc.
ejemplo de ellas se tienen las variables sexo, profesión, nacionalidad, etc. es decir, son
aquellas que proporcionan datos estadísticos no numéricos.
Variables Cuantitativas: Son aquellas que proporcionan datos estadísticos numéricos,
ejemplo: edad, peso, estatura, calificación obtenida en determinada asignatura. Este tipo de
variables clasifican en discretas y continúas:
a) Variables Discretas: Cuando los datos son obtenidos por medio de una operación de
conteo, arrojando como resultados números enteros. Ejemplo: número de docentes adscritos
por departamento académico, cantidad de estudiantes por sección, etc.
b) Variables Continuas: Cuando la variable puede tomar cualquier valor, incluso decimal.
Ejemplo: promedio de calificaciones por sección en la asignatura Estadística en el Programa de
Educación, coeficiente intelectual de un grupo de estudiantes, etc.
Figura Nº 1
TIPOS DE VARIABLES

Dra. Yeanny Marcano


4
Dra. Yeanny Marcano

Estadística II

Medición: Es la observación de un fenómeno o propiedad, y la asignación de un número o

categoría, como forma de representar ese fenómeno. Suele usarse el término observar como

sinónimo de medir. Por ejemplo, pesar un objeto es observar una propiedad, su peso, y

asignarle un número, el número de kilogramos que pesa. Determinar el estado civil de una

persona también es efectuar una medición, que consiste en clasificar esa propiedad en una de

varias categorías: soltera, casada, etc.

Dra. Yeanny Marcano


5
Dra. Yeanny Marcano

Estadística II

Medida: Es el número o categoría que se asigna al medir un fenómeno. Un sinónimo


demediad es observación.
Escala de medida: Una escala de medida es el conjunto de valores que puede tomar una
determinada medida. Se pueden clasificar en los siguientes tipos:
Escalas de medida Categóricas: Nominales. Ordinales.
Escalas de medida Numéricas: De intervalos. De razón.
a) Las escalas categóricas: sólo asignan una categoría, o clasifican el fenómeno o
propiedad que se mide. Las Ordinales se distinguen de las nominales, en el hecho que sus
valores tienen un orden natural.
b) Las escalas numéricas asignan números: Si la escala tiene en cero absoluto, la
escala es de razón, si el cero es arbitrario, la escala es de intervalo.
Por ejemplo, al determinar el color de ojos de una persona se está midiendo en una escala
categórica nominal, su fecha de nacimiento se mide en escala categórica ordinal. Su
temperatura corporal, en grados centígrados, se mide en una escala numérica de intervalos. Su
peso, en escala numérica de razón. En esta escala tiene sentido decir que una persona tiene el
doble de peso que la otra.

1. Escala Nominal: se clasifican a los sujetos en categorías, mutuamente excluyentes y


totalmente exhaustivas, tal que todos los sujetos clasificados en la misma categoría son
equivalentes respecto a la variable que se está midiendo. No tiene sentido la relación de
igualdad - desigualdad, se pueden utilizar números, letras o símbolos para identificar a cada
categoría de la variable y no se puede realizar ninguna operación aritmética en esta escala.
Ejemplos:
Masculino → M
Genero
Femenino → F
Soltero →1
Casado →2
Estado civil Divorciado → 3
Concubino → 4
Viudo →5

Dra. Yeanny Marcano


6
Dra. Yeanny Marcano

Estadística II

2. Escala Ordinal: se usa cuando es posible establecer una relación de orden entre las
distintas categorías de una variable. Es decir, prevalece la relación de orden “mayor que” ( ≥ ) .
Se pueden usar letras o números para identificar a cada categoría de la variable. Los números
o letras deben reflejar un orden de las categorías y no se puede realizar operaciones
aritméticas entre los números asignados a las distintas categorías, tales números solo reflejan
una relación de orden.
Ejemplos:
Preescolar →1
Nivel de Educación Básica →2
Instrucción Media y Diversificada → 3
Superior →4
Mala →1
Calidad de un Regular →2
servicio Buena →3
Excelente → 4

Dra. Yeanny Marcano


7
Dra. Yeanny Marcano

Estadística II

3. Escala de Intervalo: Posee una unidad de medida constante y arbitraria, posee un


cero relativo, es decir, no indica ausencia de la característica que se está midiendo y prevalece
la relación de orden “mayor que” ( ¿ ) . Entre los valores de la variable solo es posible realizar la
suma y la resta como operaciones aritméticas.
Ejemplos:
 La temperatura de una ciudad medida en grados Fahrenheit o Celsius.
 La altura de las ciudades usando como referencia el nivel del mar.
 El rendimiento académico medido en una escala del 0 al 20
 Para cada caso el cero “0” es arbitrario.
4. Escala de razón: Posee una unidad de medida constante y arbitraria, posee un cero
“absoluto”, es decir, indica ausencia de la característica que se está midiendo y prevalece la
relación de orden “mayor que” ( ¿ ) . Entre los valores de la variable es posible realizar todas las
operaciones aritméticas entre los valores de la variable.
Ejemplos:
 Edad.
 Peso.
 Estatura.
 Tiempo invertido por un estudiante en realizar una tarea
 Ingreso familiar
 Para cada caso el cero “0” es absoluto.
Instrumento de medida: Es un elemento sensible al fenómeno que se desea medir, y que
se emplea para medir.
Por ejemplo, una regla graduada, un examen de laboratorio, una encuesta, el juicio de una
persona, etc.
Validez de un instrumento de medida: Un instrumento de medida es válido respecto de
una propiedad, si es relevante a ella, es decir, un cambio en la propiedad, determina un cambio
en la medida, y un cambio en la medida obedece sólo a un cambio en la propiedad. Un
instrumento válido proporciona una medida válida. Por ejemplo, para medir pesos se, debe
usar una balanza, para medir cortesía se debe usar un instrumento adecuado, como una
encuesta, si se desea que sean válidas las medidas.
Exactitud de un instrumento de medida: Un instrumento de medida es exacto si tiene la
capacidad de describir el fenómeno sin sobrevalorarlo o subvalorarlo sistemáticamente. Si un
instrumento no es exacto, se dice que tiene sesgo. Un instrumento de medida exacto
proporciona medidas exactas. Por ejemplo, un examen puede no rendir una medida exacta de
los conocimientos de los alumnos si es extremadamente fácil o extremadamente difícil, en
relación al conocimiento que se quiere medir.
Confiabilidad de un instrumento de medida: Un instrumento de medida es confiable si
tiene la capacidad proporcionar medidas similares cuando se aplica reiteradas veces al mismo
fenómeno. Como sinónimo se usa el término precisión. Un instrumento confiable proporciona
medidas confiables.
Los conceptos siguientes se relacionan con las fuentes de información y los conjuntos de
observaciones disponibles para el análisis:
Universo: Se define como el conjunto de sujetos o elementos que tienen una característica
común, observable y susceptible de ser medida.

Dra. Yeanny Marcano


8
Dra. Yeanny Marcano

Estadística II

Población: Es el conjunto de todas las mediciones u observaciones hechas sobre una o


varias de las características de los elementos del universo. Se define también como población
objetivo, es el conjunto de todos los valores de un fenómeno o propiedad que se quiere
observar. También se usa el nombre de variable para designar a este conjunto. Por ejemplo,
las edades de los escolares de enseñanza media del país, las preferencias de marca de jabón
manifestadas por un conjunto de consumidores, los diámetros de los ejemplares de un objeto
producido por una máquina, etc. La población puede ser finita o infinita y su tamaño es
denotado, generalmente, con el símbolo “N”. Ejemplo:

Muestra: Es la parte de la población que efectivamente se mide, con el objeto de obtener


información acerca de toda la población. La selección de la muestra se hace por un
procedimiento que asegure en alta grado que sea representativa de la población. Los métodos
de selección de muestras se describen más adelante. Su tamaño es denotado, generalmente,
con el símbolo “n”.
Censo: Es el proceso de observar la población completa. Es decir, tomar una muestra igual
a la población.
Unidad muestral: Es cada una de los miembros individuales de una población. Cada
unidad muestral proporciona una medida.
Parámetro: Nombre dado a una característica global de una población. En general, un
parámetro no es conocido. Es un valor que describe una característica de la población, estos
se estiman a partir de la información aportada por una muestra de la población. Por ejemplo, si
se considera como universo a todos los estudiantes de la UNERMB, la edad promedio de
estos, el porcentaje de estudiantes de sexo femenino que fuman, el ingreso medio de todos los
estudiantes, son valores que describen a este conjunto y son estimados más no conocidos.
Estadístico ó Estadígrafo: Es una característica de la muestra. Es un valor conocido, que
varía de una muestra a otra, el cual describe una característica de la muestra y se puede
calcular mediante la manipulación algebraica de los datos recolectados. Se utiliza para obtener
conclusiones acerca de la población. Por ejemplo, supóngase que se toma una muestra
representativa de los estudiantes regulares de la UNERMB, para esta muestra se calcula: edad
promedio, rendimiento promedio, porcentaje de estudiantes que fuman, otros.
Errores muéstrales: Son errores causados por el acto de obtener la información a partir de
una muestra, en lugar de la población completa. Se deben a la variación existente entre una
muestra y otra.
Errores no muestrales: Son errores no asociados al hecho de obtener información a partir
de una muestra. Por ejemplo, datos faltantes, errores de recolección de datos, errores de
respuesta, errores de transcripción, errores de proceso.
Para que un plan de muestreo produzca muestras representativas de la población, la
selección debe ser al azar, en el sentido que se pueda conocer el modelo probabilístico que
describe el conjunto de todas las distintas muestras que es posible obtener. A continuación se
describen algunos procedimientos para obtener muestras:
Métodos de muestreo:
a) Muestreo Aleatorio Simple. Es un procedimiento de toma de muestra, en el que todas
las muestras posibles, de un tamaño fijo, tienen igual probabilidad de ser seleccionada. Para
obtener una muestra por este procedimiento, se enumeran todas las unidades muéstrales, y se
sortean unidades hasta completar el número requerido.

Dra. Yeanny Marcano


9
Dra. Yeanny Marcano

Estadística II

b) Muestro Sistemático. Se practica cuando se dispone de una lista de todas las


unidades muestrales, en un orden independiente de la variable que se desea medir.
Supóngase que el tamaño de la población es N, y el tamaño seleccionado para la muestra es n.
Sea M el entero más cercano al valor del cociente N/n. El procedimiento de muestreo
sistemático consiste en seleccionar al azar, un número entre 1 y M, correspondiendo éste al
orden de la primera unidad seleccionada. Luego se recorre la lista y se selecciona una de cada
M, hasta completar las n unidades muéstrales requeridas.
c) Muestro Estratificado. Consiste en dividir la población en grupos homogéneos, o
estratos, de acuerdo a los valores de una variable relacionada con la característica bajo
estudio, y aplicar el método de muestreo aleatorio simple en cada estrato. Por ejemplo, si se
desea medir las preferencias de una población de consumidores, se separa la población en
estratos de acuerdo al nivel socioeconómico, y se muestrea en cada estrato separadamente.
d) Muestreo por Conglomerados. Consiste en dividir la población en pequeños grupos,
o conglomerados, obtener una muestra aleatoria simple de conglomerados, y practicar un
censo dentro de cada conglomerado seleccionado en la muestra. Por ejemplo, para realizar
una encuesta de hogares, en una ciudad, en lugar de obtener una muestra de hogares, se
obtiene una muestra de manzanas. Se envía un encuestador a cada manzana
seleccionada, con el objeto de encuestar todos los hogares de la manzana, lo que resulta
más eficiente.
Nivel de confianza: Probabilidad de que la estimación efectuada se ajuste a la realidad.
Cualquier información que se quiera recoger está distribuida según una ley de probabilidad
(por ejemplo: Gauss o Student), así se denomina el nivel de confianza a la probabilidad de que
el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.
Varianza poblacional: Es un indicador del grado de homogeneidad de la población en
estudio. Cuando una población es más homogénea la varianza es menor y el número de
observaciones necesarias para construir un modelo reducido del universo, o de la población,
será menor. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de
estudios previos.
2. EL MUESTREO
Es la técnica a través de la cual se estudia la muestra. Cuando se desea conocer, por
ejemplo, la totalidad de habitantes del país, se necesita recurrir a un censo y el resultado del
mismo es una cifra exacta que se denomina parámetro. Pero es el caso que los censos, por la
complejidad que demanda su ejecución y por los recursos económicos que requiere, no se
realizan a cada momento. Por otra parte, los resultados de un censo no pueden ser conocidos
de inmediato, por lo que la pregunta sobre la población de estudiantes de un país queda sin
respuesta inmediata. Pero como el investigador necesita una respuesta inmediata, recurre a
otras formas de estimar ese número y, vía aproximaciones o análisis de los últimos datos
censales y de los índices en un período determinado, puede identificar una cifra, no exacta
pero aproximada, que se denomina estadísticos.
Como resultado de la aplicación de la técnica de muestreo, el investigador obtiene un
estadístico, una cifra lograda por estimación, cálculo o aproximación al número real de los
elementos de la población.
Por eso se dice que el muestreo es una técnica que permite conocer los parámetros de la
población a través de los estadísticos ó estadígrafos de la muestra. Esto quiere decir que la
muestra, al ser considerada un sub conjunto de la población tiene que ser, necesariamente,
representativa de la población para poder generalizar los datos que se obtengan al estudiar la
muestra.
Una muestra no representativa es una muestra sesgada, por no poseer las mismas
características de la población.
Para que un estadígrafo sea válido debe coincidir con el parámetro, con más o menos
aproximación. En caso contrario, tal cifra no puede ser considerada un estadístico porque no se
aproxima al parámetro.

Dra. Yeanny Marcano


10
Dra. Yeanny Marcano

Estadística II

La técnica del muestreo se usa cuando la población es relativamente grande y no se puede


censar a todos los sujetos y hallar parámetros. Por el contrario, si la población de estudio es
pequeña, no será necesario emplear la técnica del muestreo y será preferible disponer de datos
censales o parámetros. Así, cuando la población es relativamente pequeña, la muestra tenderá
a ser más grande. Y, por el contrario, si la población es demasiado grande, la muestra tenderá
a ser relativamente pequeña.
La técnica de muestreo permite generalizar los datos obtenidos para todos los elementos de
la población y no sólo para los elementos de la muestra. También se puede generalizar para
otras poblaciones que tengan características similares a las que se estudia. Esta es la manera
inferencial que hace posible la generalización del conocimiento y, por consiguiente, el avance
de la ciencia.
3. VENTAJAS Y LIMITACIONES DEL MUESTREO
A continuación se presentan las principales ventajas del muestreo:
a) Mayor Rapidez: el proceso de recolección de la información requiere una cantidad
menor de tiempo, esto le permite al investigador dedicar más tiempo y mayor atención al
análisis de los resultados de en la investigación.
b) Mayor Exactitud: es posible cuidar más la precisión de la observación o medida de
cada elemento al utilizar muestras, por cuanto se pueden establecer mayores controles en el
levantamiento de la data o recolección de la información.
c) costo reducido: es evidente que el costo es menor que al aplicar un censo ya que
trabajar con muestras conlleva a una menor demanda de recursos tanto humanos como
financieros empleados en el desarrollo de la investigación.
A veces el muestreo no es muy conveniente (Bradburn,1998). Por ejemplo:
Cuando se necesita información de todos los elementos que conforman la población.
Cuando sea difícil cumplir con los requisitos de las técnicas de muestreo probabilístico.
El muestreo exige menos trabajo material que una investigación exhaustiva, pero más
refinamiento y preparación (conocimientos adecuados de los diseñadores y preparación de los
entrevistadores, inspectores y supervisores), lo que puede suponer un uso limitado.
Cuando el costo por unidad, que es mayor en las encuestas que los censos, es aconsejable
desestimar los métodos de muestreo.
4. TIPOS DE MUESTREO.
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.
4.1. Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída
y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:
a) Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la
población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.

Dra. Yeanny Marcano


11
Dra. Yeanny Marcano

Estadística II

b) Muestreo aleatorio sistemático:


Este procedimiento exige, como el anterior, numerar todos los elementos de la población,
pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número
aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los
que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n.
El número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los
dos sexos.
c) Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán
parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y
puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la
población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo
que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele
conocer la desviación.
d) Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muéstrales son los elementos de la
población.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la
población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas
suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de
conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados elegidos.
4.2. Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente
costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para
realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene
certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la

Dra. Yeanny Marcano


12
Dra. Yeanny Marcano

Estadística II

población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea
representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los
problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo
los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la
población.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación
encontramos:
a) Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de
un buen conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de
aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos
que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de
sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que
se encuentren que cumplan esas características. Este método se utiliza mucho en las
encuestas de opinión.

b) Muestreo intencional o de conveniencia:


Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy
frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los
individuos de la población. El caso más frecuente de este procedimiento el utilizar como
muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean
con mucha frecuencia a sus propios alumnos).
c) Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos,
etc.
d) Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo
que él cree que pueden aportar al estudio.
Cuadro Nº 1
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

Dra. Yeanny Marcano


13
Dra. Yeanny Marcano

Estadística II

5. FACTORES QUE DETERMINAN EL TAMAÑO DE LA MUESTRA PROBABILÍSTICA.


La determinación del tamaño de la muestra es de suma importancia en la planificación del
muestreo en el proceso de investigación, ya que una muestra demasiado grande (numerosa)
conlleva a un derroche de recursos humanos, materiales y de tiempo. Al contrario de la
muestra muy grande, una muestra muy pequeña disminuye la utilidad de los resultados
debido a la falta de precisión en los estadísticos (estimadores) a utilizar. Es por ello que la
magnitud del tamaño a utilizar, está relacionado a un conjunto de factores que han sido
analizados por los teóricos del muestreo estadístico y permiten establecer a través de ciertas
ecuaciones, el tamaño optimo de la muestra. Algunos de estos factores son:
a) homogeneidad de la población: esta característica es importante, ya que cuando más
homogénea sea una población, se hace posible seleccionar menos elementos para la muestra,
debido a que con pocos casos se puede representar la similitud existente en la población. Se
requiere, por lo tanto, poseer una medida del grado de homogeneidad (concentración) o de
heterogeneidad (dispersión) de las variables y la medida que permite dicho conocimiento es la
varianza.
b) la precisión: la medida que se emplea para especificar el grado de precisión que se
espera es el llamado Error Máximo Admisible (EMA), y se establece indicando la cantidad de
error que se está dispuesto a tolerar en los estimadores. Por lo tanto, el error máximo admisible
lo fija el investigador de acuerdo a las condiciones del estudio, decidiendo cuál es la magnitud
de error que le parece razonable. Es decir, cuanto es lo máximo que se toleraría en relación a
la diferencia entre el valor del estadístico ¿ y el parámetro correspondiente a estimar ¿. Y éste

Dra. Yeanny Marcano


14
Dra. Yeanny Marcano

Estadística II

se simboliza con la letra e . Por ejemplo, se puede tener que la estimación que se desea hacer,
sea la de una proporción poblacional ( p) , con un EMA de 0,09 (e=0,09) ; se tendría entonces
un intervalo de ( p ±0,09 ) . si loa resultados arrojados por el estudio arrojan que la proporción
muestral es igual a 0,27, el investigador tolerará, como máximo, una desviación desde
( 0,27 ± 0,09 )=( 0,18; 0,36 ), en su estimación de la proporción poblacional.
Es evidente que si el investigador requiere aumentar la precisión, el intervalo de oscilación
debe ser menos amplio y el valor de e a utilizar debe ser menor, esto es:
Mayor Precisión → e más pequeño → n más GRANDE
Menor Precisión → e más grande → n más PEQUEÑO
c) La confianza: el hecho de trabajar con solo una parte de la población “una muestra”, no
garantiza con total exactitud o precesión la estimación, por lo que habrá siempre cierta
incertidumbre en el muestreo. No obstante, si el muestreo es probabilístico, dicha incertidumbre
puede ser controlada, fijando un determinado nivel de confianza, denominado Coeficiente de
Confianza, el cual no es más, que una medida de la seguridad que se tiene de que la
estimación está dentro del EMA fijado por el investigador. También esta medida, es fijada por el
investigador, quien decide la proporción o porcentaje de muestras en las que espera que su
estimación se desvíe del intervalo fijado con el EMA. Siguiendo con el ejemplo anterior, se
podría establecer un coeficiente de confianza de 0,95, que significa un 95% de confianza, esto
es que de cada 100 casos se obtendrá una muestra que satisface su precisión en un 95% y
solo 5% (0,05) de cada 100 casos, se obtendrá una muestra que no satisface la precesión.
En conclusión, la precisión “ e ”, siempre debe ser acompañada con un determinado nivel
de confianza, dándose el caso de que los coeficientes de confianza más utilizados en las
ciencias sociales son:
90 %
95 %
99 %
Se concluye entonces, que existe una relación entre el nivel de confianza y el tamaño de la
muestra. Si los demás factores (varianza y la precisión) permanecen inalterables, se tendrá:
A Mayor Confianza → n más GRANDE
A Menor Confianza → n más PEQUEÑO
d) El costo: este factor es de suma importancia, ya que en la medida que la investigación
cuente con un determinado presupuesto, con el cual desarrollarse, la evaluación del tamaño
óptimo tendrá relación estrecha con el costo. De esta manera, si ante una precisión, una
homogeneidad y una confianza dada resulta un costo demasiado elevado, será necesario la
revisión del esquema de muestreo propuesto para ajustarlo a los requerimientos
presupuestarios asignados, con lo cual se corre el riesgo de sacrificar la confianza fijada o la
precisión.
PRINCIPIO BÁSICO DEL MUESTREO: “La teoría del Muestreo intenta desarrollar
métodos de estimación que proporcionen, al más bajo costo, estimadores que sean lo
suficientemente precisos para un propósito establecido” [Cochran, 1.974].

6. MUESTREO ALEATORIO SIMPLE SIN REEMPLAZAMIENTO (M.A.S.)


Diseño en el que se seleccionan unidades de la población N sin reponer los elementos
observados, de tal modo que todas las unidades tienen la misma probabilidad de selección y
todas las muestras n son equiprobables.
6.1. Características:
 Tamaño de muestra n.

Dra. Yeanny Marcano


15
Dra. Yeanny Marcano

Estadística II

 Selección sucesiva e independiente de las unidades con probabilidades iguales


1
en cada extracción a ; t = 0, 1, 2, …, n .
N -t
 Las muestras que constan de las mismas unidades obtenidas en distintos
órdenes se consideran idénticas;
1
p (S j )= /S j=[ U 1 , U 2 U 3 , … , U n ]
( )
N
n
6.2. Procedimiento.
a) Se debe poseer una lista exhaustiva de todos los elementos de la población objeto de
estudio, esta es denominada Marco Muestral.
b) se asigna un número a cada uno de los elementos del marco muestral.
c) se puede utilizar la tabla de números aleatorios (ver tabla Nº1 “Tabla de Números
Aleatorios”), para buscar tantos números como indique el tamaño de la muestra.
Ejemplo: Para una población N=950, los resultados del cálculo de la muestra arrojan n =
91 para un nivel de error del 10%. Una vez establecida la cantidad de sujetos en la muestra, se
procede a buscar en la tabla de números aleatorios 91 números de 3 dígitos, debido a que la
población es de 950 (consta de 3 dígitos) los cuales irán desde 001 hasta 950. Para el uso de
la tabla se siguen los siguientes pasos:
1) Elegir al azar una de las filas de la tabla de números aleatorios (Ver anexo 1 Tabla de
números aleatorios). Suponga que se ha elegido la tercera fila.
2) Se separan los números de la fila elegida de tres en tres, esto es:

De lo cual se obtiene lo siguiente: 148|716 |035 |032|404 |362|235 .. . basados en la fila 3


tendremos: i = 148; pasamos a i = 716; pasamos i = 35; pasamos, … y así sucesivamente.
Cada grupo de tres cifras indica un número del 001 al 950 que va a ser el índice de las
observaciones elegidas. ¿Por qué de tres en tres? Para que la observación X = 950 tenga la
misma probabilidad de salir que las demás, ya que es una muestra aleatoria simple. En este
procedimiento se eligen las observaciones en función de los índices que han salido.
Es de hacer notar, que no es el único procedimiento que garantiza la aleatoriedad en la
selección de la muestra; también se pueden emplear programas de computación que generan
números aleatorios, así como, calculadoras de bolsillo que tienen incorporada la tecla “random
# “, entre otros.
d) luego de seleccionado los números aleatorios, se ubican los elementos de la población a
los cuales les corresponden dichos números en el marco muestral y se procede a obtener de
ellos la información requerida por los instrumentos diseñados para la recolección de datos.

6.3. Calculo del tamaño de muestra en el M.A.S. para estimar la Media Poblacional
Si la medida de interés en una muestra aleatoria simple es la media poblacional, el tamaño
de la muestra se calcula con la siguiente ecuación:

Dra. Yeanny Marcano


16
Dra. Yeanny Marcano

Estadística II

Z 2 * S2
n= 2
e
Donde:
Z=¿ Valor de la distribución normal para un nivel de confianza dada.
S2=¿ Varianza estimada de la variable más relevante en el estudio
e=¿ Error máximo admisible para la estimación.
Esta ecuación se aplica para casos en los cuales la población es infinita o el muestreo es
con reemplazo. Por el contrario si la población es finita y no hay reemplazo el muestreo, se
puede ajustar al tamaño de la muestra a través de una expresión denominada Factor de
Corrección para Poblaciones Finitas (FCPF). La decisión para asumir si la población es finita o
infinita, se orienta por siguiente regla:

Si la muestra incluye menos del 10 % de la población, ésta se considera como infinita y el


factor de corrección puede omitirse. Por el contrario, el tamaño de la muestra puede ajustarse
de la siguiente manera:

Z2 * S2
n =
e2
n 0 *N
n =
n0 +(N −1)

Ejemplo 1: Se está interesado en estimar cuál es el tiempo medio de espera entre el


arresto y el juicio para los procesados del reten de cierta ciudad. Si el error máximo admisible
es de 15 días, con una confianza de 90% y, además, los estudios previos arrojan una
desviación típica del tiempo medio de espera de 35 días ¿Cuál debe ser el tamaño de la
muestra aleatoria simple a utilizar?
Datos:
Varianza: S2=35

EMA: e=± 15 días


Confianza: 90 % a la cuál le corresponde un valor de Z=1,645, según la tabla de
Distribución Normal.
Además:
Universo: todos los procesados de la ciudad.
Población: los tiempos de espera para el juicio por parte de todos los procesados de
la ciudad.
Variable clave: tiempo de espera entre el arresto y el juicio.
Parámetro a estimar: la media ( μ ) del tiempo de espera para todos los procesados
de la ciudad.
SOLUCIÓN:
Se sustituyen los datos en la fórmula:

(1,645)2 * (35)2
n = 2
(15)

Dra. Yeanny Marcano


17
Dra. Yeanny Marcano

Estadística II

2,71 *1.225 3.314,9


n = = =14,7 ≈ 15
225 225
Interpretación: El tamaño óptimo para este plan de muestreo es de 15 procesados como
mínimo, es decir que si se desea trabajar con un número mayor a este valor óptimo se puede
hacer, lo contrario no. El tamaño óptimo, significa que es el mínimo tamaño requerido para
cumplir con los factores de: confianza, precesión, variabilidad poblacional y costos).
Ejemplo 2:
Determine el tamaño de la muestra del problema anterior, si el tamaño de la población es de
138 procesados y todos los demás factores permanecen iguales. ¿Cuál debe ser el tamaño
óptimo del M.A.S.?
SOLUCIÓN:
Se debe determinar primero si la población es finita o infinita, para ello se divide el tamaño
de la muestra ya calculado entre el tamaño de la población y si el resultado es mayor al 10% de
la población está es finita. Así se tiene:
15 = tamaño óptimo calculado
138 = población de procesados
15
0,109∗100=10,9 %
138
De acuerdo a los resultados obtenidos la población puede determinarse como finita, ya que
representa más del 10% de población y por tanto se le aplica el factor de corrección para
poblaciones finitas:
n 0 = 15
n 0 *N 15 *138 2.070 2.070
n = = = = =13,6 ≈ 14
n0 +( N −1) 15+(138−1) 15+137 152

Interpretación: para una población de 138 procesados el tamaño óptimo para este plan de
muestreo es de 14 procesados como mínimo,

6.5. Calculo del tamaño de la muestra en el M.A.S. para estimar una Proporción
Poblacional
Si la muestra aleatoria simple es para estimar la proporción de la población, el tamaño de la
misma se determina con la siguiente ecuación:
2
Z *P(1-P)
n = 2
e
Donde:
Z=¿ Valor de la distribución normal para un nivel de confianza dada.
P(1−P)=¿ Varianza de la proporción y está determinada por un valor estimado o
hipotético de la proporción P.
e=¿ Error máximo admisible para la estimación.
Si la población es finita se corrige el tamaño de la muestra con el factor de corrección
explicado en el ejerció anterior del ejemplo 2.
Ejemplo 3:

Dra. Yeanny Marcano


18
Dra. Yeanny Marcano

Estadística II

Se aproximan las elecciones estudiantiles en cierta universidad, se desea estimar la


proporción de votantes de la escuela de administración que están a favor de la elección directa
de los representes estudiantiles. La estimación de esta proporción se hará a través de un
muestreo aleatorio simple. Si el error máximo admisible es del 0,05 y la confianza del 95%
¿Cuál sería el tamaño de la muestra?
Datos:
Universo: todos los votantes de esa universidad.
Población: las opiniones de todos los votantes de la escuela de administración acerca de la
elección directa de los representantes estudiantiles.
Variable clave: opinión sobre la elección directa de los representantes estudiantiles.
Parámetro a estimar: proporción de votantes a favor de la elección directa de los
representantes estudiantiles.
Error máximo admisible: e=0,05
Confianza: 95 % a la cuál le corresponde un valor de Z=1,96, según la tabla de
Distribución Normal (Ver anexo 2. Calculo de Z).
Varianza: P ( 1−P )=0,5 ( 1−0,5 )=0,5∗0,5=0,25
Nota: cuando no se posee información adicional sobre la varianza se asume que el valor
hipotético de la probabilidad de éxito P es de 0,50 y la de fracaso (1-P) es de 0,50.
SOLUCIÓN:
2 2
Z *P(1-P) (1,96) * 0,50P (1- 0,50) 3,8416 * 0,25 0,9604
n = == = = =384,16
e
2
(0,05)
2
0,0025 0,0025

Interpretación: el tamaño óptimo para este plan de muestreo es de es de 385 votantes


7. MUESTREO ALEATORIO ESTRATIFICADO (M.A.E.)
Una muestra aleatoria estratificada probabilística, se obtiene al dividir a la población objeto
de estudio en grupos mutuamente excluyentes (significa que un elemento cualquiera no puede
pertenecer a mas de dos estratos, solo a uno de ellos) y colectivamente exhaustivos (esto
significa que la unión de todos los estratos da como resultado la población completa) llamados
estratos y estos deben ser lo más homogéneo posible en su interior y heterogéneos posible
entre ellos. La muestra de cada uno de los estratos debe ser representativa para cada estrato
por separado.
El principio Básico: los estratos deben ser lo más homogéneo posible en su interior y
2 2
heterogéneos posible entre ellos. Esto es, S E es la variación entre los estratos y S D la variación
dentro de los estratos. De manera simbólica:

S2D → 0
2
SE → ∞
Lo anterior significa que en la medida en que los estratos sean homogéneos en su interior
con respecto a las variables estudiadas, se puede mejorar la eficacia del diseño de selección
de la muestra y ganar mayor precisión.
7.1. Procedimiento de selección del M.A.E.
a) Elaborar los estratos de acuerdo con las variables de estudio
b) se extrae una muestra aleatoria simple de cada estrato por separado
c) los miembros seleccionados de cada estrato se combinan o mezclan para lograr tener
una muestra de toda la población denominada muestra aleatoria estratificada.

Dra. Yeanny Marcano


19
Dra. Yeanny Marcano

Estadística II

7.2. Calculo del tamaño de la muestra en el M.A.E.


Los factores determinantes del tamaño de la muestra son los mismos estudiados en el
M.A.S, (precisión, confianza deseada y la varianza de la población) solo se le agrega un factor
o elemento adicional que es propio de este tipo de muestreo y se denomina Asignación, que no
es más que el reparto del tamaño de la muestra (n) entre los distintos estratos.
n1 +n 2+ n3+ …+n L =n
Los tipos de asignación se pueden realizar de tres formas (estas son las más comunes):
a) Asignación igual: consiste en hacer una repartición equitativa entre los diferentes
estratos, así se tiene:
n
ni =
L
Donde:
n = tamaño de la muestra
L = número de estratos
b) Asignación de Neyman: consiste en hacer una repartición de la muestra entre los
estratos tomando en cuenta no solo el tamaño del estrato en la población, sino también la
dispersión o grado de homogeneidad dentro de cada estrato y este último se mide por medio
de las desviaciones típicas de la variable de interés en cada estrato. Su fórmula de cálculo es la
siguiente:
n∗W i∗S
ni = L
i

∑ W i∗S i
i=1

Donde:
Ni
W i = Peso relativo del estrato “i” con W i =
N
Si = Desviación típica del estrato “i”

c) Asignación Proporcional: consiste en dividir la muestra total en partes proporcionales al


tamaño de cada estrato en la población. Para ello su cálculo se hace con la formula siguiente:
Ni
ni =n
N
Donde:
Ni
W i = Peso relativo del estrato “i” con W i =
N
Si = Desviación típica del estrato “i”

7.2.1. Calculo del tamaño de muestra en el M.A.E con asignación de Neyman para
estimar la Media Poblacional
n=¿ ¿ ¿
7.2.2. Calculo del tamaño de muestra en el M.A.E con asignación de Neyman para
estimar la Proporción Poblacional

Dra. Yeanny Marcano


20
Dra. Yeanny Marcano

Estadística II

2
( ∑ N i √ P i∗Qi )
n= 2 2
N ∗e
2
+ ∑ N i∗Pi∗Q i
z
7.2.3. Calculo del tamaño de muestra en el M.A.E con asignación Proporcional para
estimar la Media Poblacional
1
N ∑ i∗S
N 2
i

n= 2
e 1
2
+ 2 ∑ N i∗S 2

z N i

7.2.4. Calculo del tamaño de muestra en el M.A.E con asignación Proporcional para
estimar la Proporción Poblacional

N ∑ N i∗P i∗Qi
n= 2
e
2 ∑
2
N + N i∗Pi∗Qi
z
En todas las ecuaciones anteriores se observa que la presencia de las desviaciones típicas
de cada una de los estratos como requerimiento para la determinación del tamaño de la
muestra requerido
Ejemplo 4: Se cuenta con la siguiente información referida a 2.010 fincas de una Región.
Tabla Nº 1. 1
Distribución del número de Fincas de una determinada región
Desviación Típica
Tamaño de la Finca
Número de Fincas de la producción de papas
(hectáreas)
(según prueba piloto)
0 – 80 855 15,3 toneladas
81 – 160 725 19,8 toneladas
161 y más 430 10,2 toneladas

Si se aspira que el error máximo sea de 3,5 toneladas en la estimación de la producción


promedio de papas, con un nivel de confianza del 90 %, se pide:
a) Calcular el tamaño de la muestra por medio de la asignación de Neyman y cómo
quedaría repartida entre los estratos.
b) Calcular el tamaño de la muestra por medio de la asignación proporcional y cómo se
distribuiría ese tamaño entre los estratos.
Datos:
Universo: todas las fincas de la región.
Población: la producción de papas (en toneladas) de todas las fincas de la región.
Parámetro a estimar: la producción promedio de papas en la finca
Error máximo admisible: e=3,5
Confianza: 90 % a la cuál le corresponde un valor de Z=1,645 según la tabla de
Distribución Normal (Ver anexo 2. Calculo de Z).
Desviaciones típicas: 15,3 toneladas; 19,8 toneladas y 10,2 toneladas
Tipo de asignación:

Dra. Yeanny Marcano


21
Dra. Yeanny Marcano

Estadística II

a) Asignación de Neyman
b) Asignación Proporcional
Número de Estratos: 3 definidos por el tamaño de las fincas.
SOLUCIÓN POR MEDIO DE LA ASIGNACIÓN DE NEYMAN PARA LA MEDIA
POBLACIONAL
Primero se calcula las desviaciones típicas mediante las siguientes fórmulas para cada
estrato:
a) ¿ ¿
2
b) N i∗S i

Tabla Nº 1.2
Calculo de las desviaciones típicas para cada estrato
Número Desviación Ni
de Fincas Típica Wi= N i∗S i Si
2
N i∗S i
2
N
Ni Si
855 15,3 ton 0,43 13.081,5 234,09 200.146,95
725 19,8 ton 0,36 14.355 392,04 284.229,00
430 10,2 ton 0,21 4.386 104,04 44.737,2
N = 2.010 1 ¿¿ ∑ N i∗S =529.113,15
i
2

n=¿ ¿ ¿

2
(855∗15,3+ 725∗19,8+ 430∗10,2)
n=
( 2.010) ∗(3,5)2
2

2
+(200.146,95+284.229+44.737,2)
(1,645)

2
(31.822,5)
n=
.100∗12,25
4.040 +529.113,15
2,71

1.012 .671.506,3
n=
4.040 .100∗4,527+529.113,15
1.012 .671.506,3
n=
18.289 .271,16+529.113,15

1.012 .671.506,3
n=
18.818 .384,31
n=53,8129

Dra. Yeanny Marcano


22
Dra. Yeanny Marcano

Estadística II

Interpretación: el tamaño óptimo de fincas que serán seleccionadas como muestras es de


54 las cuales se repartirán entre los 3 estratos. De acuerdo con la Asignación de Neyman
fijada en la ecuación de la parte b) se tiene:
n∗W i∗S
ni = L
i

∑ W i∗S i
i=1

Primero se calcula el peso relativo a cada estrato W i :


Estrato 1 = 855
Estrato 2 = 725
Estrato 3 = 430
855
W 1= =0,43
2.010
725
W 2= =0,36
2.010
430
W 3= =0,21
2.010
Luego se calcula el peso relativo de cada estrato con su respectiva desviación típica

∑ W i∗Si= ( 0,43∗15,3 ) +( 0,36∗19,8 ) + ( 0,21∗10,2 )=¿


∑ W i∗Si=6,51+7,14 +2,18=15,83
Finalmente, se procede a calcular la asignación del tamaño de la muestra para cada estrato:
54∗( 0,43∗15,3 ) 54∗6,51 351,44
n1 = = = =22,20
15,83 15,83 15,83

54∗( 0,36∗19,8 ) 54∗7,14 385,66


n2 = = = =24,36
15,83 15,83 15,83
54∗( 0,21∗10,2 ) 54∗2,18
n3 = = =7,44
15,83 15,83

Interpretación: según la asignación de Neyman se deben extraer para el primer estrato 22


fincas, para el segundo 24 y para el tercer estrato 7 fincas lo que da como sumatoria n = 53, el
cual es un número menor al tamaño óptimo de n y esto se debe al redondeo. Cuando esto
ocurre se recomienda colocar el elemento faltante en el estrato con menor tamaño, lo que
resulta, para este caso, que el tercer estrato tendrá un tamaño de muestra igual a 8 fincas.
La sumatoria total debe dar el tamaño de la muestra total:
n1 +n 2+ n3+ …+n L =n
22+24+ 8=54
SOLUCIÓN POR MEDIO DE LA ASIGNACIÓN PROPORCIONAL PARA LA MEDIA
POBLACIONAL

Dra. Yeanny Marcano


23
Dra. Yeanny Marcano

Estadística II

1
N
∑ N i∗S i
2

n= 2
e 1
2
+ 2 ∑ N i∗S 2

z N i

Se calcula primero el término: ∑ N i∗S i


2

∑ N i∗S =855 (15,3)2 +725(18,2)2+ 430(10,2)2=529.113,15


i
2

Estos resultados se encuentran en la tabla Nº 1.2.


Luego:
1
∗(529.113,15)
2.010
n= 2
=¿
(3,5) 1
+ (529.113,15)
(1,645)2 ( 2.010 )2

0,00049751∗(529.113,15)
n= =¿
12,25 1
+ (529.113,15)
2,71 4.040.100

263,24
n= =¿
1∗529.113,15
4,527+
4.040 .100
263,24
n= =¿
529.113,15
4,527+
4.040 .100

263,24 263,24
n= = =56,51
4,527+0,13096536 4,657900625

Interpretación: el tamaño de la muestra es de 57 fincas del total de 2010 que hay en la


población.
Ahora bien, de las 57 fincas ¿Cuántas les corresponde a cada uno de los estratos?
Esto se determina a través de la ecuación c) Asignación Proporcional:
Ni
ni =n
N
855
n1 =57 =57∗0,43=24,2
2010
725
n2 =57 =57∗0,36=20,6
2010

Dra. Yeanny Marcano


24
Dra. Yeanny Marcano

Estadística II

430
n3 =57 =57∗0,21=12,2
2010
Interpretación: según la asignación proporcional se deben extraer para el primer estrato 24
fincas, para el segundo 20 y para el tercer estrato 12 fincas lo que da como sumatoria n = 56, el
cual es un número menor al tamaño óptimo de n y esto se debe al redondeo. Cuando esto
ocurre se recomienda colocar el elemento faltante en el estrato con menor tamaño, lo que
resulta, para este caso, que el tercer estrato tendrá un tamaño de muestra igual a 13 fincas ó
de igual manera se puede redondear algunos de los resultados como por ejemplo: 20,6 llevarlo
a 21. Para este caso en particular se le sumo el elemento faltante al último estrato, por tener el
menor valor.
La sumatoria total debe dar el tamaño de la muestra total:
n1 +n 2+ n3+ …+n L =n
24+ 20+13=57
8. MUESTREO ALEATORIO POR CONGLOMERADO (M.A.C.)
Consiste en seleccionar de una población, en forma aleatoria, un conjunto de m colecciones
de elementos muestrales llamados conglomerados y, posteriormente, efectuar un censo o
enumeración completa en cada uno de los conglomerados seleccionados.
Los métodos anteriores se utilizan para seleccionar directamente de la población los
elementos ó unidades muestrales. En el muestreo por conglomerado la unidad muestral es un
grupo de elementos de la población.
Un conglomerado puede ser natural o no natural, los primeros están referidos por ejemplo,
a las unidades hospitalarias, unidades educativas, un departamento universitario, una caja de
un determinado producto, entre otros, y los no naturales pueden ser las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de muestreo por áreas.
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número
de conjutos y en investigar después todos los elementos pertenecientes a los conglomerados
elegidos.
Supuesto Básico: el M.A.C proporciona una cantidad específica de información a un costo
mínimo cuando:
a) No exista una lista con todos los elementos de la población o sería muy costoso
obtenerlo.
b) La población es muy grande y dispersa en un área geográfica.
8.1. Procedimiento de selección del M.A.C.
El procedimiento se lleva a cabo en dos etapas:
Etapa 1: se determinan conglomerados de elementos muestrales, los cuales se asumen
reunidos o concentrados en áreas geográficas ó físicas de ubicación fácil o conveniente. De la
lista de conglomerados que se diseñe, se escoge al azar un determinado número de unidades.
La elección de los conglomerados debe hacerse de manera cuidadosa basado en el supuesto
básico para una selección óptima de la muestra.
Etapa 2: luego de seleccionar cierto número de conglomerados, se registra (para los
integrantes de cada uno) la información requerida en función de las variables en estudio.
Principio Básico: los conglomerados deben ser lo más heterogéneos posible en su interior
y, a su vez, lo más homogéneos posible entre sí.
La situación ideal sería que un único conglomerado pudiese representar fielmente a la
población. El principio anterior puede representarse simbólicamente asumiendo S2 d y a S2e
como las varianzas dentro y entre los conglomerados, respectivamente, entonces:

Dra. Yeanny Marcano


25
Dra. Yeanny Marcano

Estadística II

S2D → ∞
2
SE → 0
Este principio es lógico, ya que si se va extraer algún conglomerado en particular, lo ideal
sería que el conglomerado tuviera un alto grado de heterogeneidad que posibilitara la presencia
de los distintos comportamientos de los elementos de la población.
Selección de la muestra por conglomerados.
1) Definir los conglomerados en los que se va a dividir a la población, los cuales pueden ser
manzanas de un barrio o urbanización, municipios o parroquias de un estado o ciudad, calles
de una ciudad, salones de clase de un colegio o universidad, otros.
2) Se elabora una lista de todos los conglomerados y a cada uno se les asigna un número
para identificarlos, también puede ser un plano o mapa.
3) Elegir al azar, tantos números como conglomerados se haya decidido seleccionar.
4) Finalmente, se procede a obtener la información requerida de todos y cada uno de los
elementos incluidos en los conglomerados elegidos al azar.

Ejemplo 5: Se ha decidido dividir la población estudiantil de la UNERMB, sede Cabimas, en


conglomerados, para estimar el gasto promedio en transporte por parte de los estudiantes. Se
decidió utilizar como conglomerados a cada una de las aulas de clase en los días y turnos en
que se imparten las clases en todos los Programas.
Solución: Se asigna un número a cada salón de clases en todos los Programas
(Administración y Educación). Si hay 30 aulas disponibles, entonces se tiene que el total de
conglomerados (N) es igual a 30 en la población.
N=30
Si se sabe, que cada aula en promedio tiene 45 alumnos, entonces se tiene un total de 1.350
estudiantes como población.
Existen varias vías para asumir la investigación, entre otras, las siguientes
a) Se aplica la formula de Sierra Bravo con un margen de error del 5% sobre el valor de la
población N = 30 aulas para determinar el número de conglomerados (aulas) a estudiar.
4 pqN
n= 2
E ( N −1 )+ 4 pq
Donde: n = tamaño de la muestra a calcular (número de aulas o conglomerados)
p = q = 0,50 (valores de probabilidad de incertidumbre binomial)
N = 30 (tamaño de la población)
E = 0,05 (5%)
4 x 0,5 x 0,5 x 30
Sustituyendo, se tiene n= 2
(0,05) ( 30−1 )+ 40,5 x 0,5

30
n=
0.025 x 29+1

30
n=
7,25+1

Dra. Yeanny Marcano


26
Dra. Yeanny Marcano

Estadística II

30
n=
8,25
n=3,6363 …
n=4
Interpretación: se deben seleccionar 4 aulas o conglomerados

b) Se aplica la formula de Sierra Bravo con un margen de error del 5% sobre el valor de la
población estudiantil N = 1350 estudiantes. Se divide el valor obtenido entre treinta para
determinar el número de aula a seleccionar.

4 x 0,5 x 0,5 x 1350


n= 2
(0,05) ( 1350−1 )+ 4 X 0,5 x 0,5

1350
n=
0,025 ( 1349 ) +1

1350
n=
33,725+1
n=38,88
n=39
39
El número de aulas es igual a n= =0,866 … 1
45
n=1 Aula

c) Si se advierte que se pueden entrevistar 200 estudiantes por motivos de costo y tiempo,
se divide esta cantidad (200) entre el número de estudiantes por aula (45) para obtener el
número de aulas a seleccionar.
200
n= =4,44 … 5
45
n=5 Aulas

9. DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA


No existe un criterio definido acerca del tamaño recomendable que debe tener la muestra.
La experiencia del investigador, los recursos que dispone o las facilidades técnicas que se le
presenten, serán los determinantes para fijar el tamaño de la muestra. Sin embargo, desde la
etapa de planificación de la investigación, se debe fijar el tamaño de la muestra. Para ello se
debe sopesar las ventajas y desventajas de trabajar con una muestra de una determinada
magnitud.
Existen muchas técnicas para calcular el tamaño de una muestra. Cada una de ellas parte
de criterios específicos derivados de las características que tienen las investigaciones que se
desean realizar. En términos generales, el tamaño de una muestra debe determinarse en
función de las siguientes condiciones:

Dra. Yeanny Marcano


27
Dra. Yeanny Marcano

Estadística II

Grado de homogeneidad de las variables claves


El nivel de significancia ( α )

El error máximo admisible que asigna el investigador ( e )


Costo o presupuesto

Dra. Yeanny Marcano

También podría gustarte