Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 1: MUESTREO
1. Conceptos básicos
La estadística inferencial consiste en determinar algo sobre una población a partir de una
muestra. Es un conjunto de técnicas que, basadas en la teoría de probabilidad y la teoría del
muestreo, permite dar conclusiones sobre una característica de la población basándose en una
muestra, la cual facilita la toma de decisiones en situaciones donde está presente la
incertidumbre.
La población puede ser infinita o finita. Es infinita cuando está conformada por un indeterminado
número de unidades. Ejemplo: número de peces de un río, número de granos de arroz
recolectados en una región, etc.
Población finita, es aquella que está constituida por un determinado o limitado número de
elementos o unidades y considerada, en la mayoría de los casos como relativamente pequeña.
Ejemplos: el número de estudiantes de un colegio, el número de empleados de una empresa, todo
el alambre producido en tres horas de producción, etc.
Unidad o elemento: son los componentes de una determinada población, cada uno de los
individuos de la población pueden describirse según uno o varios caracteres.
Ejemplo: El personal de una empresa (unidad o elemento), del cual puede ser realizado un estudio
estadístico de su edad, sexo, antigüedad, etc. (caracteres).
Características cualitativas: son atributos que pueden ser expresados mediante palabras.
Ejemplos: ocupación, profesión, nacionalidad, sexo, estado civil, etc.
2. investigación
Tipos de investigación.
a) Investigación exhaustiva: es aquella en la que se observa todas las unidades que constituyen la
población, objeto de la investigación. Ejemplos: censos de poblaciones, tiendas en una ciudad, de
industrias manufactureras, etc.
Este tipo de investigación requiere de grandes recursos financieros, de tiempo, de personas, etc.
Profesor Jairo Alonso Moreno Montagut
Marco: es un listado que corresponde al total de unidades o elementos que integran la población a
investigar o a seleccionar; también llamado marco de referencia o marco muestra correspondiente
a la población objetivo. Un marco también puede ser un mapa o fotografías aéreas. Ejemplos: la
nómina de pago, ya sea de un grupo de trabajadores en una fábrica o de empleados de una
empresa, el listado de estudiantes de una universidad, etc.
La investigación tiene como sustento fundamental los datos, siendo estos una categoría asignada
a una variable de una unidad de análisis. Por ejemplo, Luis tiene 1.70 metros de estatura, es un
dato donde Luis es la unidad de análisis, estatura es la variable y 1.70 metros, es la categoría
asignada.
Las tres actividades que involucran una investigación estadística son: a. planificación, b.
ejecución y procesamiento, c. análisis y divulgación. En muchas investigaciones estadísticas las
personas trabajan en todas o la mayor parte de las actividades y estas se solapan tanto como es
posible. La división en fases se realiza exclusivamente para facilitar la presentación de los
conceptos involucrados.
a. Planificación en esta etapa se hace necesario, entre otras muchas cosas, definir los objeticos de
la investigación, tener en cuenta investigaciones similares, los procedimientos de recolección de
datos, los métodos de recolección, el calendario de operaciones, presupuesto, etc.
Métodos de recolección de datos: los más relevantes son la entrevista personal, correo, entrega
personal, teléfono, correo electrónico, e internet.
b. Ejecución y procesamiento, esta etapa involucra todo lo que tiene que ver con los equipos de
encuestadores y supervisores, la asignación de cargas de trabajo y distribución del material,
manejo de los cuestionarios, realización de las encuestas, control administrativo de los trabajos
de campo, programación para el ingreso de datos (escogencia de paquetes de cómputos que
faciliten el ingreso de datos), programación para la tabulación, ingreso de datos (digitación) y
concentración de la información.
c. Análisis y divulgación en esta fase se tiene en cuenta las siguientes acciones: la consistencia
interna y de completitud (se decide qué hacer con datos faltantes de los cuestionarios),
Profesor Jairo Alonso Moreno Montagut
comparación con otras fuentes (detectar errores por comparación con otras encuestas de otras
fuentes), análisis estadístico, tabulaciones finales (se define la presentación más apropiada para
las tabulaciones finales a los efectos de la publicación) e informe final que debe proporcionar a los
usuarios información sobre la metodología utilizada en la investigación, los principales resultados,
los problemas que se debió enfrentar y la forma en que se resolvieron.
3. TIPOS DE MUESTREO
Del mapa conceptual se hará una pequeña reseña de cada una de los tipos de muestreo en él
señalado.
Muestreo aleatorio o probabilístico: se habla de éste cuando todos los elementos que componen
la población tienen la misma probabilidad de ser seleccionado para conformar una muestra. Los
muestreos de esta clase son más populares y útiles que los no aleatorios, principalmente porque
tienen una elevada representatividad y permiten calcular el error de la muestra.
a) Muestreo aleatorio simple: es el más utilizado, pero es menos eficaz en muestras grandes. La
selección de la muestra se realiza en una sola etapa directamente y sin reemplazo o con
reemplazo si la población es finita.
b) De conglomerado: son conjuntos de elementos poblacionales, como pueden ser las escuelas o
los centros hospitalarios públicos de un municipio. La población se divide en varios conglomerados
y luego se elige varios de ellos en forma aleatoria para estudiarlos.
Muestreo no aleatorio: utilizan criterios con un bajo nivel de sistematización que procuran
asegurar que la muestra tenga un cierto grado de representatividad. Este tipo de muestreos se
emplean principalmente cuando no es posible llevar a cabo otros de tipo aleatorio, lo cual es muy
habitual a causa del elevado coste de los procedimientos de control. Está sujeto a errores porque
depende del juicio subjetivo del ser humano. En el muestreo aleatorio, no todos los integrantes
tienen la probabilidad de ser incluidos en la muestra.
Ejemplos: encuestas de opinión que realizan los locutores deportivos, cuando se juega un partido
de fútbol.
b) muestreo de bola de nieve: En este tipo de muestreo los investigadores establecen contacto
con sujetos determinados; a continuación, estos consiguen a nuevos participantes para la muestra
hasta completarla. Útil cuando se trabaja con poblaciones de difícil acceso.
c) Muestreo por cuotas o accidental: cuando los investigadores escogen un número concreto de
sujetos que cumplan unas características determinadas (p. e. mujeres españolas de más de 65
años con deterioro cognitivo severo) a partir de su conocimiento sobre los estratos de la
población. El muestreo accidental se usa con frecuencia en las encuestas.
4. Tamaño de la muestra
Intervalos de confianza
Conjunto de valores que se forma a partir de una muestra de datos de forma que exista la
posibilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad
específica. La probabilidad específica recibe el nombre de nivel de confianza.
Ejemplos:
Solución:
𝑠
𝑒𝑒 =
= √25 = 2 véase el vídeo https://www.youtube.com/watch?v=N3Ix3S7D7KQ para la
√𝑛 10
b) Calcular el margen de error estándar en el peso promedio de una muestra de 100 recién
nacidos. El cálculo del peso promedio fue <x>= 3,100 kg con una desviación estándar σ = 1,500 kg.
Nivel de confianza del 68%.
Solución:
𝑠
El margen de error estándar es: 𝑒𝑒 = 1.50 = 0.15𝑘𝑔.
√𝑛 =
0𝑘𝑔
√100
Calculo del intervalo de confianza. 𝐼𝐶68 = 𝑋̅ + 1𝑒𝑒 = 3.100 + 0.15 = 3.25 𝑦 𝐼𝐶68 = 𝑋̅ − 1𝑒𝑒 =
3.100 − 0.15 = 2.950
Lo que significa que con estos datos se puede inferir que el peso del 68% de los recién nacidos está
comprendido entre 2,950 kg y 3.25 kg.
d) grado de variabilidad: hace referencia a que tanto se aleja un dato de una muestra con respecto
a la media.
Ejemplo: se tiene un grupo de niñas con edades de 5, 10 y 15 cuyo promedio es 10 años y se tiene
un segundo grupo de niñas con edades de 9, 11 y 10 años cuyo promedio es de 10 años.
Se puede observar que el primer grupo presenta mayor variabilidad que el segundo a pesar que
los dos grupos tienen el mismo promedio. Es decir, en el primer grupo los integrantes presentan
un mayor distanciamiento con respecto a la media que el segundo grupo.
A la hora de hallar el tamaño de una muestra se ha de tener presente que está no puede ser
demasiado grande o demasiado pequeña. Si se toma una muestra demasiado grande esto puede
Profesor Jairo Alonso Moreno Montagut
Factores para determinar el tamaño de una muestra: existen tres factores que determinan el
tamaño de la muestra, ninguno de los factores tiene relación directa con el tamaño de la
población.
1. El grado de confianza seleccionado. Los más usuales son el 0.95 o 0.99 aunque puede ser
cualquier nivel; el investigador especifica el grado de confianza con el que trabaja.
Si el grado de confianza aumenta de 0.95 a 0.99 el tamaño de la muestra debería aumentar, lo que
lleva a concluir que a mayor grado de confianza mayor será el tamaño de la muestra requerida
para tener cierta precisión.
2. El máximo error permisible. También lo decide el investigador. Es el máximo error tolerable en
un nivel de confianza específico. Lo más común es tomar el 5%.
3. La variación de la población. La variabilidad la mide la desviación estándar. Poblaciones con
variabilidad pequeña requiere de muestras pequeñas.
Las siguientes son las fórmulas usadas para hallar el tamaño de una muestra según los objetivos
de la investigación.
1. Cuando se quiere estimar proporciones o los resultados se dan en porcentajes se usan las
siguientes dos fórmulas para variables cualitativas:
𝑧2𝑝𝑞
a) Cuando no se conoce el tamaño de la población (N). 𝑛 = , z es el factor probabilístico que
𝑒2
depende del nivel de confianza con el que se desea trabajar, pq es la varianza de la proporción; p
es la probabilidad de que ocurra el suceso esperado y q la probabilidad que no ocurra. e es el error
máximo permitido y n es el tamaño de la muestra a calcular.
Si p no se conoce se usa el 50% (0.5), por tato q será también 50% o se busca una investigación
que persiga el mismo objetivo y se usa el valor de p usado en esa investigación, en este caso q=1-
p.
Profesor Jairo Alonso Moreno Montagut
𝑧2𝑝𝑞𝑁
𝑛= 𝑒2(𝑁−1)+𝑧2𝑝𝑞
, donde N es el tamaño de la población.
2. Para variables cuantitativas: estimación de promedios. Se usan las siguientes dos fórmulas que
depende si no se conoce o si el tamaño de la población.
𝑧2𝜎2𝑁
𝑛= 𝑒2(𝑁−1)+𝑧2𝜎2
. Donde N es el tamaño de la población.
Las siguientes URL muestran vídeos con el desarrollo de ejemplos para las diferentes fórmulas:
1. https://www.youtube.com/watch?v=iXJfDZAt2qs
2. https://www.youtube.com/watch?v=GWgFlJsPdFI
Bibliografía
Glejberman, D. (s.f.). La investigación estadística. Obtenido de dgeec.gov.py:
https://www.dgeec.gov.py/convocatoria/document/etapas_invest_estadistica.pdf