Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestreo y Probabilidad
Es frecuente que, en investigaciones aplicadas de las Ciencias Sociales, se encuentre con
cantidades considerables de individuos que son objeto de estudio. En esta unidad se
analizan los conceptos de población y muestra, y la importancia que tiene la delimitación
de características de los individuos objeto de estudio para el diseño del muestreo.
El muestreo es el proceso para seleccionar una muestra, que implica dos momentos: el
cálculo del tamaño de la muestra y, la selección de los individuos que conforman la
muestra. Aprenderá los elementos que se consideran para determinar el tamaño de una
muestra en general y a partir de estratos.
El muestreo es un elemento importante en el diseño metodológico de una investigación,
su correcta implementación garantiza resultados respaldados por la teoría de
probabilidad y le brinda carácter científico al estudio.
Introducción a la unidad
Poblaciones y Muestras
Técnicas de Muestreo
Distribuciones de Probabilidad
Distribución Normal
Cierre de la unidad
Glosario de términos
Recursos complementarios
Lección 1 de 8
Introducción a la unidad
Universidad Gerardo Barrios
Poblaciones y Muestras
Universidad Gerardo Barrios
Cualquier investigación en las Ciencias Sociales tiene como sujeto de investigación a un conjunto de
personas. Las investigaciones con frecuencia establecen conclusiones sobre grupos más amplios que
los observados, establecer esta diferencia es importante en el ámbito estadístico. Los conceptos por
estudiar en este contenido son población y muestra.
Población
Una población es un conjunto de individuos que comparten alguna característica en común por la cual
son objeto de estudio.
Por ejemplo, en una investigación de carácter socioeconómico, el estudio puede dirigirse sobre la
fracción de los ciudadanos con menores ingresos, con menor grado de escolaridad, o puede realizarse
para toda una ubicación geográfica sin importar los ingresos o estudios. Definir de forma clara la
característica en común que tienen las personas que son objeto de estudio es de suma importancia,
brinda una primera delimitación de la investigación; si la característica es geográfica entonces se
delimita la región sobre la que se investigará.
Para establecer la población, el investigador debe describir de forma clara la característica en común de
los individuos, esta debe ser destacada en relación con el tema de la investigación. Escribir de forma
clara la característica no significa describir todas las características en común de los elementos de la
población, porque muchos de ellos posiblemente no estén relacionados con el tema de investigación.
Por ejemplo, si una investigación está relacionada a aspectos de jurisprudencia, lo más razonable es
que requiera que los individuos sean estudiantes o graduados de Licenciatura en Ciencias Jurídicas de
alguna universidad en particular, ésta es la característica en común. Podrá haber otras características,
como la franja de edad, zona de residencia, religión u otros, pero no son relevantes para la
investigación.
Co n tin u ar
Muestra
Una muestra se expresa de forma tan sencilla en la definición anterior, pero el corto concepto incluye
dos elementos con importancia suficiente para ser analizados.
1 El tamaño de la muestra.
En un estudio estadístico, a partir de un conjunto de datos se pueden obtener diversas medidas como
la media aritmética, proporciones y desviación estándar. Estas medidas reciben un nombre especial
que establece diferencia cuando se calculan a partir de una muestra o de una población.
En algunos casos, las fórmulas para calcular las medidas son iguales entre estadísticos y parámetros,
pero en otros casos las fórmulas difieren. Un ejemplo es la desviación estándar estudiada en la Unidad
2, se enunciaron dos fórmulas con una ligera variación para denominar como “muestral” y como
“poblacional” a la desviación estándar. La desviación estándar muestral es un estadístico y la
poblacional es un parámetro.
La selección de los elementos de una muestra puede hacerse de muchas formas, algunas pueden
garantizar representatividad y otras no. A las formas para seleccionar los elementos que conforman la
muestra se le denomina técnicas de muestreo.
En resumen, para obtener una muestra representativa se debe calcular el tamaño de la muestra
utilizando fórmulas basadas en la teoría de la probabilidad, y elegir los elementos de la muestra
utilizando técnicas de muestreo apropiadas.
Proceso de muestreo
Co n tin u ar
Donde:
zα: Es el valor en tabla de la distribución normal que deja una probabilidad de α a un extremo. El valor
Ahora, para calcular el tamaño de la muestra cuando el tamaño de la población es conocido se utiliza:
Ecuación 2. Fórmula para calcular el tamaño de la muestra con Población conocida
Afortunadamente, en estos días se cuenta con herramientas que permiten calcular el tamaño de la
muestra de forma confiable. Puede obviar el cálculo con fórmulas y utilizar la Calculadora de Muestras
del Sitio Web Raosoft, accediendo al enlace siguiente: http://www.raosoft.com/samplesize.html.
En la calculadora aparece la explicación de cada dato que se ingresa a la fórmula y ofrece el cálculo de
forma inmediata. A continuación, se muestra el cálculo del tamaño de la muestra para una población
de 1500 individuos, con un margen de error de 5%, nivel de confianza de 95% y una probabilidad de
éxito de 50%:
Cálculo del tamaño de la muestra en Raosoft. Fuente: www.raosoft.com
El tamaño de 306 elementos para la muestra significa una importante reducción de recursos para la
investigación, tales como recursos humanos, papelería, transporte costos de logística, etc. En ocasiones
la cantidad de recursos disponibles no alcanza para cubrir tamaños ideales de muestra, en estos casos
se reduce el nivel de confianza y/o se incrementa el margen de error para que se reduzca el tamaño de
la muestra.
Observe que hay una importante reducción en el tamaño de la muestra, pero el costo de usar una
muestra más pequeña es un mayor margen de error.
Los valores usuales en investigación son los presentados en la Ilustración 4. Como investigador trate
de mantener dichos valores para mantener niveles adecuados para el rigor científico.
Referencias Bibliográficas
Técnicas de Muestreo
Universidad Gerardo Barrios
En el contenido anterior se ha mencionado que hacer estudios sobre una población completa significa
una gran inversión de recursos, por tanto, se realiza el estudio sobre una parte de la población llamada
muestra. La técnica de muestreo consiste en el método para seleccionar los individuos que conforman
la muestra.
Las técnicas no probabilísticas carecen de fiabilidad en sus resultados. La técnica no probabilística más
común es el muestreo por conveniencia, en el cuál el investigador selecciona los individuos por
amistad, compañerismo, vecindad pensando en su comodidad. Es una técnica cuya selección no
depende del azar, sino del criterio del investigador.
Imagine el nombre de cada individuo de la población ubicado en una urna, luego el investigador
selecciona los nombres uno a uno. Esta especie de sorteo permite que cada uno de los individuos
tenga la misma probabilidad de pertenecer a la muestra, y mejor aún, permite que cualquier
subconjunto de la población tenga la misma probabilidad de ser seleccionado.
En la práctica, este sorteo es difícil de realizar. Usualmente se pueden utilizar ordenadores para
seleccionar la muestra mediante funciones aleatorias.
A menudo se usan computadoras para generar números aleatorios, correos electrónicos, perfiles de
Facebook, etc.
En muchos casos, el proceso de recolección de datos se realiza al mismo tiempo que se seleccionan los
individuos de la muestra. Es probable que el lector en algún momento haya respondido una encuesta,
en ese momento se volvió un elemento de la muestra.
Cuando un equipo parte al campo a recopilar datos, debe tener en mente el tipo de muestreo que está
aplicando. Para que el proceso sea aleatorio, el investigador no debe aplicar ningún tipo de criterio
personal para seleccionar los individuos, pero se debe asegurar que el individuo sea parte de la
población.
Muestreo Estratificado
Los elementos de una población tienen alguna característica en común que los convierte en objeto de
estudio. Pero los elementos tienen otras características que los diferencia unos de otros, algunos
pueden sesgar la investigación si no se consideran para seleccionar una muestra.
El muestreo estratificado es una técnica de muestreo que establece un proceso para garantizar la
representatividad de todas las características que diferencian los elementos de una población.
El muestreo estratificado consiste en la división en al menos dos subgrupos (llamados estratos) que
comparten una misma característica, por ejemplo: zona urbana o rural; sexo masculino o femenino;
estudios medios o superiores; categorías de edad, etc. Después se realiza el muestreo a cada estrato
por muestreo aleatorio u otro que elija el investigador.
La imagen siguiente ilustra un muestreo que divide a la población según género y luego selecciona una
muestra de cada estrato:
Muestreo estratificado
Suponga que se realiza una investigación en una urbanización privada que tiene 600 habitantes que
conforman la población, utilizando Raosoft con los parámetros por defecto se calcula un tamaño de la
muestra de 235.
La investigación tiene como objetivo conocer la satisfacción de los habitantes con respecto al
mantenimiento y ornato de las vías y zonas verdes de la urbanización.
Suponga que se conoce que en la urbanización residen 250 niños y niñas entre 12 y 18 años, 250
mujeres mayores de 18 años y 100 hombres mayores de 18 años.
Nº sujetos
Identificaci Muestra
Estrato en el Proporción
ón del estrato
estrato
100.0% 235
Calculadora muestreo.xlsx
11.6 KB
Co n tin u ar
Muestreo Sistemático
Si el tamaño de la población es conocido, como el ejemplo anterior con tamaño 600, se calcula el
tamaño de la muestra 235, luego se divide el tamaño de la población entre el tamaño de la muestra
como sigue:
Para seleccionar la muestra se toma un individuo de cada 2 según aparición o según un listado.
Muestreo sistemático
En el muestreo sistemático, debe respetarse siempre el sistema dado por el valor de k para seleccionar
la muestra.
Este tipo de muestreo se puede combinar con otras técnicas, por ejemplo, con el muestreo
estratificado. Al utilizar ambas técnicas se distribuyen los estratos y se calcula el tamaño de la muestra
de cada estrato, luego se aplica el muestreo sistemático para elegir los elementos que conforman la
muestra de cada estrato.
Muestreo por Conglomerado
Consiste en dividir la población en secciones (o racimos). Esta división suele ser natural, especialmente
por ubicación geográfica de la población. Luego se eligen al azar algunos racimos para elegir todos sus
elementos como parte de la muestra.
Aleatorio simple
–
En un partido político deciden hacer una investigación de intención de votos, según la cantidad de
inscritos en el padrón, la muestra debe ser de 206 votantes. Para seleccionarlos utilizan un software
para seleccionar aleatoriamente a los 206 votantes de entre el padrón completo.
Sistemático
–
Un psicólogo que atiende únicamente problemas escolares decide, a partir de un día, aplicar una
encuesta a cada 5° niño que ingrese a consulta.
Por conveniencia
–
Un estudiante tiene que aplicar una encuesta a 20 personas adultas, por conveniencia decide
aplicárselas a sus vecinos y conocidos.
Estratificado
–
Se quiere investigar el estrés laboral en una empresa. El total de empleados a nivel nacional es 160
empleados, de los cuales 60 son hombres y 100 mujeres. Utilizando Raosoft se calcula la muestra de 101
con 5% de margen de error, 90% de confianza y 50% en distribución de la respuesta. El investigador
divide la población en base a la característica sexo: hombres y mujeres. Lo que sigue es decidir cuántos
de los 101 elementos de la muestra serán hombres y cuántas mujeres. Para ello se realiza una
proporción de la siguiente manera:
Por racimos
–
Se desea indagar sobre la violencia intrafamiliar en el departamento de San Miguel, el investigador
considera que es difícil hacer un muestreo aleatorio o estratificado en todo el departamento, y divide la
población en municipios, posteriormente determina municipios al azar hasta completar el tamaño de la
muestra y se investigan completamente. En este caso resultaron en el sorteo los municipios de
Chirilagua, Ciudad Barrios y Moncagua. En estos municipios se investigará a la totalidad de la población.
Referencias Bibliográficas
Distribuciones de Probabilidad
Universidad Gerardo Barrios
Antes de estudiar las distribuciones de probabilidad se deben definir algunos conceptos previos:
Variable Aleatoria
Experimento
–
Se refiere a cualquier actividad sobre la que se pueda realizar observación o medición. Un experimento
debe tener algunas características:
1. Debe poder replicarse bajo las mismas condiciones por el investigador, ofreciendo resultados
posiblemente distintos en cada repetición.
2. El investigador puede establecer todos los posibles resultados del experimento, pero no predecir
el resultado.
Espacio muestral
–
Es un conjunto formado por todos los posibles resultados de un experimento. Por ejemplo, al aplicar
un determinado tratamiento médico pueden obtenerse los resultados: con efectos secundarios, sin
efectos secundarios.
Punto muestral
–
Se denomina así a cada elemento del espacio muestral. Es, por tanto, un posible resultado de un
experimento.
Evento
–
Es un subconjunto de elementos del espacio muestral. En palabras más sencillas, es un acontecimiento
particular en un experimento. Por ejemplo, suponga que el experimento consiste en el lanzamiento de
un dado, un evento puede ser A: obtener un numero par (A = {2,4,6}).
Probabilidad
–
Es la medida de las posibilidades que tiene un evento de ocurrir. Se representa con un número
comprendido entre 0 y 1.
Sucede cuando el valor de la probabilidad se asigna dependiendo la experiencia del observador. Por
ejemplo, es común visitar algún pariente en zonas rurales y que, al ver las nubes, puedan predecir que
lloverá. Esta predicción es equivalente a asociar una probabilidad alta al evento lloverá. Asimismo, podría
preguntarse cuál es la probabilidad de que ocurra una tormenta de nieve en El Salvador, seguramente
se le ocurrió 0%. Es también un ejemplo de probabilidad empírica.
Ocurre cuando la probabilidad se establece en base a observaciones. Por ejemplo, se observa que un
portero de fútbol ha atajado 12 de los últimos 15 penales que le han lanzado. Si ocurriera un nuevo
penalti es razonable asumir que la probabilidad que ataje el tiro de penal es de 12/15 = 0.8, concluyendo
que hay un 80% de probabilidad que ataje el penal.
Una variable aleatoria se define como una función que asigna a cada punto muestral un número.
Para comprender mejor la definición, suponga el experimento de lanzar una moneda, el resultado
posible es cara o cruz. Estos resultados no son números y por tanto no es posible su manipulación ni
análisis más profundos. Sin embargo, se puede definir una variable aleatoria como:
Si el resultado es cara, entonces x toma el valor de 1. Esta definición ha convertido dos resultados
cualitativos en valores cuantitativos.
Las variables aleatorias, al igual que los datos, se pueden clasificar en discretas y continuas. Las
variables discretas toman valores numerables, mientras las variables continuas toman valores en
intervalos de los números reales.
Distribuciones de Probabilidad
Una distribución de probabilidad es una tabla o función que describe todos los posibles valores de una
variable aleatoria junto con su probabilidad. Posee las siguientes características:
Suponga que la defensoría del consumidor selecciona, de forma aleatoria, tres artículos con el fin de
comprobar una denuncia ciudadana. Cada artículo se inspecciona y se clasifica como defectuoso, D, o
no defectuoso, N. Para listar los elementos del espacio muestral, se construye el diagrama siguiente:
Espacio muestral del experimento. Fuente: (Walpole, Myers, & Myers, 2012)
En Estadística, estas distribuciones tienen importantes aplicaciones para procesos de inferencia. Las
distribuciones más conocidas son la Distribución Normal, distribución t de Student y la distribución Chi
cuadrado.
Referencias Bibliográficas
Distribución Normal
Universidad Gerardo Barrios
Distribución Normal
Si una variable aleatoria continua tiene una distribución con una gráfica simétrica y en forma de
campana, como en la figura siguiente:
Entonces se dice que la variable tiene una distribución normal.
La distribución normal tiene como valor central la media de la variable aleatoria. La forma de la
campana está determinada por la desviación estándar.
La distribución normal estándar es una distribución normal de probabilidad con una media de 0 y
una desviación estándar de 1, de forma que el área total bajo su curva es igual a 1. Cualquier variable
con distribución normal puede transformarse en una distribución normal estándar. La distribución
normal estándar se aplica para la variable z, y tiene su propia tabla de probabilidades bajo la curva, de
modo que al encontrar una probabilidad para la variable z se determina para cualquier variable x.
Para encontrar áreas bajo la curva de la distribución normal estándar se retomará la tabla A-2 del
Apéndice A presentada por (Triola, 2004) en su libro; sin embargo, también la puede descargar dando
clic en el enlace siguiente: Tabla de distribución normal.
Los valores en la tabla representan el área bajo la curva a la izquierda del valor encontrado. Por
ejemplo, para encontrar el área bajo la curva de , se busca el valor 1.5 en la columna izquierda y el valor
de .08 en la primera fila, para encontrar el valor de 0.9429. En la figura se muestra el área que
representa el 0.9429:
Área representada por el 0.9429 correspondiente a z=1.58. Fuente: (Triola, 2004)
Con la distribución normal estándar se pueden resolver muchos problemas de probabilidad, pero el
objetivo de estudiarla en esta asignatura es tomarla como herramienta en procesos inferenciales. Para
ello, únicamente es necesario conocer su definición e interpretar los resultados que la tabla ofrece.
Referencias Bibliográficas
Walpole, R. E., Myers, R., & Myers, S. (2012). Probabilidad y estadística para ingeniería y ciencias.
México: Pearson Educación.
Lección 6 de 8
Cierre de la unidad
Universidad Gerardo Barrios
Glosario de términos
Universidad Gerardo Barrios
Recursos complementarios
Universidad Gerardo Barrios
Diferencia entre
Sitio web (7Graus, s.f.)
población y muestra.
Calculadora de tamaños
Sitio web (Raosoft, s.f.)
de muestra.
Explicación de las
Video (Rojas, 2014)
técnicas de muestreo.