Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
TEORIA BASICA DEL MUESTREO
1. INTRODUCCIÓN.
Debido a que los sucesos o eventos que pueden ser objeto de estudio en una investigación,
generalmente implican el estudio de poblaciones numerosas, muy grandes o que tienden al infinito, y
por ello técnicamente resulta poco viable tomar información de todos y cada uno de los elementos o
valores de interés que las integran, o bien porque económicamente no sea rentable, es necesario
tomar información parcial, pero técnicamente consistente, es decir que llene los requisitos de
suficiencia para que con base en ella se pueda arribar a conclusiones válidas para toda la población
objeto de estudio.
Existen técnicas variadas para este propósito, y estas son las técnicas de muestreo. El uso
correcto y adecuado de éstas ayuda a diseñar muestras útiles para obtener la información que se
requiere en el estudio de determinado problema y someter a prueba las hipótesis formuladas.
1.1 DEFINICIONES BASICAS UTILIZADAS EN EL MUESTREO.
1.1.1 Población y/o Universo.
k
p
2
1.1.2 Muestra.
3
1.1.5 Estadístico.
▪ Es una medida usada para describir alguna característica de una muestra, tal como
una media aritmética, mediana, desviación estándar, etc.
▪ Es un valor calculado, obtenido con los elementos incluidos en una muestra.
1.1.6 Parámetro.
▪ Es una medida usada para describir alguna característica de una población, tal
como una media aritmética, mediana, desviación estándar. El proceso de
estimación en inferencia estadística puede ser descrito como el proceso de estimar
un parámetro a partir de un estadístico correspondiente, tal como utilizar una media
muestral (un estadístico) para estimar la media de la población (un parámetro).
Los símbolos usados para representar los estadísticos y los parámetros, se
resumen en la siguiente tabla.
1.1.7 Censo.
▪ Es la actividad investigativa que implica obtener información de todos los elementos o
sucesos simples y compuestos que integran la totalidad de observaciones o valores de
interés de la población.
▪ Es una indagación completa sobre las variables que interesa investigar, de los elementos
que componen una población claramente definida. Asegura la posibilidad de obtener
datos fehacientes, siempre que no se cometan errores en la recopilación y el tratamiento
de la información. Es bastante difícil realizar un censo, especialmente cuando la
población es muy grande y diversa, su mayor desventaja es su costo elevado.
▪ Se deriva del latín censere, ‘recuento’, y es el recuento o estimación de una población
presente en un área de estudio determinada en un momento concreto. Su objetivo
principal es conocer el número de individuos que componen la población. Debido a las
dificultades metodológicas resulta imposible contar todos los elementos de una población
salvo casos puntuales. Las principales fuentes de datos demográficos son los censos
nacionales, el registro civil y, a partir de la década de 1960, los muestreos a nivel
nacional. Estas fuentes proporcionan el material de base para investigar las causas y las
consecuencias de los cambios en la población. La fuente más habitual es el censo de
población, que contabiliza en un cierto momento todas las personas de un área
determinada, con sus datos personales y características sociales y económicas
específicas. Un registro civil es la contabilización continua, por parte de las
administraciones locales, de los nacimientos, fallecimientos, migraciones, matrimonios y
4
divorcios. Su fiabilidad depende de lo veraces que sean los ciudadanos al proporcionar
los datos.
1.1.8 Encuesta.
Es la actividad mediante la cual se recopila información de un fenómeno específico de
manera parcial o total; también se denomina así al instrumento de recolección de datos.
Aún cuando en las encuestas se utilizan métodos de muestreo probabilístico, están sujetas a
errores potenciales, entre los que se pueden mencionar:
a) Error de cobertura o sesgo en la selección.
Ocurre si se excluyen ciertos grupos de sujetos de las listas de población en la muestra, de
manera que no tienen oportunidad de ser seleccionados.
b) Error de no respuesta
No todas las personas están dispuestas a responder una encuesta. Existen investigaciones
que indican que los individuos de las clases económicas alta y baja tienden a responder con
menos frecuencia que los individuos de clase media.
c) Error Muestral o de Muestreo.
La diferencia entre el valor obtenido de una muestra (un estadístico) y el resultado que
se debió de haber obtenido de la población se llama error muestral o error de muestreo.
Mientras más pequeño es el error muestral, mayor es la precisión de la estimación.
Cuando más grande sea el tamaño de la muestra, menor será el error de muestreo, de
tal modo que al analizar toda la población por medio de un censo, dicho error
desaparece.
Existen tres razones principales para extraer una muestra en lugar de realizar un censo
completo: es más rápida, menos costosa y más eficiente.
d) Error de medición
Cuando se quiere realizar una investigación, se diseña un cuestionario que permita reunir
información importante. Los datos deben ser válidos; es decir, las respuestas “correctas”
deben ser evaluadas y plantearse de manera que arrojen medidas significativas.
Los errores en la medición, son provocados por la redacción ambigua de las preguntas, el
efecto de halo, sucede cuando la persona que responde se siente obligada a complacer al
entrevistador; y errores en la persona que contesta, cuando ésta realiza un esfuerzo muy
grande o muy pequeño para dar sus respuestas.
d) Error Estándar.
Es la desviación estándar de una distribución, en el muestreo de un estadístico, es
frecuentemente llamada error estándar del estadístico. Ejemplo: la desviación estándar
de las medias de todas las muestras posibles del mismo tamaño, extraídas de una
población, es llamada error estándar de la media. Por otro lado, la desviación
estándar de las proporciones de todas las muestras posibles del mismo tamaño,
extraídas de la población, es llamada el error estándar de la proporción. La
diferencia entre los términos “desviación estándar” y “error estándar” es que la primera
se refiere a los valores originales, mientras que la última está relacionada con valores
calculados.
5
1.1.9 Inferencia
6
En este tipo de muestreo técnicamente debe observarse que la muestra o muestras no
necesariamente deben ser muy grandes o significativamente grandes, es decir que con
el 30% de la población ya puede esperarse una base informativa consistente, siempre
tomando en cuenta la naturaleza del evento o sucesos a investigar.
7
1.3.1.2 Muestreo de Cuotas.
Este tipo de muestreo implica:
▪ Dividir la población en subgrupos o cuotas, según determinadas características:
sexo, religión, edad, etc. Pueden haber combinaciones de cuotas, tales como
hombres mayores de 50 años, mujeres solteras.
▪ En la selección de los casos interviene el criterio del investigador. Con este tipo de
muestreo se intenta tener representatividad del universo estudiado, pero presenta la
limitante que la información obtenida sólo es válida para la muestra.
1.3.1.3 Muestreo Intencional o Selectivo.
En la muestra se tomará en cuenta únicamente a aquellas personas que posean un
conocimiento amplio y claro sobre el fenómeno que se investiga. Esta técnica a pesar
de no ser probabilística presenta la ventaja de obtener datos muy importantes para el
estudio.
Todos y cada uno de los elementos de la población tienen la misma probabilidad de ser
seleccionados en la muestra. Para su empleo es necesario contar con un listado de los
elementos de la población (personas, viviendas, empresas, etc) numeras del 1 al N*.
La mala utilización del término “azar o aleatorio”, supone muchas veces en forma
equivocada que toda técnica de selección como un volado de cara o cruz, lo cual dará
como resultado una muestra al azar. Estos malentendidos conducen a que la muestra
esté sesgada.
8
En el muestreo aleatorio simple se usa “n” para representar el tamaño de la muestra y
N para el tamaño de la población. Cada persona o elemento en el marco se numera de
1 a N.
Existen dos métodos básicos para seleccionar muestras: con reemplazo y sin
reemplazo.
El muestreo con reemplazo implica que una vez seleccionada una persona o
elemento, se regresa al marco, donde tiene la misma probabilidad de ser elegida de
nuevo. Se repite el procedimiento hasta alcanzar “n” muestras deseadas. Sin
embargo, suele considerarse más adecuado tener una muestra de personas o
elementos diferentes en lugar de permitir la repetición de mediciones de la misma
persona o elemento.
En el muestreo sin reemplazo no se regresa la persona o elemento al marco una vez
seleccionado y, por lo tanto, no puede elegirse otra vez.
Para seleccionar muestras al azar existen algunas técnicas, entre las que se pueden
mencionar:
▪ Escribir el nombre o asignar un código a cada elemento. Posteriormente, se
concentran en un recipiente del cual se extraerán al azar y en forma aleatoria, uno
por uno hasta completar la muestra. Luego debe elaborarse un listado de los
elementos seleccionados.
▪ Las tablas de números aleatorios. Estas son generadas en forma manual, con una
computadora y/o calculadora, también existen tablas ya elaboradas. Se le asigna a
cada elemento un número de identificación único. Si la muestra es grande se
requiere tener varias tablas con números aleatorios o ampliar el procedimiento
dividiendo cualquier número aleatorio entre el tamaño de la muestra, tomando el
cociente y el número elegido. Al finalizar la selección de los elementos de la
muestra, se elabora una lista con las personas que fueron elegidas.
El muestreo aleatorio simple debe utilizarse cuando los individuos de
la población son homogéneos respecto a las características a estudiar (es decir, a priori no
sabemos si los resultados van a ser muy diferentes por causa de otras variables). Es poco
recomendado cuando la población es muy grande y heterógenea (los individuos presentan
características dispares).
9
Ejemplo; en una población de 5,000 elementos se determinó el tamaño de la muestra y
ésta es de 200 elementos, entonces:
10
INFERENCIA Y/O INDUCCIÓN ESTADÍSTICA
2. INTRODUCCIÓN
Todos los gerentes deben efectuar estimaciones rápidas. El resultado de ellas puede afectar
las decisiones tomadas en sus empresas. Los jefes del departamento universitario de control
académico realizan estimaciones sobre la matrícula del siguiente año. Los gerentes de crédito
estiman si un cliente pagará la factura en el plazo fijado. Los que desean comprar una casa hacen
estimaciones respecto al comportamiento de las tasas de interés en el mercado de las hipotecas.
Todas estas personas realizan estimaciones sin preocuparse si son científicas, con la única esperanza
de que sus proyecciones guarden una semejanza razonable con los resultados.
Los gerentes recurren a las estimaciones porque en todas sus decisiones menos las más
triviales, deben tomar decisiones racionales sin información completa y con mucha incertidumbre
respecto a lo que les depara el futuro.
La necesidad del uso de los métodos de inferencia estadística se deriva de la necesidad del
muestreo. A medida que una población crece, resulta demasiado costoso y tedioso obtener
información de toda la población. Las decisiones respecto a las características de la población
deben basarse en información que está contenida en una muestra.
2.1 DEFINICIÓN:
11
❑ Rama de la estadística que se ocupa del uso de los conceptos de la probabilidad para
afrontar la incertidumbre en la toma de decisiones.
❑ Son los métodos que hacen posible la estimación de una característica de la población
objeto de estudio, basada sólo en resultados muestrales.
2.2 CLASIFICACIÓN.
Asigna características paramétricas a un estadístico, o sea que con base en los valores
de las medidas de tendencia central o de dispersión, correspondientes a una o varias
muestras, extraídas y analizadas en forma técnica y estadísticamente adecuada, el
investigador asume que su valor es igual al del parámetro de la población que según
sea el caso es objeto de estudio.
Consiste en un solo estadístico muestral que se usa para estimar el valor verdadero de
un parámetro de una población, la media muestral X, es una estimación puntual de la
media poblacional .
Un estadístico muestral como X varía de una muestra a otra porque depende de los
elementos seleccionados en la muestra, por lo que debe tomarse en cuenta al
proporcionar un estimador de las características de la población. Para lograrlo se
desarrolla un estimador de intervalo.
Es una gama de valores que sirven para estimar el parámetro de una población. Es la
definición de dos valores uno mínimo y uno máximo dentro de los cuales se estima que
se encuentra el verdadero valor del parámetro objeto de interés que está a cierta
distancia de la media poblacional.
Estos límites se hallan calculando primero la media muestral, X. Luego, se suma una
cierta cantidad a X para obtener el LS (límite superior) o L 2, y la misma cantidad se resta
de X para obtener el LI (límite inferior) o L1.
12
2.2.2.2 Ejemplos de estimaciones o estimados.
Parámetros
de la población Tipos de estimación de Estimación de intervalo
Punto
MEDIA
El guatemalteco medio consume El consumo medio mensual de
20 libras de carne al mes. Carne en Guatemala fluctúa
Entre 15 y 20 libras.
PROPORCIÓN
El 22% de los residentes en Entre el 18 y 22% de los resi-
Salcajá utiliza transporte públi- dentes en Salcajá utiliza trans-
co para llegar a su trabajo. porte público para llegar a su
trabajo.
8 /___________________/
16 /________________/
22 /_____________/
64 /__________/
c. Efecto de la dispersión
De la población
5 /_______/
10 /___________/
15 /_______________/
20 /___________________/
13
En la tabla anterior se puede observar que:
a. Al aumentar el grado de confianza da como resultado una ampliación del intervalo.
b. Un aumento en el tamaño de la muestra provoca que se reduzca el intervalo.
c. La dispersión de la población puede alterar el intervalo: a mayor dispersión, mayor intervalo.
PRUEBA DE HIPÓTESIS
3. INTRODUCCIÓN
Generalmente, una prueba de hipótesis inicia con alguna teoría, declaración o aseveración
relativa a cierto parámetro de una población. Por ejemplo: con propósitos de análisis estadístico, el
gerente de operaciones de la compañía de cereales elige como hipótesis inicial que el proceso opera
de manera adecuada; es decir, que el llenado promedio es 368 gramos y no se necesita acción
correctiva.
3.1 CLASIFICACION
Ho: = 368
Observe que aunque el gerente de operaciones cuenta sólo con la información de una
muestra, la hipótesis nula se escribe en términos del parámetro de población. Esto se debe a que
está interesado en todo el proceso de llenado, (la población de) todas las cajas de cereal que se
14
llenan. El estadístico muestral se utilizará para hacer inferencias sobre el proceso completo. Una
de estas inferencias puede ser que los resultados observados en los datos de la muestra indican que
la hipótesis nula es falsa. Al suceder ésto, algo más debe ser cierto. Para prever esta posibilidad,
siempre que se especifica una hipótesis nula debe establecerse una hipótesis alternativa, o una
que debe ser cierta si la hipótesis nula es falsa. La hipótesis alternativa H 1 es el opuesto de la
hipótesis nula Ho. La cual se expresa así:
Ha: 368
3.2 CARACTERISTICAS
✓ La hipótesis nula Ho, siempre se refiere a un valor específico del parámetro de población (como ),
no al estadístico muestral (como X).
✓ La expresión de la hipótesis nula siempre contiene un signo igual respecto al valor especificado del
parámetro de población (Ho: =368 gramos).
✓ La expresión de la hipótesis alternativa nunca contiene un signo igual respecto al valor
especificado de parámetro de población (H1: 368)
Aún cuando la hipótesis nula sea cierta en realidad, es probable que el estadístico difiera del
valor del parámetro real debido al azar o a un error de muestreo. En estas circunstancias se espera
que el estadístico muestral sea cercano al parámetro de población. En esta situación no habrá
suficiente evidencia para rechazar la hipótesis nula. Por otro lado, si existe gran discrepancia entre el
valor del estadístico y su parámetro hipotético correspondiente, sería instintivo concluir que es poco
probable que la hipótesis nula sea cierta. En cualquier caso, se llega a una decisión debido a la
creencia de que una muestra seleccionada al azar es en verdad representativa de la población de
donde se obtuvo.
15
El proceso de toma de decisiones no siempre es claro y directo y no se puede dejar al juicio
subjetivo de una persona el significado de “muy cercano” o “muy diferente”. Determinar qué es
cercano y qué es diferente es bastante arbitrario y no tiene una definición clara. La metodología de
prueba de hipótesis proporciona definiciones explícitas para evaluar esas diferencias y permite
cuantificar el proceso de toma de decisiones de modo que la probabilidad de obtener un resultado
dado de la muestra se puede encontrar si la hipótesis nula es cierta. Esto se logra al determinar
primero la distribución muestral para el estadístico muestral de interés (como la media muestral) y
después calcular el estadístico de prueba específico basado en el resultado de la muestra. Debido a
que la distribución muestral del estadístico de prueba con frecuencia sigue una distribución normal, ser
puede usar esta distribución para determinar la probabilidad de que una hipótesis nula sea cierta. |
Sea la edad promedio de los estudiantes del 7º. Semestre de la carrera de 25 años.
16
3.6 PLANTEAMIENTO DE HIPÓTESIS PARA PROPORCIONES
Sea el parámetro a investigar la edad promedio de los estudiantes inscritos en el 2009, igual a 25
años.
17
18