Está en la página 1de 12

Politometría

Imputación: llenar con datos aquellas casillas vacías.


¿Por qué se utiliza el muestreo?
- Censos (registro completo o base de datos): proviene de toda la población o dan
preferencia a toda una población, conteo de todos los casos
- Muestras: solo una parte de esta
- Puede resultar imposible
- Muy costoso, recursos escasos
- Requiere mucho tiempo
- De esta manera llevamos a algo realista la investigación estudiando una muestra.
- a través de las encuestas, es una aproximación a la realidad
- una muestra mayor no asegura una mejor calidad de investigación
- deben poseer el tamaño suficiente para llegar a comprender la realidad, que sea
una muestra representativa (justa y necesaria). Que nos permita establecer
conclusiones y generar resultados (muestra potente).
Tener una muestra muy grande involucra un error sistemático o error
no muestral.
Diseños Muestrales
Nos interesamos en estudiar muestras probabilistas (muestra de un total) porque
no tenemos acceso a un registro completo o un censo y lo hacemos a través de una
parte de la población. Por lo cual puede hacerse de manera cuali pero
principalmente cuanti. Sin son costosas. Es una aproximación de la realidad. Una
muestra mayor es más costosa (llegar a más casos, cuesta más el estudio) pero no
necesariamente mejora la calidad de la investigación, porque a la hora de recabar
más información incrementa la probabilidad de cometer errores (error no
muestral o sistemático), impactando en la confiabilidad de los datos.
Muestreo: cómo llego a la muestra (operaciones encaminadas a determinar una
muestra). Determinar el tamaño de la muestra (incluye el cálculo del tamaño de la
muestra) y determinar quiénes serán dichos elementos seleccionados en base a mis
características identificadas.
Población: características comunes concretas transversales a toda la población,
es así como determino donde empieza y donde acaba una población (conjunto de
la totalidad de elementos).
Población de estudio: dentro de la población, elegimos el sub conjunto que
abarcaremos para tomar la muestra (marco sobre el que se trabajará el calculo
muestral) puede ser identica a la población o puede ser más acotada.
Muestra: finalmente elementos elegidos de la población para estudiar y asi poder
inferir caracteristicas de la poblacion a manera de conclusiones a través del estudio
muestral que realicemos.
Censo: listado completo de los elementos de una población.
Error muestral y error no muestral:
Error Muestral: parte de la población que no estamos abordando. Complemento
de la muestra. Siempre estará ya que en muestras no trabajamos con toda la
población, imputable al estudio.
Error no muestral: se produce en el proceso de la investigación, al recabar datos
o desarrollando herramientas o haciendo consistencia de los datos. Siempre
tenemos un error no muestral, ya sea pequeño o grande. Puede ser reducido. En los
censos no sabemos cuanto error no muestral o sistematico estamos recabando.
Marco muestral: identifica los elementos de nuestra población objetivo, limita
en base al listado que identifica los elementos de la población objetivo
(identificadores). En base a ello planteo la muestra. Al hacer un estudio
probabilisto debo ubicar mi marco muestral.
Elementos: Unidades sobre las que me interesa obtener información. Los
elementos de la muestra se llamarán unidades muestrales. Unidad seleccionada de
la población para la aplicación de la tecnica de investigación.
Parámetro: medida de las caracteristicas determinadas de una población.
Estadistico o estadigrafo: medida de las caracteristicas determinadas de una
muestra.
La diferencia entre ambos es el error muestral: complemento de la
muestra
Estimador: es un valor muestral que nos permite inferir el valor poblacional. Se
dice que es consistente cuando al sustituir el tamaño de la muestra por el total de
la población, coinciden con el parámetro poblacional ( es decir estima cuanto
representa de la población cada unidad muestral).
Distribución muestral: valores de los estadísticos con sus frecuencias, me
permite saber cómo se distribuye la variable de la muestra.
Teorema de limite central: no tenemos que recabar una muestra enorme, por
lo cual con por lo menos 30 casos, me permite conocer la distribución y calcular sus
estadísticos y puedo inferirlos en la población si estos han sido extraídos
aleatoriamente. Muestra útil e importante. Mientras más la muestra se acerque al
total, tendrá más características cercanas a la población (media y varianza igual,
distribución normal). La muestra puede mantenerse, ya que así la población sea
infinita, la muestra será representativa.
1 inferencia estadística: estimar los resultados de la muestra para la población.
2 intervalo de confianza: probabilidad de incluir el valor poblacional. Contiene
en sus límites al valor poblacional más o menos y se determina a partir de los
resultados muestrales y el error de muestreo.
1 y 2 Ambos son relevantes si hacemos muestreo (muestras - inferencia)
solo si trabajamos con muestra podemos hacer análisis inferencial: calcular por
ejemplo intervalo de confianza para la media, la mediana, la simetría, la curtosis,
la varianza, si hay asociación, diferencia de medias, entre otros. Calcular la
significancia es parte del análisis inferencial. En población pasamos a encargarnos
de los coeficientes.
Nivel de confianza: probabilidad de obtener un intervalo de confianza concreto.
Método de muestreo: procedimiento que utilizaremos para seleccionar las
unidades muestrales de manera representativa.

CÓMO TIENE QUE SER UNA MUESTRA


- lo suficientemente amplia para conocer la realidad
- de tamaño suficiente no necesariamente grande
- aplicaremos técnicas de muestreo y conceptos básicos
ERRORES DE MUESTREO
- Error aleatorio o propio del muestreo: (de la muestra) siempre que
hagamos muestra existe el error muestral, se puede acotar agrandando la
muestra. Decrece si la muestra se amplía y crece si se reduce la muestra, depende
del tamaño de la muestra. Mientras más homogénea (gracias al estadístico
desviación estándar, si se acerca a 0 es homogénea, si se aleja mucho de 0 es
heterogénea - si es variable numérica) las características de la población son
menor. Si son cualitativas - categóricas, identificamos homogeneidad a través de
si se encuentra en una categoría o varias categorías, si se concentra en un grupo o
no.
- Error sistemático o ajeno al muestreo: (de la investigación) crece con el
tamaño de la muestra, se reduce si cuidamos los detalles, planificando la selección,
seleccionando personal calificado, redactando bien y facilitando, entre otros. Los
errores ajenos al muestreo no se pueden acotar.
MUESTREO PROBABILISTICO
Las muestras se seleccionan al azar (aleatorio), no son seleccionadas por los
investigadores. Si se puede conocer el error muestral (en función al error y si es
homogéneo o no), el nivel de confianza y el nivel de precisión de las estimaciones.
Los resultados se pueden generalizar, es decir, inferir en la población. Cada
elemento de la población tiene la misma probabilidad de ser elegido (debemos tener
un marco muestral completo, no pueden haber excluidos o desfasados, por lo tanto
no será representativo). Es más caro que el muestreo no probabilístico, pero es más
lento y complicado. Único método que puede evaluar la representatividad de la
muestra.
Tipos de muestreo aleatorio
Muestreo aleatorio simple: la selección de la muestra es aleatoria, cada
elemento tiene las mismas probabilidades de ser seleccionado, es posible estimar,
medir y acotar el error, es posible conocer la confianza y el costo (implica mayor
movilización) y dificultad del diseño es elevado (al ubicar mi muestra), además de
lento y complicado. Se emplea en poblaciones poco heterogéneas (necesitamos
población homogénea o muy parecida y pequeña o simple) (para no recabar tantos
datos ni ampliar tanto mi muestra para que no crezca mi error muestral). Se
emplea para hacer estimaciones en poblaciones homogéneas. Requiere una
localización previa de los elementos de la población. Por ejemplo, puedo seleccionar
mi muestra a través de llamadas telefónicas y voy llamando a través de mi guía de
números de la ciudad. Sirve para hacer inferencias en la población.
Muestreo aleatorio sistemático: (ordenamos la población para ubicar o
buscar luego la muestra). Primero se selecciona el coeficiente de elevación (tamaño
de población N/ tamaño de muestra n) y se selecciona al azar un número inferior
a dicho coeficiente. Así sucesivamente aplicamos a la primera unidad muestral un
nuevo coeficiente de elevación, hasta completar el tamaño de la muestra. Por
ejemplo 435 población entre 85 muestra, mi coeficiente de elevación seria 5. Calculo
al azar mi primer elemento que puede ser 3 y de ahí de 5 en 5 elijo el orden hasta
completar los 85. Por ejemplo, sirve para recabar datos de la experiencia
ingresando una denuncia o alguna experiencia en un centro comercial de inicio a
fin. Es sencillo, fácil de ejecutar y menos caro. Solo es al azar al inicio y de ahí el
proceso es sistemático. Este muestreo asegura un reparto que contribuya que la
muestra no este compuesta solo por valores extremos. Logro una distribución
uniforme y equitativa. (con un marco muestral aproximado o referencial del día
anterior y calcular el tamaño de muestra aproximado). Podemos ordenar por edad
de menor a mayor, por partidos de extremo a extremo, de orden alfabético, por
distritos, etc. Tiene un ordenamiento y es más uniforme.
Muestreo aleatorio estratificado: Es un proceso de dos fases en el que la
población se divide en estratos. Primero, identifico los conjuntos o subdivisiones
en mi población. Por ello, lo que hace es ubicar estratos mutuamente excluyentes,
es decir, elementos exclusivos de cada grupo y colectivamente exhaustivos, incluye
todas sus especialidades. Mutuamente excluyente hacia afuera y
colectivamente exhaustivo hacia adentro. Segundo, de manera aleatoria
elegimos o extraemos la muestra en cada estrato de manera aleatoria simple. Se
aplica en poblaciones heterogéneas, por lo cual se busca la representatividad de
cada grupo o estrato en la población. Pretende implementar la precisión sin
aumentar el costo, obteniendo respuestas por cada estrato e inferirlo en la
población. Es un estudio más representativo debido al estudio de los estratos. El
tamaño de la muestra es menor que el necesario y podemos estimar en los mismos
estratos.

Procedimientos utilizados para la estratificación de la muestra:


- Afijación simple: se reparte la muestra total en partes iguales, cada
estrato recibe la misma cantidad. Por ejemplo, si mi muestra es de 400 cada
estrato (4) tendrá 100. Si tengo 3 estratos iguales, cada uno será 33.33% y
juntos darán 100%.
- Afijación proporcional: (es la más ideal en encuestas de
aceptación, por ejemplo) reparte proporcionalmente la muestra en
base a la población de cada estrato. Es decir, si tenemos más médicos habrá
más médicos en la muestra, si hay menos ingenieros habrá menos en la
muestra. El tamaño de los estratos guarda relación con el tamaño de la
población. Por ejemplo, si en la población hay un 58% de hombres y un
42% de mujeres, en la muestra debe haber lo mismo. Se usa para estimar
proporciones.
- Afijación optima o no proporcional: (estudios más especializados
combinan proporcional y optima) aquí debemos identificar la
heterogeneidad primero de la muestra mediante la varianza o la desviación
estándar o típica dentro de cada estrato (el tamaño del estrato es
proporcional a la varianza de la variable que se estudia), trabajamos
en función de cuan heterogéneo u homogéneo es cada estrato, debido a
características diferentes como las edades, etc. Por ejemplo, mi variable de
estudio puede ser el numero de veces que ha consumido alcohol en el año y
según mi heterogeneidad lo represento en la muestra. En función a eso se
colocará más o menos muestra, si hay más varianza o menos varianza.
Muestreo por conglomerados (cluster’s): se busca que cada conglomerado
sea un fiel reflejo de la población. Si mi población es heterogénea mis clusters
también son heterogéneos y dentro de cada conglomerado extraemos muestras,
uno para cada uno, esto los genero a partir de una variable. Es probabilisto porque
o bien la selección de los conglomerados es aleatoria o bien la elección de cada
elemento dentro de cada conglomerado. La idea es tener una población
heterogénea dentro de cada conglomerado a diferencia de los estratos. La variable
que mayormente se utiliza es por territorios, ya que dentro de cada territorio,
provincia o departamentos o país hay muchas diferencias en unidades de
observación. Si no tenemos en claro nuestra población deberemos buscar otro tipo
de variables. Lo importante de los conglomerados es que son homogéneos hacia
afuera (conglomerado 1 2 3 se parecen, pero diferente territorio, por ejemplo). La
variable tiempo o determinado periodo también sirve. Cada conglomerado debe
ser una representación de la población en pequeña escala. Permite ahorrar tiempo
y disminuir costes. (mi unidad de muestreo es el conglomerado, urbanizaciones o
territorios, en lugar de seleccionar varios casos como en el muestreo aleatorio
simple, aquí seleccionamos varios conglomerados y dentro de ellos ya tenemos
nuestros individuos, pero se estudia el grupo completo como tal)
Diferencias entre muestreo por estratos y por conglomerados
(Cluster’s)

Estratos Conglomerados
Tomamos sub muestras de cada estrato Estudiamos todo el conglomerado
para el estudio
La homogeneidad en su interior, La homogeneidad es entre
dentro del grupo, es por lo cual se conglomerados, asumimos que tienen
agrupa cada estrato, por lo cual se composición similar (la diferencia está
estratificaron, los estratos no tienen la en los individuos que lo conforman)
misma composición
La aleatoriedad proviene de La aleatoriedad viene por parte de la
seleccionar para el estudio dentro de selección de conglomerados para el
cada estrato estudio
Las categorías de los estratos son Por lo general ocurren naturalmente
decididos por el investigador
Tiene como objetivo incrementar la Tiene como objetivo reducir costos e
precisión y representación incrementar la eficiencia (ENAO)

Hay muestreos polietápicos o multietapicos, puede ser un muestreo por


conglomerados al que le puede seguir uno por estratificado y aleatorio simple hasta
llegar a los elementos que formaran parte de la muestra del estudio probabilístico.
Estimación del error muestral
Por muy perfecta que sea la muestra siempre habrá grado de divergencia entre los
parámetros estimados y los de la verdadera población. En el cálculo del error
intervienen: Tamaño de la muestra. Varianza poblacional. Nivel de confianza y el
Tipo de muestreo.
La estimación del error muestral mediante la formula podemos hacerlo cuando la
variable bajo estudio es numérica (cuantitativa), por lo tanto, se puede generar
una media y podemos hallar la desviación típica y posiblemente la confianza.
N = población ; n = muestra

Las poblaciones son finitas hasta 10 000 según la literatura. Si es infinita ya no se


usa el factor de conversión.
El error muestral crece si el tamaño de la muestra es menor. Si n baja el error
sube y si n sube el error baja. Inversamente proporcional
El error muestral será mayor si la variabilidad de la variable es mayor (s –
desviación típica). Si s crece el error también crece. Directamente
proporcional.
Cuando la variable bajo estudio es proporciona, o sea nominal u ordinal con pocas
categorías (cualitativa), si es politómica o tengo más categorías debo agruparlas
tan solo en 2 (dicotomizarlas).

Las poblaciones son finitas hasta 10 000 según la literatura. Si es infinita ya no se


usa el factor de conversión.
El error muestral crece si el tamaño de la muestra es menor. Si n baja el error
sube y si n sube el error baja. Inversamente proporcional
El error muestral crece si la heterogeneidad se eleva (p.q). Directamente
proporcional.
El tamaño de la muestra es:
- Directamente proporcional al nivel de confianza (z)
- Directamente proporcional a la variabilidad del fenómeno a estudiar (s)
- Inversamente proporcional al error
Datos adicionales:
- La determinación a priori de los valores que intervienen en las fórmulas del tamaño
muestral es una decisión del investigador. Determino con cuanto nivel de confianza
(z) o de error quiero trabajar, así como la población de estudio.
- La desviación típica (s) la podemos obtener de una muestra piloto o de trabajos
similares. Además el piloto sirve para mejorar la herramienta.
- En la práctica, las encuestas están generalmente diseñadas para estimar un
conjunto grande de parámetros y no solo uno.
En la calculadora dejar en 50% la proporción o distribución significa que es el
extremo de discrepancia (heterogeneidad).

MUESTREO NO PROBABILISTICO
La selección de muestras no es aleatoria, el costo y dificultad del diseño es más
reducido que el probabilisto y es más rápido y fácil, no es posible estimar el error
ni la confianza y no se basa en ninguna teoría de probabilidad.
Tipos de muestreo no aleatorio
Por conveniencia: las muestras se seleccionan según un criterio de comodidad y
accesibilidad mediante la rapidez y economía (no es costoso), nos sirve para ir
validando que nuestras herramientas estén bien y tener conocimiento que el
problema a investigar si existe. Sirve para afinar la investigación. Es el diseño
inicial de las investigaciones Por ejemplo encuestas a estudiantes en clase o centros
comerciales. (Sirve para formular bien mi hipótesis, validar mis escalas, calcular
mis varianzas para afijarlas en el muestreo). La muestra es por conveniencia. El
término encuesta alude a todo el proceso: desde la idea hasta el reporte de la
investigación, de la cual la muestra es el subconjunto que nace de ahí. El
cuestionario es el conjunto de preguntas que aplicaremos. Los tres términos son
diferentes.
Según el criterio: la muestra es elegida por un experto de acuerdo con su criterio,
el cual, respaldado por su trayectoria, es quien busca las unidades más
representativas. Indica y direcciona que grupo de personas puedo abordar o
recabar información por ejemplo seleccionar determinadas ciudades para aplicar
determinado piloto. Se emplea cuando el tamaño de la muestra es pequeño. Si bien
puede resultar más complicado, se realiza de una forma más sofisticada,
experimentada, nutrida, con evidencias y rigurosa.
Diseño de bola de nieve: Diseño en el cual pido referencias, por lo que cada
unidad muestral es localizada por indicación de otra persona. Me sirve para
investigar por ejemplo un territorio novedoso o lugar o tema o población
desconocida para mí. Por ejemplo, si quiero saber cuales son las necesidades de la
población venezolana. Me da comodidad en la selección de la muestra, pero
presenta sesgo porque es muy probable que la persona sugerida por otro miembro
de la muestra sea similar a la primera. Por ejemplo, acudir a un grupo de
periodistas de trabajadores de la zona y así sucesivamente voy determinando y
acercándome a la muestra. Se emplea cuando se quiere estudiar poblaciones
pequeñas muy especializadas y difíciles de acceder o localizar por no existir censos.
Secuencial: La muestra inicial reducida se incrementa (busca saturar) hasta
alcanzar las cuotas deseadas. Es decir, hasta llegar al momento en el cual no tenga
más información nueva o diferente. Todos piensan sobre esto diferentes cosas, pero
me dan la misma información, conseguí la verdad, voy avanzando de cuotas en
cuotas. No tiene por qué ser rápido ni cómodo. Por ejemplo, estudio una bancada
por una hasta llegar a la conclusión. Se aplica en investigaciones de fase inicial.
Posteriormente se acude a un muestreo aleatorio estratificado.
TRABAJO EN SPSS

1) Analizar -> informes -> libro de códigos


2) En el cuadro de dialogo emergente seleccionamos las variables a
estudiar -> pegar
3) Procede a abrirse la sintaxis -> selecciono todo y corro el código
con la flecha verde de arriba -> play (triangulo verde invertido)
4) Los percentiles son una medida de posición:
- Es menor hasta igual al valor del percentil y el restante es mayor
5) Ahora: analizar -> estadísticos descriptivos -> explorar
6) En la ventana emergente seleccionamos la variable que queremos
y en “estadísticos” al lado derecho activamos todas las opciones.
En “gráficos”, seleccionamos “niveles de los factores juntos”,
“histograma” y gráficos de normalidad con pruebas. Y finalmente
en “opciones” seleccionamos excluir casos según lista o según nos
pidan otra cosa. -> pegar
7) En la sintaxis corremos de nuevo con play
8) Estimadores M: mientras más ser acerquen a la media es más
confiable, son tipo estadísticos centrales
DIRECTAMENTE TRABAJANDO EN SPSS
1) Selección aleatoria y probabilística de la muestra: lo hago en la calculadora
y obtengo el tamaño de la muestra
2) Para seleccionar los casos: Datos -> seleccionar casos
3) Selecciono muestra aleatoria de casos, luego ejemplo y pido exactamente el
número de la muestra y el número de casos completos -> continuar ->
descartar casos no seleccionados -> pegar
4) Voy a la sintaxis y corro con play
5) Retiro lo hecho retrocediendo a “todos los casos”, es decir, desactivo la
opción que realicé y vuelven todos los casos a estar activos
6) Ahora vuelvo a datos -> seleccionar casos -> muestra aleatoria de casos con
los valores correspondientes -> copiar casos seleccionados a un nuevo
conjunto de datos y le coloco un nombre-> aceptar
MUESTREO ALEATORIO SIMPLE
- Analizar -> muestras complejas -> seleccionar una muestra
- Diseñar una muestra: guardo mi archivo en una carpeta -> guardar ->
siguiente
- Elijo una variable que tenga lo misma información para todos los casos.
Selecciono -> click derecho -> información de la variable -> para ver que
solo tenga una categoría -> siguiente
- Elijo el tipo de muestreo: aleatorio simple, por ejemplo -> sin reposición o
con reposición, pero en este caso ponemos sin reposición a menos que
indique lo contrario -> siguiente
- Unidades -> recuento: valores absolutos; valor -> número de los casos que
quiero
- Qué variables deseo guardar -> selecciono todos los cuadritos
- No, no deseo salir a otra etapa
- Desea extraer una muestra -> si -> etapas 1-> valor de semilla -> valor
personalizado -> coloco el valor dentro del numero de casos -> continuar
- Nuevo conjunto de datos -> coloco nombre -> continuar
- Guardar el diseño en un archivo de plan y extraer la muestra -> listo
MUESTREO ALEATORIO PARA UNA MUESTRA ESTRATIFICADA
- Analizar -> muestras complejas -> seleccionar una muestra
- Diseñar una muestra: guardo mi archivo en una carpeta -> guardar ->
siguiente
- Selecciono la variable que me indican -> verifico sus dos categorías o más
que me hayan indicado -> continuar
- Tipo: muestreo aleatorio simple -> sin reposición -> continuar
- Unidades: recuentos -> valores desiguales para los estratos -> definir ->
coloco los valores que me han dado -> continuar
- Qué variables deseo guardar -> selecciono todos los cuadritos
- No, no deseo salir a otra etapa
- Desea extraer una muestra -> si -> etapas 1-> valor de semilla -> valor
personalizado -> coloco el valor dentro del número de casos -> continuar
- Nuevo conjunto de datos -> coloco nombre -> continuar
- Guardar el diseño en un archivo de plan y extraer la muestra -> listo
- Si quiero comprobar mis resultados voy a la pagina de vista de variables de
la muestra que he sacado y selecciono la que he estudiado y click derecho ->
descriptivos
MUESTREO ALEATORIO SISTEMATICO SIMPLE
- Primero debo ordenar mi marco muestral -> variable en función
- Datos -> ordenar casos -> ascendente
- Luego procedemos a los pasos de siempre:
- Analizar -> muestras complejas -> seleccionar una muestra
- Diseñar una muestra: guardo mi archivo en una carpeta -> guardar ->
siguiente
- Selecciono la variable que me indican -> verifico su categoría-> continuar
- Tipo: sistemático simple -> continuar
- Unidades: recuentos -> valores: coloco el tamaño que me piden -> continuar
- Qué variables deseo guardar -> selecciono todos los cuadritos
- No, no deseo salir a otra etapa
- Desea extraer una muestra -> si -> etapas 1-> valor de semilla: valor de
forma aleatoria -> continuar
- Conjunto de datos activo
- Guardar el diseño en un archivo de plan y extraer la muestra -> listo
- Debo ir a vista de datos y a la derecha todo para ver el coeficiente y el total
MUESTREO POR CONGLOMERADOS (CLUSTER’S)
- No debo olvidar borrar los datos que aparecen demás en variables
- Analizar -> muestras complejas -> seleccionar una muestra
- Diseñar una muestra: guardo mi archivo en una carpeta -> guardar ->
siguiente
- Selecciono la variable que me indican (territorio funciona bien en este caso)
-> lo mando a clusters -> continuar
- Tipo: muestreo aleatorio simple -> sin repetición ->continuar
- Unidades: recuentos -> valores: coloco el tamaño que me piden -> continuar
- Qué variables deseo guardar -> tamaño de la muestra
- No, no deseo salir a otra etapa
- Desea extraer una muestra -> si -> etapas 1-> valor de forma aleatoria ->
continuar
- Nuevo conjunto de datos-> coloco nombre
- Guardar el diseño en un archivo de plan y extraer la muestra -> listo
-

También podría gustarte