Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Free TEMA 6
Free TEMA 6
PsicoVP
Metodología de encuestas
4º Grado en Psicología
Facultad de Psicología
Universidad de Almería
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1. LA MATRIZ DE DATOS.
Podemos distinguir:
• Los estudios exploratorios que utilizamos para introducirnos en el conocimiento de un fenómeno o llegar a
nuevos aspectos de este, con el objetivo de formular un problema o un tema de partida con mayor precisión o
con el fin de poder explicitar algunas hipótesis.
• Los estudios descriptivos que pretenden describir las características de una determinada población y establecer
asociaciones sobre relaciones entre esas características.
• Los estudios explicativos en donde se formulan y se verifican hipótesis causales que afirman que un cambio
en una determinada característica es uno de los factores que determinan el cambio de otra.
Insertar una población en una tabla es reducirla a términos manejables. La matriz de datos es el cruce de unidades
con variables:
• N filas para las unidades que se desea explorar
• M columnas para variables utilizadas para explorarlas
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6735760
Después de grabar los datos y depurarlos1 entramos en la fase de análisis.
Los estudios realizados con encuesta contiene una fase exploratoria que nos sirve para ver cómo funcionan las
variables y realizar las pertinentes agrupaciones en los valores de estas que hagan más visibles las posibles asociaciones
entre variables. El análisis es un momento posterior en el ámbito descriptivo, en el cual se elabora un plan de tabulación
y análisis que parte de nuestras hipótesis iniciales. Así, casi siempre el contenido del informe final suele seguir el orden
del cuestionario. Se pretende observar la variación conjunta de las variables más relevantes y para ello, con las variables
estructurales las consideramos explicativas para observar cómo influyen en el resto de las variables temáticas o
específicas. Tenemos, por tanto, dentro de análisis momentos explicativos.
El análisis de datos es la descripción de las distribuciones de valores y a la vez la explicación de esas
distribuciones en función de las otras variables.
En el plan de análisis nos centramos en las variables que pretendemos explicar (dependientes) para ver cómo está
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
se explican en todo o en parte por las distribuciones de otras variables (independiente).
2. DISTRIBUCIONES DE UNA VARIABLE.
Se trata de ver cómo se distribuyen las unidades de una población entre los valores de una variable. Lo que hacemos
es contar el número de casos (n) que tenemos en cada uno de los valores. Para cada valor este número es su frecuencia,
es decir, el número de veces que el valor se repite. Por ello, hablamos de distribuciones de frecuencias de una variable
a través de ella, vemos cómo se distribuye una variable en la población o cómo se distribuye una población en una
variable.
2.1.NÚMEROS ABSOLUTOS Y PORCENTAJES: RECUENTOS Y TASAS:
Esta contabilización o recuento se da en números absolutos (n). Con los valores de una variable en una población, es
necesario trabajar con las frecuencias relativas (f). Esto resulta de dividir el número de casos (n) entre el número total
de casos que se distribuyen la variable (N). Así obtenemos la proporción (p) del total de la población que adopta un
1
Proceso de cruces entre variables para comprobar la consistencia interna de los dados.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
valores (medidas de centralización).
• Comparar un solo valor de la variable para hacerlo objeto de comparación (binomializar o dicotomizar). La
variable se reducirá a dos valores, el que nos interesa y su complementario opuesto. Reducir este a su grado
cero es reducir las variables a su categorización meramente nominal.
2.5.COMPARACIONES CON PORCENTAJES:
Para comparar dos poblaciones nos fijamos en la proporción en que se presente en una determinada característica
de ellas. Para ver algo hemos de homogeneizar el tamaño de la muestra y el tamaño de la población. Luego
estandarizamos los datos, elaborando porcentajes.
Siempre será mejor recoger los dados con la mayor desagregación posible, ya que siempre podemos agregarlos
durante el análisis.
2.6.COMPARACIONES CON VALORES MEDIOS:
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La representación más idónea para las variables numéricas discreta es la de diagrama de barras. Cuando una
variable discreta presenta muchos valores, podemos tratarla gráficamente como si fuese continua.
No es correcto representar las variables numéricas continuas a través de un diagrama de barras, ya que en este
perdemos el específico carácter de los datos. Las variables cuantitativas se han de ser siempre a través de histogramas
o de polígonos de frecuencias.
• Histogramas.
o Los valores han de agruparse en intervalos.
o Se sitúan de manera continua en el eje la risa.
o Si los intervalos son de la misma amplitud, la altura de cada intervalo puede considerarse equivalente al
número de casos que se dan en el intervalo.
o Es conveniente trabajar con intervalos de igual recorrido.
• Diagramas de líneas (o polígono de frecuencias/ gráfico lineal).
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Se va a establecer diferencias entre grupos a raíz de cómo se distribuyen ellos una determinada características. Hay
que diferenciar entre variables de registro, que son las originales que se emplean para registrar la información que se
suelen presentar con el máximo detalle, y son puntos de partida para la investigación. Y las variables de análisis, que
son variables construida desde la pertinencia empírica estrictamente sociológica.
Cómo lo que queremos ver es cómo se distribuye un valor, podemos comparar los grupos entre sí y para eso
tendremos que estandarizar los totales de los grupos que nos van a servir de base (estado civil y edad).
Un solo dato por grupo nos permite comparar la distribución de un atributo en distintos grupos.
6. TABLAS BIVARIABLES.
Para hacer un análisis comparativo entre grupos poblacionales distintos, nos fijamos bien. Cómo se distribuía una
variable de cada uno de ellos.
Como esos grupos se originan en la clasificación generada por otra variable, lo que hacemos es comparar grupos Es
observa cómo se distribuye una variable en otra variable.
Veremos cómo se agrupa la población simultáneamente en dos variables, realizando un cruce de variables que
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6735760
Se conoce como una paradoja de Simpson, que es una asociación entre 2 variables que desaparece o cambia de
sentido cuando los datos son desagregados por grupos, es decir, cuando se controla el efecto de una tercera variable.
Este efecto se pone claramente de relieve cuando originalmente tenemos una tabla de 2x2 y pasamos a otra de
2x2x2.
Puede ocurrir que no se manifieste relación entre 2 variables hasta que no introducimos una variable de control.
Los esquemas que soportan la relación entre 3 variables pueden ser muy diversos. La variable de control afecta a
esta. Es decir, explica, la relación entre 2 variables si:
1) Se relaciona con la variable independiente o causal
2) Se relaciona con la variable dependiente o efecto
3) Cuando segmentamos la población según los grupos de la variable de control. Se observa que las relaciones
entre las variables originales son de menor intensidad, sin la injerencia de la tercera variable.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Se destaca que era un de saltera una determinada relación entre 2 variables fue la presencia de la tercera, la tercera
actúa como variable antecedente y aquellos otros que actúan como variable interviniente.
La interacción entre 3 variables se puede sintetizar en una tabla, pero la manera más clara es segmentar a la población
entre los valores de una de las variables y observando cómo se comportan las otras dos variables en cada una de las
categorías de la primera.
Y si es posible dualizar las variables en juego tanto mejor, ya que facilitan el análisis. La interacción entre múltiples
variables cuantitativas y la obtención de modelos complejos de esta interacción multivariable sido el objetivo de Path
Analysis
Si trabajamos con datos obtenidos a partir de una encuesta, lo previo es captar todas las posibles variables que
muestran una aparente asociación con aquella que nos interesa explicar y establecer modelos más complejos que integren
otra variable más que pueda afectar a una de las dos o las dos de manera conjunta.
9. INTRODUCCIÓN.
2
Se obtiene sumando los valores de todas las unidades dividiendo el resultado entre el total de casos o unidades.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
intervalos. Este será el valor central de los intervalos, suponiendo que el conjunto de elementos contenidos en cada
intervalo tienen ese valor.
Con los datos agregados obtenemos un valor aproximado de la media real (perdemos información). Una media es
una medida representativa de toda la población. Por tanto, es un valor hipotético de la variable considerada y por lo
tanto se expresa siempre las unidades de esa variable (edad → años).
11.3. USO DE VALORES MEDIOS DE OTRAS VARIABLES PARA COMPARAR GRUPOS:
Para comparar grupos podemos servirnos con las diferencias de cada grupo, con el valor medio de la población
total. Estas diferencias nos marcan desigualdades entre los grupos. Y para ver estas desigualdades debemos calcular la
diferencia entre estos.
• Punto de vista institucional → interesa comparar países
• Punto de vista sociolaboral → diferencias de las estructuras salariales de algunos países a través de salarios
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
considerar que la dispersión o la variabilidad de la variable nominal X será igual a “p * q”.
De esta manera, podemos observar que la máxima variabilidad o dispersión es cuando p = 0,5.
No existiría dispersión alguna cuando el peso de la población de 1 de los valores sea el 100%. es decir, cuando todos
los casos de la evaluación tomen un solo valor.
Tendremos la máxima dispersión cuando 1 de los valores de esta representa el 50%, es decir, cuando la poblacion
se divida al 50% entre los dos grupos que la constituyen.
Unas representaciones gráficas nos pueden ayudar a entender la máxima y también a la dispersión, que son las
diagramas de barras.
El producto p*q nos mide la dispersión de los datos de las variables dicotómicas nominales, del mismo modo que
la desviación típica nos mide en variables numéricas.
14. ESTRUCTURA DE LOS DATOS EN LA DISTRIBUCIÓN DE UNA VARIABLE.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
la distribución real.
En el gráfico también aparece una línea diagonal del cuadrado, que representa lo que se llama la línea de
equidistribución. Si la curva de Lorenz:
• Está por debajo de la línea de distribución, eso indica que la riqueza está concentrada entre los más
ricos
• Si está por encima nos indica que la riqueza está concentrada entre los más pobres.
El índice de Gini estableció a partir de la curva de Lorenz un coeficiente indicador de la desigualdad, que
resumió la desigualdad en la distribución observada en un solo número, el coeficiente o índice de Gini.
Esta relación parte de una teoría distribución equitativa y la distribución empírica fijada por la curva de Lorenz.
• Si ya está próximo a 0, estaremos ante una población en la que la renta se distribuyen más equitativamente.
• Si una población R cuenta con un coeficiente de Gini que resulta menor que el otro de la población. La primera
población es más equitativa en la distribución que la segunda.
Mientras más grande sea el área que define la curva de Lorenz con la línea de equidistribución más grande será la
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-6735760