METODOS Y TEC DE INV SOCIAL - Lectura 4 PDF

Módulo 4
Análisis de la
información
7. Análisis de la
información
7.1. Análisis e interpretación de los datos
“Análisis de datos: conjunto de transformaciones numéricas de los

datos para conseguir que éstos sean interpretables, generalmente
en relación con la hipótesis de investigación” (Del Río Sadornil,
2013, p. 22).
Las tareas previas al análisis de datos, una vez completados todos los aspectos
de la captura, deben llevarse a cabo antes de iniciar el análisis propiamente
dicho. Esas tareas consisten en codificar las respuestas de preguntas abiertas,
cargar los datos y depurar errores de carga o inconsistencias.
El análisis estadístico involucra diferentes procedimientos descriptivos e

inferenciales que se realizan, en su totalidad, a través de la aplicación de
software específico para este fin. Durante este módulo los ejemplos se
presentarán utilizando SPSS. En el texto de bibliografía básica se emplea
predominantemente Minitab. En ambos casos son ilustraciones. No se
pretende que el alumno sepa manejarlos como resultado de este curso, sino
que pueda interpretar resultados básicos provenientes de estos programas de
uso generalizado.
1
Figura 1: Fases del análisis de datos
Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.
7.1.1. Análisis descriptivos: distribución de frecuencias y

medidas de tendencia central
Al cargar los datos en el respectivo programa de análisis estadístico queda
determinada una matriz donde cada caso es una fila y cada columna una
variable o un aspecto considerado. En el caso de una encuesta, una variable
puede corresponder a una pregunta de un cuestionario (preguntas que
admiten una sola respuesta) o puede ser necesaria más de una variable para
capturar la información proveniente de una pregunta (aquellas que admiten
respuestas múltiples).
Para decidir qué tipo de análisis descriptivo se puede aplicar, hay que
considerar el nivel de medición de cada variable (nominal, ordinal, de intervalo
o de razón), al tiempo que las hipótesis a las que responde y cómo está
formulada.
Se denomina análisis univariado al que considera una por una cada variable del
estudio.
2
Figura 2: Análisis de datos
Fuente: [Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q
Distribución de frecuencias y su representación gráfica
La frecuencia de una variable es la representación de la cantidad de veces que

aparece en cierto conjunto cada uno de los valores de esa variable. Esta
representación sintética puede aplicarse a variables de todos los niveles de
medición.
Los indicadores de frecuencias son:
 Frecuencia absoluta o simplemente frecuencia: cantidad de veces que

aparece cada valor.
 Frecuencia relativa: proporción de las veces que aparece cada valor en

el total. Se la suele expresar en porcentajes a fin de facilitar su
interpretación.
 Frecuencia acumulada: apariciones totales acumuladas hasta cierto

valor de la variable.
Tomemos como ejemplo la encuesta sobre uso del tiempo (Indec, 2013) para
mostrar los conceptos involucrados en este módulo.
La siguiente tabla presenta una salida de SPSS a partir de la base de datos

correspondientes. Veamos qué información contiene. Cada columna posee
información relevante. La primera indica los valores posibles de la variable (Sí,
No, Ns/Nr). La segunda muestra la frecuencia absoluta, es decir, cuántos casos
en la encuesta respondieron cada valor. En este caso, 46.372 dijeron “Sí”, en
tanto 18.916 dijeron “No”. La tercera columna presenta la frecuencia relativa
expresada en términos porcentuales. El 71 % respondió “Sí”, mientras que el
3
28,9 % respondió “No”, y el 0,1 % “Ns/Nr”. La cuarta columna indica los
porcentajes válidos. Como a esta pregunta la responden todos los encuestados,
coincide con la columna anterior. Pero si la pregunta se realizara a solo una
parte de los encuestados, el porcentaje de una y otra columna diferiría.
Finalmente, la quinta columna indica el porcentaje acumulado. Si bien puede
analizarse, en el caso de las variables cualitativas este análisis es menos
interesante que en el caso de las variables cuantitativas.
Tabla 1: Salida de SPSS
Participó en quehaceres domésticos
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válido Sí 46372 71,0 71,0 71,0
No 18916 28,9 28,9 99,9
Ns/Nr 64 ,1 ,1 100,0
Total 65352 100,0 100,0
Fuente: elaboración propia.
Las frecuencias también pueden representarse a través de gráficos.
Figura 3: Gráfico de barras
4
Figura 4: Gráfico circular. Diagrama de sectores
Figura 5: Polígono de frecuencias
5
Medidas de posición o tendencia central
Las medidas de tendencia central son medidas sintéticas que permiten indicar,
con un único número, un valor de referencia del conjunto de datos. Las
principales son: la media, la mediana y la moda.
La media es el promedio de todos los valores de un conjunto de datos

cuantitativos (escalas de intervalo o razón). Se calcula sumando todos los
valores y dividiendo esa suma por la cantidad de casos totales que el conjunto
incluya. Por ejemplo, si tenemos los datos de la cantidad de miembros de 5
familias en una zona: 2, 3, 5, 5 y 7 miembros respectivamente, la media de
miembros por familia es:
Media = (2 + 3 + 5 + 5 + 7) / 5 = 22/5 = 4,4 miembros por familia.
La mediana corresponde al valor del conjunto de datos (ordenados de menor a

mayor) que se encuentra exactamente en medio de la distribución, o más
formalmente, el valor tal que no más de la mitad de los datos de la distribución
es mayor que tal valor, y no más de la mitad de los datos es menor a ese valor.
La mediana se calcula para variables de escalas de razón, intervalo u ordinal.
En el ejemplo anterior, la mediana (Me) será el valor que ocupe la tercera

posición de la serie ordenada:
Mediana = 5
La mediana puede o no pertenecer al conjunto. En el caso de los conjuntos con

un número par de casos, la mediana se calcula como el promedio de los dos
valores centrales. Por ejemplo, si tenemos las edades de los gerentes de 8
empresas de la ciudad: 40, 45, 45, 48, 52, 60, 65, 68, la mediana es Indec:
Me = (48 + 52) /2= 50 años
La moda señala el valor que tiene más repeticiones de un conjunto de datos.

Una distribución puede tener más de una moda o valor modal. Del ejemplo
anterior (edades de los gerentes), la moda es:
Mo = 45 años
Veamos cómo es la salida de datos de SPSS al analizar las medidas de tendencia

central de un conjunto de datos. La variable que consideramos de la encuesta
de uso del tiempo (Indec, 2013) es el tiempo dedicado la semana anterior a
actividades de voluntariado.
6
Tabla 2: Salida de SPSS. Estadísticas descriptivas
Estadísticos
Tiempo dedicado a trabajo voluntario
N Válido 65352
Perdidos 0
Media ,5487
Mediana ,0000
Moda ,00
¿Cómo interpretar estos resultados?
La tabla nos muestra que, en promedio, de los 65,352 encuestados, el tiempo

dedicado a actividades de voluntariado la semana anterior es 0,5487 horas. Si
consideramos el valor central de la distribución (Mediana), vemos que el 50%
(mitad de la distribución) dedica, a lo sumo, 0 horas a voluntariado, y que el 50
% dedica 0 horas o más. Finalmente, también podemos afirmar que lo más
frecuente es que se dediquen 0 horas a actividades de voluntariado.
Medidas de dispersión o variabilidad
Como complemento necesario de las medidas de tendencia central,

necesitamos otras medidas que hagan referencia a cuán concentrados están los
datos del conjunto respecto de tales medidas de tendencia central. Estas
medidas se denominan de dispersión. Las medidas de dispersión más utilizadas
son: rango, varianza, desviación estándar y coeficiente de variación.
 El rango o recorrido se define como la diferencia entre el mayor valor y

el menor valor de un conjunto de datos cuantitativos.
Tomemos el conjunto de edades de los gerentes de 8 empresas: 40, 45, 45, 48,
52, 60, 65, 68. El rango es:
Rango = 68 – 40 = 28 años
La varianza surge de calcular el promedio de los desvíos al cuadrado de cada

valor del conjunto respecto de la media. Veamos cómo se calcula para el
ejemplo anterior:
Media: 52,875
Como puede observarse, por la propia naturaleza de la definición de la media,

la suma de los desvíos de cada valor respecto de la media, es cero. Por eso,
7
para poder contar con una medida de dispersión, se eleva cada diferencia al
cuadrado. La varianza se calcula dividiendo la suma de desvíos al cuadrado en la
cantidad de casos:
Var = 740,875/8 = 92,609 años2
Tabla 3: Cálculo de varianza
Valor (xi) xi - Media (xi – Media)2
40 -12,875 165,765625
45 -7,875 62,015625
45 -7,875 62,015625
48 -4,875 23,765625
52 -0,875 0,765625
60 7,125 50,765625
65 12,125 147,015625
68 15,125 228,765625
Suma: 0 740,875
Hay que tener en cuenta que la unidad de medida de la varianza está expresada
en la misma unidad de medida que la variable original, pero elevada al
cuadrado, como lo expresa el resultado anterior (en años2).
La desviación estándar (la medida de dispersión más utilizada) surge de tomar

la raíz cuadrada positiva de la varianza. Por lo tanto, la desviación estándar sí
está expresada en la misma unidad de medida que la variable original y que la
media.
Utilizando los datos del ejemplo anterior:
8
DS = 92,609 años2 = 9,623 años
Figura 6: Varianza
Fuente: [Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6
El coeficiente de variación vincula la desviación estándar con la media y permite

comparar la variabilidad de varias distribuciones entre sí:
CV = (DS /Media).100
Con los datos del ejercicio anterior:
CV = (9,623/52,875).100 = 18,2 %
La siguiente tabla muestra la salida de SPSS respecto de medidas de dispersión, en este
caso de la variable “tiempo dedicado a trabajo voluntario”, con datos de la encuesta
de uso del tiempo (Indec, 2013).
Tabla 4: Salida de SPSS. Estadísticos descriptivos
Estadísticos
N Válido 65352
Perdidos 0
Desviación estándar 3,16122
Varianza 9,993
Rango 105,00
9
Medidas de asimetría y curtosis
Las medidas de asimetría y curtosis hacen referencia a la forma de la gráfica de

la distribución de datos.
La asimetría mide cuán diferente es una distribución específica respecto de una

distribución teórica denominada normal, que es simétrica. Si el indicador es 0
significa que la distribución es simétrica (no difiere en simetría de la
distribución normal). Si la medida de asimetría es positiva, quiere decir que hay
más valores agrupados a la izquierda de la curva; y, por el contrario, si el
indicador es negativo, quiere decir que la mayor proporción de datos se agrupa
del lado derecho del eje de simetría.
Figura 7: Asimetría
Fuente: [Imagen intitulada sobre asimetría] (s. f.). Recuperada de http://goo.gl/R1w7IX
La curtosis indica qué tan plana o empinada es la distribución. Nuevamente, el

patrón de comparación es la distribución normal. Si la curtosis es 0 significa que
la distribución que consideramos es igual de empinada que la normal; si es
positiva quiere decir que es más empinada que la normal; y, por el contrario, si
es negativa, quiere decir que es más aplanada que la distribución normal.
10
Figura 8: Curtosis
Fuente: [Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX
La siguiente tabla muestra la salida de SPSS respecto de medidas de curtosis y

asimetría, en este caso de la variable “tiempo dedicado a trabajo voluntario”,
con datos de la Encuesta de uso del tiempo (Indec, 2013). Vemos que la
distribución del tiempo es asimétrica positiva (los valores están concentrados
en el lado izquierdo respecto del eje de simetría) y la curtosis es positiva. Por lo
tanto, la distribución es bastante más empinada que la normal. El gráfico
siguiente permite observar la distribución de datos de la variable “tiempo
dedicado a trabajo voluntario”, junto con la distribución normal (línea azul) de
referencia.
Tabla 5: Salida de SPSS
N Válido 65352
Perdidos 0
Asimetría 11,570
Error estándar de asimetría ,010
Curtosis 188,328
Error estándar de curtosis ,019
11
Figura 9: Otras estadísticas descriptivas
Figura 10: Ejemplo
Razones y tasas
12
Una tasa es la relación entre una categoría y un total. Por ejemplo, la tasa de
desocupación, que mide la proporción de la población activa que está sin
empleo en cierto período y busca uno de manera activa.
Una razón es un cociente entre dos categorías de una variable. Por ejemplo, la
razón de masculinidad en una población mide la cantidad de hombres respecto
de mujeres en un conjunto.
Figura 11: Tasa de desempleo en el mundo
Referencias: Verde: es menor, mientras más intenso más reducida la tasa; Rojo: mayor,
mientras más intenso más elevada la tasa. Fuente: [Imagen intitulada sobre tasa de desempleo
en el mundo] (s. f.). Recuperada de https://goo.gl/ag8dGH
Figura 12: Razón de masculinidad en el mundo
Referencias: Rosa: países con un índice de masculinidad menor que 1 (más mujeres que
hombres). Azul: países con un índice de masculinidad mayor que 1 (más hombres que mujeres).
Verde: países con un índice de 1. Gris: sin datos. Fuente: [Imagen intitulada sobre razón de
masculinidad en el mundo] (s. f.). Recuperada de http://goo.gl/0fKKHL
13
Análisis de la no respuesta
Una de las consideraciones relativas a la no respuesta se vincula con el

porcentaje de casos válidos. Si el porcentaje es demasiado alto, por ejemplo, 20
%, no corresponde analizar esos datos.
Validez y confiabilidad
Confiabilidad
1) Medida de estabilidad: se mide dos veces un mismo instrumento con el

mismo grupo de personas, en dos oportunidades distintas, separadas
por un período de tiempo. Si tal período no es tan extenso, se espera
una alta correlación en las respuestas si el instrumento es confiable.
2) Método de formas paralelas o alternativas: dos versiones de un mismo
instrumento se miden con el mismo grupo de personas, en dos
oportunidades distintas o de manera simultánea. Se espera una alta
correlación en las respuestas si el instrumento es confiable.
3) Método de mitades partidas: se divide el conjunto de reactivos y se
separa la muestra en dos partes (asignación aleatoria), y a cada una se
la mide con una parte de los reactivos. Se espera correlación entre las
mediciones de ambas partes.
4) Método de coherencia o consistencia interna:
o Alpha de Cronbach.
o KR 20 y KR21.
Validez
1) De contenido: opiniones de expertos que ayudan a asegurarse de que

aquellas dimensiones que se consideraron en el instrumento sean
representativas.
2) De criterio: correlación entre los puntajes obtenidos con el instrumento
y las puntuaciones correspondientes en el criterio.
3) De constructo: cuántas dimensiones integran a una variable y, a su vez,
los ítems que integran cada dimensión, identificando aspectos
redundantes.
El análisis descriptivo presentado se complementa con una serie de

herramientas de índole inferencial, a través de las cuales se trata de sacar
conclusiones referidas a la población de estudio a partir de los datos
muestrales. En dos grandes grupos, estas herramientas se refieren a técnicas de
estimación (es decir, indicar cuál es el valor aproximado de un cierto indicador
14
poblacional) y a pruebas de hipótesis (decisiones basadas en una
fundamentación estadística).
Figura 13: Análisis de datos
Fuente: [Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3
7.1.2. Análisis de la relación entre variables:

clasificación según el tiempo, la dirección y la intensidad
de la relación
Coeficiente de correlación de Pearson (r)
Este coeficiente sirve para cuantificar la relación entre dos variables, ambas
medidas en escalas de intervalo o razón.
El coeficiente de correlación de Pearson (r) puede asumir valores entre -1 y 1. El

signo del coeficiente permite identificar el sentido de la correlación. La
interpretación de los valores se indica en la siguiente tabla.
15
Tabla 6: Interpretación del coeficiente de correlación
Valor Significa
-1 Correlación negativa perfecta.
-0.9 Correlación negativa muy fuerte.
-0,75 Correlación negativa considerable.
-0,5 Correlación negativa media.
-0,25 Correlación negativa reducida.
-0,1 Correlación negativa muy débil.
0 No existe correlación entre las variables.
0,1 Correlación positiva muy débil.
0,25 Correlación positiva reducida.
0,5 Correlación positiva media.
0,75 Correlación positiva considerable.
0,9 Correlación positiva muy fuerte.
1 Correlación positiva perfecta.
Figura 14: Coeficiente de correlación
Fuente: [Imagen intitulada sobre coeficiente de correlación] (s. f.). Recuperada de

http://goo.gl/HLj77l
16
La fórmula de cálculo parece sumamente compleja, pero veamos con un
ejemplo cómo se aplica.
Pensemos en las variables “nota promedio en el secundario” y “notas promedio

en el primer año en la carrera universitaria”. Supongamos que tenemos una
muestra de 10 alumnos con la siguiente información:
Tabla 7: Datos
Nota promedio en el Notas promedio en el primer año en la

secundario carrera universitaria
6 5
7 6
7 5.5
7.5 6
7 8
8 6.5
8 7.5
8.2 7.5
9 8
9.4 8.5
Una primera exploración gráfica nos permite tener una hipótesis sobre la
relación entre las variables:
17
Figura 15: Diagrama de dispersión
10
9,5
9
8,5
8
7,5
7
6,5
6
5,5
5
5 6 7 8 9 10
Se observa una relación positiva entre las variables consideradas. Ahora, con el
coeficiente de correlación de Pearson, podemos cuantificar esta relación.
Tabla 8: Cálculo de desvíos
Valor (xi) xi - Media (xi – Media)2
40 -12,875 165,765625
45 -7,875 62,015625
45 -7,875 62,015625
48 -4,875 23,765625
52 -0,875 0,765625
60 7,125 50,765625
65 12,125 147,015625
68 15,125 228,765625
Suma: 0 740,875
18
Tabla 9: Cálculo de coeficiente de correlación
Nota Notas
promedio promedio en
en el el primer año
secundario en la carrera
(xi) universitaria
(yi) xiyi xi2 yi2
6 5 30 36 25
7 6 42 49 36
7 5,5 38,5 49 30,25
7,5 6 45 56,25 36
7 8 56 49 64
8 6,5 52 64 42,25
8 7,5 60 64 56,25
8,2 7,5 61,5 67,24 56,25
9 8 72 81 64
9,4 8,5 79,9 88,36 72,25
Sumatoria 77,1 68,5 536,9 603,85 482,25
19
r= 10 .536,9 - 77,1 . 68,5
10. 603,85- (77,1)2 10.482,25 –(68,5)2
r = 0,7917
Por lo tanto, la relación positiva que observamos en el gráfico implica una

asociación entre considerable y fuerte (0.7917).
En esta asignatura no se espera que el alumno realice habitualmente este tipo

de cálculos, pero sí que sepa interpretarlos.
Cuando se eleva el coeficiente de Pearson al cuadrado, se obtiene el coeficiente

de determinación (con una interpretación sumamente difundida en los análisis
de regresión).
Fuente: [Imagen intitulada sobre diagrama de dispersión] (s. f.). Recuperada de

http://goo.gl/GgaTFE
20
Asociación entre dos variables categóricas
Si queremos conocer el grado de asociación entre dos variables categóricas,

debemos recurrir a otros estadísticos. La idea básica en todos los casos es ver si
la distribución de valores de una de las variables difiere según los valores que
tiene que la otra variable.
Veamos el siguiente ejemplo:
Tabla 10: Tabla de contingencia
Percepción de la situación personal en el Total

último año
Grupo etario Buena Regular Mala
Jóvenes 48 42 60 150
Adultos 70 105 175 350
Total 118 147 235 500
La idea, ahora, es comparar la distribución que presenta la tabla de datos con

aquella hipotética que correspondería a una situación en la cual las dos
variables analizadas no poseen ningún tipo de asociación entre sí, es decir, de
modo que los valores de una variable no condicionen los que se observan en la
otra.
Para obtener esta tabla que refleje independencia, tenemos que hacer algunos
cálculos auxiliares. Para esto tengamos presente los conceptos de frecuencias
marginales, que son las que corresponden a los márgenes de la tabla. Allí
figuran, tanto para fijas como para columnas, los totales. En la siguiente tabla
sólo dejamos los datos de las frecuencias marginales.
A la tabla que refleje situación de no asociación la vamos a construir utilizando

las frecuencias marginales. Para cada celda de la tabla vamos a multiplicar el
valor de la frecuencia marginal de la fila que le corresponde a ese valor y el
valor de la frecuencia marginal de la columna que le corresponde a ese valor.
Luego, a este resultado lo vamos a dividir por el total de casos.
21

último año
Jóvenes 150
Adultos 350
Total 118 147 235 500
Veamos la celda de la posición (1,1), es decir, de la primera fila y la primera

columna de datos.
a11 = (150 . 118) / 500
a11 = 35,4
Y completamos el primer valor de la tabla de no asociación:

último año
Buena
Grupo etario
Grupo etario Buena Regular
Jóvenes 35,4 150
Adultos 350
Total 118 147 235 500
De la misma manera, procedemos para calcular los siguientes valores:
22
a12= (150 . 147) / 500 = 44,1
a13= (150 . 235) / 500 = 70,5
a21= (350 . 118) / 500 = 82,6
a22= (350 . 147) / 500 = 102,9
a23= (350 . 235) / 500 = 164,5
Veamos la tabla completa, a la que llamaremos tabla de valores esperados:

último año
Jóvenes 35,4 44,1 70,5 150
Adultos 82,6 102,9 164,5 350
Total 118 147 235 500
La idea, ahora, es comparar las frecuencias reales/observadas con los datos

hipotéticos de esta tabla que muestra los valores que podríamos esperar en
cada celda si ambas variables entre sí no tuvieran ninguna asociación. En el
caso de que las diferencias fueran “importantes estadísticamente hablando”
(esto es lo que luego aporta cada uno de los indicadores de asociación
específicos que se usen), podríamos concluir que existe una asociación.
Para determinar las diferencias, vamos a trabajar celda por celda y elevar tales
valores al cuadrado.
Tabla de diferencias de valores observados y esperados, elevados al cuadrado.
Percepción de la situación personal

en el último año
Grupo Buena Regular Mala
etario
Jóvenes 158,76 4,41 110,25
Adultos 158,76 4,41 110,25
23
Generalmente, para una prueba estadística de la independencia de dos
variables categóricas, se usa el estadístico:
Que tiene distribución “chi” cuadrado, donde “O” hace referencia a los valores
de las frecuencias observadas y “E” a las frecuencias esperadas.
Existen otros índices bivariados. La elección entre ellos depende

fundamentalmente del nivel de medición de las variables consideradas. La tabla
siguiente resume los principales índices de correlación disponibles.
Tipo de Símbolo Variable 1 Variable 2 Cuándo usar

correlación
Pearson r Continua Continua Es la técnica

más estable
Kendall tau Ordinal Ordinal n<10
Biserial r bis Dicotómica Continua Análisis de
ítems
Biserial r pbis Dicotómica Continua Correlaciones
puntual inferiores que
r bis
Tetracórica rt Dicotómica Dicotómica
Coeficiente fi Fi Dicotómica Dicotómica
Coeficiente eta Continua Continua
eta
Fuente: Bisquerra Alzina, 2009.
24
7.2 Informe y exposición de conclusiones
Una vez realizado el análisis y la síntesis de la

información el proceso siguiente y último de la
investigación consiste en presentar el informe con los
resultados obtenidos. Para su elaboración es necesario
por un lado, seleccionar el material que se va a incluir
y, por el otro, estructurar el documento de tal manera
que se facilite la comprensión de su contenido (Rojas
Soriano, 2006, p. 351).
Un aspecto central al comenzar a preparar un reporte de investigación es

considerar el público receptor y el propósito que tiene la presentación, en el
marco del estudio desarrollado. El manual de las Naciones Unidas (2009), en
relación con la presentación de datos estadísticos, menciona la pregunta crucial
y la respuesta que todo investigador debe darse al momento de elaborar cada
reporte: “¿Para quién estoy escribiendo? Sencillamente, el público es quien
manda” (p. 1).
Figura 17: Otras estadísticas descriptivas
Fuente: [Imagen intitulada sobre otras estadísticas descriptivas] (s. f.). Recuperada de
http://goo.gl/WlktRs
25
Asimismo, no puede descuidarse la atención en cuanto a la situación o el
contexto. En este sentido, también siguiendo las recomendaciones de Naciones
Unidas (2009) tendientes a entender el contexto en el que se comunican los
datos, se sugiere “usar las herramientas del lenguaje, la estructura y la
presentación más apropiada para transmitir el mensaje” (p. 3).
Si bien cada combinación de estos aspectos sugiere una estructura y una

extensión particular (de las cuales presentaremos las normas usuales), en todos
los casos corresponde aplicar un criterio de especificidad. En tal sentido, lo que
se debe presentar es “lo estrictamente necesario”: que no falte nada de lo que
es importante.
Figura 18: Reporte de investigación. Contenido
 Portada: es la carátula del reporte. Contiene el título, el/los autores, la

filiación institucional, el lugar y fecha de la investigación. Además,
también se incluye el financiador, si es que lo hay, y toda otra norma de
estilo que haya definido la institución que determinó la existencia de la
investigación.
26
 Índices: tabla de contenido de todos los capítulos y, si corresponde, un
índice de tablas y figuras.
 Resumen: redactado de manera simple, clara y concisa, debe dar cuenta

de los objetivos, la metodología y los resultados más relevantes, así
como de las conclusiones que se lograron. Para el caso de publicaciones
científicas, suelen existir normas en cuanto la extensión máxima
permitida.
 Cuerpo del reporte: incluye las diferentes secciones con el contenido

pormenorizado.
 Introducción: se detallan, sin demasiada extensión, los antecedentes, el

planteo del problema y las hipótesis.
 Marco teórico: teorías consideradas, así como estudios previos

relevantes, sumario de los hallazgos previos y su interrelación con la
presente investigación.
Figura 19: Contenido del cuerpo del reporte
27
 Método: se presentan el enfoque y los diseños adoptados, la
contextualización temporal y espacial, y aspectos de la muestra
utilizada. También deben estar los procedimientos, los métodos de
captura de datos y las operaciones de procesamiento y análisis
aplicadas.
 Resultados: resumir lo obtenido del análisis descriptivo e inferencial

llevado a cabo. En este apartado se detallan las tablas estadísticas, cada
una de las cuales tiene que incluir su título respectivo. También pueden
incluirse figuras y gráficas, siempre que sean sencillas y aporten al
análisis de la investigación.
 Discusión: se exponen las conclusiones y recomendaciones (si

corresponde). Se presentan comparaciones con otros estudios, se
extrapolan los resultados y se mencionan limitaciones, entre otros
productos finales.
Figura 20: Reporte de investigación
Fuente: [Imagen intitulada sobre reporte de investigación] (s. f.). Recuperada de

https://goo.gl/s6nUuh
 Referencias bibliográficas: listado de trabajos de autores que fueron

consultados y citados en el reporte. Hay diferentes estilos para realizar
28
estas referencias. En algunos casos el autor elige qué estilo usar; en
otros (por ejemplo, en artículos para revistas o congresos), se especifica
qué estilo se debe aplicar como condición.
 Apéndices: aspectos que son importantes o interesantes, pero que

podrían distraer el foco durante la lectura del cuerpo principal del texto.
En el caso de los reportes no académicos, una sección adicional y central

corresponde al Resumen ejecutivo. En tal resumen se indican los resultados
más importantes, presentados de manera predominantemente gráfica. Por otra
parte, los reportes no académicos no suelen contar con la sección Referencias
bibliográficas. Las demás secciones no difieren significativamente de las
indicadas para textos académicos.
Elementos para la redacción del informe
Siguiendo el manual de recomendaciones de Naciones Unidas (2009),

mencionamos algunas de las sugerencias que sirven para lograr un buen
reporte, desde lo comunicacional:
 utilizar frases cortas;
 tratar una idea en cada frase;
 comenzar cada párrafo con la idea central del párrafo. Luego desagregar
el análisis en sus componentes relevantes;
 desarrollar párrafos cortos;
 mantener una redacción concisa.
¿Cómo presentar gráficos y tablas?
La mayoría de los reportes de investigación cuantitativos incluye como

elementos centrales de exposición de los hallazgos, diferentes tablas y gráficos.
A continuación, listamos diferentes recomendaciones para su aplicación

efectiva.
En particular, los gráficos se privilegian en diferentes formatos sintéticos, ya

que se constituyen como una de las mejores técnicas para hacer comprensibles
los datos, como una representación de números mediante imágenes (Naciones
Unidas, 2009, p. 7). A través de una presentación visual de los datos, se intenta
facilitar la comprensión y la extracción de conclusiones por parte del público
destinatario del informe (Naciones Unidas, 2009, p. 9).
29
Cuando se elabora un gráfico para un reporte, se debe tener en cuenta que,
además de ser atractivo, no pierda sencillez, claridad y precisión. Un gráfico no
debe inducir a errores de interpretación. El tipo de gráfico que se defina aplicar
debe ser lo más sintético posible, de modo que haga más fáciles las
comparaciones y destaque las diferencias, si existen, o haga evidenciar las
tendencias que describe.
Sin embargo, hay situaciones en las cuales no se recomienda el uso de gráficos.

En su lugar es mejor explicar los resultados a través de textos o tablas. Estas
situaciones se dan cuando los datos se caracterizan por una gran dispersión o
cuando no permiten detectar ningún tipo de diferencia o variación entre grupos
o categorías. Además, resultan poco útiles cuando la cantidad de valores de la
variable considerada es demasiado elevada o demasiado reducida.
Los gráficos que presentamos previamente en este módulo, asociados a la

ilustración de frecuencias, son los más utilizados en general en los reportes.
Veamos qué aspectos hay que considerar al aplicarlos en un reporte de
investigación.
Gráfico de barras:
 Se usan tanto los gráficos de barras horizontales como verticales.

 Desde la experiencia del lector, es más clara la lectura de las barras
horizontales.
 Se recomienda que las barras tengan más ancho que el espacio entre
tales barras.
 Una variante muy útil para comparar participaciones de distintas
categorías en diferentes totales es el gráfico de barras apiladas. En este
caso resulta efectiva la transmisión de información si no hay demasiadas
categorías.
30
Figura 21: Gráficos de barras
Fuente: Rivas et al., 2010.
Figura 22: Gráficos de barras apiladas
Gráficos de líneas
Los gráficos de líneas permiten ilustrar tendencias a lo largo del tiempo. Por eso
es el tipo de gráfico más conveniente cuando se necesita mostrar series
temporales.
31
Figura 23: Gráficos de líneas
Fuente: Domenech, 2013.
Gráficos circulares
Como mencionamos al inicio de la lectura sobre representación de frecuencias,

los gráficos circulares o de sectores sirven para mostrar la distribución
porcentual de una variable.
Figura 24: Gráfico circular
Fuente: Rivas, 2013.
32
La recomendación, desde el punto de vista de la comunicación, es que solo
conviene mostrar un pequeño número de categorías (no más de seis en un
gráfico).
Algunos especialistas indican que es difícil comparar los diferentes segmentos

del círculo y comparar datos entre diferentes gráficos circulares. Para facilitar la
lectura, los segmentos tendrían que estar etiquetados con sus valores reales.
“En la mayoría de los casos, gráficos como los de barras son más apropiados,
pero los gráficos circulares no se deben descartar por completo, ya que son
eficaces para visualizar la importancia relativa de una categoría en el total”
(Naciones Unidas, 2009, p. 23). Los gráficos circulares pueden ser muy útiles
para brindar una visión general, como en el ejemplo.
Diagrama de dispersión
El diagrama de dispersión sirve para ilustrar gráficamente la relación entre dos

variables. Es la manera más exacta de mostrar correlaciones. Sin embargo,
debe tenerse en cuenta que, en general, no son susceptibles de ser
interpretados intuitivamente para alguien no entrenado.
Fuente: Rivas, 2013.
33
¿Cómo lograr que un gráfico sea efectivo?
Los diferentes elementos de un gráfico compiten entre sí por la atención del

público destinatario. Mientras más elementos tenga el gráfico, menos foco se
dispone para atender a lo esencial del mensaje.
Los datos
La representación de los datos son las barras, líneas, sectores o puntos de los
diferentes gráficos mencionados previamente.
Información de apoyo
Título, leyenda, etiquetas de datos, líneas de división, notas a pie y la fuente de

los datos.
 El título del gráfico debe dar una idea clara y concisa de lo que el gráfico
contiene. Los títulos pueden ser:
o informativos: proporcionan toda la información necesaria para

entender los datos. Responde a tres preguntas: “¿qué?”,
“¿dónde?” y “¿cuándo?”;
o descriptivo: enfatiza en las principales pautas o tendencias

mostradas en el gráfico y plantea sintéticamente lo que este
muestra.
 Las etiquetas de los ejes deben indicar las variables mostradas en el

gráfico. Conviene mostrar los niveles de las categorías horizontalmente
en ambos ejes.
 Los títulos de los ejes se utilizan para identificar la unidad de medida de

los datos. Puede resultar redundante en algunos casos y pueden
omitirse si esa es la situación.
 Las líneas de división sirven de ayuda a leer y comparar los valores de

los datos en los gráficos de barras y líneas. Debe revisarse que no quede
demasiado sobrecargado el gráfico.
 Las leyendas y etiquetas de datos identifican los símbolos o colores

utilizados para representar los datos. La leyenda no se debe mostrar
cuando solo una serie de valores está representada en el gráfico.
Siempre que sea posible, es mejor emplear etiquetas que leyendas.
 Las notas al pie tienen como finalidad proporcionar definiciones, alguna

aclaración o información metodológica.
34
 La fuente de los datos debe estar indicada en la parte inferior del
gráfico.
Elementos de estética visual
 Evitar las tres dimensiones en los gráficos, ya que no suele aportar

información adicional y distrae la atención del lector con otra carga
cognitiva adicional.
 Siempre utilizar la menor cantidad posible de variaciones de colores que

exprese adecuadamente la información.
 Hay que prestar atención a las escalas utilizadas, de modo de no

distorsionar el mensaje de los datos. Como ejemplo, la siguiente figura
muestra un caso donde con solo cambiar la escala se da una idea
diferente de la información.
Figura 26: Dos gráficos con diferentes escalas para ilustrar los mismos datos
Fuente: Naciones Unidas, 2009.
Nubes de etiquetas
Una nube de etiquetas (también llamada nube de palabras) es una

representación visual de la frecuencia de palabras (por ejemplo, en el análisis
cuantitativo de textos o análisis de contenido) o etiquetas en un texto.
Las nubes de etiquetas son una forma útil de identificar los términos comunes
de un texto y construir taxonomías de palabras clave.
35
Figura 27: Nube de etiquetas
Fuente: [Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4
Otros gráficos
Los siguientes gráficos combinan elementos estadísticos, como el polígono de

frecuencias, con elementos de diseño que facilitan la transmisión de la
información.
Figura 28: Polígono de frecuencias enriquecido
36
Figura 29: Gráfico de sectores enriquecido
¿Cómo lograr que una tabla sea efectiva en comunicar el mensaje?
En primer lugar, la tabla que forma parte del reporte o de una presentación
tiene que tener algún nivel de síntesis y no todo el detalle de los datos
recogidos.
Cuando a alguna tabla detallada se la considera importante, pero pesada de

leer y con posibilidades de distraer la atención del foco principal que se está
intentando presentar, se la debe colocar en el anexo.
Las tablas también tienen elementos constitutivos esenciales que deben

incluirse para cumplir los requisitos formales que las investigaciones respetan:
 Título de la tabla: descripción clara y precisa de los datos que contiene.

Debe responder las tres preguntas: "¿qué?", "¿dónde?" y "¿cuándo?".
Un título es mejor mientras más breve y conciso sea. Se debe evitar el
uso de verbos en un título.
 Encabezados de las columnas: indican qué datos están presentes en

cada columna de la tabla. Tienen que tener las especificaciones breves
que sean necesarias.
 Encabezados de las filas: identifican los datos ubicados en cada fila de la

tabla.
 Notas al pie: indican cualquier información adicional necesaria para

comprender y utilizar correctamente los datos.
37
 Fuente: indica de dónde provienen los datos, es decir, la organización
que elaboró los datos, el método de recogida de datos y el período de
obtención, si corresponde.
Figura 30: Elementos constitutivos de una tabla
Fuente: Basado en Naciones Unidas, 2009.
Algunas recomendaciones de las Naciones Unidas (2009) para asegurarse de

que las tablas sean fáciles de entender:
 Evitar texto innecesario.

 Presentar los datos por orden cronológico en el caso de series
temporales o usando una clasificación estándar.
 Usar las mínimas posiciones decimales que sean necesarias.
 Usar separadores de miles.
 Alinear los números hacia la derecha hace claramente apreciable su
valor relativo. No centrar los números en una columna, a menos que
todos tengan la misma extensión.
38
 No dejar ninguna celda de datos vacía.
Figura 31: Ejemplo de una tabla
39
Referencias
Básica:
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2010).
Metodología de la investigación. México: Mc Graw Hill.
Ampliatoria:
Bisquerra Alzina, R. (2009). Metodología de la investigación educativa. La Muralla:

Madrid.
Di Pietro, S.; Tófalo, A.; Medela, P. y Pitton, E. (2013). La situación educativa a través
de los censos nacionales de población. Dirección General de Evaluación de la Calidad
Educativa: Buenos Aires.
Domenech, R. (2013). La evolución del nivel educativo en la OCDE, 1960-2010.

Observatorio Económico Global. BBVA: Madrid.
Naciones Unidas. Comisión Económica para Europa. (2009). ¿Cómo hacer

comprensibles los datos? Una guía para presentar estadísticas. Naciones Unidas:
Ginebra.
Río Sadornil, D. (2013). Diccionario-glosario de Metodología de Investigación Social.

Universidad Nacional de Educación a Distancia: Madrid.
Rivas, A., Vera, A. & Bezem, P. (2010). Radiografía de la educación argentina. CIPPEC:
Buenos Aires.
Rojas Soriano, R. (2006). Guía para la realización de investigaciones sociales. Plaza y

Valdez: México.
Imágenes
Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q
Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6
Imagen intitulada sobre asimetría] (s. f.). Recuperada de http://goo.gl/R1w7IX
Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX
Imagen intitulada sobre tasa de desempleo en el mundo] (s. f.). Recuperada de

https://goo.gl/ag8dGH
40
Imagen intitulada sobre razón de masculinidad en el mundo] (s. f.). Recuperada de
http://goo.gl/0fKKHL
Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3
Imagen intitulada sobre coeficiente de correlación] (s. f.). Recuperada de

http://goo.gl/HLj77l
Imagen intitulada sobre diagrama de dispersión] (s. f.). Recuperada de

http://goo.gl/GgaTFE
Imagen intitulada sobre otras estadísticas descriptivas] (s. f.). Recuperada de

http://goo.gl/WlktRs
Imagen intitulada sobre reporte de investigación] (s. f.). Recuperada de

https://goo.gl/s6nUuh
Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4
41

METODOS Y TEC DE INV SOCIAL - Lectura 4 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

METODOS Y TEC DE INV SOCIAL - Lectura 4 PDF

Cargado por

Copyright:

Formatos disponibles

Módulo 4

“Análisis de datos: conjunto de transformaciones numéricas de los

El análisis estadístico involucra diferentes procedimientos descriptivos e

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

7.1.1. Análisis descriptivos: distribución de frecuencias y

Distribución de frecuencias y su representación gráfica

La frecuencia de una variable es la representación de la cantidad de veces que

Los indicadores de frecuencias son:

 Frecuencia absoluta o simplemente frecuencia: cantidad de veces que

 Frecuencia relativa: proporción de las veces que aparece cada valor en

 Frecuencia acumulada: apariciones totales acumuladas hasta cierto

La siguiente tabla presenta una salida de SPSS a partir de la base de datos

Tabla 1: Salida de SPSS

Participó en quehaceres domésticos

Válido Sí 46372 71,0 71,0 71,0

No 18916 28,9 28,9 99,9

Total 65352 100,0 100,0

Fuente: elaboración propia.

Las frecuencias también pueden representarse a través de gráficos.

Figura 3: Gráfico de barras

Fuente: elaboración propia.

Fuente: elaboración propia.

Figura 5: Polígono de frecuencias

Fuente: elaboración propia.

La media es el promedio de todos los valores de un conjunto de datos

Media = (2 + 3 + 5 + 5 + 7) / 5 = 22/5 = 4,4 miembros por familia.

La mediana corresponde al valor del conjunto de datos (ordenados de menor a

En el ejemplo anterior, la mediana (Me) será el valor que ocupe la tercera

La mediana puede o no pertenecer al conjunto. En el caso de los conjuntos con

Me = (48 + 52) /2= 50 años

La moda señala el valor que tiene más repeticiones de un conjunto de datos.

Veamos cómo es la salida de datos de SPSS al analizar las medidas de tendencia

¿Cómo interpretar estos resultados?

La tabla nos muestra que, en promedio, de los 65,352 encuestados, el tiempo

Medidas de dispersión o variabilidad

Como complemento necesario de las medidas de tendencia central,

 El rango o recorrido se define como la diferencia entre el mayor valor y

La varianza surge de calcular el promedio de los desvíos al cuadrado de cada

Como puede observarse, por la propia naturaleza de la definición de la media,

Var = 740,875/8 = 92,609 años2

Tabla 3: Cálculo de varianza

Valor (xi) xi - Media (xi – Media)2

Fuente: elaboración propia.

La desviación estándar (la medida de dispersión más utilizada) surge de tomar

Utilizando los datos del ejemplo anterior:

Fuente: [Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6

El coeficiente de variación vincula la desviación estándar con la media y permite

Con los datos del ejercicio anterior:

Tabla 4: Salida de SPSS. Estadísticos descriptivos

Las medidas de asimetría y curtosis hacen referencia a la forma de la gráfica de

La asimetría mide cuán diferente es una distribución específica respecto de una

Fuente: [Imagen intitulada sobre asimetría] (s. f.). Recuperada de http://goo.gl/R1w7IX

La curtosis indica qué tan plana o empinada es la distribución. Nuevamente, el

Fuente: [Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX

La siguiente tabla muestra la salida de SPSS respecto de medidas de curtosis y

Tabla 5: Salida de SPSS

Tiempo dedicado a trabajo voluntario

Fuente: elaboración propia.

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

Figura 10: Ejemplo

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

Figura 11: Tasa de desempleo en el mundo

Figura 12: Razón de masculinidad en el mundo