Está en la página 1de 42

Módulo 4

Análisis de la
información
7. Análisis de la
información
7.1. Análisis e interpretación de los datos

“Análisis de datos: conjunto de transformaciones numéricas de los


datos para conseguir que éstos sean interpretables, generalmente
en relación con la hipótesis de investigación” (Del Río Sadornil,
2013, p. 22).

Las tareas previas al análisis de datos, una vez completados todos los aspectos
de la captura, deben llevarse a cabo antes de iniciar el análisis propiamente
dicho. Esas tareas consisten en codificar las respuestas de preguntas abiertas,
cargar los datos y depurar errores de carga o inconsistencias.

El análisis estadístico involucra diferentes procedimientos descriptivos e


inferenciales que se realizan, en su totalidad, a través de la aplicación de
software específico para este fin. Durante este módulo los ejemplos se
presentarán utilizando SPSS. En el texto de bibliografía básica se emplea
predominantemente Minitab. En ambos casos son ilustraciones. No se
pretende que el alumno sepa manejarlos como resultado de este curso, sino
que pueda interpretar resultados básicos provenientes de estos programas de
uso generalizado.

1
Figura 1: Fases del análisis de datos

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

7.1.1. Análisis descriptivos: distribución de frecuencias y


medidas de tendencia central
Al cargar los datos en el respectivo programa de análisis estadístico queda
determinada una matriz donde cada caso es una fila y cada columna una
variable o un aspecto considerado. En el caso de una encuesta, una variable
puede corresponder a una pregunta de un cuestionario (preguntas que
admiten una sola respuesta) o puede ser necesaria más de una variable para
capturar la información proveniente de una pregunta (aquellas que admiten
respuestas múltiples).

Para decidir qué tipo de análisis descriptivo se puede aplicar, hay que
considerar el nivel de medición de cada variable (nominal, ordinal, de intervalo
o de razón), al tiempo que las hipótesis a las que responde y cómo está
formulada.

Se denomina análisis univariado al que considera una por una cada variable del
estudio.

2
Figura 2: Análisis de datos

Fuente: [Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q

Distribución de frecuencias y su representación gráfica

La frecuencia de una variable es la representación de la cantidad de veces que


aparece en cierto conjunto cada uno de los valores de esa variable. Esta
representación sintética puede aplicarse a variables de todos los niveles de
medición.

Los indicadores de frecuencias son:

 Frecuencia absoluta o simplemente frecuencia: cantidad de veces que


aparece cada valor.

 Frecuencia relativa: proporción de las veces que aparece cada valor en


el total. Se la suele expresar en porcentajes a fin de facilitar su
interpretación.

 Frecuencia acumulada: apariciones totales acumuladas hasta cierto


valor de la variable.

Tomemos como ejemplo la encuesta sobre uso del tiempo (Indec, 2013) para
mostrar los conceptos involucrados en este módulo.

La siguiente tabla presenta una salida de SPSS a partir de la base de datos


correspondientes. Veamos qué información contiene. Cada columna posee
información relevante. La primera indica los valores posibles de la variable (Sí,
No, Ns/Nr). La segunda muestra la frecuencia absoluta, es decir, cuántos casos
en la encuesta respondieron cada valor. En este caso, 46.372 dijeron “Sí”, en
tanto 18.916 dijeron “No”. La tercera columna presenta la frecuencia relativa
expresada en términos porcentuales. El 71 % respondió “Sí”, mientras que el

3
28,9 % respondió “No”, y el 0,1 % “Ns/Nr”. La cuarta columna indica los
porcentajes válidos. Como a esta pregunta la responden todos los encuestados,
coincide con la columna anterior. Pero si la pregunta se realizara a solo una
parte de los encuestados, el porcentaje de una y otra columna diferiría.
Finalmente, la quinta columna indica el porcentaje acumulado. Si bien puede
analizarse, en el caso de las variables cualitativas este análisis es menos
interesante que en el caso de las variables cuantitativas.

Tabla 1: Salida de SPSS

Participó en quehaceres domésticos

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado

Válido Sí 46372 71,0 71,0 71,0

No 18916 28,9 28,9 99,9

Ns/Nr 64 ,1 ,1 100,0

Total 65352 100,0 100,0

Fuente: elaboración propia.

Las frecuencias también pueden representarse a través de gráficos.

Figura 3: Gráfico de barras

Fuente: elaboración propia.

4
Figura 4: Gráfico circular. Diagrama de sectores

Fuente: elaboración propia.

Figura 5: Polígono de frecuencias

Fuente: elaboración propia.

5
Medidas de posición o tendencia central

Las medidas de tendencia central son medidas sintéticas que permiten indicar,
con un único número, un valor de referencia del conjunto de datos. Las
principales son: la media, la mediana y la moda.

La media es el promedio de todos los valores de un conjunto de datos


cuantitativos (escalas de intervalo o razón). Se calcula sumando todos los
valores y dividiendo esa suma por la cantidad de casos totales que el conjunto
incluya. Por ejemplo, si tenemos los datos de la cantidad de miembros de 5
familias en una zona: 2, 3, 5, 5 y 7 miembros respectivamente, la media de
miembros por familia es:

Media = (2 + 3 + 5 + 5 + 7) / 5 = 22/5 = 4,4 miembros por familia.

La mediana corresponde al valor del conjunto de datos (ordenados de menor a


mayor) que se encuentra exactamente en medio de la distribución, o más
formalmente, el valor tal que no más de la mitad de los datos de la distribución
es mayor que tal valor, y no más de la mitad de los datos es menor a ese valor.
La mediana se calcula para variables de escalas de razón, intervalo u ordinal.

En el ejemplo anterior, la mediana (Me) será el valor que ocupe la tercera


posición de la serie ordenada:

Mediana = 5

La mediana puede o no pertenecer al conjunto. En el caso de los conjuntos con


un número par de casos, la mediana se calcula como el promedio de los dos
valores centrales. Por ejemplo, si tenemos las edades de los gerentes de 8
empresas de la ciudad: 40, 45, 45, 48, 52, 60, 65, 68, la mediana es Indec:

Me = (48 + 52) /2= 50 años

La moda señala el valor que tiene más repeticiones de un conjunto de datos.


Una distribución puede tener más de una moda o valor modal. Del ejemplo
anterior (edades de los gerentes), la moda es:

Mo = 45 años

Veamos cómo es la salida de datos de SPSS al analizar las medidas de tendencia


central de un conjunto de datos. La variable que consideramos de la encuesta
de uso del tiempo (Indec, 2013) es el tiempo dedicado la semana anterior a
actividades de voluntariado.

6
Tabla 2: Salida de SPSS. Estadísticas descriptivas

Estadísticos
Tiempo dedicado a trabajo voluntario

N Válido 65352

Perdidos 0
Media ,5487
Mediana ,0000
Moda ,00

¿Cómo interpretar estos resultados?

La tabla nos muestra que, en promedio, de los 65,352 encuestados, el tiempo


dedicado a actividades de voluntariado la semana anterior es 0,5487 horas. Si
consideramos el valor central de la distribución (Mediana), vemos que el 50%
(mitad de la distribución) dedica, a lo sumo, 0 horas a voluntariado, y que el 50
% dedica 0 horas o más. Finalmente, también podemos afirmar que lo más
frecuente es que se dediquen 0 horas a actividades de voluntariado.

Medidas de dispersión o variabilidad

Como complemento necesario de las medidas de tendencia central,


necesitamos otras medidas que hagan referencia a cuán concentrados están los
datos del conjunto respecto de tales medidas de tendencia central. Estas
medidas se denominan de dispersión. Las medidas de dispersión más utilizadas
son: rango, varianza, desviación estándar y coeficiente de variación.

 El rango o recorrido se define como la diferencia entre el mayor valor y


el menor valor de un conjunto de datos cuantitativos.

Tomemos el conjunto de edades de los gerentes de 8 empresas: 40, 45, 45, 48,
52, 60, 65, 68. El rango es:

Rango = 68 – 40 = 28 años

La varianza surge de calcular el promedio de los desvíos al cuadrado de cada


valor del conjunto respecto de la media. Veamos cómo se calcula para el
ejemplo anterior:

Media: 52,875

Como puede observarse, por la propia naturaleza de la definición de la media,


la suma de los desvíos de cada valor respecto de la media, es cero. Por eso,

7
para poder contar con una medida de dispersión, se eleva cada diferencia al
cuadrado. La varianza se calcula dividiendo la suma de desvíos al cuadrado en la
cantidad de casos:

Var = 740,875/8 = 92,609 años2

Tabla 3: Cálculo de varianza

Valor (xi) xi - Media (xi – Media)2

40 -12,875 165,765625

45 -7,875 62,015625

45 -7,875 62,015625

48 -4,875 23,765625

52 -0,875 0,765625

60 7,125 50,765625

65 12,125 147,015625

68 15,125 228,765625

Suma: 0 740,875

Fuente: elaboración propia.

Hay que tener en cuenta que la unidad de medida de la varianza está expresada
en la misma unidad de medida que la variable original, pero elevada al
cuadrado, como lo expresa el resultado anterior (en años2).

La desviación estándar (la medida de dispersión más utilizada) surge de tomar


la raíz cuadrada positiva de la varianza. Por lo tanto, la desviación estándar sí
está expresada en la misma unidad de medida que la variable original y que la
media.

Utilizando los datos del ejemplo anterior:

8
DS = 92,609 años2 = 9,623 años

Figura 6: Varianza

Fuente: [Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6

El coeficiente de variación vincula la desviación estándar con la media y permite


comparar la variabilidad de varias distribuciones entre sí:

CV = (DS /Media).100

Con los datos del ejercicio anterior:

CV = (9,623/52,875).100 = 18,2 %
La siguiente tabla muestra la salida de SPSS respecto de medidas de dispersión, en este
caso de la variable “tiempo dedicado a trabajo voluntario”, con datos de la encuesta
de uso del tiempo (Indec, 2013).

Tabla 4: Salida de SPSS. Estadísticos descriptivos

Estadísticos
Tiempo dedicado a trabajo voluntario

N Válido 65352

Perdidos 0
Desviación estándar 3,16122
Varianza 9,993
Rango 105,00
Fuente: elaboración propia.

9
Medidas de asimetría y curtosis

Las medidas de asimetría y curtosis hacen referencia a la forma de la gráfica de


la distribución de datos.

La asimetría mide cuán diferente es una distribución específica respecto de una


distribución teórica denominada normal, que es simétrica. Si el indicador es 0
significa que la distribución es simétrica (no difiere en simetría de la
distribución normal). Si la medida de asimetría es positiva, quiere decir que hay
más valores agrupados a la izquierda de la curva; y, por el contrario, si el
indicador es negativo, quiere decir que la mayor proporción de datos se agrupa
del lado derecho del eje de simetría.

Figura 7: Asimetría

Fuente: [Imagen intitulada sobre asimetría] (s. f.). Recuperada de http://goo.gl/R1w7IX

La curtosis indica qué tan plana o empinada es la distribución. Nuevamente, el


patrón de comparación es la distribución normal. Si la curtosis es 0 significa que
la distribución que consideramos es igual de empinada que la normal; si es
positiva quiere decir que es más empinada que la normal; y, por el contrario, si
es negativa, quiere decir que es más aplanada que la distribución normal.

10
Figura 8: Curtosis

Fuente: [Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX

La siguiente tabla muestra la salida de SPSS respecto de medidas de curtosis y


asimetría, en este caso de la variable “tiempo dedicado a trabajo voluntario”,
con datos de la Encuesta de uso del tiempo (Indec, 2013). Vemos que la
distribución del tiempo es asimétrica positiva (los valores están concentrados
en el lado izquierdo respecto del eje de simetría) y la curtosis es positiva. Por lo
tanto, la distribución es bastante más empinada que la normal. El gráfico
siguiente permite observar la distribución de datos de la variable “tiempo
dedicado a trabajo voluntario”, junto con la distribución normal (línea azul) de
referencia.

Tabla 5: Salida de SPSS

Tiempo dedicado a trabajo voluntario

N Válido 65352

Perdidos 0
Asimetría 11,570
Error estándar de asimetría ,010
Curtosis 188,328
Error estándar de curtosis ,019

Fuente: elaboración propia.

11
Figura 9: Otras estadísticas descriptivas

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

Figura 10: Ejemplo

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

Razones y tasas

12
Una tasa es la relación entre una categoría y un total. Por ejemplo, la tasa de
desocupación, que mide la proporción de la población activa que está sin
empleo en cierto período y busca uno de manera activa.

Una razón es un cociente entre dos categorías de una variable. Por ejemplo, la
razón de masculinidad en una población mide la cantidad de hombres respecto
de mujeres en un conjunto.

Figura 11: Tasa de desempleo en el mundo

Referencias: Verde: es menor, mientras más intenso más reducida la tasa; Rojo: mayor,
mientras más intenso más elevada la tasa. Fuente: [Imagen intitulada sobre tasa de desempleo
en el mundo] (s. f.). Recuperada de https://goo.gl/ag8dGH

Figura 12: Razón de masculinidad en el mundo

Referencias: Rosa: países con un índice de masculinidad menor que 1 (más mujeres que
hombres). Azul: países con un índice de masculinidad mayor que 1 (más hombres que mujeres).
Verde: países con un índice de 1. Gris: sin datos. Fuente: [Imagen intitulada sobre razón de
masculinidad en el mundo] (s. f.). Recuperada de http://goo.gl/0fKKHL

13
Análisis de la no respuesta

Una de las consideraciones relativas a la no respuesta se vincula con el


porcentaje de casos válidos. Si el porcentaje es demasiado alto, por ejemplo, 20
%, no corresponde analizar esos datos.

Validez y confiabilidad

Confiabilidad

1) Medida de estabilidad: se mide dos veces un mismo instrumento con el


mismo grupo de personas, en dos oportunidades distintas, separadas
por un período de tiempo. Si tal período no es tan extenso, se espera
una alta correlación en las respuestas si el instrumento es confiable.
2) Método de formas paralelas o alternativas: dos versiones de un mismo
instrumento se miden con el mismo grupo de personas, en dos
oportunidades distintas o de manera simultánea. Se espera una alta
correlación en las respuestas si el instrumento es confiable.
3) Método de mitades partidas: se divide el conjunto de reactivos y se
separa la muestra en dos partes (asignación aleatoria), y a cada una se
la mide con una parte de los reactivos. Se espera correlación entre las
mediciones de ambas partes.
4) Método de coherencia o consistencia interna:
o Alpha de Cronbach.
o KR 20 y KR21.

Validez

1) De contenido: opiniones de expertos que ayudan a asegurarse de que


aquellas dimensiones que se consideraron en el instrumento sean
representativas.
2) De criterio: correlación entre los puntajes obtenidos con el instrumento
y las puntuaciones correspondientes en el criterio.
3) De constructo: cuántas dimensiones integran a una variable y, a su vez,
los ítems que integran cada dimensión, identificando aspectos
redundantes.

El análisis descriptivo presentado se complementa con una serie de


herramientas de índole inferencial, a través de las cuales se trata de sacar
conclusiones referidas a la población de estudio a partir de los datos
muestrales. En dos grandes grupos, estas herramientas se refieren a técnicas de
estimación (es decir, indicar cuál es el valor aproximado de un cierto indicador

14
poblacional) y a pruebas de hipótesis (decisiones basadas en una
fundamentación estadística).

Figura 13: Análisis de datos

Fuente: [Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3

7.1.2. Análisis de la relación entre variables:


clasificación según el tiempo, la dirección y la intensidad
de la relación
Coeficiente de correlación de Pearson (r)

Este coeficiente sirve para cuantificar la relación entre dos variables, ambas
medidas en escalas de intervalo o razón.

El coeficiente de correlación de Pearson (r) puede asumir valores entre -1 y 1. El


signo del coeficiente permite identificar el sentido de la correlación. La
interpretación de los valores se indica en la siguiente tabla.

15
Tabla 6: Interpretación del coeficiente de correlación

Valor Significa
-1 Correlación negativa perfecta.
-0.9 Correlación negativa muy fuerte.
-0,75 Correlación negativa considerable.
-0,5 Correlación negativa media.
-0,25 Correlación negativa reducida.
-0,1 Correlación negativa muy débil.
0 No existe correlación entre las variables.
0,1 Correlación positiva muy débil.
0,25 Correlación positiva reducida.
0,5 Correlación positiva media.
0,75 Correlación positiva considerable.
0,9 Correlación positiva muy fuerte.
1 Correlación positiva perfecta.

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

Figura 14: Coeficiente de correlación

Fuente: [Imagen intitulada sobre coeficiente de correlación] (s. f.). Recuperada de


http://goo.gl/HLj77l

16
La fórmula de cálculo parece sumamente compleja, pero veamos con un
ejemplo cómo se aplica.

Pensemos en las variables “nota promedio en el secundario” y “notas promedio


en el primer año en la carrera universitaria”. Supongamos que tenemos una
muestra de 10 alumnos con la siguiente información:

Tabla 7: Datos

Nota promedio en el Notas promedio en el primer año en la


secundario carrera universitaria
6 5
7 6
7 5.5
7.5 6
7 8
8 6.5
8 7.5
8.2 7.5
9 8
9.4 8.5

Fuente: elaboración propia.

Una primera exploración gráfica nos permite tener una hipótesis sobre la
relación entre las variables:

17
Figura 15: Diagrama de dispersión

10
9,5
9
8,5
8
7,5
7
6,5
6
5,5
5
5 6 7 8 9 10

Fuente: elaboración propia.

Se observa una relación positiva entre las variables consideradas. Ahora, con el
coeficiente de correlación de Pearson, podemos cuantificar esta relación.

Tabla 8: Cálculo de desvíos

Valor (xi) xi - Media (xi – Media)2

40 -12,875 165,765625

45 -7,875 62,015625

45 -7,875 62,015625

48 -4,875 23,765625

52 -0,875 0,765625

60 7,125 50,765625

65 12,125 147,015625

68 15,125 228,765625

Suma: 0 740,875

Fuente: elaboración propia.

18
Tabla 9: Cálculo de coeficiente de correlación

Nota Notas
promedio promedio en
en el el primer año
secundario en la carrera
(xi) universitaria
(yi) xiyi xi2 yi2

6 5 30 36 25

7 6 42 49 36

7 5,5 38,5 49 30,25

7,5 6 45 56,25 36

7 8 56 49 64

8 6,5 52 64 42,25

8 7,5 60 64 56,25

8,2 7,5 61,5 67,24 56,25

9 8 72 81 64

9,4 8,5 79,9 88,36 72,25

Sumatoria 77,1 68,5 536,9 603,85 482,25

Fuente: elaboración propia.

19
r= 10 .536,9 - 77,1 . 68,5
10. 603,85- (77,1)2 10.482,25 –(68,5)2

r = 0,7917

Por lo tanto, la relación positiva que observamos en el gráfico implica una


asociación entre considerable y fuerte (0.7917).

En esta asignatura no se espera que el alumno realice habitualmente este tipo


de cálculos, pero sí que sepa interpretarlos.

Cuando se eleva el coeficiente de Pearson al cuadrado, se obtiene el coeficiente


de determinación (con una interpretación sumamente difundida en los análisis
de regresión).

Figura 16: Diagrama de dispersión

Fuente: [Imagen intitulada sobre diagrama de dispersión] (s. f.). Recuperada de


http://goo.gl/GgaTFE

20
Asociación entre dos variables categóricas

Si queremos conocer el grado de asociación entre dos variables categóricas,


debemos recurrir a otros estadísticos. La idea básica en todos los casos es ver si
la distribución de valores de una de las variables difiere según los valores que
tiene que la otra variable.

Veamos el siguiente ejemplo:

Tabla 10: Tabla de contingencia

Percepción de la situación personal en el Total


último año

Grupo etario Buena Regular Mala

Jóvenes 48 42 60 150
Adultos 70 105 175 350
Total 118 147 235 500

Fuente: elaboración propia.

La idea, ahora, es comparar la distribución que presenta la tabla de datos con


aquella hipotética que correspondería a una situación en la cual las dos
variables analizadas no poseen ningún tipo de asociación entre sí, es decir, de
modo que los valores de una variable no condicionen los que se observan en la
otra.

Para obtener esta tabla que refleje independencia, tenemos que hacer algunos
cálculos auxiliares. Para esto tengamos presente los conceptos de frecuencias
marginales, que son las que corresponden a los márgenes de la tabla. Allí
figuran, tanto para fijas como para columnas, los totales. En la siguiente tabla
sólo dejamos los datos de las frecuencias marginales.

A la tabla que refleje situación de no asociación la vamos a construir utilizando


las frecuencias marginales. Para cada celda de la tabla vamos a multiplicar el
valor de la frecuencia marginal de la fila que le corresponde a ese valor y el
valor de la frecuencia marginal de la columna que le corresponde a ese valor.
Luego, a este resultado lo vamos a dividir por el total de casos.

21
Tabla 11: Tabla de contingencia

Percepción de la situación personal en el Total


último año

Grupo etario Buena Regular Mala

Jóvenes 150
Adultos 350
Total 118 147 235 500

Fuente: elaboración propia.

Veamos la celda de la posición (1,1), es decir, de la primera fila y la primera


columna de datos.

a11 = (150 . 118) / 500

a11 = 35,4

Y completamos el primer valor de la tabla de no asociación:

Tabla 12: Tabla de contingencia

Percepción de la situación personal en el Total


último año
Buena
Grupo etario
Grupo etario Buena Regular
Jóvenes 35,4 150
Adultos 350
Total 118 147 235 500

Fuente: elaboración propia.

De la misma manera, procedemos para calcular los siguientes valores:

22
a12= (150 . 147) / 500 = 44,1
a13= (150 . 235) / 500 = 70,5
a21= (350 . 118) / 500 = 82,6
a22= (350 . 147) / 500 = 102,9
a23= (350 . 235) / 500 = 164,5

Veamos la tabla completa, a la que llamaremos tabla de valores esperados:

Tabla 13: Tabla de contingencia

Percepción de la situación personal en el Total


último año
Grupo etario Buena Regular Mala
Jóvenes 35,4 44,1 70,5 150
Adultos 82,6 102,9 164,5 350
Total 118 147 235 500

Fuente: elaboración propia.

La idea, ahora, es comparar las frecuencias reales/observadas con los datos


hipotéticos de esta tabla que muestra los valores que podríamos esperar en
cada celda si ambas variables entre sí no tuvieran ninguna asociación. En el
caso de que las diferencias fueran “importantes estadísticamente hablando”
(esto es lo que luego aporta cada uno de los indicadores de asociación
específicos que se usen), podríamos concluir que existe una asociación.

Para determinar las diferencias, vamos a trabajar celda por celda y elevar tales
valores al cuadrado.

Tabla de diferencias de valores observados y esperados, elevados al cuadrado.

Tabla 14: Tabla de contingencia

Percepción de la situación personal


en el último año
Grupo Buena Regular Mala
etario
Jóvenes 158,76 4,41 110,25
Adultos 158,76 4,41 110,25
Fuente: elaboración propia.

23
Generalmente, para una prueba estadística de la independencia de dos
variables categóricas, se usa el estadístico:

Que tiene distribución “chi” cuadrado, donde “O” hace referencia a los valores
de las frecuencias observadas y “E” a las frecuencias esperadas.

Existen otros índices bivariados. La elección entre ellos depende


fundamentalmente del nivel de medición de las variables consideradas. La tabla
siguiente resume los principales índices de correlación disponibles.

Tabla 15: Tabla de contingencia

Tipo de Símbolo Variable 1 Variable 2 Cuándo usar


correlación

Pearson r Continua Continua Es la técnica


más estable
Kendall tau Ordinal Ordinal n<10
Biserial r bis Dicotómica Continua Análisis de
ítems
Biserial r pbis Dicotómica Continua Correlaciones
puntual inferiores que
r bis
Tetracórica rt Dicotómica Dicotómica
Coeficiente fi Fi Dicotómica Dicotómica
Coeficiente eta Continua Continua
eta
Fuente: Bisquerra Alzina, 2009.

24
7.2 Informe y exposición de conclusiones

Una vez realizado el análisis y la síntesis de la


información el proceso siguiente y último de la
investigación consiste en presentar el informe con los
resultados obtenidos. Para su elaboración es necesario
por un lado, seleccionar el material que se va a incluir
y, por el otro, estructurar el documento de tal manera
que se facilite la comprensión de su contenido (Rojas
Soriano, 2006, p. 351).

Un aspecto central al comenzar a preparar un reporte de investigación es


considerar el público receptor y el propósito que tiene la presentación, en el
marco del estudio desarrollado. El manual de las Naciones Unidas (2009), en
relación con la presentación de datos estadísticos, menciona la pregunta crucial
y la respuesta que todo investigador debe darse al momento de elaborar cada
reporte: “¿Para quién estoy escribiendo? Sencillamente, el público es quien
manda” (p. 1).

Figura 17: Otras estadísticas descriptivas

Fuente: [Imagen intitulada sobre otras estadísticas descriptivas] (s. f.). Recuperada de
http://goo.gl/WlktRs

25
Asimismo, no puede descuidarse la atención en cuanto a la situación o el
contexto. En este sentido, también siguiendo las recomendaciones de Naciones
Unidas (2009) tendientes a entender el contexto en el que se comunican los
datos, se sugiere “usar las herramientas del lenguaje, la estructura y la
presentación más apropiada para transmitir el mensaje” (p. 3).

Si bien cada combinación de estos aspectos sugiere una estructura y una


extensión particular (de las cuales presentaremos las normas usuales), en todos
los casos corresponde aplicar un criterio de especificidad. En tal sentido, lo que
se debe presentar es “lo estrictamente necesario”: que no falte nada de lo que
es importante.

Figura 18: Reporte de investigación. Contenido

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

 Portada: es la carátula del reporte. Contiene el título, el/los autores, la


filiación institucional, el lugar y fecha de la investigación. Además,
también se incluye el financiador, si es que lo hay, y toda otra norma de
estilo que haya definido la institución que determinó la existencia de la
investigación.

26
 Índices: tabla de contenido de todos los capítulos y, si corresponde, un
índice de tablas y figuras.

 Resumen: redactado de manera simple, clara y concisa, debe dar cuenta


de los objetivos, la metodología y los resultados más relevantes, así
como de las conclusiones que se lograron. Para el caso de publicaciones
científicas, suelen existir normas en cuanto la extensión máxima
permitida.

 Cuerpo del reporte: incluye las diferentes secciones con el contenido


pormenorizado.

 Introducción: se detallan, sin demasiada extensión, los antecedentes, el


planteo del problema y las hipótesis.

 Marco teórico: teorías consideradas, así como estudios previos


relevantes, sumario de los hallazgos previos y su interrelación con la
presente investigación.

Figura 19: Contenido del cuerpo del reporte

Fuente: elaboración propia a partir de Hernández Sampieri et al., 2010.

27
 Método: se presentan el enfoque y los diseños adoptados, la
contextualización temporal y espacial, y aspectos de la muestra
utilizada. También deben estar los procedimientos, los métodos de
captura de datos y las operaciones de procesamiento y análisis
aplicadas.

 Resultados: resumir lo obtenido del análisis descriptivo e inferencial


llevado a cabo. En este apartado se detallan las tablas estadísticas, cada
una de las cuales tiene que incluir su título respectivo. También pueden
incluirse figuras y gráficas, siempre que sean sencillas y aporten al
análisis de la investigación.

 Discusión: se exponen las conclusiones y recomendaciones (si


corresponde). Se presentan comparaciones con otros estudios, se
extrapolan los resultados y se mencionan limitaciones, entre otros
productos finales.

Figura 20: Reporte de investigación

Fuente: [Imagen intitulada sobre reporte de investigación] (s. f.). Recuperada de


https://goo.gl/s6nUuh

 Referencias bibliográficas: listado de trabajos de autores que fueron


consultados y citados en el reporte. Hay diferentes estilos para realizar

28
estas referencias. En algunos casos el autor elige qué estilo usar; en
otros (por ejemplo, en artículos para revistas o congresos), se especifica
qué estilo se debe aplicar como condición.

 Apéndices: aspectos que son importantes o interesantes, pero que


podrían distraer el foco durante la lectura del cuerpo principal del texto.

En el caso de los reportes no académicos, una sección adicional y central


corresponde al Resumen ejecutivo. En tal resumen se indican los resultados
más importantes, presentados de manera predominantemente gráfica. Por otra
parte, los reportes no académicos no suelen contar con la sección Referencias
bibliográficas. Las demás secciones no difieren significativamente de las
indicadas para textos académicos.

Elementos para la redacción del informe

Siguiendo el manual de recomendaciones de Naciones Unidas (2009),


mencionamos algunas de las sugerencias que sirven para lograr un buen
reporte, desde lo comunicacional:

 utilizar frases cortas;

 tratar una idea en cada frase;

 comenzar cada párrafo con la idea central del párrafo. Luego desagregar
el análisis en sus componentes relevantes;

 desarrollar párrafos cortos;

 mantener una redacción concisa.

¿Cómo presentar gráficos y tablas?

La mayoría de los reportes de investigación cuantitativos incluye como


elementos centrales de exposición de los hallazgos, diferentes tablas y gráficos.

A continuación, listamos diferentes recomendaciones para su aplicación


efectiva.

En particular, los gráficos se privilegian en diferentes formatos sintéticos, ya


que se constituyen como una de las mejores técnicas para hacer comprensibles
los datos, como una representación de números mediante imágenes (Naciones
Unidas, 2009, p. 7). A través de una presentación visual de los datos, se intenta
facilitar la comprensión y la extracción de conclusiones por parte del público
destinatario del informe (Naciones Unidas, 2009, p. 9).

29
Cuando se elabora un gráfico para un reporte, se debe tener en cuenta que,
además de ser atractivo, no pierda sencillez, claridad y precisión. Un gráfico no
debe inducir a errores de interpretación. El tipo de gráfico que se defina aplicar
debe ser lo más sintético posible, de modo que haga más fáciles las
comparaciones y destaque las diferencias, si existen, o haga evidenciar las
tendencias que describe.

Sin embargo, hay situaciones en las cuales no se recomienda el uso de gráficos.


En su lugar es mejor explicar los resultados a través de textos o tablas. Estas
situaciones se dan cuando los datos se caracterizan por una gran dispersión o
cuando no permiten detectar ningún tipo de diferencia o variación entre grupos
o categorías. Además, resultan poco útiles cuando la cantidad de valores de la
variable considerada es demasiado elevada o demasiado reducida.

Los gráficos que presentamos previamente en este módulo, asociados a la


ilustración de frecuencias, son los más utilizados en general en los reportes.
Veamos qué aspectos hay que considerar al aplicarlos en un reporte de
investigación.

Gráfico de barras:

 Se usan tanto los gráficos de barras horizontales como verticales.


 Desde la experiencia del lector, es más clara la lectura de las barras
horizontales.
 Se recomienda que las barras tengan más ancho que el espacio entre
tales barras.
 Una variante muy útil para comparar participaciones de distintas
categorías en diferentes totales es el gráfico de barras apiladas. En este
caso resulta efectiva la transmisión de información si no hay demasiadas
categorías.

30
Figura 21: Gráficos de barras

Fuente: Rivas et al., 2010.

Figura 22: Gráficos de barras apiladas

Fuente: Rivas et al., 2010.

Gráficos de líneas

Los gráficos de líneas permiten ilustrar tendencias a lo largo del tiempo. Por eso
es el tipo de gráfico más conveniente cuando se necesita mostrar series
temporales.

31
Figura 23: Gráficos de líneas

Fuente: Domenech, 2013.

Gráficos circulares

Como mencionamos al inicio de la lectura sobre representación de frecuencias,


los gráficos circulares o de sectores sirven para mostrar la distribución
porcentual de una variable.

Figura 24: Gráfico circular

Fuente: Rivas, 2013.

32
La recomendación, desde el punto de vista de la comunicación, es que solo
conviene mostrar un pequeño número de categorías (no más de seis en un
gráfico).

Algunos especialistas indican que es difícil comparar los diferentes segmentos


del círculo y comparar datos entre diferentes gráficos circulares. Para facilitar la
lectura, los segmentos tendrían que estar etiquetados con sus valores reales.

“En la mayoría de los casos, gráficos como los de barras son más apropiados,
pero los gráficos circulares no se deben descartar por completo, ya que son
eficaces para visualizar la importancia relativa de una categoría en el total”
(Naciones Unidas, 2009, p. 23). Los gráficos circulares pueden ser muy útiles
para brindar una visión general, como en el ejemplo.

Diagrama de dispersión

El diagrama de dispersión sirve para ilustrar gráficamente la relación entre dos


variables. Es la manera más exacta de mostrar correlaciones. Sin embargo,
debe tenerse en cuenta que, en general, no son susceptibles de ser
interpretados intuitivamente para alguien no entrenado.

Figura 25: Diagrama de dispersión

Fuente: Rivas, 2013.

33
¿Cómo lograr que un gráfico sea efectivo?

Los diferentes elementos de un gráfico compiten entre sí por la atención del


público destinatario. Mientras más elementos tenga el gráfico, menos foco se
dispone para atender a lo esencial del mensaje.

Los datos

La representación de los datos son las barras, líneas, sectores o puntos de los
diferentes gráficos mencionados previamente.

Información de apoyo

Título, leyenda, etiquetas de datos, líneas de división, notas a pie y la fuente de


los datos.

 El título del gráfico debe dar una idea clara y concisa de lo que el gráfico
contiene. Los títulos pueden ser:

o informativos: proporcionan toda la información necesaria para


entender los datos. Responde a tres preguntas: “¿qué?”,
“¿dónde?” y “¿cuándo?”;

o descriptivo: enfatiza en las principales pautas o tendencias


mostradas en el gráfico y plantea sintéticamente lo que este
muestra.

 Las etiquetas de los ejes deben indicar las variables mostradas en el


gráfico. Conviene mostrar los niveles de las categorías horizontalmente
en ambos ejes.

 Los títulos de los ejes se utilizan para identificar la unidad de medida de


los datos. Puede resultar redundante en algunos casos y pueden
omitirse si esa es la situación.

 Las líneas de división sirven de ayuda a leer y comparar los valores de


los datos en los gráficos de barras y líneas. Debe revisarse que no quede
demasiado sobrecargado el gráfico.

 Las leyendas y etiquetas de datos identifican los símbolos o colores


utilizados para representar los datos. La leyenda no se debe mostrar
cuando solo una serie de valores está representada en el gráfico.
Siempre que sea posible, es mejor emplear etiquetas que leyendas.

 Las notas al pie tienen como finalidad proporcionar definiciones, alguna


aclaración o información metodológica.

34
 La fuente de los datos debe estar indicada en la parte inferior del
gráfico.

Elementos de estética visual

 Evitar las tres dimensiones en los gráficos, ya que no suele aportar


información adicional y distrae la atención del lector con otra carga
cognitiva adicional.

 Siempre utilizar la menor cantidad posible de variaciones de colores que


exprese adecuadamente la información.

 Hay que prestar atención a las escalas utilizadas, de modo de no


distorsionar el mensaje de los datos. Como ejemplo, la siguiente figura
muestra un caso donde con solo cambiar la escala se da una idea
diferente de la información.

Figura 26: Dos gráficos con diferentes escalas para ilustrar los mismos datos

Fuente: Naciones Unidas, 2009.

Nubes de etiquetas

Una nube de etiquetas (también llamada nube de palabras) es una


representación visual de la frecuencia de palabras (por ejemplo, en el análisis
cuantitativo de textos o análisis de contenido) o etiquetas en un texto.

Las nubes de etiquetas son una forma útil de identificar los términos comunes
de un texto y construir taxonomías de palabras clave.

35
Figura 27: Nube de etiquetas

Fuente: [Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4

Otros gráficos

Los siguientes gráficos combinan elementos estadísticos, como el polígono de


frecuencias, con elementos de diseño que facilitan la transmisión de la
información.

Figura 28: Polígono de frecuencias enriquecido

Fuente: Rivas et al., 2003.

36
Figura 29: Gráfico de sectores enriquecido

Fuente: Rivas et al., 2003.

¿Cómo lograr que una tabla sea efectiva en comunicar el mensaje?

En primer lugar, la tabla que forma parte del reporte o de una presentación
tiene que tener algún nivel de síntesis y no todo el detalle de los datos
recogidos.

Cuando a alguna tabla detallada se la considera importante, pero pesada de


leer y con posibilidades de distraer la atención del foco principal que se está
intentando presentar, se la debe colocar en el anexo.

Las tablas también tienen elementos constitutivos esenciales que deben


incluirse para cumplir los requisitos formales que las investigaciones respetan:

 Título de la tabla: descripción clara y precisa de los datos que contiene.


Debe responder las tres preguntas: "¿qué?", "¿dónde?" y "¿cuándo?".
Un título es mejor mientras más breve y conciso sea. Se debe evitar el
uso de verbos en un título.

 Encabezados de las columnas: indican qué datos están presentes en


cada columna de la tabla. Tienen que tener las especificaciones breves
que sean necesarias.

 Encabezados de las filas: identifican los datos ubicados en cada fila de la


tabla.

 Notas al pie: indican cualquier información adicional necesaria para


comprender y utilizar correctamente los datos.

37
 Fuente: indica de dónde provienen los datos, es decir, la organización
que elaboró los datos, el método de recogida de datos y el período de
obtención, si corresponde.

Figura 30: Elementos constitutivos de una tabla

Fuente: Basado en Naciones Unidas, 2009.

Algunas recomendaciones de las Naciones Unidas (2009) para asegurarse de


que las tablas sean fáciles de entender:

 Evitar texto innecesario.


 Presentar los datos por orden cronológico en el caso de series
temporales o usando una clasificación estándar.
 Usar las mínimas posiciones decimales que sean necesarias.
 Usar separadores de miles.
 Alinear los números hacia la derecha hace claramente apreciable su
valor relativo. No centrar los números en una columna, a menos que
todos tengan la misma extensión.

38
 No dejar ninguna celda de datos vacía.

Figura 31: Ejemplo de una tabla

Fuente: Rivas et al., 2010.

39
Referencias
Básica:

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2010).
Metodología de la investigación. México: Mc Graw Hill.

Ampliatoria:

Bisquerra Alzina, R. (2009). Metodología de la investigación educativa. La Muralla:


Madrid.

Di Pietro, S.; Tófalo, A.; Medela, P. y Pitton, E. (2013). La situación educativa a través
de los censos nacionales de población. Dirección General de Evaluación de la Calidad
Educativa: Buenos Aires.

Domenech, R. (2013). La evolución del nivel educativo en la OCDE, 1960-2010.


Observatorio Económico Global. BBVA: Madrid.

Naciones Unidas. Comisión Económica para Europa. (2009). ¿Cómo hacer


comprensibles los datos? Una guía para presentar estadísticas. Naciones Unidas:
Ginebra.

Río Sadornil, D. (2013). Diccionario-glosario de Metodología de Investigación Social.


Universidad Nacional de Educación a Distancia: Madrid.

Rivas, A., Vera, A. & Bezem, P. (2010). Radiografía de la educación argentina. CIPPEC:
Buenos Aires.

Rojas Soriano, R. (2006). Guía para la realización de investigaciones sociales. Plaza y


Valdez: México.

Imágenes

Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/LVVo9q

Imagen intitulada sobre varianza] (s. f.). Recuperada de http://goo.gl/xMeuV6

Imagen intitulada sobre asimetría] (s. f.). Recuperada de http://goo.gl/R1w7IX

Imagen intitulada sobre curtosis] (s. f.). Recuperada de http://goo.gl/1ooLfX

Imagen intitulada sobre tasa de desempleo en el mundo] (s. f.). Recuperada de


https://goo.gl/ag8dGH

40
Imagen intitulada sobre razón de masculinidad en el mundo] (s. f.). Recuperada de
http://goo.gl/0fKKHL

Imagen intitulada sobre análisis de datos] (s. f.). Recuperada de http://goo.gl/1hA9S3

Imagen intitulada sobre coeficiente de correlación] (s. f.). Recuperada de


http://goo.gl/HLj77l

Imagen intitulada sobre diagrama de dispersión] (s. f.). Recuperada de


http://goo.gl/GgaTFE

Imagen intitulada sobre otras estadísticas descriptivas] (s. f.). Recuperada de


http://goo.gl/WlktRs

Imagen intitulada sobre reporte de investigación] (s. f.). Recuperada de


https://goo.gl/s6nUuh

Imagen intitulada sobre nube de palabras] (s. f.). Recuperada de http://goo.gl/lllPx4

41

También podría gustarte