Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN.
El Dato
Podemos aquí dar cuenta de cuatro características que hacen a su contenido, para luego mencionar la
Estructura que compone su forma. Dentro de lo que llamamos el contenido, tenemos que indicar que un
Dato implica una información que es extraída de la realidad. Como se mencionó, no se trata de una
invención sino de un producto de la acción humana. Por otro lado, el Dato debe tener la capacidad de
poder ser registrado en algún tipo de soporte, que puede ser tanto físico como simbólico. Otra de las
características importantes es que un Dato implica una elaboración conceptual, fruto de un cuerpo teórico
que lo sustente y le brinde sus límites. Por último, debe considerarse que este necesita ser expresado a
través de alguna forma de lenguaje (numérica o no numérica).
Pasemos ahora a conocer la forma que adquiere el Dato. Investigaciones realizadas por el sociólogo y
matemático noruego Johan Galtung indican que su forma más acertada requiere considerar una
“Estructura Tripartita”. Esta se compone por una Unidad de Análisis, que en una Variable, asumirá un
determinado Valor. Para Galtung, lo que constituye el Dato, son estos tres elementos considerados en
forma conjunta a través de las relaciones que mantienen entre sí.
Las Unidades de Análisis son los elementos menores y no divisibles que componen el universo de estudio
de una investigación. Se trata de sujetos individuales, productos de la acción humana, tanto material
(instituciones, empresas, etc.) como inmaterial (valores, normas), y grupos sociales. Las Variables hacen
referencia a los aspectos de un fenómeno, las cuales poseen la propiedad de asumir diferentes valores,
siendo estas Variables, en definitiva, lo que vamos a medir. Los Valores son las diferentes posiciones o
alternativas que presenta la Variable. Se pueden expresar cualitativamente a través de una clasificación por
ausencia o presencia, jerarquía u orden, o sino, cuantitativamente, es decir a través de magnitudes
numéricas.
Análisis de Datos
Planteado esto, y en relación con el Análisis de Datos, veremos a continuación, muy brevemente, de qué
hablamos cuando realizamos un Análisis y lo compararemos con otro proceso: la Interpretación de Datos.El
Análisis consiste en separar los elementos básicos de la información que hemos recolectado, para
examinarlos con el propósito de responder a las distintas cuestiones que se plantearon previamente en la
investigación. Implica descomponer la información en principio en términos cuantitativos o cualitativos. Sin
embargo, no termina ahí el asunto. Luego de esto debe realizarse el proceso totalmente contrario al del
Análisis: la Interpretación de los Datos. Consiste en un proceso mental mediante el cual se trata de
encontrar un significado más amplio de la información empírica recabada. Trata de darle sentido
teóricamente. Es decir que la separación que realizamos inicialmente, la vamos a transformar en una
conjunción posterior de la información para brindarle un significado que se ajuste al Marco Teórico que ha
sido la guía de la investigación.
A continuación se procederá a la descripción de los elementos que componen el Análisis de Datos. Veremos
cómo estos se vuelcan primeramente en una Matriz de Datos, que no es otra cosa que un modo de ordenar
los Datos de manera que sea particularmente visible la Estructura Tripartita. Cada fila de la Matriz
corresponde a una Unidad de Análisis, cada columna a una Variable y en cada celda figura el Valor que cada
Unidad asume para cada Variable.
Luego, se mencionarán las diferentes Medidas que estudiaremos para realizar el Análisis de Datos. En
principio, se incluyen las Medidas de Tendencia Central. Estas reducen los Datos crudos a su forma más
manejable: un sólo número o atributo representa toda la información detallada que se reunió acerca de la
Variable. Con una salvedad, no es posible reconstruir los Datos originales a partir sólo de ellas.
Se mencionarán tres medidas: La Moda, la Mediana y la Media. La Moda: indica el caso más frecuente. La
Mediana, el valor central que deja a la mitad de los Datos por arriba de él y a la otra mitad por debajo. La
Media indica el promedio aritmético. Por último, se observará una Medida de Dispersión: El Rango, que
indica la distancia que separa el Valor más grande del más pequeño.
Es el instrumento que alberga la totalidad de los datos que hemos recolectado en nuestra salida a campo y
que fueran recogidos mediante la aplicación de las diferentes técnicas: Entrevistas u Observación.
En la matriz de datos se condensan los correspondientes a cada unidad de análisis y resulta conveniente
presentarlos en forma de tabla o planilla en la que, en columnas, se presentan las variables y en filas, como
dijimos más arriba, cada unidad de análisis.
Los datos contenidos pueden pertenecer a un estudio llevado adelante mediante un método cuantitativo o
cualitativo y, más allá del que se haya seleccionado, se mantiene la idea esencial de albergar los datos que
posteriormente serán analizados. Relacionado con el manejo y las operaciones analíticas de la información
que contienen los datos, el auxilio informático vino a prestar una ayuda inestimable en muchos aspectos de
la vida y la investigación empírica no fue insensible a su influjo. Los antiguos sistemas –por ejemplo,la
operación manual de los instrumentos que contenían la información-fueron reemplazados paulatinamente
por avances tecnológicos cada vez más potentes que beneficiaron a la práctica en varios aspectos, de los
que podemos destacar dos: la velocidad en el procesamiento y la exactitud de los cálculos. Hoy, extensos
trabajos del que participan grandes grupos de investigadores o en los que intervienen inmensas cantidades
de sujetos que aportan información (por ejemplo, los censos de población o las elecciones de autoridades),
podemos acceder a los resultados a pocas horas de habérselos realizado, cuestión esta impensable algunas
décadas atrás.
Reproducimos textualmente las respuestas. Podemos, incluso, consignar gestos, movimientos, etc.
21 1
24 1
46 1
44 2
51 1
Alto 1 14.3%
Medio 4 57.1%
Bajo 2 28.6%
7 casos 100.0 %
Qué nos posibilita? La frecuencia de cada categoría nos indica qué porcentaje tiene ingresos de cada nivel.
Por ejemplo, el 16 % de las personas, percibe un ingreso de entre $ 6001 y $ 8000. La frecuencia acumulada
nos permite observar que el 70 % de estas personas tiene un ingreso de hasta $ 8.000.- o inferior
GRAFICOS
Casos
0
ALTO MEDIO BAJO
El Histograma o Gráfico de columnas/barras representa la cantidad de personas por categoría de NSE. Las
barras guardan proporción entre ellas: la correspondiente a nivel Medio es cuatro veces más alta que la
que representa al nivel Alto
Circular: Cada “porción” o sector representa la cantidad o proporción de casos por categoría
Alto
Medio
Bajo
7. MEDIDAS DE TENDENCIA CENTRAL
Son puntos en una distribución, valores medios o centrales y se refiere al lugar donde se centra una
distribución en la escala de valores. El concepto que las identifica más corrientemente, de tendencia
central, permite darnos la idea de que los valores que representan, correspondientes a una
distribución determinada (conjunto de sujetos –personas- u objetos inanimados) se encuentran
alrededor suyo. Sin profundizar demasiado, podríamos decir que representan la normalidad de ese
conjunto, constituyendo excepciones aquellas unidades que más se alejan. Este tipo de recursos o
herramientas se utilizan en investigaciones de tipo cuantitativas y son aplicables, según el caso, a
variables cuantitativas o cualitativas.
Moda: Es el valor (Categoría, Clase) que se presenta u ocurre con mayor frecuencia. Se puede obtener
para cualquier variable
Mediana: Es el valor que divide a la distribución por la mitad, dejando tantos valores por encima como
por debajo. Se obtiene para variables medidas con escalas intervalares u ordinales
Media: Es el promedio aritmético de una distribución. Se trata, simplemente, de la suma de todas las
puntuaciones divididas por el número de casos. Se calcula en variables medidas con escalas
intervalares.
Categorías Frecuencia
20 1
21 1 Moda
24 1
36 1
44 2
51 1
Categorías Frecuencia
Alto 1 Moda
Medio 4
Bajo 2
MEDIANA
La Mediana, como vimos, es el valor que divide a la distribución en dos partes iguales, dejando
tantos valores por encima de ella como por debajo.
La ubicación de la Mediana responde a un sencillo cálculo; Una vez ordenados los valores (de menor
a mayor o viceversa), ubicamos el valor central mediante la aplicación de la fórmula N+1
2
En nuestro ejemplo (para cualquiera de las variables), dado que tenemos 7 casos (N), el valor central será 4,
ya que 7+1/2=4
Si tuviésemos una distribución con un número par de casos, la Mediana será el promedio entre los valores
centrales
Cálculo de la Media (o Promedio) para una tabla de frecuencias con varios casos por categoría
Variable: Edad
Categorías Frecuencia
20 3
21 4
24 2
36 3
44 1
51 2
Total: 15
La operatoria consiste en sumar las edades de cada una de las observaciones (unidades de análisis, en
nuestro caso) y dividirlo por la cantidad que representan. Para nuestro ejemplo, sería:
20+20+20+21+21+21+21+24+24+36+36+36+44+51+51=446 = 29.7
15 15
Categoría X Frecuencia
20 X 3= 60
21 X 4= 84
24 X 2= 48
36 X 3= 108
44 X 1= 44
51 X 2= 102
Total: 15 446
Estas medidas nos indican la dispersión de los datos en la escala y permiten conocer la homogeneidad
o heterogeneidad de una distribución determinada. Se complementan perfectamente con las medidas
de tendencia central ya que proveen lo que ellas no nos brindan. Vemos el ejemplo de estos dos
grupos de personas, de las que se consigna su edad:
Media Mediana
Grupo A: 21 – 22 – 22 – 22 – 22 – 22 – 23
Media Mediana
Grupo B: 19 – 20 – 21 - 22 – 23 – 24 - 25
Como podemos apreciar, en ambos grupos coinciden dos medidas de tendencia central: tanto Media
como Mediana, resultan ser 22. Pero ¿Son iguales?
RANGO o RECORRIDO
El Rango es la diferencia entre el valor mayor y el valor menor de una distribución.
Grupo B: 19 – 20 – 21 – 22 – 23 – 24 – 25
Rango= 25-19= 6
Como vemos, la diferencia de valor nos indica que se trata de dos distribuciones diferentes y, a
priori, podemos estimar una mayor homogeneidad en la primera que en la segunda, ya que todos
los valores se ubican en un Rango 2
DESVIACION MEDIA
Grupo A: 21 – 22 – 22 – 22 – 22 – 22 – 23
Desviación Media: 0,577
Grupo B: 19 – 20 – 21 – 22 – 23 – 24 – 25
Desviación Media: 2,160
Si bien no nos adentraremos en el desarrollo del cálculo (sencillo, por otra parte), la diferencia de
valores nos permiten corroborar la mayor homogeneidad del Grupo A