Archivo 15 CV - Procesamiento y Análisis de Datos

PROCESAMIENTO Y ANALISIS DE DATOS
Ricardo Machado – Alberto Levy Martínez
INTRODUCCIÓN.
El Dato
Luego de la utilización de las Técnicas de Recolección de Datos, vamos a tratar a continuación el

Procesamiento y Análisis de Datos. Para esto vamos a partir brevemente de la Noción de Dato. Como decía
un viejo filósofo que aún está vigente en el siglo XXI, si la ciencia pudiera observarse a simple vista, la
ciencia misma no haría falta. Esto significa por un lado, que la ciencia constituye un proceso de adquisición
de conocimiento que requiere un esfuerzo humano y por otra parte, como complemento de lo anterior,
indica que el proceso científico no es otra cosa que una construcción humana. Esto trae como conclusión
que a pesar de su origen etimológico (datum: lo dado), el Dato no surge de la contemplación del universo
per sé, sino que los seres humanos construimos el Dato. No de manera arbitraria, sino a través de
sofisticados procesos de interrelación de elementos.Veamos cuáles:
Podemos aquí dar cuenta de cuatro características que hacen a su contenido, para luego mencionar la
Estructura que compone su forma. Dentro de lo que llamamos el contenido, tenemos que indicar que un
Dato implica una información que es extraída de la realidad. Como se mencionó, no se trata de una
invención sino de un producto de la acción humana. Por otro lado, el Dato debe tener la capacidad de
poder ser registrado en algún tipo de soporte, que puede ser tanto físico como simbólico. Otra de las
características importantes es que un Dato implica una elaboración conceptual, fruto de un cuerpo teórico
que lo sustente y le brinde sus límites. Por último, debe considerarse que este necesita ser expresado a
través de alguna forma de lenguaje (numérica o no numérica).
Pasemos ahora a conocer la forma que adquiere el Dato. Investigaciones realizadas por el sociólogo y
matemático noruego Johan Galtung indican que su forma más acertada requiere considerar una
“Estructura Tripartita”. Esta se compone por una Unidad de Análisis, que en una Variable, asumirá un
determinado Valor. Para Galtung, lo que constituye el Dato, son estos tres elementos considerados en
forma conjunta a través de las relaciones que mantienen entre sí.
Las Unidades de Análisis son los elementos menores y no divisibles que componen el universo de estudio
de una investigación. Se trata de sujetos individuales, productos de la acción humana, tanto material
(instituciones, empresas, etc.) como inmaterial (valores, normas), y grupos sociales. Las Variables hacen
referencia a los aspectos de un fenómeno, las cuales poseen la propiedad de asumir diferentes valores,
siendo estas Variables, en definitiva, lo que vamos a medir. Los Valores son las diferentes posiciones o
alternativas que presenta la Variable. Se pueden expresar cualitativamente a través de una clasificación por
ausencia o presencia, jerarquía u orden, o sino, cuantitativamente, es decir a través de magnitudes
numéricas.
Análisis de Datos
Planteado esto, y en relación con el Análisis de Datos, veremos a continuación, muy brevemente, de qué
hablamos cuando realizamos un Análisis y lo compararemos con otro proceso: la Interpretación de Datos.El
Análisis consiste en separar los elementos básicos de la información que hemos recolectado, para
examinarlos con el propósito de responder a las distintas cuestiones que se plantearon previamente en la
investigación. Implica descomponer la información en principio en términos cuantitativos o cualitativos. Sin
embargo, no termina ahí el asunto. Luego de esto debe realizarse el proceso totalmente contrario al del
Análisis: la Interpretación de los Datos. Consiste en un proceso mental mediante el cual se trata de
encontrar un significado más amplio de la información empírica recabada. Trata de darle sentido
teóricamente. Es decir que la separación que realizamos inicialmente, la vamos a transformar en una
conjunción posterior de la información para brindarle un significado que se ajuste al Marco Teórico que ha
sido la guía de la investigación.
A continuación se procederá a la descripción de los elementos que componen el Análisis de Datos. Veremos
cómo estos se vuelcan primeramente en una Matriz de Datos, que no es otra cosa que un modo de ordenar
los Datos de manera que sea particularmente visible la Estructura Tripartita. Cada fila de la Matriz
corresponde a una Unidad de Análisis, cada columna a una Variable y en cada celda figura el Valor que cada
Unidad asume para cada Variable.
Luego, se mencionarán las diferentes Medidas que estudiaremos para realizar el Análisis de Datos. En
principio, se incluyen las Medidas de Tendencia Central. Estas reducen los Datos crudos a su forma más
manejable: un sólo número o atributo representa toda la información detallada que se reunió acerca de la
Variable. Con una salvedad, no es posible reconstruir los Datos originales a partir sólo de ellas.
Se mencionarán tres medidas: La Moda, la Mediana y la Media. La Moda: indica el caso más frecuente. La
Mediana, el valor central que deja a la mitad de los Datos por arriba de él y a la otra mitad por debajo. La
Media indica el promedio aritmético. Por último, se observará una Medida de Dispersión: El Rango, que
indica la distancia que separa el Valor más grande del más pequeño.
1. EL ANALISIS DE LOS DATOS
Matriz de datos – Base de datos
Es el instrumento que alberga la totalidad de los datos que hemos recolectado en nuestra salida a campo y
que fueran recogidos mediante la aplicación de las diferentes técnicas: Entrevistas u Observación.
En la matriz de datos se condensan los correspondientes a cada unidad de análisis y resulta conveniente
presentarlos en forma de tabla o planilla en la que, en columnas, se presentan las variables y en filas, como
dijimos más arriba, cada unidad de análisis.
Los datos contenidos pueden pertenecer a un estudio llevado adelante mediante un método cuantitativo o
cualitativo y, más allá del que se haya seleccionado, se mantiene la idea esencial de albergar los datos que
posteriormente serán analizados. Relacionado con el manejo y las operaciones analíticas de la información
que contienen los datos, el auxilio informático vino a prestar una ayuda inestimable en muchos aspectos de
la vida y la investigación empírica no fue insensible a su influjo. Los antiguos sistemas –por ejemplo,la
operación manual de los instrumentos que contenían la información-fueron reemplazados paulatinamente
por avances tecnológicos cada vez más potentes que beneficiaron a la práctica en varios aspectos, de los
que podemos destacar dos: la velocidad en el procesamiento y la exactitud de los cálculos. Hoy, extensos
trabajos del que participan grandes grupos de investigadores o en los que intervienen inmensas cantidades
de sujetos que aportan información (por ejemplo, los censos de población o las elecciones de autoridades),
podemos acceder a los resultados a pocas horas de habérselos realizado, cuestión esta impensable algunas
décadas atrás.
El procesamiento de la información, el uso de herramientas útiles para el análisis de los datos y

presentación de los resultados de un estudio cualquiera, cuentan con un auxilio que, sin embargo, no obra
en forma autónoma. Las poderosas máquinas son capaces de actuar con velocidad y eficiencia, pero no
pueden competir en creatividad, necesidad o sensibilidad porque no las poseen. Esto está reservado a
mujeres y hombres que deciden qué investigar, por qué, cuándo y para qué. Es decir, todo aquello que los
convierte en indispensables.
2. LA MATRIZ DE DATOS (METODO CUALITATIVO)
Nombre Facilidades Dificultades El afuera

( Unidad de
Análisis)
Javier El taller de Braille me Un día me llevaban y dos

ayudó a ayudar a otros, no. La Requisa decía que
porque hay mucha gente no tenían gente. Y eso te
que no puede tener un hace largar todo
libro en Braille
Silvia El destino me trajo… El Yo creo que se me abre una

destino me tenía esperanza. Yo hablo con mi
preparado este mágico mamá y ella me lo dice
lugar (Sonríe)
Alexandra Yo al principio iba Y qué voy a hacer… de

seguido a Educación… nuevo lo mismo. Si no me
pero después, con el queda nada ni nadie.
juicio, me “bajoneé” y (Gesto de desaliento:
dejé. revolea su mano por sobre
la cabeza)
Reproducimos textualmente las respuestas. Podemos, incluso, consignar gestos, movimientos, etc.
3. LA MATRIZ DE DATOS (METODO CUANTITATIVO)
Nombre Edad Ocupación NSE

(Unidad de
Análisis)
Maximiliano 21 Estudiante (1) Medio (2)
Romina 20 Estudiante (1) Medio (2)
Elena 51 Docente (3) Medio (2)
Ernesto 44 Empleado (2) Bajo (3)
María Julia 36 Odontóloga (4) Alto (1)
Osvaldo 44 Docente (3) Medio (2)
Hugo 24 Estudiante (1) Bajo (3)

Los números entre paréntesis nos muestran la codificación de las categorías.
Así, para la variable Ocupación, N°1 será Estudiante; N°2 Empleada/o y así sucesivamente.
Para Nivel Socioeconómico: N°1 Alto; N°2 Medio; N°3 Bajo
4. ESTADISTICA DESCRIPTIVA PARA CADA VARIABLE
DISTRIBUCION DE FRECUENCIAS
 Nos permite verificar el “comportamiento” de cada variable, a través de la cantidad de casos

encuadrados en cada categoría.
 En este caso, observemos la correspondiente a la variable “Edad”
21 1
24 1
46 1
44 2
51 1
La columna de la izquierda presenta las categorías de la variable (edad de cada uno)

En la de la derecha, se consigna la cantidad de casos.
La categoría 44 presenta la frecuencia 2, que corresponde a Osvaldo y Ernesto

DISTRIBUCION DE FRECUENCIAS
 Además de las frecuencias absolutas (cantidad de observaciones por categoría), podemos presentar
las frecuencias relativas (porcentuales).
 Observemos, en el ejemplo, la variable NSE (Nivel Socioeconómico)
Alto 1 14.3%
Medio 4 57.1%
Bajo 2 28.6%
7 casos 100.0 %
La columna Frecuencia Absoluta muestra la cantidad de casos.

La columna Frecuencia Relativa, presenta el porcentaje del total de casos ubicado en cada categoría
En la última fila observamos el total de casos (7) y el porcentaje que representa (100%)
DISTRIBUCION DE FRECUENCIAS ACUMULADAS

En el siguiente ejemplo construiremos una tabla de distribución de frecuencias acumuladas, tanto
Absolutas como Relativas. Esta operación se realiza para la construcción de distribuciones de frecuencia
para variables medidas a nivel Ordinal o Intervalar; es decir, para aquellas variables que posibilitan ordenar
su categorías o valores en forma jerárquica (de mayor a menor o de menor a mayor). La operatoria es
sencilla y consiste en ir sumando frecuencias a medida que “avanzamos” de una categoría a la otra. El
resultado posibilita visualizar el “hasta acá”, es decir, cuántos casos –o qué porcentaje del total- se
encuentra incluido hasta cada una de las categorías. Resulta de utilidad, además, para el cálculo de la
Mediana, lo que veremos más adelante.
Variable: Ingresos FRECUENCIAS

Categorías Absoluta Relativa AcumuladaAbsol. AcumuladaRelat.
Hasta 2000 40 16.0 % 40 16.0 %
2001 – 4000 50 20.0 % 90 36.0 %
4001 -6000 45 18.0 % 135 54.0 %
6001 – 8000 40 16.0 % 175 70.0 %
8001 – 10000 35 14.0 % 210 84.0 %
10001 – 12000 30 12.0 % 240 96.0 %
Más de 12000 10 4.0 % 250 100 %
250 casos 100 %
Qué nos posibilita? La frecuencia de cada categoría nos indica qué porcentaje tiene ingresos de cada nivel.
Por ejemplo, el 16 % de las personas, percibe un ingreso de entre $ 6001 y $ 8000. La frecuencia acumulada
nos permite observar que el 70 % de estas personas tiene un ingreso de hasta $ 8.000.- o inferior
GRAFICOS
Casos
0
ALTO MEDIO BAJO
El Histograma o Gráfico de columnas/barras representa la cantidad de personas por categoría de NSE. Las
barras guardan proporción entre ellas: la correspondiente a nivel Medio es cuatro veces más alta que la
que representa al nivel Alto
Circular: Cada “porción” o sector representa la cantidad o proporción de casos por categoría
Alto
Medio
Bajo
7. MEDIDAS DE TENDENCIA CENTRAL
 Son puntos en una distribución, valores medios o centrales y se refiere al lugar donde se centra una
distribución en la escala de valores. El concepto que las identifica más corrientemente, de tendencia
central, permite darnos la idea de que los valores que representan, correspondientes a una
distribución determinada (conjunto de sujetos –personas- u objetos inanimados) se encuentran
alrededor suyo. Sin profundizar demasiado, podríamos decir que representan la normalidad de ese
conjunto, constituyendo excepciones aquellas unidades que más se alejan. Este tipo de recursos o
herramientas se utilizan en investigaciones de tipo cuantitativas y son aplicables, según el caso, a
variables cuantitativas o cualitativas.
 Moda: Es el valor (Categoría, Clase) que se presenta u ocurre con mayor frecuencia. Se puede obtener
para cualquier variable
 Mediana: Es el valor que divide a la distribución por la mitad, dejando tantos valores por encima como
por debajo. Se obtiene para variables medidas con escalas intervalares u ordinales
 Media: Es el promedio aritmético de una distribución. Se trata, simplemente, de la suma de todas las
puntuaciones divididas por el número de casos. Se calcula en variables medidas con escalas
intervalares.
MODA: Variable medida a nivel Interval

Variable: Edad
Categorías Frecuencia
20 1
21 1 Moda
24 1
36 1
44 2
51 1
MODA: Variable medida a nivel Ordinal

Variable: Nivel socioeconómico
Alto 1 Moda
Medio 4
Bajo 2
MODA: Variable medida a nivel Nominal

Variable: Ocupación
Estudiante 3
Empleada/o 1
Docente 2 Moda
Odontólogo 1
MEDIANA
 La Mediana, como vimos, es el valor que divide a la distribución en dos partes iguales, dejando
tantos valores por encima de ella como por debajo.
 La ubicación de la Mediana responde a un sencillo cálculo; Una vez ordenados los valores (de menor
a mayor o viceversa), ubicamos el valor central mediante la aplicación de la fórmula N+1
2
En nuestro ejemplo (para cualquiera de las variables), dado que tenemos 7 casos (N), el valor central será 4,
ya que 7+1/2=4
Si tuviésemos una distribución con un número par de casos, la Mediana será el promedio entre los valores
centrales
Variable: Edad (Interval)
Categorías N° de observación (caso)

20 1
21 2 Mediana para una distribución de cantidad impar
24 3
36 4
44 5
44 6 Mediana para una distribución de cantidad par
51 7
55 8
Variable: Nivel socioeconómico (Ordinal)
Categorías N° de observación (caso)

Alto 1
Medio 2 Mediana para una distribución de cantidad impar
Medio 3
Medio 4
Medio 5 Mediana para una distribución de cantidad par
Bajo 6
Bajo 7
Bajo 8
MEDIA
 Es el promedio de la distribución y surge de la suma de todos los valores, dividida por el total de
casos. En el ejemplo de la variable Edad, entonces, queda así:
20+21+24+36+44+44+51 (Categorías) = 34,3

7 (Cantidad de observaciones o casos)
 Cálculo de la Media (o Promedio) para una tabla de frecuencias con varios casos por categoría
Variable: Edad
20 3
21 4
24 2
36 3
44 1
51 2
Total: 15
La operatoria consiste en sumar las edades de cada una de las observaciones (unidades de análisis, en
nuestro caso) y dividirlo por la cantidad que representan. Para nuestro ejemplo, sería:
20+20+20+21+21+21+21+24+24+36+36+36+44+51+51=446 = 29.7
15 15
Simplificando, podemos hacerlo de esta manera:
Categoría X Frecuencia
20 X 3= 60
21 X 4= 84
24 X 2= 48
36 X 3= 108
44 X 1= 44
51 X 2= 102
Total: 15 446
Para obtener el resultado:446 / 15: 29.7

MEDIDAS DE DISPERSION:
 Estas medidas nos indican la dispersión de los datos en la escala y permiten conocer la homogeneidad
o heterogeneidad de una distribución determinada. Se complementan perfectamente con las medidas
de tendencia central ya que proveen lo que ellas no nos brindan. Vemos el ejemplo de estos dos
grupos de personas, de las que se consigna su edad:
Media Mediana
Grupo A: 21 – 22 – 22 – 22 – 22 – 22 – 23
Media Mediana
Grupo B: 19 – 20 – 21 - 22 – 23 – 24 - 25
Como podemos apreciar, en ambos grupos coinciden dos medidas de tendencia central: tanto Media
como Mediana, resultan ser 22. Pero ¿Son iguales?
RANGO o RECORRIDO
 El Rango es la diferencia entre el valor mayor y el valor menor de una distribución.
 Observemos nuestro ejemplo:

Grupo A: 21 – 22 – 22 – 22 – 22 – 22 – 23
Rango= 23-21= 2
 Grupo B: 19 – 20 – 21 – 22 – 23 – 24 – 25
Rango= 25-19= 6
Como vemos, la diferencia de valor nos indica que se trata de dos distribuciones diferentes y, a
priori, podemos estimar una mayor homogeneidad en la primera que en la segunda, ya que todos
los valores se ubican en un Rango 2
DESVIACION MEDIA
 Es el promedio de desviación respecto del valor medio o Media.

Observemos en nuestros ejemplos:
Grupo A: 21 – 22 – 22 – 22 – 22 – 22 – 23
Desviación Media: 0,577
Grupo B: 19 – 20 – 21 – 22 – 23 – 24 – 25
Desviación Media: 2,160
Si bien no nos adentraremos en el desarrollo del cálculo (sencillo, por otra parte), la diferencia de
valores nos permiten corroborar la mayor homogeneidad del Grupo A

Archivo 15 CV - Procesamiento y Análisis de Datos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Archivo 15 CV - Procesamiento y Análisis de Datos

Cargado por

Copyright:

Formatos disponibles

PROCESAMIENTO Y ANALISIS DE DATOS

Ricardo Machado – Alberto Levy Martínez

Luego de la utilización de las Técnicas de Recolección de Datos, vamos a tratar a continuación el

1. EL ANALISIS DE LOS DATOS

Matriz de datos – Base de datos

El procesamiento de la información, el uso de herramientas útiles para el análisis de los datos y

2. LA MATRIZ DE DATOS (METODO CUALITATIVO)

Nombre Facilidades Dificultades El afuera

Javier El taller de Braille me Un día me llevaban y dos

Silvia El destino me trajo… El Yo creo que se me abre una

Alexandra Yo al principio iba Y qué voy a hacer… de

3. LA MATRIZ DE DATOS (METODO CUANTITATIVO)

Nombre Edad Ocupación NSE

Maximiliano 21 Estudiante (1) Medio (2)

Romina 20 Estudiante (1) Medio (2)

Elena 51 Docente (3) Medio (2)

Ernesto 44 Empleado (2) Bajo (3)

María Julia 36 Odontóloga (4) Alto (1)

Osvaldo 44 Docente (3) Medio (2)

Hugo 24 Estudiante (1) Bajo (3)

 Nos permite verificar el “comportamiento” de cada variable, a través de la cantidad de casos

La columna de la izquierda presenta las categorías de la variable (edad de cada uno)

5. ESTADISTICA DESCRIPTIVA PARA CADA VARIABLE

La columna Frecuencia Absoluta muestra la cantidad de casos.

DISTRIBUCION DE FRECUENCIAS ACUMULADAS

Variable: Ingresos FRECUENCIAS

6. ESTADISTICA DESCRIPTIVA PARA CADA VARIABLE

MODA: Variable medida a nivel Interval

MODA: Variable medida a nivel Ordinal

MODA: Variable medida a nivel Nominal

Variable: Edad (Interval)

Categorías N° de observación (caso)

Variable: Nivel socioeconómico (Ordinal)

Categorías N° de observación (caso)

20+21+24+36+44+44+51 (Categorías) = 34,3

Simplificando, podemos hacerlo de esta manera:

Para obtener el resultado:446 / 15: 29.7

 Observemos nuestro ejemplo:

 Es el promedio de desviación respecto del valor medio o Media.

También podría gustarte