Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tratamiento o Procesamiento de Los Datos
Tratamiento o Procesamiento de Los Datos
CONCEPTO.
Los datos en forma aislada no tienen ningn significado. Previamente, necesitan ser procesados para su
posterior anlisis e interpretacin. El procesamiento de datos es el conjunto de actividades que nos
permiten ordenar, clasificar, codificar, tabular y presentar los dato recogidos mediante tablas y grficas, con el
objeto de analizarlos e interpretarlos adecuadamente.
PASOS.
Para el procesamiento de los datos se siguen los siguientes pasos:
A.
a.
Determinar si se han recibido todos los formularios u hojas de registro, o cuando menos, en una
proporcin que no invalide las conclusiones que se puedan hacer.
b.
c.
d.
La revisin de los datos constituye lo que se ha dado en llamar el control de calidad de los datos, ya
que en gran parte, la calidad de los resultados depende de la calidad de los datos recogidos.
Todo investigador desea recibir la totalidad de los formularios con los datos requeridos y que estn
acordes con la realidad; pero tambin es fcil imaginar que por diversas causas, pueden haber serias
deficiencias. Sin embargo, algo puede hacerse para evitar o reducir al mnimo este margen de error si se
conocen de antemano cules son estas causas.
Entre las causas del envo incompleto de formularios deben mencionarse: formularios demasiados
extensos, insuficiente sensibilizacin del informante, carencia de instrucciones claras, inadecuada asignacin
de funciones, irresponsabilidades o bajo nivel de instruccin del informante, remuneracin insuficiente, falta
de autoridad ejecutiva o moral de los responsables de la investigacin y dotacin insuficiente o inoportuna de
los formularios o de los elementos para realizar las mediciones u observaciones.
Algunas de las medidas que podran tomarse antes de la captacin misma de los datos podran ser: que
los formularios tengan una extensin moderada, de acuerdo al nmero de datos necesarios para cumplir con
los objetivos del trabajo de investigacin o para verificar la o las hiptesis formuladas; que se realice una
propaganda adecuada no slo de qu se va a investigar, sino tambin para qu, probar la comprensin de las
instrucciones con personas tan semejantes a las que sern dirigidas; comunicar por los conductos adecuados a
cada uno de los participantes lo que se espera de ellos y el momento que deban cumplir su parte; seleccin
apropiada del personal, y para protegerse del bajo nivel de instruccin de los elementos en estudio, slo nos
queda formular las preguntas de acuerdo a su nivel y empleando un lenguaje apropiado; realizar la captacin
de los datos utilizando los recursos de personal o equipos adecuados, y finalmente, procurar que la amplitud y
1
profundidad de la investigacin no rebase la capacidad econmica de sus realizadores, para que el personal
participante responda a lo que pudiera ser una remuneracin justa.
El llenado incompleto de los formularios puede obedecer a un formulario mal diseado, que no tenga
considerada la posibilidad de que algunas preguntas no resulten aplicables o comprensibles a todos los
miembros de la comunidad estudiada; puede deberse tambin a negligencia de la persona que haga las
preguntas, ya que puede haber omitido hacer alguna o habindola hecho, no haber registrado la respuesta; otra
posibilidad es que el informante se haya negado a contestar la pregunta correspondiente; en este caso se debe
anotar esta posibilidad.
Los problemas mencionados podran ser controlados mediante la prueba de campo del formulario, la
seleccin y adiestramiento apropiado del personal, y la adecuada motivacin del personal e informantes. Sin
embargo, a pesar de estas medidas, siempre hay la posibilidad de que persistan preguntas sin la debida
respuesta.
La falta de legibilidad en el llenado de los formularios puede deberse a la premura en el llenado de los
mismos, utilizar lapiceros de mala calidad, condiciones ambientales inadecuadas para la recoleccin de los
datos (por ejemplo: lluvia), sobre todo cuando se realiza un trabajo de campo
La solucin de estos problemas podra ser un mayor cuidado en el momento de escribir las respuestas,
utilizar lapiceros de buena calidad y proteger los formularios de factores ambientales adversos.
Las incongruencias en las respuestas obtenidas se refieren a lecturas de instrumentos, caractersticas
medidas por el personal o respuestas proporcionadas por los informante cuya ocurrencia es imposible o
queden fuera de los valores considerados como posibles o bastante probables. Por ejemplo: neonato de 8,000
gramos, nio de 5 aos con instruccin superior, hombre con el diagnstico de cncer crvicouterino, etc.
Como algunas de estas respuestas pueden ser correctas, conviene investigarlas.
Las causas de tales incongruencias pueden ser aparatos defectuosos, personal no calificado o
irresponsable, preguntas confusas, formularios extensos que provocan fatiga, informantes poco motivados que
dan como respuesta lo que primero que se les ocurre para salir del paso, o demasiados complacientes, pues
piensan que negar o afirmar determinada cosa va a ser recibido con beneplcito por el investigador.
Las soluciones de estos problemas son obvias: utilizar aparatos
condiciones, capacitar al personal, motivar a los informantes, etc.
B.
La clasificacin consiste en agrupar los datos en categoras o clases de acuerdo a ciertos criterios
preestablecidos o escalas.
Todo sistema de clasificacin debe ser:
a.
Exhaustiva: esto significa que debe permitir la clasificacin de cualquier individuo u objeto que se estudia.
Un sistema de clasificacin que dividiera las personas de acuerdo a la raza en slo tres categoras: raza
blanca, negra y amarilla sera incompleta, ya que no permitira la inclusin de las personas de raza
americana o cobriza.
b.
Mutuamente excluyentes: Las clases, categoras o subdivisiones de que consta un sistema de clasificacin
deben ser mutuamente excluyentes; esto quiere decir que no debe haber ninguna duda sobre en qu
grupo se debe inclur a cada uno de las unidades de estudio. Por ejemplo, tenemos un sistema de
clasificacin de las personas de acuerdo a su edad:
Escala incorrecta: 0-5, 5-10, 10-15, 15-20, etc.
Escala correcta: 0-4, 5 - 9, 10-14, 15-19, etc.
FECHA
HORA
SEXO
PESO
TALLA
PC
EG
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
01-04-99
00:05
00:55
01:15
02:16
02:50
03:40
03:45
03:48
04:00
04:11
04:30
04:58
05:08
05:35
05:48
06:10
06:46
07:25
08:38
08:42
F
M
M
F
M
M
F
F
M
M
M
M
F
M
M
M
M
M
M
M
3440
3620
3340
3300
3210
3100
3060
3220
3250
3800
3680
3780
3230
3580
3090
3900
3290
3470
3690
3240
51.0
52.0
51.0
49.0
50.0
49.0
49.0
50.0
50.0
49.0
51.0
51.0
48.0
52.0
49.0
49.0
50.0
49.0
52.0
50.0
34.0
37.0
34.0
34.0
35.0
34.0
33.0
34.0
34.0
35.0
35.0
35.0
33.5
34.0
33.0
35.5
33.0
35.0
34.0
35.0
39
40
40
40
39
38
38
39
41
40
39
39
40
41
40
38
39
39
40
40
PC
EG
Permetro ceflico
Edad gestacional
No. DE CATEGORIAS
CATEGORIAS
SEXO
MASCULINO
FEMENINO
PESO
10
Menos de 1,000 g
1,000 - 1,499 g
1,500 - 1,999 g
2,000 - 2,499 g
2,500 - 2,999 g
3,000 - 3,499 g
APGAR
AL
NACER
9
8
9
9
9
9
9
9
9
9
9
8
9
9
9
9
9
9
8
9
VARIABLES
No. DE CATEGORIAS
CATEGORIAS
3,500 - 3,999 g
4,000 - 4,499 g
4,500 4,999 g
5,000 ms g
C.
TALLA
10
Menos de 30 cm
30-32 cm
33-35 cm
36-38 cm
39-41 cm
42-44 cm
45-47 cm
48-50 cm
51-54 cm
54 ms cm
PERIMETRO
CEFALICO
Menos de 28 cm
28-29 cm
30-31 cm
32-33 cm
34-35 cm
36 ms cm
EDAD GESTACIONAL
Menos de 37 semanas
37 - 41 semanas
42 ms semanas
PUNTAJE APGAR
AL NACER
0 - 3
4 - 6
7 - 10
Codificacin.
Es la asignacin de smbolos numricos, literales o una mezcla de ambos a cada de las categoras o
clases. As por ejemplo, si tenemos la variable sexo y la clasificamos en dos categoras: hombre y mujer, le
asignaremos lo cdigos 1 H para el hombre y 2 M para la mujer. A continuacin presentamos los cdigos
asignados a las categoras de las dems variables:
VARIABLES
CATEGORIAS
CODIGOS
SEXO
MASCULINO
FEMENINO
1
2
PESO
Menos de 1,000 g
1,000 - 1,499 g
1,500 - 1,999 g
2,000 - 2,499 g
2,500 - 2,999 g
3,000 - 3,499 g
3,500 - 3,999 g
4,000 - 4,499 g
4,500 4,999 g
5,000 ms
1
2
3
4
5
6
7
8
9
10
VARIABLES
CATEGORIAS
CODIGOS
Menos de 30 cm
30-32 cm
33-35 cm
36-38 cm
39-41 cm
42-44 cm
45-47 cm
48-50 cm
51-54 cm
54 ms cm
1
2
3
4
5
6
7
8
9
10
Menos de 28 cm
28-29 cm
30-31 cm
32-33 cm
34-35 cm
36 ms cm
1
2
3
4
5
6
EDAD GESTACIONAL
Menos de 37 semanas
37 - 41 semanas
42 ms semanas
1
2
3
PUNTAJE APGAR AL
NACER
0 - 3
4 - 6
7 - 10
1
2
3
TALLA
PERIMETRO CEFALICO
Cuando algunos recin nacidos no tienen datos, se puede agregar una categora ms: sin datos y se le
asigna el cdigo numrico del nmero siguiente.
En el proceso de codificacin es necesario elaborar un manual de codificacin para que todo el
personal codifique las categoras con los mismos smbolos.
D.
Consiste en determinar el nmero de casos que corresponde a cada categora o clase. As, por ejemplo,
determinar cuntos son hombres y mujeres, cuntos son sanos y enfermos, etc.
Para realizar el recuento de los datos existen diversas tcnicas:
a.
Tcnicas manuales.
Son tcnicas que no requieren el uso de equipos especiales; slo se utiliza lpiz y papel.
El recuento manual puede realizarse de las siguientes formas:
Recuento directo:
Cuando la misma hoja o documento de registro se utiliza para efectuar el recuento. As, por
ejemplo, ya hemos mencionado anteriormente que en el Departamento de Neonatologa del
Instituto Materno Perinatal existe un libro donde se registra el nacimiento de todos los recin
nacidos, anotndose los datos referentes a la fecha y hora de nacimiento, sexo, peso, talla, edad
gestacional, puntaje Apgar al nacer, diagnstico, etc.; si se quiere saber cuntos recin nacidos
son de sexo masculino, se utiliza directamente el libro de registro para efectuar el recuento
correspondiente.
Al realizar el recuento directo de los recin nacidos de sexo masculino, encontramos que
hay 15 neonatos.
b.
Se recorren los valores de los pesos de los recin nacidos y se marca con un palote a la
derecha del intervalo en el cual queda comprendido cada valor. Se cruzan los palotes
cada quinta observacin.
c.
Se hace el recuento de palotes en cada intervalo y se anotan los resultados, tal como se
muestra a continuacin con el ejemplo citado:
Grupos de peso en gramos
Menos de 1,000
1,000 - 1,499
1,500 - 1,999
2,000 - 2,499
2,500 - 2,999
3,000 - 3,499
3,500 - 3,999
4,000 - 4,499
4,500 ms
Total
Paloteo
Recuento
13
7
20
Esta tcnica se puede utilizar cuando se quiere cruzar variables: por ejemplo, grupos de peso
por sexo. Sin embargo, cuando se trata de cruzar ms de 2 variables, hay muchas probabilidades
de cometer errores.; en estos casos, se recomienda utilizar otras tcnicas.
Para el recuento de los recin nacidos segn grupos de peso y sexo se siguen los siguientes
pasos:
a.
Se elabora una tabla matriz con los intervalos de los pesos correspondientes y las
categoras de la variable sexo .
b.
c.
Se hace el recuento de los palotes de cada casillero y se anotan los resultados, tal como
se muestra a continuacin:
Grupos de peso en
gramos
Menor de 1,000
1,000 1,499
1,500 1,999
2,000 2,499
2,500 2,999
3,000 3,499
3,500 3,999
4,000 4,499
4,500 ms
Total
Sexo
Masculino
llll lll
llll ll
=
=
Total
Femenino
8
7
llll
15
= 5
13
7
20
SEXO
TALLA
PESO
DATOS DE FILIACION
PERIMETRO
CEFALICO
EDAD
GESTACIONAL
PUNTAJE APGAR
AL NACER
Los cdigos asignados a los datos de las variables de los recin nacidos son:
VARIABLES
SEXO
PESO
TALLA
CATEGORIAS
MASCULINO
FEMENINO
Menos de 1,000 g
1,000 - 1,499 g
1,500 - 1,999 g
2,000 - 2,499 g
2,500 - 2,999 g
3,000 - 3,499 g
3,500 - 3,999 g
4,000 - 4,499 g
4,500 4,999 g
5,000 ms
CODIGOS
1
2
1
2
3
4
5
6
7
8
9
10
Menos de 30
30-32 cm
33-35 cm
36-38 cm
39-41 cm
42-44 cm
45-47 cm
48-50 cm
51-54 cm
54 ms
1
2
3
4
5
6
7
8
9
10
Menos de 28 cm
28-29 cm
30-31cm
32-33cm
34-35 cm
36 ms cm
1
2
3
4
5
6
EDAD GESTACIONAL
Menos de 37 semanas
37 - 41 semanas
42 ms semanas
1
2
3
PUNTAJE APGAR AL
NACER
0 - 3
4 - 6
7 - 10
1
2
3
PERIMETRO CEFALICO
En nuestro ejemplo, para el primer caso se llenara la tarjeta de la siguiente forma (Ver
figura en pgina siguiente):
Sexo: por ser de sexo femenino se le asigna el cdigo 2.
Talla: la talla (51 cm) se halla dentro del intervalo 51-54 cm y se le asigna el cdigo 9.
Peso: el peso del recin nacido (3,440 g ) se halla dentro del intervalo 3,000 3,499 g
por lo que se le asigna el cdigo 6
Permetro ceflico: Es de 34 cm y se halla dentro del intervalo 34-35 cm, por lo que se
le asigna el cdigo 5.
Edad gestacional: es de 39 semanas y se halla dentro del intervalo 37-41 semanas, por lo
que se le asigna el cdigo 2.
Puntaje Apgar: es de 9 y se halla dentro del intervalo 7-10, asignndosele el cdigo 3.
b. Se procede de igual forma para los dems recin nacidos.
c. Una vez que se han llenados todas las tarjetas, se clasifican cada una de ellas de acuerdo a
las variables correspondientes, formando grupos de tarjetas.
d. Se procede a realizar el recuento de cada grupo en forma manual.
b.
SEXO
TALLA
PESO
PERIMETRO
CEFALICO
EDAD
GESTACIONAL
PUNTAJE APGAR
AL NACER
Tcnica mecnica.
Son tcnicas en las que se emplean algunos equipos e instrumentos (mquinas perforadoras,
verificadoras y tabuladoras, tarjetas tipo Hollerith, siendo la ms conocida la tarjeta IBM, tarjetas de
perforacin marginal, punzones, etc). Existen dos tcnicas mecnicas, pero una de ellas prcticamente ya no
se usa y la otra tiene aplicaciones muy limitadas; sin embargo, vamos a describirlas brevemente.
6
7
8
9
Si los mismos 4 dgitos se repiten 2 veces para representan las unidades y las decenas, entonces
seran necesarios slo 8 perforaciones para representar hasta 100 categoras ( del 00 al 99 ), y
12 perforaciones para representar hasta 1,000 categoras ( del 000 al 999 ).
____________________
______________________________
O O O O O O O O
O O O O O O O O O O O O
7 4 2 1
7 4 2 1
7 4 2 1 7 4 2 1 7 4 2 1
Decenas
Unidades
Centenas
Decenas
Unidades
Para ilustrar esta tcnica, vamos a utilizar el mismo ejemplo anterior de los 20 recin nacidos .
Para ello se emplea una tarjeta por cada caso. Los pasos a seguirse son:
a.
Se transcriben los datos del recin nacido de la hoja de registro a la tarjeta, anotando el cdigo
correspondiente en la posicin que le corresponde.
En nuestro ejemplo, para el primer caso se llenara la tarjeta de la siguiente forma:
Sexo: Cdigo 1 (Masculino) se corta la perforacin 1
Peso: Cdigo 6 (3000 3499) se cortan las perforaciones 2 y 4 (2+4 = 6)
Talla: Cdigo 9 (51-54 cm) se cortan las perforaciones 2 y 7 (2+7 = 9)
PC: Cdigo 5 (34-35 cm) se cortan las perforaciones 1 y 4 (1+4 = 5)
EG: Cdigo 2 (39-41 semanas) se cota la perforacin 2
Apgar: Cdigo 3 ( 7-10 ) se corta la perforacin 3
O O O O O O O O O O O O O O O O O O O O O
1 2 7 4 2 1 7 4 2 1 4 2 1 1 2 3 1 2 3
O Sexo
Peso
Talla
PC
EG
Apgar
O
O
O
O
O
O
O
O
O
O
O O O O O O O O O O O O O O O O O O O O O O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
b.
c.
Una vez que se han llenados las tarjetas, se renen todas ellas con el ngulo cortado dirigido
haca la izquierda y arriba., y se procede a clasificar cada una de ellas de acuerdo a las
variables correspondientes. Para ello se pasa un punzn por las perforaciones correspondientes
a cada una de las categoras.
As, para clasificar la variable sexo, se pasa el punzn por la perforacin 1 y se suspenden las
tarjetas del punzn; al hacerlo, todas las tarjetas que tengan cortada el margen en esa
perforacin, es decir, las del sexo masculino, caern, en tanto que las otras, las del sexo
femenino, quedarn colgadas del punzn. Esta operacin ha separado las tarjetas por sexo.
Para clasificar la variable peso, que tiene 10 categoras, se procede de la siguiente forma: se
pasa el punzn por la perforacin del 7, y las que caigan correspondern a las que tengan el
cdigo 7, 8 y 9; de modo que si se pasa por la perforacin 2, las que caen sern las del cdigo 9;
luego se pasa por la perforacin 1, y caen las del cdigo 8; las que quedan colgadas son del
cdigo 7. Seguidamente, se pasa el punzn por la perforacin del 4 y las que caigan
correspondern a las que tengan el cdigo 4, 5 y 6.; se pasa el punzn por la perforacin del 2 y
caen las del cdigo 6; se pasa por la perforacin del 1 y caen las del cdigo 5, y las que quedan
colgadas son las del cdigo 4. A continuacin se pasa el punzn por la perforacin del 2, y las
que caen son las que tienen el cdigo 2 y 3.; luego se pasa por la perforacin del 1 y caen las
que tienen el cdigo 3 y quedan colgadas las del cdigo 2. Y finalmente, se pasa el punzn por
la perforacin del 1 y caen las del cdigo 1 y quedan colgadas las del cdigo 10.
De forma similar se procede para el recuento de las dems variables.
La nica ventaja al usar las tarjetas de perforacin marginal es que la clasificacin de las
variables se realiza ms rpidamente que con la tcnica de la las tarjetas simple. Ya no va a ser
necesario leer cada tarjeta en forma individual y luego clasificarlas.
d.
Tarjetas de Hollerith.
De las tarjetas tipo Hollerith, la ms conocida es la mundialmente tarjeta IBM. Es una tarjeta
rectangular que consta de 80 columnas, cada una con 10 filas numeradas del 0 al 9 (Ver modelo)
Como cada columna tiene 10 filas, cualquier variable que no tenga ms de 10 categoras, podr
inscribirse en una sola columna. Con 2 columnas se podran inscribirse hasta 100 categoras; con 3
columnas hasta 1,000, etc. De acuerdo a esto, una variable que tenga 100,000 categoras, slo
necesitara 5 columnas.
Como en el caso anterior, se utiliza una tarjeta para cada individuo.
El llenado de la tarjeta se hace con una mquina perforadora, que es como una mquina de escribir,
que realiza perforaciones rectangulares en los espacios que les corresponde, segn el cdigo adoptado.
Luego se utiliza una mquina verificadora para corregir los errores cometidos y finalmente se procede
al conteo mediante las mquinas tabuladoras., que no solamente hace el recuento, sino que imprime los
resultados.
c.
Tcnica electrnica.
La tcnica electrnica se utiliza cuando el nmero de elementos y observaciones por elemento es
grande. Para ello se utilizan las modernas computadoras, que son equipos electrnicos que tienen la
capacidad de recibir una gran cantidad de datos, seguir con ellos una compleja cadena de operaciones y
tabularlos con rapidez. Adems, nos permite presentar los datos por medio de tablas y grficas, y
efectuar su posterior anlisis mediante el uso de programas (Software) estadsticos. En trminos
generales, el sistema consiste en introducir datos (Unidad de entrada), darles cierto tratamiento
(Unidad de procesamiento) y recibir un producto (Unidad de salida). La introduccin de datos se puede
realizar a travs del teclado, o mediante datos previamente digitada (disquete, CD-ROM, Zip),; el
procesamiento de los datos se realiza en la Unidad Central de Proceso (CPU) utilizando un software o
programa estadstico. El producto del proceso puede recibirse impreso mediante una impresora o
visualmente en la pantalla de un monitor.
E.
b. La presentacin grfica.
c.Medidas de resumen