Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROCESAMIENTO Y ANÁLISIS DE
DATOS
1
OBTENCION DE DATOS
Los métodos utilizados para la obtención y el análisis
de datos dependen de :
• Los objetivos del estudio,
• El diseño de la investigación
• El instrumento utilizado (fichas, cuestionarios,
equipo de laboratorio, etc.)
INSTRUMENTO DE MEDICIÓN
Recolectar los datos implica tres actividades estrechamente
vinculadas entre si:
• Seleccionar un instrumento de medición o desarrollar uno
(Debe ser válido y confiable, de lo contrario no podemos
basarnos en sus resultados).
• Aplicar el instrumento de medición. Es decir, obtener las
observaciones y mediciones de las variables que son de
interés para el estudio.
• Preparar las mediciones obtenidas para que puedan analizarse
correctamente (a esta actividad se le llama codificación de
datos).
ESCALAS DE MEDICIÓN
Antes de aplicar cualquier técnica para resumir los datos es
importante verificar la escala en que han sido medidas las
variables estadísticas.
Variables categóricas:
- Nominal
- Ordinal
7
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Los procedimientos de organización y presentación de los datos
tienen por objetivo reducir el volumen de datos resumiéndolos de
manera que se puedan observar los comportamientos sistemáticos.
Tablas estadísticas
- Tablas de frecuencias (resumen una sola variable
- Tablas cruzadas o de contingencia (resumen dos o más
variables).
Gráficos estadísticos
EJEMPLO
Los datos mostrados a continuación corresponden al número de
células anormales en 50 cultivos.
0 2 2 3 3 4 4 0 0 2 0 1 3 2 2 2 2
1 4 2 0 1 2 4 2 0 2 2 0 4 0 1 2 1
1 1 3 0 1 4 1 4 5 3 0 3 0 0 3 1
Es necesario organizar y resumir los datos para extraer la
información.
Cultivo Número de células
Anormales (X)
1 0
2 2
::::
50 1
9
TABLAS DE FRECUENCIAS.
Son arreglos que resumen el conjunto de datos correspondientes
a una variable.
Ejemplo:
Tabla Nº 1 Número de células anormales en cultivos
Número de células Número de Porcentaje
anormales cultivos
(Frec. Relativas)
0 12 24.0
1 10 20.0
2 13 0.26
3 7 0.14
4 7 0.14
5 1 0.02
Total 50 100.0
10
GRÁFICOS PARA UNA VARIABLE CUANTITATIVA
Número de
cultivos Tallo y Hojas
12 0 |000000000000
10 1 |0000000000
13 2 |0000000000000
7 3 |0000000
7 4 |0000000
1 5 |0
11
TABLAS DE CONTINGENCIA
12
EJEMPLO
Un grupo de investigadores estudiaron la manifestación de los
antígenos de histocompatibilidad de clase I en el carcinoma de
células de trasmisión de la vejiga urinaria, mediante la técnica
de inmunoperoxidasa, y la correlacionaron con la diferenciación
tumoral y la supervivencia.
Los investigadores afirman que debido a que la microglobulina
ß2 siempre se manifiesta en la superficie de la célula con
antígeno de clase I, es un marcador seguro para la presencia de
antígenos de histocompatibilidad de clase I.
Seleccionaron una muestra de 69 pacientes con carcinoma
invasivo de células de transición. Los resultados se resumen en
la tabla Nº 2..
13
Tabla Nº 2 Diferenciación tumoral y Manifestaciones de microglobulina 2
Diferenciación Manifestaciones de
microglobulina B2 Total
tumoral
Positivo Negativo
Grado 1 15 8 23
Grado 2 18 9 27
Grado 3-4 7 12 19
Total 40 29 69
14
Tabla Nº 2 Diferenciación tumoral y Manifestaciones de microglobulina
2 (Porcentajes por Filas)
Manifestaciones de microglobulina B2
Diferenciación Total
Positivo Negativo
tumoral
n % n % n %
Grado 1 15 65,2 8 34,8 23 100,0
Grado 2 18 66,7 9 33,3 27 100,0
Grado 3-4 7 36,8 12 63,2 19 100,0
Total 40 58,0 29 42,0 69 100,0
15
GRÁFICOS
Manifestaciones de
20
microglobulina B2 Manifestaciones de
30
Positivo microglobulina B2
Negativo Positivo
Negativo
15
20
Número de cultivos
Frecuencia
10
10
0
Grado 1 Grado 2 Grado 3-4
0
Diferencia de tumor
Grado 1 Grado 2 Grado 3-4
Casos ponderados por VAR00001
Diferencia de tumor
16
GRÁFICO DE BARRAS
17
GRÁFICO DE CAJAS
Figura 3.
Concentración de plomo en los dientes de Cada caja es equivalente a un
leche de niños y niñas, según edad. histograma de frecuencias.
- Permite resaltar datos atípicos
- No es afectado por datos extremos.
- Permite responder a las dos
preguntas
- ¿Alrededor de que valor se
encuentran los datos?
- ¿Cómo se distribuyen los datos
alrededor del valor central?
se construye a partir de:
• Observación con valor mínimo
• Observación con valor máximo
• Percentiles 25, 50 y 75
DISTRIBUCIÓN DE ABUNDANCIA DE
ESPECIES
19
GRÁFICO LINEAL
▪ ¿Cuál es la riqueza
de especies en la
comunidad? A?
▪ ¿Cuál de las
comunidades tiene
mayor diversidad?
20
Figura Nº Peso y longitud de las alas de aves hembras
de las especies de la familia Phasianidae
5000,00
Wild-Turkey
4000,00
3000,00
masa
Caspian-Snowcock
Western-Capercaillie
2000,00
1000,00
0,00
alas
Figura Nº Longitud de alas, tarso y cola de aves hembras de las
especies de la familia Phasianidae
500
Wild-Turkey
400
Wild-Turkey
300 Western-Capercaillie
Caspian-Snowcock
Wild-turkey
200 Western-Capercaillie
Caspian-Snowcock
Wild-Turkey
100 Blue-Grouse
0
Western-Capercaillie
alas tarso cola
22
GRÁFICO DE DISPERSIÓN
23
MAPAS
Distribución espacial de una enfermedad
24
RECOMENDACIONES PARA ELABORAR GRÁFICOS
No es fácil dar consejos generales en cuanto a cómo elaborar un gráfico, sólo se
pueden dar normas básicas mínimas :
• El gráfico cumple una función estética, que fomenta la lectura del texto y ayuda a su
comprensión.
• Lograr consenso en el aspecto estético es donde será más complicado
• La única norma general es buscar sencillez y claridad,
• El uso del color debe ser moderado y bien elegido.
• En la imagen debe haber un adecuado balance entre el espacio en blanco y el que
contiene datos.
• Debe existir una adecuada relación entre el texto, las tablas y las imágenes,
• Deben ser fáciles de localizar , esto es deben estar próximas al texto donde son
referenciadas y de ser posible en la misma página.
En el gráfico ideal no será necesario acudir a las tablas para
la interpretación
INDICADORES RESUMEN
26
MEDIDAS O INDICADORES RESUMEN DE DATOS
Se calculan con el objetivo de dar respuesta a las
preguntas:
x = (( x )( x )...(x ))
n
XG =
1/ n
n
i 1 2 n
i =1
n
log( x )
log( x ) + log( x ) + .... + log( x )
i
X G
= i =1
= 1 2 n
n n
OBSERVACIONES
Los indicadores de tendencia central más utilizados son la media y la
mediana.
La media es muy sensible a la variación de las observaciones por lo
que es aconsejable calcular ambos indicadores, si coinciden entonces
se opta por la media aritmética, en caso, contrario es necesario
realizar un análisis más exhaustivo de los datos para averiguar las
razones de esta diferencia, pero en estos casos la mediana puede ser
más confiable.
La moda es utilizada principalmente cuando la variable es estudio es
categórica nominal ya sea con dos categorías (dicotómica) o con
varias categorías (politómica ) y los datos están dispuestas en tablas
de frecuencias.
La media geométrica se utiliza cuando las observaciones varían en
progresión geométrica
MEDIDAS DE DISPERSIÓN
Varianza
n
(x − )
2
i
( x − ) + ( x − ) + ... + ( x − )
2 2 2
2
= i =1
= 1 2 n
n n
n
(x − x )
2
i
( x − x ) + ( x − x ) + ... + ( x − x )
2 2 2
S 2
= i =1
= 1 2 n
n n
OBSERVACIONES
La varianza describe la variabilidad o dispersión, por tanto, cuando
los datos están muy alejados de la media, el numerador en la
fórmula será grande y la varianza y la desviación típica también
serán grandes.
Al aumentar el tamaño de la muestra, disminuye la varianza y la
desviación típica
Cuando todos los datos de la distribución son iguales (no hay
variabilidad) por lo tanto, la varianza y la desviación típica son
iguales a cero.
Así como la media aritmética, la varianza no es resistente y puede
ser muy afectado por las observaciones atípicas..
La varianza es especialmente útil para el cálculo de las estadísticas
usadas en la inferencia estadística.
COEFICIENTE DE VARIACIÓN
Se calcula como:
S
CV % = * 100
X
Distribución normal
INDICADORES DE POSICIÓN
Percentiles
Una forma de observar la distribución de los datos es mediante los
gráficos (histogramas, polígonos de frecuencias, la otra es dividir la
distribución en varios segmentos, de igual tamaño. Así se tiene:
Los percentiles que dividen a la serie de datos en 100 partes iguales.
Los valores que delimitan los segmentos se representan por P1,P2..., P99.
Los deciles que dividen a la serie de datos en 10 partes iguales. Los
valores que delimitan los segmentos se representan por P10,P20..., P90.
Los quintiles que dividen a la serie de datos en 5 partes iguales. Los
valores que delimitan los segmentos se representan por P20, P40..., P80.
Los cuartiles que dividen a la serie de datos en 4 partes iguales. Los
valores que delimitan los segmentos se representan por P25, P50,..., P75.
Cuartiles
Los cuartiles dividen la distribución de frecuencias en cuatro partes
iguales de modo que en cada segmento se encuentra el 25% del total de
observaciones.
Polígono de
frecuencias
Diagrama de cajas
REPRESENTACIÓN GRÁFICA DE PERCENTILES
OTROS INDICADORES
46
TAREA
I. En su área de especialización:
1. Describa las características de sus unidades de análisis que le
interesa observar (variables) y en que escala se suelen medir
estas variables (nominal/ordinal/ intervalo/razón).
2. Que uso le podría dar a:
- La media, mediana, media geométrica
- Rango, varianza, desviación estándar, coeficiente de
variación.
II. Elegir una investigación
Utilice la data de alguna de sus investigaciones indique cual fue
el objetivo del estudio, población, diseño del estudio, identifique
las variables e indique la escala de medición de cada una de ellas.
Describa los datos mediante, tablas, gráficos e indicadores
resumen.
47