Está en la página 1de 25

Facultad de Medicina Humana

Escuela Profesional de Medicina Humana

Presentación de datos ordinales y


nominales con tablas y gráficos
Ms. Zoraida Yanet Vidal Melgarejo
zvidalm@upao.edu.pe

Adaptado de: Bioestadística Médica. Dawson & Trapp.


Editorial Manual Moderno. 2005.

Formas para describir datos nominales


Los datos nominales pueden cuantificarse con varios métodos: proporciones, porcentajes,
relaciones y tasas.

Al medir los datos en una escala nominal o categórica, los métodos como la media o
desviación estándar no son adecuados para describir el punto medio y la dispersión
de una distribución.
Las características medidas en una escala nominal no tienen valores numéricos, pero
son conteos de frecuencias de presentación. Los datos nominales pueden
cuantificarse con varios métodos: proporciones, porcentajes, relaciones y tasas.

Para ilustrar estas medidas se usarán los datos del estudio sobre violencia doméstica, realizado por
Lapidus et al. (2002), el cual examinó diversas características sobre los médicos, incluyendo su
entrenamiento previo ante la violencia doméstica, lo que ayuda a explicar las diferencias en su
conducta de escrutinio.

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 1
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Formas para describir datos nominales


Cuadro 1. Prevalencia de detección médica por datos demográficos, práctica y educación de violencia
doméstica en 438 encuestados.
Detección
Total
Si No
Localización en la práctica
Urbana 97 28 125
Suburbana 199 99 298
Rural 34 11 45
Tipo de práctica
Privada 261 110 371
Otra 40 12 52
Enseñanza de residentes
Si 154 62 216
No 175 76 251
Entrenamiento previo de violencia doméstica
Si 175 27 202
No 155 111 266 -3-

Formas para describir datos nominales


1 Proporciones y porcentajes

Una proporción es el número, a, de  La proporción siempre se define como una


observaciones con una característica parte dividida entre el total, y es útil para los
determinada (quienes fueron detectados datos ordinales y numéricos, sobre todo si las
para violencia doméstica) dividida entre observaciones se colocaron en una tabla de
el número total de observaciones a + b, frecuencias.
en un grupo dado (como aquellos que  En el estudio sobre violencia doméstica, la
tuvieron entrenamiento previo). proporción de médicos capacitados en
violencia doméstica obtuvo una detección en
𝒂 los pacientes de 175/202 = 0.866, y la
𝑷𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 = proporción de médicos sin entrenar que
𝒂+𝒃
detectó pacientes fue de 155/266 = 0.583

El porcentaje es la proporción multiplicada por 100%.


-4-

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 2
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Formas para describir datos nominales


2 Relaciones y tasas

Una relación es el número de observaciones en un grupo 𝒂


determinado, con una característica dividido entre el número de 𝑹𝒆𝒍𝒂𝒄𝒊ó𝒏 =
𝒃
observaciones de esa característica.

 La relación siempre se define como una parte dividida entre otra parte. Por ejemplo, en el
caso de los médicos entrenados, la relación de quienes detectaron pacientes con aquellos
que no lo hicieron fue 175/27 = 6.481.

 Otras relaciones familiares incluyen los tres componentes del colesterol (HDL, LDL,
triglicéridos), así como la relación LDL/HDL.

-5-

Formas para describir datos nominales


2 Relaciones y tasas
Las tasas son similares a las proporciones, excepto en que se usa un multiplicador (por
ejemplo, 1000, 10000 o 100000), que se le llama base, la fórmula es:

𝒂
𝑻𝒂𝒔𝒂 = × 𝒃𝒂𝒔𝒆
𝒂+𝒃

Por ejemplo, si un estudio duró exactamente un año y la proporción de pacientes con una
condición dada fue de 0.002, la tasa por 10000 pacientes sería (0.002) x (10000) o 20 por
10000 pacientes por año.
Las tasas son importantes en epidemiología y en la medicina basada en evidencias, son la
base para calcular las estadísticas vitales (tasas de mortalidad y tasas de morbilidad), las
cuales describen el estado de salud de las poblaciones.
-6-

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 3
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Tasas de estadísticas vitales


2 Relaciones y tasas
2.1. Tasas de mortalidad.
 Son una manera estándar para comparar los números de muertes que ocurren en
diferentes poblaciones, ya sea por diferentes enfermedades en la misma población o en
diferentes periodos. El numerador en una tasa de mortalidad es el número de personas que
falleció en un periodo determinado, en tanto que el denominador será el número de
personas que estuvieron en riesgo de expirar durante el mismo periodo.
 En vista de que el denominador por lo general es difícil de obtener, con frecuencia se usa el
número de personas vivas de la población a la mitad de ese periodo como una
aproximación.

Una tasa real es la tasa calculada para todos los individuos de una población
determinada, por ejemplo, la tasa de mortalidad infantil de menores de un año en el
Perú fue de 16.1 por 1000 en 2011.
-7-

Tasas de estadísticas vitales


2 Relaciones y tasas
2.1. Tasas de mortalidad.
 Las tasas de mortalidad específicas por causa miden los decesos en una población ya sea
por enfermedad o evento adverso específicos. Comparar las tasas de mortalidad específicas
por causa en un periodo ayuda a los epidemiólogos a determinar los posibles factores
predisponentes en la presentación de enfermedades y hacer proyecciones sobre tendencias
futuras.
 Otras tasas de mortalidad usadas con frecuencia son la de mortalidad infantil y la de
letalidad por caso. La tasa de mortalidad infantil, que en ocasiones se usa como indicador del
grado de atención de la salud en general de una población, es el número de niños menores
de un año que fallecen por 1000 nacidos vivos. La tasa de letalidad por caso es el número de
muertes por una enfermedad específica que se presenta en un periodo determinado dividido
entre el número de individuos con la enfermedad especificada durante ese periodo.

-8-

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 4
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Tasas de estadísticas vitales


2 Relaciones y tasas
2.2. Tasas de morbilidad.
 Son parecidas a las de mortalidad, pero muchos epidemiólogos opinan que las tasas de
morbilidad proporcionan una medida más directa del estado de salud de una población. La
tasa de morbilidad es el número de individuos que presentan un padecimiento en un
periodo determinado dividido entre el número de personas de una población en riesgo.
 La prevalencia y la incidencia son dos medidas importantes usadas con frecuencia en
epidemiología. La prevalencia se define como el número de individuos con una enfermedad
determinada, en cierto punto dividido entre la población en riesgo de tener esa enfermedad
en ese momento. La incidencia se define como el número de casos nuevos que se presentan
en un intervalo determinado dividido entre la población en riesgo al inicio de ese intervalo.

En vista de que la prevalencia no comprende un periodo, en la actualidad es


una proporción, pero se le considera en forma incorrecta como una tasa.
-9-

Tasas de estadísticas vitales


2 Relaciones y tasas
2.2. Tasas de morbilidad.
 El término “incidencia” se usa a veces de forma errónea cuando en realidad se trata de
una “prevalencia”.
 La prevalencia es como una instantánea en el tiempo, como lo es un estudio de corte
transversal. De hecho, a muchos estudios de corte transversal, los epidemiólogos los
llaman estudios de prevalencia.

Los epidemiólogos emplean las tasas de prevalencia e incidencia para evaluar patrones de enfermedad
y proyecciones futuras. Por ejemplo, la diabetes mellitus tiene una prevalencia creciente aunque su tasa
anual de aproximadamente 230 casos por 100000 se ha mantenido relativamente estable en los últimos
años. La razón de esta diferencia es que al presentarse la enfermedad, un paciente continúa teniendo
diabetes por el resto de su vida, pero los avances en los cuidados de los diabéticos han aumentado el
periodo de vida de éstos.

- 10 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 5
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Tasas ajustadas

 Pueden usarse tasas reales para realizar comparaciones entre dos poblaciones diferentes
sólo si éstas son similares en todas las características que puedan afectar la tasa, por
ejemplo, si las poblaciones son diferentes o se ven confundidas por factores como edad,
género o raza, deben usarse tasas específicas por edad, género o raza, o ajustar las tasas
reales, de otro modo no serán válidas las comparaciones.

Método directo para ajustar tasas


Como ejemplo, supóngase que un investigador compara las tasas de mortalidad infantil de un
país desarrollado con las de otro en vías de desarrollo y concluye que la tasa de mortalidad
del último es casi el doble que la tasa del primero. ¿Esta conclusión es errónea?, ¿hay
posibles factores de confusión que afecten la mortalidad infantil de tal modo que se
distribuya de manera diferente en ambos países?

- 11 -

Tasas ajustadas

Existe una relación entre el peso al nacer y la mortalidad, y en este ejemplo, una comparación
válida de las tasas de mortalidad requiere que la distribución de los pesos al nacer sea similar
en los dos países. En el Cuadro 2 se presentan datos hipotéticos.
Cuadro 2. Tasa ajustada de mortalidad infantil; método directo.

País desarrollado País en vías de desarrollo


Nacimientos Muertes Nacimientos Muertes

Peso al nacer N (por 1000) % Núm. Tasa N (por 1000) % Núm. Tasa

< 1500 g 20 10 870 43.5 30 21 1860 62.0

1500 a 2499 g 30 15 480 16.0 45 32 900 20.0

>= 2500 g 150 75 1050 7.0 65 47 585 9.0

Total 200 2400 12.0 14.0 3345 23.9

- 12 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 6
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Tasas ajustadas
 La tasa real de mortalidad infantil para el país desarrollado es 12.0 por 1000 niños, para el
país en vías de desarrollo es de 23.9 por 1000. Las tasas específicas para el segundo país son
mayores para todas las categorías de peso al nacer. Sin embargo, ambas distribuciones de
peso al nacer no son las mismas: el porcentaje de niños de bajo peso al nacer (< 2500g) es
más de dos veces el porcentaje mayor en los países en vías de desarrollo. En vista de que el
peso al nacer y la mortalidad infantil se relacionan, no es posible determinar qué porcentaje
de diferencia en las tasas reales de mortalidad entre ambos se debe a las diferencias en la
mortalidad específica por peso y qué cantidad se debe a la mayor proporción de recién
nacidos de bajo peso al nacer en el país en vías de desarrollo. En este caso, las tasas de
mortalidad deben estandarizarse o ajustarse para que sean independientes de la distribución
del peso al nacer.
La determinación de la tasa ajustada es un proceso simple, siempre y cuando se disponga de
información. Para cada población se deben conocer las tasas específicas. Nótese que la tasa real de
cada país es, de hecho, un promedio cargado de las tasas específicas, en las que el número de neonatos
nacidos en cada categoría de peso al nacer se usan como las cargas.

- 13 -

Tasas ajustadas
 Por ejemplo, la tasa real de mortalidad para el país desarrollado es 2400/200000 = 0.012 o
12 por 1000, y es igual a:

σ 𝑇𝑎𝑠𝑎 × 𝑁 43.5 × 20 + 16.0 × 30 + 7.0 × 150 2400


= = , 𝑜 12 𝑝𝑜𝑟 1000
𝑁 𝑡𝑜𝑡𝑎𝑙 20 + 30 + 150 200

 En virtud de que el objetivo de ajustar las tasas es hacer que reflejen distribuciones
similares, se utilizan los números de cada categoría de una población, llamada población de
referencia, como las cargas para formar los promedios cargados para ambas poblaciones. No
importa la población que se elija como referencia, de hecho, puede usarse un grupo de
frecuencias que corresponda a una población de referencia totalmente distinta. El punto es
aplicar el mismo grupo de números a las dos poblaciones.

- 14 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 7
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Tasas ajustadas
 Por ejemplo, si se usan los números de neonatos en cada categoría de peso al nacer en
el país desarrollado como la referencia y se aplican a las tasas específicas del país en vías
de desarrollo, se tendrá:

σ 𝑇𝑎𝑠𝑎 × 𝑁 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 62.0 × 20 + 20.0 × 30 + 9.0 × 150 3190


𝑻𝒂𝒔𝒂 𝒂𝒋𝒖𝒔𝒕𝒂𝒅𝒂 = = = , 𝑜 15.95 𝑝𝑜𝑟 1000
𝑁 𝑡𝑜𝑡𝑎𝑙 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 20 + 30 + 150 200

 Por tanto, la tasa real de mortalidad en el país en vías de desarrollo será de 15.95 por 1000
(en vez de 23.9 por 1000) si fueron distribuidas las proporciones de los pesos al nacer de los
neonatos de igual forma a como se hizo en el país desarrollado.
 Para emplear este método de ajuste de tasas deben conocerse las tasas específicas de cada
categoría de las poblaciones que se vayan a ajustar y las frecuencias en la población de
referencia para el factor que se quiera ajustar. A este método se le denomina método
directo para estandarización de tasas.
- 15 -

Tasas ajustadas
Método indirecto para ajustar tasas
A veces no se dispone de tasas específicas de una o de las dos poblaciones que se van a
comparar. Si se conocen las frecuencias del factor de ajuste, como la edad o el peso al nacer
para cada población y se cuenta con cualquier grupo de tasas específicas (ya sea de una de
las poblaciones que se va a comparar o de cualquier otra), puede usarse un método indirecto
para ajustar las tasas. El método indirecto da lugar a una relación de mortalidad
estandarizada que se define como el número de muertes observadas dividido entre el
número de muertes esperadas.

Como ejemplo, supóngase que se dispone de la distribución de pesos al nacer tanto de los países
desarrollados como en vías de desarrollo, pero sólo se tienen las tasas de mortalidad específicas de otra
población, nombrada población estándar (Cuadro 3). El número esperado de muertes se calcula en cada
población mediante las tasas específicas de la población estándar.

- 16 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 8
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Tasas ajustadas
Cuadro 3. Tasa ajustada de mortalidad infantil, método indirecto

Número de nacimientos Tasa de mortalidad


Peso al nacer País en vías de específica por 100 en
País desarrollado población estándar
desarrollo
< 1500 g 20 30 50.0
1500 a 2499 g 30 45 20.0
>= 2500 g 150 65 10.0
Número de muertes 2400 3345

Para el país desarrollado, el número esperado de muertes es:

50.0  20  20.0  30  10.0  150  3100


- 17 -

Tasas ajustadas
Para el país en vías de desarrollo, el número esperado de muertes es:

50.0  30  20.0  45  10.0  65  3050

 La relación de mortalidad estándar (número real de muertes dividido entre el número


esperado) para el país desarrollado es 2400/3100 = 0.77
 Para el país en vías de desarrollo, esta misma relación es 3345/3050 = 1.1
 Si la relación de mortalidad estándar es mayor de 1, como en el país en vías de desarrollo,
la población de interés tiene una tasa de mortalidad mayor que la de la población
estándar. Si la tasa de mortalidad estándar es menor de 1, como sucede en el país
desarrollado, su tasa de mortalidad es menor que la de la población estándar. Por tanto,
el método indirecto permite hacer una comparación relativa.

- 18 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 9
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Exposición de datos nominales y ordinales en


cuadros y gráficas

Planteamiento del problema 1: Enunciado del estudio Bossi et al (1998).

 El factor VIII es uno de los procoagulantes de la vía intrínseca de la coagulación. La hemofilia


A, enfermedad que afecta a 1 de cada 10000 varones, es un trastorno hemorrágico
hereditario caracterizado por la presencia de un factor VIII deficiente o defectuoso. La
hemofilia adquirida es un trastorno hemorrágico más raro, el cual afecta a una persona por
cada millón cada año y se caracteriza por el desarrollo espontáneo de anticuerpos dirigidos
contra el factor VIII. Es común que los pacientes presenten equimosis, hematomas,
hematuria o neuropatía por compresión. Las complicaciones hemorrágicas son letales en 14
a 22% de los enfermos. Con frecuencia se acompaña de otras enfermedades como
padecimientos autoinmunitarios y neoplasias.

- 19 -

Exposición de datos nominales y ordinales en


cuadros y gráficas
Planteamiento del problema 1: Enunciado del estudio Bossi et al (1998).
 No se ha establecido el tratamiento óptimo, y en vista de que la enfermedad es poco
frecuente, no se han efectuado ensayos controlados aleatorios. Se realizó un estudio
retrospectivo en 34 pacientes con hemofilia adquirida ocasionada por inhibidores del factor
VIII, junto con una extensa revisión de la bibliografía para aclarar las características clínicas
del padecimiento y planear un estudio prospectivo para obtener el tratamiento óptimo
(Bossi et al., 1998).
 Para ilustrar la forma de construir cuadros para datos nominales, se tomará como base los
datos de 34 pacientes con hemofilia adquirida del estudio de Bossi (1998).

- 20 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 10
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Exposición de datos nominales y ordinales en


cuadros y gráficas
Cuadro 4. Datos de 34 pacientes con hemofilia adquirida debido a factor VIII

< 5 unidades
Nro Edad Género (Sexo) Equimosis Hematoma Hematuria Factor VIII
eritrocitarias
1 70 Varón Si No Si 5.0 Si
2 70 Mujer Si Si Si 0.0 No
3 75 Mujer Si Si No 1.0 Si
4 93 Mujer Si Si No 5.0 No
5 69 Varón No No Si 5.0 No
6 85 Varón Si Si No 6.0 Si
7 80 Mujer No No No 1.0 No
8 26 Mujer Si Si Si 2.5 No
9 33 Mujer Si Si Si 3.5 Si
10 81 Varón Si Si No 1.3 No



33 40 Varón Si Si Si 3.0 Si
34 22 Mujer Si Si No 1.0 No - 21 -

Exposición de datos nominales y ordinales en


cuadros y gráficas
La manera más sencilla de presentar datos nominales (u ordinales si no hay demasiados
puntos en la escala) es hacer una lista de las categorías en una de las columnas del cuadro y la
frecuencia (conteo) o porcentaje de las observaciones en otra columna. El Cuadro 5 muestra
el resumen del número de pacientes que tuvieron o no hematuria al momento del diagnóstico
de hemofilia.

Cuadro 5. Tabla de contingencia para frecuencia de hematuria en pacientes con hemofilia adquirida.

Hematuria Número de pacientes

Si 13

No 21

- 22 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 11
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Exposición de datos nominales y ordinales en


cuadros y gráficas
Cuando se exploran 2 características en una escala nominal, una forma común de mostrar los
datos es en una tabla de contingencia, en la cual los datos se clasifican según varios factores.
Por ejemplo, si se desea conocer el número de varones y mujeres que tuvieron hematuria al
momento del diagnóstico, se construye la tabla de contingencia que se muestra en el Cuadro
6. A menudo se dan los porcentajes junto con los conteos de las casillas.

Cuadro 6. Tabla de contingencia para varones y mujeres con y sin hematuria.

Género Sin hematuria Con hematuria

Varones 9 6

Mujeres 12 7

- 23 -

Exposición de datos nominales y ordinales en


cuadros y gráficas
Figura 1. Diagrama de barras de la presencia de
hematuria.

Para la imagen gráfica de datos


nominales u ordinales se usan los
diagramas de barras. Es común el uso
de otros tipos de gráficas, como las
circulares y las pictografías,
principalmente en diarios, revistas
populares y folletos publicitarios.

- 24 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 12
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


11
Relación entre dos
características numéricas
• El coeficiente de correlación (a veces llamado coeficiente de correlación del momento del
producto de Pearson) mide la relación entre dos características numéricas, simbolizadas
como X y Y.
• La fórmula del coeficiente de correlación, simbolizado por r, es:
σ 𝑿−𝑿 𝒀−𝒀
𝒓=
𝟐 𝟐
σ 𝑿−𝑿 σ 𝒀−𝒀

• Al aplicar la fórmula a los datos de la investigación de Hébert et al. (1997), para calcular el
coeficiente de correlación entre la capacidad mental en el tiempo 1 (X) y tiempo 3 (Y) para
mujeres de 85 años y más, se obtiene el valor de 0.5827
- 25 -

Descripción de la relación entre dos características


21 Interpretación de los
coeficientes de correlación
• El coeficiente de correlación siempre varía de -1 a +1, en el que -1 describe una relación
lineal negativa perfecta (línea recta) y +1 implica una relación lineal positiva perfecta. La
correlación 0 significa que no hay relación lineal entre ambas variables.
• A veces, la correlación se eleva al cuadrado (r2) para formar una función estadística útil
llamada coeficiente de determinación o r2.

Para los datos del funcionamiento mental, el coeficiente de determinación es (0.58)2 = 0.34 . Esto quiere
decir que 34% de la variabilidad de una de las medidas, como sería el funcionamiento mental a los dos
años, puede ser la causa (o predecir) a partir del conocimiento del valor de la otra medida, el
funcionamiento mental basal. Es decir, si se conoce el valor de la calificación de una mujer anciana en la
parte del funcionamiento mental del SMAF y se considera la calificación dos años después, la varianza de
la calificación después de dos años se verá reducida en 34% o alrededor de un tercio.

- 26 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 13
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


21 Interpretación de los
coeficientes de correlación
 El valor del coeficiente de correlación es independiente de las unidades particulares que se
emplean para medir las variables, por ejemplo, si se miden la talla y el peso de un grupo de
niños de preescolar para determinar la correlación entre talla y peso. La talla se mide en
centímetros y el peso en kilogramos, y se calcula el coeficiente de correlación igual a 0.70. Si
se hubieran medido en pulgadas y libras, el coeficiente de correlación seguiría siendo 0.70
debido a que el denominador de la fórmula para el coeficiente de correlación se ajusta para
la escala de las unidades.
 El valor del coeficiente de correlación está muy influenciado por los valores extremos,
idéntico a la desviación estándar. Por tanto, la correlación no describe bien la relación entre
dos variables cuando la distribución de cada una se carga o contiene valores extremos. En
esta situación, debe hacerse una transformación de datos que modifique la escala de
medición y modere el efecto de los extremos o puede usarse la correlación de Spearman.
- 27 -

Descripción de la relación entre dos características


21 Interpretación de los
coeficientes de correlación

 Cuando se miden las características físicas y se dispone de buenos instrumentos de


medición, como en las ciencias físicas, es posible hacer correlaciones muy precisas. En las
ciencias biológicas a menudo participan características menos definidas y los instrumentos
de medición son imprecisos, en estos casos ocurrirán correlaciones inferiores.
 Colton (1974) comenta la siguiente regla real para interpretar el tamaño de las
correlaciones:
 Correlaciones de 0 a 0.25 (o -0.25) indican muy poca o ninguna relación.
 Las que van de 0.25 a 0.50 (o de -0.25 a -0.50) señalan un grado mínimo de relación.
 Las que son de 0.50 a 0.75 (o -0.50 a -0.75) implican una relación de moderada a buena.
 Las mayores de 0.75 (o de -075) señalan una relación de buena a excelente.

- 28 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 14
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


21 Interpretación de los
coeficientes de correlación
 Colton también enfatiza el cuidado que se debe tener con correlaciones de 0.95 o
mayores en las ciencias biológicas debido a la variabilidad inherente en la mayor parte de
las características biológicas.
 Cuando se encuentra una correlación alta, se debe preguntar si es un error, un artefacto o
el resultado de combinar dos poblaciones. Un ejemplo de un artefacto es cuando el
número de kilogramos que los pacientes pierden en la primera semana de un programa
de dieta se pone en correlación con el número de kilogramos que ellos pierden durante el
programa entero del segundo mes.

- 29 -

Descripción de la relación entre dos características


21 Interpretación de los
coeficientes de correlación
 El coeficiente de correlación mide sólo una relación en línea recta, de hecho, dos
características pueden tener una fuerte correlación curvilínea, aunque la correlación sea
muy pequeña. Por consiguiente, cuando se analizan las relaciones entre dos
características, los datos siempre deben graficarse.
 Una gráfica ayudará a detectar errores y sesgos en las distribuciones.

Finalmente, “correlación no es igual a causa”. El juicio de que una característica causa


otra, debe justificarse con base en las observaciones experimentales o argumentos
lógicos, no sólo en el coeficiente de correlación.

- 30 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 15
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


31 Relación entre dos
características ordinales
La correlación de rangos de Spearman, a veces llamada rho de Spearman se emplea con
frecuencia para describir la relación entre dos características ordinales (o una ordinal y otra
numérica).
También es el método estadístico apropiado para usarse con variables numéricas cuyas
distribuciones estén cargadas y tengan observaciones extremas.

Al calcular la correlación de rangos de Spearman, simbolizada como rs, participa el


ordenamiento por rangos de los valores de cada una de las características, desde la más
baja hasta la más alta, después se tratan los rangos como si fueran valores reales. Aunque la
fórmula es simple, cuando no hay ajustes en los valores, el cálculo es muy tedioso.

- 31 -

Descripción de la relación entre dos características


41 Relación entre dos
características nominales

En estudios en los que participan dos características, el interés principal puede ser si éstos se
encuentran significativamente relacionados o la magnitud de dicha relación, como la relación
entre un factor de riesgo y la ocurrencia de un resultado determinado.
Se usan dos relaciones para estimar esto: la relación del riesgo relativo y la razón de momios,
ambas a menudo referidas como relaciones de riesgo.

- 32 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 16
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


41 Relación entre dos
características nominales

a. Tasas de eventos experimental y control.

Los conceptos importantes en el cómputo de medidas de riesgo se conocen como tasa de


eventos. Con los datos del Cuadro 7, se tiene interés en el hecho de que ocurra una
enfermedad. La tasa de eventos experimentales (TEE) es el número de personas que con un
factor de riesgo tienen o van a presentar una enfermedad, A/(A+B). La tasa de eventos control
(TEC) es el número de personas sin el riesgo quienes tienen o van a presentar la enfermedad,
C/(C+I).

- 33 -

Descripción de la relación entre dos características


Cuadro 7. Disposición de la tabla y fórmulas de varias medidas importantes de riesgo.

Enfermedad No enfermedad
Factor de riesgo presente A B A+B
Factor de riesgo ausente C D C+D
A+C B+D
Tasa de eventos A Número necesario para 1
TEE = NNT =
experimentales (TEE) A+B tratar (NNT) RRA

C Reducción del riesgo RRA


Tasa de eventos control (TEC) TEC = RRR =
C+ D relativo (RRR) TEC

Reducción del riesgo RRA = TEE − TEC


TEE
Riesgo relativo (RR) RR =
absoluto (RRA) TEC
A/ A + C / C/ A + C A/C AD
Razón de momios (RM) RM = = =
B/ B + D / D/ B + D B/D BC

- 34 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 17
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


41 Relación entre dos
características nominales
b. Riesgo relativo.
• El riesgo relativo (RR), o relación de riesgo, de una enfermedad es la relación de la incidencia en
personas con el factor de riesgo (personas expuestas) con la incidencia en personas sin este factor
(personas no expuestas). Se obtiene al dividir la TEE entre la TEC.
• The Physicians Health Study (conducido por el Committee of the Physicians Health Study Research
Group, 1989) es un estudio clásico emprendido para conocer si el ácido acetilsalicílico en dosis bajas
(325 mg cada tercer día) reduce la mortalidad en las enfermedades cardiovasculares. Los participantes
en este ensayo clínico fueron 22071 médicos sanos del sexo masculino asignados en forma aleatoria
para recibir el fármaco o placebo y se evaluaron a lo largo de 60 meses. Se dio seguimiento a los
médicos que tomaron el medicamento y a quienes tomaron placebo para conocer el número de cada
grupo que tuvo infarto del miocardio. En este estudio, la ingestión del fármaco asume el papel de
factor de riesgo.
- 35 -

Descripción de la relación entre dos características


Grupo de ácido
Grupo placebo
acetilsalicílico
b. Riesgo relativo.
Número de pacientes 11037 11034
Punto final
En el cuadro 8 se presentan los datos
Infarto del miocardio
de infarto del miocardio en médicos
Mortal 10 26
que tomaban ácido acetilsalicílico y
No mortal 129 213
en los que tomaban placebo.
Total 139 239
Personas-año de observación 54560.0 54355.7
Evento vascular cerebral Cuadro 8. Puntos finales cardiovasculares
confirmados en el componente del ácido
Mortal 9 6
acetilsalicílico del Physicians Health Study, de
No mortal 110 92 acuerdo con el grupo de tratamiento.
Total 119 98
Personas-año de observación 54650.3 54635.8

- 36 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 18
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características

41 Relación entre dos


características nominales
b. Riesgo relativo.
• La TEE es la incidencia de infarto del miocardio en médicos que tomaron ácido acetilsalicílico,
139/11037 =0.0126. La TEC es la incidencia de infarto del miocardio en los que tomaron
placebo, 239/11034=0.0217. El riesgo relativo de infarto del miocardio con el primero,
comparado con el de infarto con placebo es, por tanto:

𝑻𝑬𝑬 𝑨/=𝑨𝟎.+𝟓𝟖𝟏
𝑩 𝟏𝟑𝟗/𝟏𝟏𝟎𝟑𝟕 𝟎. 𝟎𝟏𝟐𝟔
𝑹𝑹 = = = =
𝑻𝑬𝑪 𝑪/ 𝑪 + 𝑫 𝟐𝟑𝟗/𝟏𝟏𝟎𝟑𝟒 𝟎. 𝟎𝟐𝟏𝟕

- 37 -

Descripción de la relación entre dos características

41 Relación entre dos


características nominales
• En vista de que se presentaron menos infartos en el grupo que tomó ácido acetilsalicílico
que en quienes tomaron placebo, el riesgo relativo es menor de 1. Si se toma el número
b. Riesgo relativo.

recíproco y se ve el riesgo relativo de tener un infarto en los médicos del grupo placebo,
el riesgo relativo de 1/0.58 = 1.72. En ese sentido, los médicos del grupo placebo tuvieron
1.7 más posibilidades de tener un infarto del miocardio que los médicos del grupo de
ácido acetilsalicílico.
• El riesgo relativo se calcula sólo en un estudio de cohorte o en un ensayo clínico en el cual
se identifica primero un grupo de personas con el factor de riesgo, y un segundo grupo
sin dicho factor, después se les da seguimiento para determinar las personas que
presenten el resultado de interés. En esta investigación, el investigador determina el
número de sujetos de cada grupo.

- 38 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 19
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


41 Relación entre dos
características nominales
c. Reducción de riesgo absoluto.
• La reducción del riesgo absoluto (RRA) es una manera de estimar la reducción del riesgo
comparado con el riesgo basal. En los pacientes que en el estudio tomaron ácido
acetilsalicílico, la TEE para un infarto del miocardio por cualquier causa fue de 0.0126, en el
grupo del ácido acetilsalicílico y la TEV fue 0.0217 en el grupo placebo. La RRA es el valor
absoluto de la diferencia entre ambos grupos:

𝑹𝑹𝑨 = 𝑻𝑬𝑬 − 𝑻𝑬𝑪 = 𝟎. 𝟎𝟏𝟐𝟔 − 𝟎. 𝟎𝟐𝟏𝟕 = −𝟎. 𝟎𝟎𝟗𝟏 = 𝟎. 𝟎𝟎𝟗𝟏

Una buena manera de interpretar estos números es pensarlos en términos de eventos por
10000 personas. Por tanto, el riesgo de infarto del miocardio es de 126 en un grupo que
toma ácido acetilsalicílico y de 217 en el que toma placebo, la RRA es de 91 por 10000
personas. - 39 -

Descripción de la relación entre dos características


41 Relación entre dos
características nominales

d. Número necesario para tratar


• Otra ventaja de interpretar los datos de riesgo en términos de RRA es que el número
recíproco, 1/RRA es el número necesario para tratar (NNT), es decir, para prevenir un
evento. Es ese sentido, el número de personas que es necesario tratar para evitar un infarto
del miocardio es 1/0.0091, es decir, 109.9 (aproximadamente 110 personas).
• Este tipo de información ayuda a los médicos a evaluar los riesgos y los beneficios relativos
de un tratamiento en particular. Con base en los riesgos de tomar el fármaco, ¿piensa que es
buena idea prescribirla a 110 personas para prevenir que una de ellas tenga infarto del
miocardio?. Los artículos de Glasziou et al. (1998) y de Sackett et al. (2000) contienen
excelentes comentarios al respecto. Nuovo et al. (2002) discuten la necesidad de incluir el
conteo necesario a tratar en los reportes de ensayos clínicos.
- 40 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 20
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


41 Relación entre dos
características nominales

e. Aumento del riesgo absoluto y número necesario para dañar


• Algunos tratamientos o procedimientos aumentan el riesgo de algún efecto o resultado
indeseable. En este caso, la diferencia (valor absoluto) entre la TEE y la TEC se denomina
aumento del riesgo absoluto (ARA). He et al. (1998), en su metaanálisis de ensayos al azar
sobre el uso del ácido acetilsalicílico, descubrieron una RRA de infarto del miocardio en 137
por 10000 personas, resultado todavía mayor que el del estudio de este fármaco en médicos.
También vieron el resultado del evento vascular cerebral e informaron de una RRA en la
apoplejía isquémica de 39 en 10000. Con base en sus resultados, el NNT para prevenir un
infarto del miocardio fue de 1/0.0137, es decir 72.99 (alrededor de 73 pacientes), y el NNT
para prevenir una enfermedad cerebral isquémica fue de 1/0.0039, o 256.41 (casi 257).

- 41 -

Descripción de la relación entre dos características


41 Relación entre dos
características nominales
e. Aumento del riesgo absoluto y número necesario para dañar

• Al mismo tiempo, el tratamiento con ácido acetilsalicílico dio como resultado un incremento
en el riesgo de enfermedad cerebral hemorrágica de 12 por cada 10000 personas. El número
recíproco del ARA, 1/ARA, se llama número necesario para dañar (NND). Con base en el
estudio de He et al. para la enfermedad cerebral hemorrágica, el NND fue de 1/0.0012, O
833. Con estos datos, los autores concluyeron que los beneficios totales del tratamiento con
ácido acetilsalicílico sobrepasan el riesgo de la enfermedad cerebral hemorrágica.

- 42 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 21
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


41 Relación entre dos
características nominales
f. Reducción del riesgo relativo
• La reducción del riesgo relativo da la cantidad de reducción del riesgo respecto al riesgo
basal, es decir, la TEE menos la TEC dividida entre la TEC (basal). La RRR en el estudio de
ácido acetilsalicílico en médicos es:
𝑇𝐸𝐸 − 𝑇𝐸𝐶 0.0091
𝑅𝑅 = = = 0.4194
𝑇𝐸𝐶 0.0217

o cerca de 42%. La RRR dice que respecto al riesgo basal de 217 infartos del miocardio en
10000 personas, si reciben ácido acetilsalicílico se reduce el riesgo en 42%.
• Muchos médicos opinan que la RRA es un índice más valioso que la RRR, ya que su número
recíproco es el número necesario para tratar.

- 43 -

Descripción de la relación entre dos características


41 Relación entre dos
características nominales
f. Razón de momios.
• Es una manera de ver el riesgo en los estudios de casos-control. La razón de momios (RM) es
la posibilidad de que un paciente con un resultado adverso haya estado expuesto o en riesgo
dividido entre la posibilidad de que una persona sin el evento adverso no haya estado
expuesta ni en riesgo.
• En los estudios de casos-control, el investigador decide la cantidad de personas a estudiar
con y sin enfermedad. Esto es contrario a lo que sucede en los estudios de cohorte y en
ensayo clínicos, en los cuales el investigador decide el número de sujetos con y sin factor de
riesgo, por tanto, la razón de momios debe usarse en los estudios de casos-control.

- 44 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 22
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


Para ejemplificar el cálculo de la razón de momios, se hará referencia a la investigación de Ballard et al.
(1998), en el cual se estudió el uso prenatal de hormona liberadora de tirotropina, cuyos resultados se
presentan en el Cuadro 9.

Cuadro 9. Desenlace de neonatos en los grupos con hormona liberadora de tirotropina y placebo.
NEONATOS EN RIESGO NEONATOS SIN RIESGO

Desenlace Razón de Razón de


TRH Placebo TRH Placebo
momios momios
(N=392) (N=377) (N=171) (N=194)
(IC 95%) (IC 95%)
Síndrome de insuficiencia
260 244 1.1 (0.8 a 1.5) 5 13 0.4 (0.1 a 1.3)
respiratoria
Muerte <=28 días después del
43 42 1.0 (0.6 a 1.6) 2 1 2.3 (0.1 a 135)
parto
Enfermedad pulmonar crónica
175 157 1.1 (0.8 a 1.3) 3 2 1.7 (0.2 a 20.7)
<= 28 días después del parto

- 45 -

Descripción de la relación entre dos características


Es fácil calcular la razón de momios cuando los resultados se presentan en una tabla de 2 x 2.
En el Cuadro 10 se presentan los datos resumidos.

Cuadro 10. Datos para la razón de momios de neonatos de 32 semanas de gestación o más.

Con insuficiencia Sin insuficiencia


Grupo Total
respiratoria respiratoria
TRH 260 132 392
Placebo 244 133 377
Total 504 265

- 46 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 23
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Descripción de la relación entre dos características


En este estudio, la posibilidad de que un neonato con síndrome de insuficiencia respiratoria
haya estado expuesto a la TRH es de:
260/504 260
= = 1.0656
244/504 244

y las posibilidades de que un neonato sin insuficiencia respiratoria haya estado expuesto a la
TRH es de:
132/265 132
= = 0.9925
133/265 133

Al juntar esta posibilidad para obtener la razón de momios se tiene:

1.0656
= 1.073, 𝑜 ≈ 1: 1
0.9925
- 47 -

Descripción de la relación entre dos características

Una razón de momios de 1:1 significa que un neonato del grupo de TRH tiene 1:1 veces más
de posibilidades de presentar síndrome de insuficiencia respiratoria que un neonato del
grupo placebo.

A la razón de momios también se le llama razón del producto cruzado, ya que puede
definirse como la relación del producto de las diagonales en una tabla de 2 x 2.

260 133
= 1.0737
244 132

- 48 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 24
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Gráficos para dos características


La mayor parte de los estudios de medicina comprenden más de una
característica, y las gráficas que muestran la relación entre dos características
son frecuentes en los textos médicos.
 No hay una gráfica para mostrar la relación entre dos características cuando ambas se miden
en escala nominal; los números se presentan en tablas de contingencia. Cuando una de las
características es nominal y la otra numérica, los datos pueden mostrarse en gráficas de caja
o como gráficas de error.
 En medicina también son frecuentes las gráficas bivariadas (conocidas como gráficas de
dispersión o diagramas de dispersión) para ilustrar la relación entre las dos características
cuando ambas se miden en escala numérica. Una gráfica de dispersión se construye
dibujando ejes X y Y, la característica, se supone, que explica o predice, o la que ocurre
primero (a veces llamada factor de riesgo), se coloca en el eje X. La característica que se
explicará o predecirá, o la que ocurre en segundo lugar, se coloca en el eje de las Y. En
aplicaciones en las cuales la hipótesis es una relación no causal, no importa el eje elegido.
Cada observación se representa con un punto pequeño.
- 49 -

Gráficos para dos características


 Hay correspondencia entre el tamaño del coeficiente de correlación y una gráfica de
dispersión de las observaciones. En la investigación de Hébert et al. (1997) acerca del
funcionamiento mental de cada paciente en tres momentos, con un año de diferencia, se
obtuvo una correlación de 0.58 al evaluar el Tiempo 1 y el Tiempo 3. Este valor (0.58) indica
una relación de moderada a buena entre estas dos calificaciones de la función mental.
Cuando la correlación es cercana a 0, la forma del patrón de los resultados es más o menos
circular. Al acercarse el valor de la correlación a + o -1, la forma se vuelve más elíptica, hasta
que en +1 y -1 los resultados forman una línea recta. Con una correlación de 0.58, es de
esperarse una forma oval del gráfico de dispersión de los datos.
Generalmente, el uso de tablas o gráficas se basa en el propósito de la presentación de los datos. Las
tablas contienen muchos detalle y pueden desplegar información sobre varias características, pero éstas
requieren una lectura y síntesis que puede llevar mucho más tiempo. Las gráficas se presentan como un
cuadro de fácil interpretación de los datos y son las más apropiadas cuando la meta es ilustrar la
distribución o las frecuencias sin detalles específicos.

- 50 -

Curso: Informática Médica y Bioestadística Tema: Presentación de datos nominales y ordinales


Docente: Ms. Zoraida Yanet Vidal Melgarejo con tablas y gráficos Pág. 25

También podría gustarte