Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Escalas de medición.
Medidas de tendencia central y de
dispersión
Ms. Zoraida Yanet Vidal Melgarejo
zvidalm@upao.edu.pe
Dr. Alex Napoleón Castañeda Sabogal
acastanedas1@upao.edu.pe
Ing. Agustín Eduardo Ullón Ramírez
aullor@upao.edu.pe
ESCALAS DE MEDICIÓN
-2-
ESCALAS DE MEDICIÓN
• Nominal
01
Ordinal
02
Numérica
03
ESCALAS DE MEDICIÓN
Las escalas nominales se usan en el nivel más simple
Nominal de medición, cuando los valores de los datos caen en
categorías.
ESCALAS DE MEDICIÓN
Nominal Velocidad del Baño en
Marea de
Categoría tormenta
viento (mph) tierra
(pies)
Los resultados pueden describirse con
1 74 – 95 Mínimo 4.5
más de dos categorías, como la
clasificación de las anemias en microcítica 2 96 – 110 Moderado 6.8
(incluida la ferropénica), macrocítica o 3 111 – 130 Extenso 9.12
megaloblástica (incluida la que produce la
4 131 - 155 Extremo 13.18
deficiencia de vitamina B12) y normocítica
(relacionada con enfermedades crónicas) 5 Over 155 Catastrófico 19+
ESCALAS DE MEDICIÓN
Nominal
ESCALAS DE MEDICIÓN
Cuando ocurre un orden inherente dentro de las
categorías, se dice que las observaciones se miden en
Ordinal
una escala ordinal.
La clasificación internacional del carcinoma del cérvix es una escala ordinal de 1 a 4, en la cual
la etapa 0 representa carcinoma in situ y la etapa 4 señala carcinoma que se extiende más allá
de la pelvis o afecta a las mucosas de vejiga y recto. Resulta obvio que el orden inherente a
esta escala ordinal será que el pronóstico para la etapa 4 es peor que para la etapa 0.
-7-
ESCALAS DE MEDICIÓN
Ordinal
OPINIÓN Bueno / Regular / Malo
-8-
ESCALAS DE MEDICIÓN
Ordinal
-9-
ESCALAS DE MEDICIÓN
Ordinal
- 10 -
ESCALAS DE MEDICIÓN
Ordinal 1
0
Un tipo especial es la escala de orden por rango, las 9
observaciones se clasifican por rango, desde el más alto al
8
más bajo (o viceversa). La duración de los procedimientos
7
quirúrgicos puede convertirse a una escala de rangos para
6
obtener una medida de la dificultad del procedimiento.
Es común el uso de porcentajes y proporciones. A veces, 5
Severo
el grupo de datos medidos se resume en un valor medio. 4
Con un gran número de valores algunas veces se tratan 3 Moderado
como si éstos fueran numéricos. 2
Leve
1
0
Los mismos tipos de cuadros y gráficas empleados para los datos nominales
también pueden usarse para los ordinales.
- 11 -
Escalas de medición
A las observaciones por las cuales las diferencias entre
Numérica números tienen significado en una escala numérica se
les denomina observaciones cuantitativas, miden la
cantidad de algo.
Escalas de medición
Numérica
La edad es una medida continua, basta aproximar la edad hasta el año más
cercano en estudios de adultos, pero en niños pequeños se prefiere aproximar la
edad al mes más cercano; otros ejemplos son peso, talla, tiempo de supervivencia,
grado de movilidad articular, así como muchos datos de laboratorio.
Cuando una observación numérica se hace sólo en valores enteros, la escala de
medición es discreta. Por ejemplo, los conteos de eventos – número de embarazos,
cirugías previas, factores de riesgo - son medidas discretas.
En el estudio de Kline et al. (2002) se evaluaron varias características de los pacientes, incluyendo índice
de choque y embolia pulmonar (EP). La primera característica se mide en una escala numérica debido a
que puede tomar un solo valor individual dentro del límite posible de valores.
- 13 -
Escalas de medición
Numérica
La presencia de EP tiene una escala nominal con sólo dos valores: presencia o
ausencia. En el estudio de Ballard et al. (1998), el número de recién nacidos que
presentó síndrome de insuficiencia respiratoria es un ejemplo de una escala
numérica discreta.
- 14 -
Las tres se emplean para datos numéricos, pero las dos últimas también se
pueden utilizar en datos ordinales.
- 15 -
1 MEDIA
Fórmula Media
σ𝑋
𝑋ത =
𝑛
Donde:
X: representa los datos individuales.
n: número total de datos. MEDIA
- 16 -
1 MEDIA Planteamiento del problema 1: Enunciado del estudio de Kline et al. (2002)
La embolia pulmonar (EP) es una causa importante de morbilidad y mortalidad. Las manifestaciones clínicas son inespecíficas y un
diagnóstico certero a menudo es difícil de realizar. Se han realizado esfuerzos por simplificar y mejorar el proceso diagnóstico evaluando
a los pacientes con posible EP mediante dos componentes: la determinación de la probabilidad por preprueba y la prueba del dímero D.
La probabilidad por preprueba se determina con el desarrollo de criterios explícitos para determinar la probabilidad clínica de EP. La
prueba del dímero D mide la formación del dímero D cuando las redes de fibrina en el trombo son destruidas por medio de la plasmina.
Puede usarse un elevado nivel de dímero D para descubrir trombosis venosa profunda (TVP) y EP. Algunas pruebas de dímero D son muy
sensibles para TVP, y puede usarse un resultado normal para descartar el tromboembolismo venoso.
Kline et al. (2002) decidieron desarrollar un conjunto de criterios clínicos que definiría un subgrupo de pacientes con una probabilidad
por preprueba de EP mayor a 40% (grupo de alto riesgo). Estos pacientes tendrían un riesgo tan elevado de experimentar EP como para
excluir el diagnóstico con base en la comprobación del dímero D. Sin embargo, pacientes con una probabilidad por preprueba más baja
(grupo de bajo riesgo), en quienes un resultado normal podría ayudar a excluir el diagnóstico de EP, podrían ser los candidatos ideales
para la comprobación con el dímero D. Los datos se obtuvieron de 931 pacientes con sospecha de EP en siete servicios de urgencias
urbano en EUA. Los investigadores midieron varios factores de riesgo potenciales para EP, y se observaron algunos atributos básicos
como índice de choque, presión arterial sistólica y frecuencia cardiaca.
- 17 -
1 MEDIA
El Cuadro 1 muestra el valor del índice de choque, presión arterial sistólica y
frecuencia cardiaca de 18 pacientes seleccionados al azar en el estudio del dímero D
(Kline et al, 2002).
El índice de choque para estos 18 pacientes es:
σ𝑋 0.61+0.56+⋯+0.85+0.44 12.41
𝑋ത = 𝑛
= 18
= 18
= 𝟎. 𝟔𝟖𝟗
Nro. de Índice de Presión arterial Frecuencia Nro. de Índice de Presión arterial Frecuencia
pacientes choque sistólica cardiaca pacientes choque sistólica cardiaca
1 0.61 139 85 10 0.63 161 102
2 0.56 151 84 11 0.55 164
3 0.52 201 104 12 0.50 138 69
4 0.33 170 56 13 0.75 118 89
5 0.45 123 55 14 0.82 130 106
6 0.74 121 90 15 1.30 109 142
7 0.73 119 87 16 1.29 92 119
8 0.92 100 92 17 0.85 126 107
9 0.42 164 69 18 0.44 139 61
- 19 -
1 MEDIA
La media se usa cuando se pueden sumar los números, es decir, cuando se miden las
características en una escala numérica, no debe emplearse con datos ordinales
debido a la naturaleza arbitraria de la escala ordinal.
- 20 -
1 MEDIA
• En el Cuadro 2 se presenta una tabla de frecuencia de las observaciones del índice de
choque que se puede usar para calcular el índice de choque medio de la frecuencia
cardiaca para todos los sujetos del estudio en quienes se haya registrado la medición.
• El cálculo del promedio cargado de la media usando el número de personas y de los
puntos medios de cada intervalo es:
0.35 × 38 + 0.45 × 104 + ⋯ + 1.25 × 19 642.75
= = 0.690
931 931
(*) El valor 0.35 es el valor medio del primer intervalo (menos de 0.40), el valor 0.45 es el valor
medio del segundo intervalo (0.40 hasta 0.50).
- 21 -
- 22 -
1 MEDIA
El valor de la media calculado a partir de una tabla de frecuencia no siempre es la misma que
al obtenido con los números reales. En el ejemplo, la media del índice de choque calculada de
los números reales y la tabla de frecuencias son muy semejantes.
2 MEDIANA
La mediana es la observación media, es decir, el punto a partir del cual la mitad de los
datos son menores y la otra mitad son mayores. Se le simboliza con M o Md.
0.33, 0.42, 0.44, 0.45, 0.50, 0.52, 0.55, 0.56, 0.61, 0.63, 0.73, 0.74, 0.75, 0.82, 0.85, 0.92, 1.29, 1.30
3 MODA
4 MEDIA GEOMÉTRICA
La media geométrica generalmente
Otra medida de tendencia central que se usa con datos medidos en una
no se usa tanto como la media escala logarítmica.
aritmética o la mediana es la media Tomando el logaritmo de ambos
geométrica, simbolizada como MG o G, lados de la ecuación precedente, se
y se define como la raíz n del producto observa que el logaritmo de la media
de n observaciones. geométrica es igual a la media de los
Fórmula logaritmos de las observaciones.
𝒏
𝑴𝑮 = 𝒙𝟏 𝒙𝟐 𝒙𝟑 … 𝒙𝒏
𝑙𝑜𝑔 𝑋
Donde: 𝑙𝑜𝑔 𝑀𝐺 =
𝑛
n : número total de observaciones.
xi : valor de la observación i
- 27 -
- 28 -
Media
Media Mediana Moda Mediana Moda Mediana Media
Moda
Asimétrica hacia la Asimétrica hacia la
Simétrica
izquierda derecha
- 29 -
La mediana se utiliza
La media geométrica se
para datos ordinales o
usa generalmente para
para datos numéricos si
observaciones medidas
la distribución está
en escala logarítmica.
cargada.
En un estudio acerca del incremento de la deuda educacional entre estudiantes de medicina canadienses,
Kwong et al. (2002) reportaron acerca del valor medio de la deuda de los estudiantes graduados.
Establecieron que usaban mejor la mediana en lugar de la media sólo porque un número relativamente
pequeño de estudiantes tenían deudas muy elevadas, esto causó una sobreestimación de la media.
Medidas de dispersión
• Suponga que todo lo que se sabe acerca de los 18 sujetos elegidos al azar del Planteamiento
del problema plasmado en el Cuadro 1 es que la media del índice de choque es 0.69. Aunque
la media proporciona información útil, se tiene una mejor idea sobre la distribución de los
índices de choque en estas personas, si se sabe algo acerca de la dispersión o variación de los
resultados.
1. VARIACIÓN
La variación es la diferencia entre el resultado mayor y menor. Es fácil de determinar cuando
los datos se han dispuesto en orden, por ejemplo, el índice de choque menor entre los 18
sujetos es 0.33 y el mayor es 1.30; por tanto la variación será 0.97 (1.30 – 0.33)
- 31 -
Medidas de dispersión
2. DESVIACIÓN ESTÁNDAR
Se simboliza como DE, de, o simplemente
Es la medida de dispersión más utilizada en e.
los datos médicos y de salud, se usa para El nombre del método estadístico antes de
describir la forma en que los resultados se la raíz cuadrada es varianza, pero la
agrupan alrededor de la media y en desviación estándar es el método de
muchas pruebas estadísticas interés primario.
La desviación estándar, al igual que la
Fórmula media, requiere datos numéricos. Es parte
ഥ
σ 𝑿−𝑿 𝟐 esencial de muchas pruebas estadísticas y
𝑫𝑬 = muy útil para describir la dispersión de los
𝒏−𝟏
resultados alrededor del valor medio.
- 32 -
Medidas de dispersión
- 33 -
Medidas de dispersión
2. DESVIACIÓN ESTÁNDAR
1. Considerar X como el índice de choque para cada persona, encontrar la media: la media
es 0.69 como ya se calculó.
2. Restar la media de cada observación para formar las desviaciones X – media.
3. Elevar al cuadrado cada desviación para formar (X – media)2.
4. Sumar las desviaciones al cuadrado.
5. Dividir el resultado del paso 4 entre n – 1, se obtiene 0.075. Este valor es la varianza.
6. Tomar la raíz cuadrada del valor en el paso 5 para encontrar la desviación estándar; se
tiene 0.27
- 34 -
Medidas de dispersión
Cuadro 3. Cálculo de la desviación estándar del índice de choque de una muestra aleatoria de 18 sujetos.
Paciente X ഥ
X-𝑿 ഥ )2
(X - 𝑿 Paciente X ഥ
X-𝑿 ഥ )2
(X - 𝑿
Medidas de dispersión
La desviación estándar junto con la media, pueden ayudar a determinar el sesgo sólo cuando se
dan resúmenes estadísticos: si la media menos 2 DE contiene 0 (es decir, la media es menor que
2 DE), los datos probablemente serán sesgados.
- 36 -
Medidas de dispersión
3. COEFICIENTE DE VARIACIÓN
Es una medida útil de la dispersión relativa de los datos y se emplea con frecuencia
en ciencias biológicas. Por ejemplo, supóngase que Kline et al (2002) quisieron
comparar la variabilidad en el índice de choque con la variabilidad en la presión
arterial sistólica en las personas de su estudio. La media y la desviación estándar del
índice de choque en la muestra total son 0.69 y 0.20; respectivamente; para la
presión sistólica, 138 y 0.26, respectivamente. No tiene sentido comparar las
desviaciones estándar debido a que el índice de choque y la presión arterial se miden
con escalas diferentes.
El coeficiente de variación ajusta las escalas de manera que pueda hacerse
una comparación sensible.
- 37 -
Medidas de dispersión
3. COEFICIENTE DE VARIACIÓN
De esta fórmula, el CV para el índice de
El coeficiente de variación se define choque es (0.20/0.69)(100%) = 29.0% y el
como la desviación estándar dividida coeficiente de variación para la presión
entre la media y multiplicada por arterial sistólica es (26/138)(100%) =
100%. Produce una medida de 18.8%. Por tanto, se concluye que la
variación relativa – que es relativa al variación relativa del índice de choque es
tamaño de la media. considerablemente mayor que la
variación en la presión arterial sistólica.
Fórmula Una aplicación frecuente del coeficiente
𝑫𝑬 de variación en el campo de la salud es
𝑪𝑽 = 𝟏𝟎𝟎% en las pruebas de laboratorio y en los
𝑿
procedimientos de control de calidad.
- 38 -
Medidas de dispersión
4. PERCENTILES
1%
- 39 -
31%
Medidas de dispersión
5. DECILES
Los deciles son 9 valores de la variable que dividen al recorrido en 10 partes iguales. A
cada parte le corresponde el 10% de los datos
D1 D2 D5 D9
10%
20%
50%
- 40 -
Medidas de dispersión
6. CUARTILES
Los cuartiles son 3 valores de la variable que dividen al recorrido en 4 partes iguales.
A cada parte le corresponde el 25% de los datos.
C1 C2 C3
25%
50%
75%
- 41 -
Medidas de dispersión
7. VARIACIÓN INTERCUARTILAR
- 42 -
Medidas de dispersión
Las siguientes guías ayudarán a los investigadores a determinar cuál de las medidas de
dispersión es la más apropiada para un grupo determinado de datos.
- 43 -
Medidas de dispersión
3 La variación intercuartilar se usa para describir el 50% central de una distribución, sin
importar su forma.
- 44 -