Está en la página 1de 22

Facultad de Medicina Humana

Escuela Profesional de Medicina Humana

Escalas de medición.
Medidas de tendencia central y de
dispersión
Ms. Zoraida Yanet Vidal Melgarejo
zvidalm@upao.edu.pe
Dr. Alex Napoleón Castañeda Sabogal
acastanedas1@upao.edu.pe
Ing. Agustín Eduardo Ullón Ramírez
aullor@upao.edu.pe

Adaptado de: Bioestadística Médica. Dawson & Trapp.


Editorial Manual Moderno. 2005.

ESCALAS DE MEDICIÓN

 La escala para medir una característica


(variable) tiene implicaciones en la forma de
presentar y resumir la información.

 La escala de medición – precisión con la que


se mide una característica – también
determina el método estadístico escogido
para analizar los datos.

-2-

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 1
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

ESCALAS DE MEDICIÓN

• Nominal
01
Ordinal
02
Numérica
03

 Las tres escalas de medición más usadas en la medición:


3

ESCALAS DE MEDICIÓN
Las escalas nominales se usan en el nivel más simple
Nominal de medición, cuando los valores de los datos caen en
categorías.

 Las observaciones pueden ser dicotómicas o binarias.


Aunque se habla de un dato nominal como SEXO – (GÉNERO)
perteneciente a una escala de medición, de hecho no se
miden datos nominales, en su lugar se cuenta el
número de observaciones con o sin el atributo de
interés.
 Por lo general, el resultado de un tratamiento médico o
procedimiento quirúrgico, así como la presencia de 1. Hombre ( ) 2. Mujer ( )
factores de riesgo o exposición posibles, se describen
como ocurrentes o no ocurrentes.
-4-

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 2
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

ESCALAS DE MEDICIÓN
Nominal Velocidad del Baño en
Marea de
Categoría tormenta
viento (mph) tierra
(pies)
 Los resultados pueden describirse con
1 74 – 95 Mínimo 4.5
más de dos categorías, como la
clasificación de las anemias en microcítica 2 96 – 110 Moderado 6.8
(incluida la ferropénica), macrocítica o 3 111 – 130 Extenso 9.12
megaloblástica (incluida la que produce la
4 131 - 155 Extremo 13.18
deficiencia de vitamina B12) y normocítica
(relacionada con enfermedades crónicas) 5 Over 155 Catastrófico 19+

 Los datos evaluados en ocasiones suelen llamarse observaciones cualitativas,


describen una cualidad de la persona o cosa estudiada, u observaciones categóricas,
si los valores caen en categorías.
-5-

ESCALAS DE MEDICIÓN
Nominal

 En general, los datos nominales o cualitativos se


describen en términos de porcentajes o
proporciones. Por ejemplo, en el estudio de
pacientes con hemofilia adquirida (Bossi et al,
1998), 38% de los pacientes tuvo hematuria.

 A menudo se utilizan tablas de contingencia y las


gráficas de barras para mostrar este tipo de
información, la cual se presenta en cuadros y
gráficas para datos nominales y ordinales.
-6-

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 3
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

ESCALAS DE MEDICIÓN
Cuando ocurre un orden inherente dentro de las
categorías, se dice que las observaciones se miden en
Ordinal
una escala ordinal.

 Las observaciones también se clasifican, como en las escalas nominales, pero


algunas observaciones son más o mayores que otras.
 A menudo, se emplean escalas ordinales para determinar la cantidad de riesgo de
un paciente o el tipo apropiado de tratamiento, por ejemplo los tumores se
clasifican según su grado de desarrollo.

La clasificación internacional del carcinoma del cérvix es una escala ordinal de 1 a 4, en la cual
la etapa 0 representa carcinoma in situ y la etapa 4 señala carcinoma que se extiende más allá
de la pelvis o afecta a las mucosas de vejiga y recto. Resulta obvio que el orden inherente a
esta escala ordinal será que el pronóstico para la etapa 4 es peor que para la etapa 0.

-7-

ESCALAS DE MEDICIÓN
Ordinal
OPINIÓN Bueno / Regular / Malo

E S TA D O D E PA C I E N T E Crítico / Estable / En mejoría / Sano

CARGO Presidente / Vicepresidente / Secretario

PREMIACIÓN 1er / 2do / 3er lugar

-8-

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 4
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

ESCALAS DE MEDICIÓN
Ordinal

 Aunque existe cierto orden entre las categorías,


la diferencia entre dos categorías adyacentes no
es la misma en toda la escala. Por ejemplo, la
escala de Apgar, el cual califica la madurez de los
recién nacidos en puntos de 0 a 10, la calificación
más baja indica depresión del funcionamiento
cardiorrespiratorio y neurológico, la más alta
representa una buena función. Es probable que la
diferencia entre las calificaciones 8 y 9 no sea de
la misma magnitud que la diferencia entre 0 y 1.

-9-

ESCALAS DE MEDICIÓN
Ordinal

 Algunas escalas consisten en calificaciones de múltiples factores que se añaden


para lograr un índice total. Un índice utilizado con frecuencia para calcular el
riesgo cardiaco en procedimiento quirúrgicos no cardiacos fue creado por
Goldman et al (1977, 1995), asigna una puntuación a una serie de factores como:
mayores de 70 años, antecedente de infarto del miocardio en los últimos 6 meses,
alteraciones específicas en el electrocardiograma y estado físico general. Los
puntos se suman para obtener una calificación total en el índice de Goldman, el
cual va de 0 a 53, y se usa para indicar el riesgo de complicaciones o muerte según
las distintas calificaciones.

- 10 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 5
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

ESCALAS DE MEDICIÓN
Ordinal 1
0
 Un tipo especial es la escala de orden por rango, las 9
observaciones se clasifican por rango, desde el más alto al
8
más bajo (o viceversa). La duración de los procedimientos
7
quirúrgicos puede convertirse a una escala de rangos para
6
obtener una medida de la dificultad del procedimiento.
 Es común el uso de porcentajes y proporciones. A veces, 5
Severo
el grupo de datos medidos se resume en un valor medio. 4
Con un gran número de valores algunas veces se tratan 3 Moderado
como si éstos fueran numéricos. 2
Leve
1
0
Los mismos tipos de cuadros y gráficas empleados para los datos nominales
también pueden usarse para los ordinales.
- 11 -

Escalas de medición
A las observaciones por las cuales las diferencias entre
Numérica números tienen significado en una escala numérica se
les denomina observaciones cuantitativas, miden la
cantidad de algo.

 Existen dos tipos de escalas numéricas:


 Una escala de intervalo o continua tiene valores en
una fase continua (por ejemplo, la edad)
 Una escala discreta tiene valores iguales en los
números enteros (por ejemplo, número de
fracturas).
Si no es necesario que los datos sean tan precisos, los datos continuos pueden
redondearse hasta el número entero más cercano, sin embargo, en teoría es
posible hacer mediciones más precisas.
- 12 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 6
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Escalas de medición

Numérica

 La edad es una medida continua, basta aproximar la edad hasta el año más
cercano en estudios de adultos, pero en niños pequeños se prefiere aproximar la
edad al mes más cercano; otros ejemplos son peso, talla, tiempo de supervivencia,
grado de movilidad articular, así como muchos datos de laboratorio.
 Cuando una observación numérica se hace sólo en valores enteros, la escala de
medición es discreta. Por ejemplo, los conteos de eventos – número de embarazos,
cirugías previas, factores de riesgo - son medidas discretas.

En el estudio de Kline et al. (2002) se evaluaron varias características de los pacientes, incluyendo índice
de choque y embolia pulmonar (EP). La primera característica se mide en una escala numérica debido a
que puede tomar un solo valor individual dentro del límite posible de valores.

- 13 -

Escalas de medición

Numérica

 La presencia de EP tiene una escala nominal con sólo dos valores: presencia o
ausencia. En el estudio de Ballard et al. (1998), el número de recién nacidos que
presentó síndrome de insuficiencia respiratoria es un ejemplo de una escala
numérica discreta.

 Con frecuencia, las características medidas en una escala numérica se muestran en


una variedad de cuadros y gráficas. Por lo general, se usan medias y desviaciones
estándar para resumir los valores de las mediciones numéricas.

- 14 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 7
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central

 Cuando un investigador obtiene muchas observaciones como el índice de choque o


la presión arterial, los número que resumen los datos pueden proporcionar mucha
información.
 Las tres medidas de tendencia central más utilizadas en medicina y epidemiología
son la media, la mediana y en menor grado, la moda.

1 MEDIA 2 MEDIANA 3 MODA

Las tres se emplean para datos numéricos, pero las dos últimas también se
pueden utilizar en datos ordinales.
- 15 -

Medidas de tendencia central

1 MEDIA

Aunque es posible calcular varias medias con métodos matemáticos, la media


aritmética es la más usada en estadística, se le conoce como “media”.
 La media es el promedio aritmético de las observaciones.
 Se le simboliza con 𝑿ഥ.

Fórmula Media
σ𝑋
𝑋ത =
𝑛
Donde:
X: representa los datos individuales.
n: número total de datos. MEDIA
- 16 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 8
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central

1 MEDIA Planteamiento del problema 1: Enunciado del estudio de Kline et al. (2002)

La embolia pulmonar (EP) es una causa importante de morbilidad y mortalidad. Las manifestaciones clínicas son inespecíficas y un
diagnóstico certero a menudo es difícil de realizar. Se han realizado esfuerzos por simplificar y mejorar el proceso diagnóstico evaluando
a los pacientes con posible EP mediante dos componentes: la determinación de la probabilidad por preprueba y la prueba del dímero D.
La probabilidad por preprueba se determina con el desarrollo de criterios explícitos para determinar la probabilidad clínica de EP. La
prueba del dímero D mide la formación del dímero D cuando las redes de fibrina en el trombo son destruidas por medio de la plasmina.
Puede usarse un elevado nivel de dímero D para descubrir trombosis venosa profunda (TVP) y EP. Algunas pruebas de dímero D son muy
sensibles para TVP, y puede usarse un resultado normal para descartar el tromboembolismo venoso.
Kline et al. (2002) decidieron desarrollar un conjunto de criterios clínicos que definiría un subgrupo de pacientes con una probabilidad
por preprueba de EP mayor a 40% (grupo de alto riesgo). Estos pacientes tendrían un riesgo tan elevado de experimentar EP como para
excluir el diagnóstico con base en la comprobación del dímero D. Sin embargo, pacientes con una probabilidad por preprueba más baja
(grupo de bajo riesgo), en quienes un resultado normal podría ayudar a excluir el diagnóstico de EP, podrían ser los candidatos ideales
para la comprobación con el dímero D. Los datos se obtuvieron de 931 pacientes con sospecha de EP en siete servicios de urgencias
urbano en EUA. Los investigadores midieron varios factores de riesgo potenciales para EP, y se observaron algunos atributos básicos
como índice de choque, presión arterial sistólica y frecuencia cardiaca.
- 17 -

Medidas de tendencia central

1 MEDIA
 El Cuadro 1 muestra el valor del índice de choque, presión arterial sistólica y
frecuencia cardiaca de 18 pacientes seleccionados al azar en el estudio del dímero D
(Kline et al, 2002).
 El índice de choque para estos 18 pacientes es:
σ𝑋 0.61+0.56+⋯+0.85+0.44 12.41
𝑋ത = 𝑛
= 18
= 18
= 𝟎. 𝟔𝟖𝟗

 La media es sensible a valores extremos de un grupo de datos, sobre todo cuando el


tamaño de la muestra es pequeño. Por ejemplo, los valores 1.30 y 1.29 para los
sujetos 15 y 16, son relativamente grandes comparados con los valores de los otros
sujetos de este grupo. Si no estuvieran estos valores, la media sería de 0.614 en vez
de 0.689
- 18 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 9
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central


Cuadro 1. Índice de choque para una muestra aleatoria de 18 pacientes.

Nro. de Índice de Presión arterial Frecuencia Nro. de Índice de Presión arterial Frecuencia
pacientes choque sistólica cardiaca pacientes choque sistólica cardiaca
1 0.61 139 85 10 0.63 161 102
2 0.56 151 84 11 0.55 164
3 0.52 201 104 12 0.50 138 69
4 0.33 170 56 13 0.75 118 89
5 0.45 123 55 14 0.82 130 106
6 0.74 121 90 15 1.30 109 142
7 0.73 119 87 16 1.29 92 119
8 0.92 100 92 17 0.85 126 107
9 0.42 164 69 18 0.44 139 61

- 19 -

Medidas de tendencia central

1 MEDIA

 La media se usa cuando se pueden sumar los números, es decir, cuando se miden las
características en una escala numérica, no debe emplearse con datos ordinales
debido a la naturaleza arbitraria de la escala ordinal.

 Si no estuvieran disponibles los datos originales, la media puede calcularse a partir


de una tabla de frecuencia. El promedio cargado se obtiene multiplicando el valor
de cada dato por el número de observaciones que tiene ese valor, se añaden los
productos y se divide la suma entre el número total de datos.

- 20 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 10
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central

1 MEDIA
• En el Cuadro 2 se presenta una tabla de frecuencia de las observaciones del índice de
choque que se puede usar para calcular el índice de choque medio de la frecuencia
cardiaca para todos los sujetos del estudio en quienes se haya registrado la medición.
• El cálculo del promedio cargado de la media usando el número de personas y de los
puntos medios de cada intervalo es:
0.35 × 38 + 0.45 × 104 + ⋯ + 1.25 × 19 642.75
= = 0.690
931 931
(*) El valor 0.35 es el valor medio del primer intervalo (menos de 0.40), el valor 0.45 es el valor
medio del segundo intervalo (0.40 hasta 0.50).

- 21 -

Medidas de tendencia central


Cuadro 2. Distribución de frecuencia del índice de choque en intervalos de 10 puntos.

Cuenta Porcentaje Gráfica de


Índice de choque Cuenta Porcentaje
acumulada acumulado porcentaje
[menos de 0.40> 38 38 4.08 4.08 /
[0.40 hasta 0.50> 104 142 11.17 15.25 ////
[0.50 hasta 0.60> 198 340 21.27 36.52 ///////
[0.60 hasta 0.70> 199 539 21.37 57.89 ///////
[0.70 hasta 0.80> 155 694 16.65 74.54 //////
[0.80 hasta 0.90> 102 796 10.96 85.50 ////
[0.90 hasta 1.00> 60 856 6.44 91.94 //
[1.00 hasta 1.10> 37 893 3.97 95.92 /
[1.10 hasta 1.20> 19 912 2.04 97.96 /
[1.20 = o más> 19 931 2.04 100.00 /

- 22 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 11
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central

1 MEDIA

El valor de la media calculado a partir de una tabla de frecuencia no siempre es la misma que
al obtenido con los números reales. En el ejemplo, la media del índice de choque calculada de
los números reales y la tabla de frecuencias son muy semejantes.

 Los investigadores que calculan la media para


presentar un trabajo o dar una conferencia deben
tener las observaciones originales y emplear la
fórmula exacta.
 Es útil la fórmula con una tabla de frecuencias
cuando, como lectores de un artículo, no se tiene
MEDIA
acceso a los datos reales, pero se quieren calcular,
a partir de dicha tabla, la media
- 23 -

Medidas de tendencia central

2 MEDIANA

La mediana es la observación media, es decir, el punto a partir del cual la mitad de los
datos son menores y la otra mitad son mayores. Se le simboliza con M o Md.

 El procedimiento para calcular la mediana es:


1. Disponer los datos desde el menor hasta el
mayor (o viceversa)
2. Contar hasta encontrar el valor medio. La
mediana es el valor medio para un número
impar de observaciones: se define como la
media de los dos valores medios para un
número par de observaciones
- 24 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 12
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central


2 MEDIANA Por ejemplo, en orden (del menor al mayor) los valores en el
índice de choque en el cuadro 1 son los siguientes:

0.33, 0.42, 0.44, 0.45, 0.50, 0.52, 0.55, 0.56, 0.61, 0.63, 0.73, 0.74, 0.75, 0.82, 0.85, 0.92, 1.29, 1.30

 La mediana es la media entre el  La mediana es menos sensible a


noveno y el décimo valor (0.61 y valores extremos que la media,
0.63) o 0.62. entonces, si la observación mayor 1.30
se eliminará de la muestra, la mediana
 La mediana dice que la mitad de los sería el valor medio, 0.61.
valores de la variación en la
frecuencia cardiaca de este grupo de  La mediana también se usa con
personas es inferior a 0.62, y la otra observaciones ordinales.
mitad es superior a ese valor. - 25 -

Medidas de tendencia central

3 MODA

 La moda es el valor que se presenta con


mayor frecuencia. Se usa, por lo general,
con grandes cantidades de datos cuando se
desea designar el valor que más se repite.
 Ninguno de los resultados se presenta con MODA

mucha frecuencia en los datos de la


frecuencia cardiaca del Cuadro 1.  En el caso de los datos del índice de
 Para tablas de frecuencia o pequeñas choque del Cuadro 2, la clase modal
cantidades, la moda se calcula a partir de la es 0.60 a 0.69 con 199 pacientes.
clase modal.
Cuando un grupo de datos tienes dos modas, se llama bimodal
- 26 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 13
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central

4 MEDIA GEOMÉTRICA
La media geométrica generalmente
Otra medida de tendencia central que se usa con datos medidos en una
no se usa tanto como la media escala logarítmica.
aritmética o la mediana es la media Tomando el logaritmo de ambos
geométrica, simbolizada como MG o G, lados de la ecuación precedente, se
y se define como la raíz n del producto observa que el logaritmo de la media
de n observaciones. geométrica es igual a la media de los
Fórmula logaritmos de las observaciones.
𝒏
𝑴𝑮 = 𝒙𝟏 𝒙𝟐 𝒙𝟑 … 𝒙𝒏
𝑙𝑜𝑔 𝑋
Donde: 𝑙𝑜𝑔 𝑀𝐺 = ෍
𝑛
n : número total de observaciones.
xi : valor de la observación i
- 27 -

Medidas de tendencia central


USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

Para determinar la mejor medida de tendencia central para un grupo particular de


datos debe tomarse en cuenta dos factores importantes: la escala de la medición
(ordinal o numérica) y la forma de distribución de los resultados (si la distribución es
simétrica respecto a la media o si se carga a la izquierda o a la derecha de la media).

- 28 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 14
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de tendencia central


Los siguientes puntos pueden ayudar a conocer la forma de distribuir los datos
de manera simplificada:

1. Si la media y la mediana son iguales, la distribución de los resultados es simétrica.


2. Si la media es mayor que la mediana, la distribución se carga a la derecha.
3. Si la media es menor que la mediana, la distribución se carga a la izquierda.

Media
Media Mediana Moda Mediana Moda Mediana Media
Moda
Asimétrica hacia la Asimétrica hacia la
Simétrica
izquierda derecha
- 29 -

Medidas de tendencia central

 La media se usa para  La moda se utiliza


datos numéricos y principalmente para
distribuciones simétricas distribuciones bimodales.
(no cargadas).

 La mediana se utiliza
 La media geométrica se
para datos ordinales o
usa generalmente para
para datos numéricos si
observaciones medidas
la distribución está
en escala logarítmica.
cargada.

En un estudio acerca del incremento de la deuda educacional entre estudiantes de medicina canadienses,
Kwong et al. (2002) reportaron acerca del valor medio de la deuda de los estudiantes graduados.
Establecieron que usaban mejor la mediana en lugar de la media sólo porque un número relativamente
pequeño de estudiantes tenían deudas muy elevadas, esto causó una sobreestimación de la media.

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 15
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión
• Suponga que todo lo que se sabe acerca de los 18 sujetos elegidos al azar del Planteamiento
del problema plasmado en el Cuadro 1 es que la media del índice de choque es 0.69. Aunque
la media proporciona información útil, se tiene una mejor idea sobre la distribución de los
índices de choque en estas personas, si se sabe algo acerca de la dispersión o variación de los
resultados.

1. VARIACIÓN
La variación es la diferencia entre el resultado mayor y menor. Es fácil de determinar cuando
los datos se han dispuesto en orden, por ejemplo, el índice de choque menor entre los 18
sujetos es 0.33 y el mayor es 1.30; por tanto la variación será 0.97 (1.30 – 0.33)

𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟

- 31 -

Medidas de dispersión
2. DESVIACIÓN ESTÁNDAR
Se simboliza como DE, de, o simplemente
Es la medida de dispersión más utilizada en e.
los datos médicos y de salud, se usa para El nombre del método estadístico antes de
describir la forma en que los resultados se la raíz cuadrada es varianza, pero la
agrupan alrededor de la media y en desviación estándar es el método de
muchas pruebas estadísticas interés primario.
La desviación estándar, al igual que la
Fórmula media, requiere datos numéricos. Es parte

σ 𝑿−𝑿 𝟐 esencial de muchas pruebas estadísticas y
𝑫𝑬 = muy útil para describir la dispersión de los
𝒏−𝟏
resultados alrededor del valor medio.

- 32 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 16
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión

La desviación estándar es una medida de la


2. DESVIACIÓN ESTÁNDAR
dispersión de los datos sobre su media.

 Usar n-1 en vez de n en el denominador produce un cálculo más exacto de la desviación


estándar de la población verdadera, y tiene propiedades matemáticas deseables para
hacer inferencias estadísticas.
 La fórmula anterior de la desviación estándar, llamada fórmula definitoria, no suele
presentarse en los textos introductorios; en su lugar se emplea la fórmula computacional.
 A continuación se realiza el cálculo aplicando la fórmula definitoria. Los resultados del
índice de choque de los 18 sujetos se repiten en el Cuadro 3. Se aplican los siguientes
pasos:

- 33 -

Medidas de dispersión

2. DESVIACIÓN ESTÁNDAR

1. Considerar X como el índice de choque para cada persona, encontrar la media: la media
es 0.69 como ya se calculó.
2. Restar la media de cada observación para formar las desviaciones X – media.
3. Elevar al cuadrado cada desviación para formar (X – media)2.
4. Sumar las desviaciones al cuadrado.
5. Dividir el resultado del paso 4 entre n – 1, se obtiene 0.075. Este valor es la varianza.
6. Tomar la raíz cuadrada del valor en el paso 5 para encontrar la desviación estándar; se
tiene 0.27

- 34 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 17
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión
Cuadro 3. Cálculo de la desviación estándar del índice de choque de una muestra aleatoria de 18 sujetos.

Paciente X ഥ
X-𝑿 ഥ )2
(X - 𝑿 Paciente X ഥ
X-𝑿 ഥ )2
(X - 𝑿

1 0.61 -0.08 0.01 12 0.50 -0.19 0.04

2 0.56 -0.13 0.02 13 0.75 0.06 0.00


14 0.82 0.13 0.02
3 0.52 -0.17 0.03
15 1.30 0.61 0.37
4 0.33 -0.36 0.13
16 1.29 0.60 0.36
5 0.45 -0.24 0.06
17 0.85 0.16 0.03
6 0.74 0.05 0.00 18 0.44 -0.25 0.06
7 0.73 0.04 0.00 Suma 12.41 1.27
8 0.92 0.23 0.05 Media 0.69

9 0.42 -0.27 0.07 Varianza 0.075


Desviación
10 0.63 -0.06 0.00 0.27
estándar
11 0.55 -0.14 0.02 - 35 -

Medidas de dispersión

Respecto de la desviación estándar, las dos reglas siguientes son importantes:


Al menos 75% de los valores siempre quedan entre estos dos números: la media menos 2
desviaciones estándar y la media más 2 desviaciones estándar.
Si la distribución de los datos tiene forma de campana, con mayor razón se puede decir
acerca del porcentaje de resultados que quedan entre la media y +/- 2 desviaciones
estándar. Para una distribución en forma de campana, aproximadamente:
 67% de las observaciones quedan entre la media +/- 1 desviación estándar.
 95% de los resultados quedan entre la media +/- 2 desviaciones estándar.
 99.7% de las observaciones quedan entre la media +/- 3 desviaciones estándar.

La desviación estándar junto con la media, pueden ayudar a determinar el sesgo sólo cuando se
dan resúmenes estadísticos: si la media menos 2 DE contiene 0 (es decir, la media es menor que
2 DE), los datos probablemente serán sesgados.
- 36 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 18
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión
3. COEFICIENTE DE VARIACIÓN

Es una medida útil de la dispersión relativa de los datos y se emplea con frecuencia
en ciencias biológicas. Por ejemplo, supóngase que Kline et al (2002) quisieron
comparar la variabilidad en el índice de choque con la variabilidad en la presión
arterial sistólica en las personas de su estudio. La media y la desviación estándar del
índice de choque en la muestra total son 0.69 y 0.20; respectivamente; para la
presión sistólica, 138 y 0.26, respectivamente. No tiene sentido comparar las
desviaciones estándar debido a que el índice de choque y la presión arterial se miden
con escalas diferentes.
El coeficiente de variación ajusta las escalas de manera que pueda hacerse
una comparación sensible.

- 37 -

Medidas de dispersión
3. COEFICIENTE DE VARIACIÓN
De esta fórmula, el CV para el índice de
El coeficiente de variación se define choque es (0.20/0.69)(100%) = 29.0% y el
como la desviación estándar dividida coeficiente de variación para la presión
entre la media y multiplicada por arterial sistólica es (26/138)(100%) =
100%. Produce una medida de 18.8%. Por tanto, se concluye que la
variación relativa – que es relativa al variación relativa del índice de choque es
tamaño de la media. considerablemente mayor que la
variación en la presión arterial sistólica.
Fórmula Una aplicación frecuente del coeficiente
𝑫𝑬 de variación en el campo de la salud es
𝑪𝑽 = 𝟏𝟎𝟎% en las pruebas de laboratorio y en los
𝑿
procedimientos de control de calidad.
- 38 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 19
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión
4. PERCENTILES

 El percentil es el porcentaje de una distribución que es igual o menor a un número


en particular. A menudo se usan para comparar el valor de un individuo con el
normal. Se utilizan para crear e interpretar diagramas de crecimiento físico y
mediciones de capacidad e inteligencia. También determinan las variaciones
normales de las cifras de laboratorio.
 Son 99 valores de la variable que dividen al recorrido de la variable en 100 partes
iguales. A cada parte corresponde el 1% de los datos.

P1 P2 P31 P98 P99

1%
- 39 -
31%

Medidas de dispersión
5. DECILES

Los deciles son 9 valores de la variable que dividen al recorrido en 10 partes iguales. A
cada parte le corresponde el 10% de los datos

D1 D2 D5 D9

10%
20%
50%

- 40 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 20
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión
6. CUARTILES

Los cuartiles son 3 valores de la variable que dividen al recorrido en 4 partes iguales.
A cada parte le corresponde el 25% de los datos.

C1 C2 C3

25%
50%
75%

- 41 -

Medidas de dispersión
7. VARIACIÓN INTERCUARTILAR

• Una medida de variación que permite


el uso de percentiles es la variación Por ejemplo, la variación
intercuartilar, definida como la intercuartilar del peso de niñas de 9
diferencia entre los percentiles 25 y meses de edad es la diferencia entre
75, también llamadas primero y 7.5 kg (percentil 75) y 6.5 kg
tercero cuartiles, respectivamente. (percentil 25), es decir, 50% de las
• La variación intercuartilar tiene 50% niñas pesan entre 6.5 y 7.5 kg a los
central de los resultados. nueve meses de edad.

- 42 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 21
Ing. Agustín Ullón
Facultad de Medicina Humana
Escuela Profesional de Medicina Humana

Medidas de dispersión

Las siguientes guías ayudarán a los investigadores a determinar cuál de las medidas de
dispersión es la más apropiada para un grupo determinado de datos.

1 La desviación estándar se usa al emplear la media (es decir, con datos


numéricos simétricos).

2 Los percentiles y la variación intercuartilar se utilizan en dos situaciones:


 Cuando se usa la media (por ejemplo con datos ordinales o numéricos
cargados).
 Cuando se utiliza la media pero el objetivo es comparar las observaciones
individuales con un grupo de valores normales.

- 43 -

Medidas de dispersión

3 La variación intercuartilar se usa para describir el 50% central de una distribución, sin
importar su forma.

La variación se utiliza con datos numéricos cuando el objetivo es destacar valores


4
extremos.

5 El coeficiente de variación se utiliza cuando el objetivo es comparar distribuciones


numéricas medidas en escalas diferentes.

- 44 -

Curso: Informática y Bioestadística Tema: Medidas de tendencia central y de


Docentes: Ms. Zoraida Vidal / Dr. Alex Castañeda / dispersión Pág. 22
Ing. Agustín Ullón

También podría gustarte