Está en la página 1de 40

LICENCIATURA

EN NUTRICIÓN
GESTIONADO CON MODALIDAD A DISTANCIA

Asignatura Bioestadística

Unidad didáctica 2. Medidas de tendencia central y dispersión

Tema 1. Media, mediana, moda. Cuartilos, decilos


y percentilos

Autoras Sandra Cavallaro y Karina Cavallaro


Objetivos
Mapa conceptual
Medidas de tendencia central

Características
Marca de clase
Cómo calcular la media paso a paso
10
12

16
Medidas de posición de variables cuantitativas
22
25
26
30
32
33
Ideas clave
Al finalizar el trabajo con este tema serás capaz de:
Cuartilos
Licenciatura en Nutrición

1. Medidas de tendencia central

Las medidas de tendencia central ofrecen información sobre los valores típico o
promedio de un conjunto de datos.

Existen varias medidas de este tipo, como veremos a continuación.

1.1. Media aritmética

La media aritmética o media es la medida de tendencia central más conocida y es


lo que generalmente llamamos “promedio”.

Como es una forma frecuente de cálculo en el en-


torno escolar, la mayoría está al tanto de su uso y
aplicación. Para su cálculo necesitamos sumar cada tamos sumar cada valor
valor obtenido hasta llegar al total y luego dividirlo obtenido hasta llegar al
por la cantidad de datos.

Para calcular la nota promedio que obtuvimos en determinada materia, debemos


sumar cada una de las calificaciones obtenidas y luego dividir ese total por la
cantidad de calificaciones. Por ejemplo, si nos sacamos un 7, un 6, un 9 y un 5, el
cálculo del promedio será el siguiente:

7 + 6 + 9 + 5 = 27/4 = 6,75

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


5
Licenciatura en Nutrición

Para definirla más formalmente, la media se representa con la siguiente fórmula:

Sumatoria de
cada dato

Media Cantidad de
datos

1.1.1. Características
La media representa todos los valores del conjunto de datos, por lo que cada uno de ellos
afecta a la media.

Aunque la media es confiable porque refleja todos los valores del conjunto de datos, pue-
de ser afectada por los valores extremos y de esa forma llegar a ser una medida menos
representativa, por lo que, si la distribución es asimétrica, la media aritmética no constituye
un valor típico.

AÑO VALOR
1 3,25
2 4,50
3 3,30
4 2,25
5 8,52
6 9,85
7 3,40
8 2,98
9 3,11
10 3,23
11 3,20
12 2,98

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


6
Licenciatura en Nutrición

Este ejemplo muestra cómo los valores que difieren mucho de la serie de datos influyen en
el valor de la media y pueden sobreestimar o subestimar (si son muy bajos) el promedio total.

EJEMPLO:

Veamos ahora esta serie de datos:

1, 1, 2, 2, 4, 4, 5, 2, 3, 2, 3, 4, 1, 2, 1.

Como sabemos, la media aritmética se calcula sumando cada dato y dividiendo


por la cantidad. En este caso, el cálculo de la media es aproximadamente igual a
2,4666.

37 / 15 = 2,4666

Si realizamos este mismo cálculo agrupando los datos que aparecen más de una
vez, podemos obtener el mismo valor. Entonces, realicemos una tabla agrupando
los datos y luego calculemos la media para valores agrupados.

Dato (xi) Frecuencia (fi) Producto xi * fi Media =


SUM xi * fi / SUM fi
1 4 4
2 5 10
3 2 6
2,46
4 3 12
5 1 5
SUM: 15 SUM: 37

Como se observa en la tabla, los datos agrupados ofrecen una forma ordenada
de cálculo.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


7
Licenciatura en Nutrición

1.1.2. Marca de clase


Como estudiamos en la unidad 1, la marca de clase
es el punto medio de cada intervalo. Es el valor que representa
a todo el intervalo para
Es el valor que representa a todo el intervalo para
el cálculo de algunos
el cálculo de algunos parámetros como la media
parámetros como la
aritmética y se representa por ci o xi .
media aritmética y se
Cada clase está delimitada por el límite inferior y el representa por ci o xi.
límite superior de la clase. Sabemos que el límite
inferior es el menor valor del intervalo, mientras que
el límite superior no está incluido en el intervalo, sino que pertenece al intervalo siguiente
(menor número del intervalo siguiente). En la representación se utiliza un corchete cuando
el número pertenece al intervalo y un paréntesis cuando no está incluido.

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13

ci fi
[0, 5) 2,5 1
[5, 10) 7,5 1
[10, 15) 12,5 3
[15, 20) 17,5 3
[20, 25) 22,5 3
[25, 30) 27,5 6
[30, 35) 32,5 7
[35, 40) 37,5 10
[40, 45) 42,5 4
[45, 50) 47,5 2
40

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


8
Licenciatura en Nutrición

La marca de clase se calcula como el promedio del intervalo: 30 + 35 / 2 = 37,5

1.1.3. Cómo calcular la media paso a paso


A continuación veremos un ejemplo de cómo calcular la media paso a paso.

Supongamos que debemos hallar el valor medio de la siguiente tabla de datos:

Intervalo Frecuencia (f)


10 - 20 4
21 - 30 5
31 - 40 9
41 - 50 8
N = 26

(N corresponde al total de observaciones, es decir, a la frecuencia acumulada).

Primero calculamos la marca de clase (son intervalos, así que se debe calcular la marca de
clase sin excepción).

Intervalo Frecuencia (f) Marca de clase


(X)
10 - 20 4 15
21 - 30 5 25,5
31 - 40 9 35,5
41 - 50 8 45,5
N = 26

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


9
Licenciatura en Nutrición

A continuación se calcula la media multiplicando cada marca de clase por la frecuencia y


luego se suman todos los resultados. Por último, se realiza la división de la sumatoria cal-
culada por el total de casos (es decir, la frecuencia acumulada o N).

Intervalo F X F*X
10 - 20 4 15 60
21 - 30 5 25,5 127,5
31 -40 9 35,5 319,5
41 - 50 8 45,5 364
26 871

Media = 871 / 26 = 33,5

1.2. Media ponderada

La media ponderada (MP) es una medida de tendencia central que es adecuada


para asignar una importancia relativa a cada dato en un conjunto de datos.

Esta importancia o peso se asigna en función de alguna propiedad u objetivo.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


10
Licenciatura en Nutrición

Su fórmula es la siguiente:

Wi = factor de ponderación

Xi = valor de la variable

Examen Nota
1° parcial 5
2° parcial 7
Final 9

(5 + 7 + 9) / 3 = 7

cada evaluación. Por ejemplo, el primer parcial vale el 30% de la nota final, el se-
gundo examen el 20% y el tercer examen, el 50%.

Datos Peso
5 0,30
7 0,20
9 0,50

(5 × 0,30) + (7 × 0,20) + (9 × 0,50)] / (0,30 + 0,20 + 0,50)

= (1,5 + 1,4 + 4,5) / 1 = 7,4

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


11
Licenciatura en Nutrición

Diferenciemos variable y ponderación.

Las variables son los distintos valores que puede asumir el fenómeno que se es-
tudia. (En el ejemplo que vimos, las notas de un examen).

La ponderación es el valor diferencial que tendría cada valor de la variable, según


el estudio que se hace.

1.3. Mediana

La mediana es la medida que divide los datos de una serie, ordenados en mag-
nitud, en dos partes iguales.

Puede ser llamada media posicional, porque se sitúa en el centro exacto de un conjunto de
datos ordenados. La mitad de las observaciones estarán por encima de la mediana y la otra
mitad, por debajo de ella.

Para poder calcular la mediana es necesario ordenar las observaciones en orden creciente o
decreciente y determinar su posición teniendo en cuenta si el número de datos es par o impar.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


12
Licenciatura en Nutrición

3,5 / 4,1 / 3,8 / 4,5 / 3,9

3,5 / 3,8 / 3,9 / 4,1 / 4,5

En este ejemplo hemos calculado el valor de la mediana para NÚMERos impares.

¿Qué ocurre cuando queremos calcular la mediana y tenemos una cantidad par de datos?
En ese caso debemos obtener el valor medio de los datos centrales de la serie ordenada.

Mediana: (4 + 6) / 2 = 5

La mediana, entonces, es el valor que deja a la mitad de los datos por encima de dicho
valor y a la otra mitad por debajo.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


13
Licenciatura en Nutrición

En el caso de que los datos se presenten agrupados en intervalos, para el cálculo de la


mediana se utiliza la siguiente fórmula:

Tamaño de la muestra.
Frecuencia acumulada
hasta ese límite inferior
(n / 2) - fa
Mdn = Li + ×A Amplitud del intervalo.
fi

Límite inferior del intervalo Frecuencia del intervalo que


que contiene a la mediana. contiene la mediana.

Valores Frecuencia absoluta Frecuencia acumulada


3-5 20 20
6-8 30 50
9 - 11 40 90
12 - 14 60 150
15 - 17 30 180
18 - 20 20 200
200

Aplicando la fórmula:

Mdn = 11,5 × 3 = 12

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


14
Licenciatura en Nutrición

1.4. Moda

La moda es el valor de la variable que tenga mayor frecuencia absoluta, es decir,


la variable que más se repite.

En el ejemplo anterior, el valor que más se repite tiene frecuencia = 60; por lo tanto, la
moda en esa serie de datos está ubicada en el intervalo con dicha frecuencia, en este
caso 12 - 14

Si la cantidad de observaciones es muy pequeña, ¿la moda es un valor significativo? La


respuesta a esta pregunta es: no, porque al ser muy pocas observaciones, la moda no es
un dato relevante.

12 / 1 / 12 / 15 / 16 / 1 / 1 / 12 / 9

Cuando hay dos modas, se trata de una muestra bimodal. Si en una muestra aparecen
más de dos modas, estamos frente a una muestra multimodal.

Cuando tenemos valores agrupados en una distribución de frecuencias, se toma como


moda el punto medio del intervalo con mayor frecuencia. También en distribuciones de
frecuencias pueden darse los mismos casos anteriores. En ellos se utilizarían las mismas
reglas que expusimos, pero aplicadas a los puntos medios de los intervalos.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


15
Licenciatura en Nutrición

clase) del intervalo con mayor frecuencia:

Valores Frecuencia
absoluta
3-5 20
6-8 30
9 - 11 40
12 - 14 60
15 - 17 30
18 - 20 20
200

La moda es la marca de clase del intervalo 12 - 14.

Moda = 13

1.5. Comparación entre las medidas de tendencia central

Hemos conocido hasta aquí los tres índices de tendencia central más utilizados, pero nos
queda por plantear una pregunta importante: ¿con qué criterios elegimos uno sobre los
demás para representar la magnitud general observada en una serie de valores o para
comparar dos o más grupos de valores?

• Si no hay ningún argumento de peso en contra, se preferirá siempre la media ya que


las medias halladas sobre muestras representativas se parecen más a la media po-
blacional que lo que se parecen las medianas y las modas muestrales a la mediana y
la moda poblacional.

• La mediana se preferirá a la media cuando la variable esté medida en una escala or-
dinal o cuando haya valores extremos que distorsionen la interpretación de la media.

• Elegiremos utilizar la moda en lugar de la mediana cuando se trata de una variable


medida en una escala nominal.

En algunos casos, los tres índices de tendencia central dan valores parecidos o incluso
pueden coincidir exactamente, pero no necesariamente ha de ser así. Por ejemplo, en dis-
tribuciones unimodales simétricas coinciden exactamente; pero, cuanto más asimétricas
son las distribuciones, más diferencia suele haber entre ellos.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


16
Licenciatura en Nutrición

Veámoslo gráficamente.

El siguiente es el caso de una distribución unimodal simétrica en la cual media, mediana y


moda coinciden exactamente.

En los siguientes casos, la distribución es asimétrica. Los índices ya no coinciden y tienden


a separarse.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


17
Licenciatura en Nutrición

Verificá tu aprendizaje

Actividad 1
Observá los siguientes datos recogidos en una clínica privada de la ciudad de San Miguel
sobre los casos de varicela durante el año 2005 y resolvé las distintas consignas.

Mes Casos
Enero 18
Febrero 10
Marzo 15
Abril 36
Mayo 40
Junio 12
Julio 10
Agosto 10
Septiembre 28
Octubre 16
Noviembre 10
Diciembre 6

1. Calculá la media aritmética.

2. ¿Se puede decir que esta medida es representativa? ¿Por qué?

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


18
Licenciatura en Nutrición

Actividad 2
En una clínica de salud se obtienen las edades de las personas que son atendidas en un fin
de semana. Calculá el promedio de edad de los pacientes que acudieron a recibir atención
médica ese fin de semana. Para ello, completá la tabla de frecuencias y tené en cuenta la
marca de clase.

Dato (xi) (grupos Marca de Frecuencia (fi) xi * fi Media = SUM


de edades) clase xi*fi / SUM fi
10 - 20 8
21 - 30 20
31 - 40 14
41 - 50 8
51 - 60 2
61 - 70 2
71 - 80 1
Sum: 55

Actividad 3
Obtené la media aritmética a partir de la siguiente tabla.

Cantidad de hijos Número de familias


1 8
2 6
3 5
4 o más 2

Actividad 4

Teniendo en cuenta las calificaciones y los pesos respectivos de cada una de ellas, indique el
promedio que obtuvo el alumno en el curso. Comparar con la media aritmética de las notas.

Materia Nota Peso


Biología 8,2 1,5
Filosofía 10 1
Física 9,5 3
Geografía 7,8 0,25
Historia 10 0,5
Inglés 9,5 0,75
Matemática 6,7 3
Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión
19
Licenciatura en Nutrición

Actividad 5
Un docente califica su curso de Bioestadística teniendo en cuenta cuatro componentes
para la nota (cada uno con distinto peso en la nota final): parcialitos (25 %), parciales (45
%) , participación en foros (20 %) y elaboración de trabajo (10%). Si un alumno fue
calificado respectivamente con un: 6, 5, 7 y 9. ¿Cuál será su nota calculándolo como media
ponderada y cuál sería la nota calculando la media aritmética?.

Actividad 6
Calculá la mediana de la siguiente serie:

15 / 25 / 3 / 28 / 36 / 98 / 1 / 6 / 8

Actividad 7
Calculá la mediana de la siguiente serie (tené en cuenta que la cantidad de datos es par):

13 / 11 / 26 / 8 / 2 / 25 / 25 / 9 / 60 / 12

Actividad 8
Obtené la moda de la siguiente serie:

12 / 1 / 5 / 12 / 42 / 23 / 12 / 42 / 7 / 6

Actividad 9
Ordená y verificá si las siguientes series de datos son unimodales, bimodales o multimodales:

1. 36 / 24 / 128 / 39 / 36 / 24 / 15 / 1 / 36 / 8 / 18 / 29 / 36

2. 1 / 25 / 89 / 78 / 89 / 1 / 36 / 1 / 60 / 96 / 89 / 27 / 142 / 106

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


20
Licenciatura en Nutrición

3. 92 / 99 / 124 / 36 / 99 / 24 / 76 / 99 / 24 / 106 / 92 / 24 / 100

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


21
Licenciatura en Nutrición

2. Medidas de posición de variables cuantitativas

Se denomina cuantiles a aquellos valores que nos permiten fragmentar la can-


tidad de datos de una muestra en n partes iguales. Son utilizados generalmente
para realizar un análisis minucioso de la distribución, para ubicar un dato dentro
de un conjunto de datos.

Entre los cuantiles encontramos los cuartilos, los decilos y los percentilos.

2.1. Cuartilos

Los cuartilos son tres valores que distribuyen la serie de datos, ordenada de for-
ma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de
ellos concentra el 25% de los resultados. Se simboliza con la letra Q, seguida por
el subíndice para identificar el cuartil al cual nos referimos (Q1, Q2, Q3).

Como vemos, el primer cuartil incluye al 25% de los datos en una distribución ordenada
de menor a mayor. En el caso del segundo cuartil, podemos ver que incluye al 50% de los
datos, por lo que coincide con la mediana. El tercer cuartil es un valor que incluye al 75%
de los datos.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


22
Licenciatura en Nutrición

Para el cálculo de cuartiles debemos usar las siguientes fórmulas:

• Si N es impar:

(N + 1) × Q / 4

Número de Cuartil que estamos


observaciones calculando

• Si N es par:

N/4

Número de
observaciones

3 / 1 / 5 / 2 / 9 / 4 / 11

1 / 2 / 3 / 4 / 5 / 9 / 11

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


23
Licenciatura en Nutrición

También podemos recurrir a una tabla:

Paciente Días de recuperación


1 1
2 2
3 3
4 4
5 5
6 9
7 11
N=7 Total: 35

Cálculo del Q1

Como la muestra es impar, debemos aplicar la fórmula:

(N + 1) × Q / 4  (7 + 1) × 1 / 4 = 2

En nuestro ejemplo, el número 2 indica la posición hasta el primer cuartil; esto corres-
ponde con dos días de recuperación.

Cálculo del Q2

Como vimos anteriormente, este cuartil corresponde con la mediana, es decir, el

número que representa el 50% de los datos.

(N + 1) × Q / 4  (7 + 1) × 2 / 4 = 4

En nuestro ejemplo está definido por la posición 4, es decir, 4 días de recuperación.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


24
Licenciatura en Nutrición

Para calcular el tercer cuartil debemos aplicar la misma fórmula:

(N + 1) × Q / 4  (7 + 1) × 3 / 4 = 6

Por lo tanto, el tercer cuartil se define como 6; esto significa que el 75% de los

pacientes tardan por lo menos 6 días en recuperarse.

2.2. Decilos

Una de las principales aplicaciones dentro de disciplinas como la biología, la psicología,


la medicina o la nutrición es la clasificación de la información en divisiones de 10, es decir,
aplicando el concepto de decilos.

Los decilos son nueve valores que distribuyen la serie de datos, ordenada de for-
ma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados.

Cuando clasificamos una población o muestra de acuerdo a un carácter determinado –


como, por ejemplo, cantidad de hijos en edad escolar–, los decilos son los valores de
esta variable que pueden tomar valores sucesivos que corresponden cada uno al 10% de
la población. En otras palabras, el 10% de los individuos de la población tiene una menor
cantidad de hijos en edad escolar que el primer decilo.

Para los decilos, tomaremos el total de los datos divididos en 10 partes iguales; por lo tan-
to, existirán 9 decilos representado como Dk.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


25
Licenciatura en Nutrición

D1 = valor de la variable que agrupa el 10% de los datos.

D2 = valor de la variable que agrupa el 20% de los datos.

D3 = valor de la variable que agrupa el 30% de los datos.

D4 = valor de la variable que agrupa el 40% de los datos.

D5 = valor de la variable que agrupa el 50% de los datos.

D6 = valor de la variable que agrupa el 60% de los datos.

D7 = valor de la variable que agrupa el 70% de los datos.

D8 = valor de la variable que agrupa el 80% de los datos.

D9 = valor de la variable que agrupa el 90% de los datos.

2.3. Percentilos

Los percentilos son 99 valores que distribuyen la serie de datos, ordenada de for-
ma creciente o decreciente, en 100 tramos iguales, en los que cada uno de ellos
concentra el 1% de los resultados.

Los percentilos indican la posición de los datos, mostrando a partir de cuál observación o
intervalo de clase se ha acumulado determinado porcentaje de observaciones. Es decir, el
percentil de orden k identifica una observación (en el caso de datos discretos) o un intervalo
de clase (en el caso de datos continuos) de tal manera que la frecuencia asociada a ese
valor lleva acumulada el k% de las observaciones.

En otras palabras, un percentil de orden 5 lleva acumuladas el 5% de las observaciones.

Los percentilos de mayor importancia son los cuartiles y los deciles. Podemos inferir, ade-
más, que el percentil de orden 50 es la mediana.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


26
Licenciatura en Nutrición

Gráficamente, es muy simple calcular un percentil determinado.

Si una variable pudiese asumir muchos valores, la representación de la proporción del total,
menor o igual que un valor, tendría una forma creciente, tal como lo muestra el gráfico. Por
ejemplo, si queremos hallar el percentil 20, podemos comprobar que dicho percentil toma
un valor un poco mayor que 2.

Para calcular un percentil, primero debemos ordenar los datos de menor a mayor y luego
usar las siguientes fórmulas:

• Cuando N es par:

N × Q /100

Número de Cuartil que estamos


observaciones calculando

• Cuando N es impar:
(N + 1) × Q

Número de Cuartil que estamos


observaciones calculando

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


27
Licenciatura en Nutrición

Analicemos un ejemplo desarrollado.

Estamos observando la cantidad de hijos por hogar en una localidad del Gran Buenos
Aires. Los datos que recolectamos son los siguientes:

Cantidad de hijos Frecuencia Frecuencia acumulada


0 8 8
1 15 23
2 12 35
3 5 40
4 2 42
5 1 43
6 1 44
44

La cantidad de observaciones, es decir, la cantidad de hogares que visitamos es de 44.

Queremos averiguar el percentil 65, es decir, en qué valor de la variable se ubican el 65%
de los hogares.

Percentilo 65 = 44 × 65 / 100 = 28,6

Observando la columna de frecuencia acumulada, podemos notar que el intervalo donde


se encuentra contenido este valor es en los hogares con hasta dos hijos.

Otra forma de verlo, más gráfica, sería esta:

Ingresamos a una casa y anotamos la cantidad de hijos. Las ordenamos de menor a mayor,
por valor de la variable:

0/0/0/0/0/0/0/0/1/1/1/1/1/1/1/1/1/1/1/1/1/1/
1/2/2/2/2/2/2/2/2/2/2/2/2/3/3/3/3/3/4/4/5/6

(Hay un total de 44 datos, como podemos notar).

Si contamos la posición, el lugar 28,6 está ubicado en familias con hasta dos hijos.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


28
Licenciatura en Nutrición

Verificá tu aprendizaje

Actividad 10
Dados los siguientes datos recogidos en un hospital acerca de la cantidad de enfermos
que permanecieron más de una semana internados (el primer dato corresponde al mes y
el segundo a la cantidad de pacientes):

(1,14) / (4,18) / (3,25) / (2,12) / (9,20) / (5, 21) /


(7,25) / (8,16) / (6,14) / (12,19) / (11,28) / (10,22)

Confeccionamos la siguiente tabla ordenando los datos de forma creciente:

Mes Cantidad de fa
pacientes
1 14 14
2 12 26
3 25 51
4 18 69
5 21 90
6 14 104
7 25 129
8 16 145
9 20 165
10 22 187
11 28 215
12 19 234

Total de pacientes: 234.

Hallá:

1. Segundo cuartil.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


29
Licenciatura en Nutrición

2. Quinto decilo.

3. Percentil 80.

4. Percentil 20.

5. Octavo decilo.

2.4. Medidas de posición en datos agrupados en intervalos

En este caso se aplica la siguiente fórmula:

Número de observaciones
Frecuencia absoluta
hechas en total
Porcentaje de las observa- acumulada hasta Li
ciones inferiores a Ck
(k × n / 100) - fa
Ck = Li + ×A Amplitud de los intervalos
Valor de la variable
fi
correspondiente al
centil de orden k Frecuencia absoluta del
Límite inferior del intervalo intervalo crítico
que contiene al k% de las
observaciones (intervalo
crítico)

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


30
Licenciatura en Nutrición

EJEMPLO:

Queremos calcular el C70 de la siguiente distribución de frecuencias:

Variable Frecuencia absoluta Frecuencia absoluta


acumulada
3-5 20 20
6-8 30 50
9 - 11 40 90
12 - 14 60 150
15 - 17 30 180
18 - 20 20 200
200

Lo primero que debemos hacer es transformar en número de sujetos al porcentaje bus-


cado. En este caso estamos buscando el valor de la variable que deja por debajo al 70%
de las observaciones. Como son 200 observaciones en total, aplicamos la expresión:

k × n / 100  70 × 200 / 100 = 140

Por lo tanto, podemos decir que estamos buscando el valor de la variable que
deja por debajo de sí a 140 observaciones.

Luego debemos determinar el intervalo crítico, es decir, aquel que contiene el valor
de la variable que buscamos, y se determina comparando las frecuencias absolu-
tas acumuladas hasta el límite superior de los intervalos con la frecuencia hallada
en el paso anterior. Esto corresponde al intervalo “12 - 14” ya que la frecuencia acu-
mulada hasta allí es 150. Este será entonces el intervalo crítico.

Ahora podemos sustituir en la fórmula los valores correspondientes, sabiendo que


“12 - 14” es el intervalo crítico:

(70 × 200 / 100) - 90


C70 = 11,5 + × 3 = 14
60

Por lo tanto, el C70 o el valor de la variable que deja por debajo de sí al 70% de las
observaciones es 14.

En muchas ocasiones, lo que interesa no es hallar el valor de la variable que deja por de-
bajo de sí cierto porcentaje de las observaciones, sino lo contrario, es decir, el porcentaje
de observaciones que deja por debajo a cierto valor de la variable.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


31
Licenciatura en Nutrición

EJEMPLO:

Podría interesarnos conocer el porcentaje de observaciones que deja por debajo


el valor de la variable 9,3. Dicho de otra forma, sabiendo que el Ck = 9,3, hay que
determinar k. Para obtener esto se aplica la misma fórmula, pero de forma inversa
ya que conocemos el Ck, sustituimos todos los elementos de la fórmula y despe-
jamos k, que es nuestra incógnita. Vamos a resolverlo.

Sabemos que:

Ck = 9,3

Lo primero es determinar el intervalo crítico. Como en este caso conocemos el


valor de la variable, el intervalo será aquel que contenga a ese valor. En nuestro
ejemplo sería el intervalo “9 - 11”. Aplicamos la fórmula de los centiles y despeja-
mos k:

(k × 200 / 100) - 50
Ck = 9,3 = 8,5 + ×3
40

k = 30,33. Por lo tanto, C30,33 = 9,3; o, lo que es lo mismo, el valor de la variable


9,3 deja por debajo de sí al 30,33% de las observaciones y por encima al 69,33%.

2.5. Resumen: fórmulas para calcular las medidas de posición

Resumiendo, las diferentes fórmulas que usaremos para calcular las medidas de posición
son las siguientes.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


32
Licenciatura en Nutrición

DATOS SIN AGRUPAR


Percentilo Cuartilo Decilo
Para N par N × Q / 100 N×Q/4 N × Q / 10

Se divide por 100 por- Se divide por 4 porque Se divide por 10 porque
que son percentilos, estamos hablando de estamos hablando de
es decir, son los 99 va- los 3 valores que divi- los 9 valores que divi-
lores que dividen a la den a la serie en 4 tra- den a la serie en 10 tra-
muestra en segmentos mos, donde cada uno mos, donde cada uno
con el 1% de los resul- de ellos concentra el de ellos concentra el
tados 25% de los resultados. 10% de los resultados.

Para N impar (N + 1) × Q / 100 (N + 1) × Q / 4 (N + 1) × Q / 10

DATOS AGRUPADOS EN INTERVALOS


Percentilo Cuartilo Decilo

(k × n / 100) - fa (k × n / 4) - fa (k × n / 10) - fa
Ck = Li + ×A Ck = Li + ×A Ck = Li + ×A
fi fi fi

2.6. Equivalencias entre cuantiles

Como ya señalamos, existe una equivalencia directa entre los distintos cuantiles, que re-
sumimos a continuación:

D1 C10
D2 C20
Q1 C25
D3 C30
D4 C40
Q2 D5 C50
D6 C60
D7 C70
Q3 C75
D8 C80
D9 C90

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


33
Licenciatura en Nutrición

Gracias a estas equivalencias, las fórmulas de cálculos de cuantiles se resumen en la de


los centiles correspondientes al cuantil que se quiera calcular.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


34
Licenciatura en Nutrición

Actividad 1

1.

(18 + 10 + 15 + 36 + 40 + 12 + 10 + 10 + 28 + 16 + 10 + 6) / 12 = 17,58

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


35
Licenciatura en Nutrición

Actividad 2

Dato (xi): grupos Marca de Frecuencia (fi) Producto Media = SUM


de edades clase xi * fi xi*fi / SUM fi
10 - 20 15,00 8 120
21 - 30 25,50 20 510
31 - 40 35,50 14 497
41 - 50 45,50 8 364 32.88
51 - 60 55,50 2 111
61 - 70 65,50 2 131
71 - 80 75,50 1 75.5
Sum: 55 sum: 1808.5

Actividad 3

Dato (xi): Frecuencia (fi) Producto xi * fi Media =


cantidad de hijos SUM xi*fi / SUM fi
1 8 8
2 6 12 2,04
3 5 15
4 2 8
Sum: 21 Sum: 43

Actividad 4

Utilicemos la fórmula de la media ponderada:

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


36
Licenciatura en Nutrición

Reemplacemos en la ecuación:
8.2 * 1.5 + 10 * 1 + 9.5 * 3 + 7.8 * 0.25 + 10 * 0.5 + 9.5 * 0.75 + 6.7 * 3
1.5 + 1 + 3 + 0.25 + 0.5 + 0.75 + 3

12.3 + 10 + 28.5 + 1.95 + 5 + 7.12 + 20.1 = 84.97 / 10 = 8.49


10

Si hubiéramos hecho el cálculo de la media de las notas, el resultado sería 8.81

Actividad 5

Media ponderada:
(8.2 * 1.5 + 10 * 1 + 9.5 * 3 + 7.8 * 0.25 + 10 * 0.5 + 9.5 * 0.75 + 6.7 * 3) / 10
84.97 / 10 = 8.49

Media aritmética= (8.2 + 10 + 9.5 + 7.8 + 10 + 9.5 +6.7) / 7 = 8.81

Actividad 6

Primero se ordenan los datos de la serie y luego se busca el valor que divide a la serie
en dos partes iguales:

1 / 3 / 6 / 8 / 15 / 25 / 28 / 36 / 98

El valor de la mediana en esta serie de datos es 15.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


37
Licenciatura en Nutrición

Actividad 7

Primero se ordenan los datos de la serie y luego se busca el valor que divide a la serie
en dos partes iguales. Como la cantidad de elementos de la serie es par, la mediana
se obtiene tomando el valor medio de los datos centrales.

Datos ordenados:

2 / 8 / 9 / 11 / 12 / 13 / 25 / 25 / 26 / 60

Valores centrales: (12 + 13) / 2 = 12,5

Valor de la mediana: (12 + 13) / 2 = 12,5

Actividad 8

La moda es 12 pues es el valor que más se repite dentro de la serie.

Actividad 9

1. Unimodal.

2. Bimodal.

3. Bimodal.

Actividad 10

1. Segundo cuartil

n / 4 × 2 = 234 / 4 × 2 = 117

Por lo tanto, mirando la tabla, podemos inferir que la cantidad de pacientes in-
ternados que se aproxima al segundo cuartil se produjo durante el mes de julio,
en el que la cantidad de pacientes no supera el 50% de las observaciones.

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


38
Licenciatura en Nutrición

Decir quinto decilo equivale a decir percentilo 50. Por lo tanto, aplicando la fór-
mula de percentilo o la fórmula de decilo vamos a llegar al mismo resultado:

N × Q / 100 = 234 × 50 / 100 = 117

N × D / 10 = 234 × 5 / 10 = 117

Percentil 80

N × Q / 100 = 234 × 80 / 100 = 187,20

Percentil 20

N × D / 10 = 234 × 8 / 10 = 187,20

Bioestadística I Unidad didáctica: 2. Medidas de tendencia central y dispersión


39
NUESTRAS SEDES

Buenos Aires La Rioja Santo Tomé


Ciudad Autónoma Provincia de La Rioja Provincia de Corrientes
de Buenos Aires
Av. Las Heras 1907 Benjamín Matienzo 3177 Rivadavia e Independencia
Tel./Fax: (011) 4800 0200 Tel./Fax: (0380) 4422090 Tel./Fax: (03756) 421622
(011) 1565193479 (0380) 154811437 (03756) 15401364
informesba@barcelo.edu.ar informeslr@barcelo.edu.ar informesst@barcelo.edu.ar

También podría gustarte