Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ud 2 - Tema 1
Ud 2 - Tema 1
EN NUTRICIÓN
GESTIONADO CON MODALIDAD A DISTANCIA
Asignatura Bioestadística
Características
Marca de clase
Cómo calcular la media paso a paso
10
12
16
Medidas de posición de variables cuantitativas
22
25
26
30
32
33
Ideas clave
Al finalizar el trabajo con este tema serás capaz de:
Cuartilos
Licenciatura en Nutrición
Las medidas de tendencia central ofrecen información sobre los valores típico o
promedio de un conjunto de datos.
7 + 6 + 9 + 5 = 27/4 = 6,75
Sumatoria de
cada dato
Media Cantidad de
datos
1.1.1. Características
La media representa todos los valores del conjunto de datos, por lo que cada uno de ellos
afecta a la media.
Aunque la media es confiable porque refleja todos los valores del conjunto de datos, pue-
de ser afectada por los valores extremos y de esa forma llegar a ser una medida menos
representativa, por lo que, si la distribución es asimétrica, la media aritmética no constituye
un valor típico.
AÑO VALOR
1 3,25
2 4,50
3 3,30
4 2,25
5 8,52
6 9,85
7 3,40
8 2,98
9 3,11
10 3,23
11 3,20
12 2,98
Este ejemplo muestra cómo los valores que difieren mucho de la serie de datos influyen en
el valor de la media y pueden sobreestimar o subestimar (si son muy bajos) el promedio total.
EJEMPLO:
1, 1, 2, 2, 4, 4, 5, 2, 3, 2, 3, 4, 1, 2, 1.
37 / 15 = 2,4666
Si realizamos este mismo cálculo agrupando los datos que aparecen más de una
vez, podemos obtener el mismo valor. Entonces, realicemos una tabla agrupando
los datos y luego calculemos la media para valores agrupados.
Como se observa en la tabla, los datos agrupados ofrecen una forma ordenada
de cálculo.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13
ci fi
[0, 5) 2,5 1
[5, 10) 7,5 1
[10, 15) 12,5 3
[15, 20) 17,5 3
[20, 25) 22,5 3
[25, 30) 27,5 6
[30, 35) 32,5 7
[35, 40) 37,5 10
[40, 45) 42,5 4
[45, 50) 47,5 2
40
Primero calculamos la marca de clase (son intervalos, así que se debe calcular la marca de
clase sin excepción).
Intervalo F X F*X
10 - 20 4 15 60
21 - 30 5 25,5 127,5
31 -40 9 35,5 319,5
41 - 50 8 45,5 364
26 871
Su fórmula es la siguiente:
Wi = factor de ponderación
Xi = valor de la variable
Examen Nota
1° parcial 5
2° parcial 7
Final 9
(5 + 7 + 9) / 3 = 7
cada evaluación. Por ejemplo, el primer parcial vale el 30% de la nota final, el se-
gundo examen el 20% y el tercer examen, el 50%.
Datos Peso
5 0,30
7 0,20
9 0,50
Las variables son los distintos valores que puede asumir el fenómeno que se es-
tudia. (En el ejemplo que vimos, las notas de un examen).
1.3. Mediana
La mediana es la medida que divide los datos de una serie, ordenados en mag-
nitud, en dos partes iguales.
Puede ser llamada media posicional, porque se sitúa en el centro exacto de un conjunto de
datos ordenados. La mitad de las observaciones estarán por encima de la mediana y la otra
mitad, por debajo de ella.
Para poder calcular la mediana es necesario ordenar las observaciones en orden creciente o
decreciente y determinar su posición teniendo en cuenta si el número de datos es par o impar.
¿Qué ocurre cuando queremos calcular la mediana y tenemos una cantidad par de datos?
En ese caso debemos obtener el valor medio de los datos centrales de la serie ordenada.
Mediana: (4 + 6) / 2 = 5
La mediana, entonces, es el valor que deja a la mitad de los datos por encima de dicho
valor y a la otra mitad por debajo.
Tamaño de la muestra.
Frecuencia acumulada
hasta ese límite inferior
(n / 2) - fa
Mdn = Li + ×A Amplitud del intervalo.
fi
Aplicando la fórmula:
Mdn = 11,5 × 3 = 12
1.4. Moda
En el ejemplo anterior, el valor que más se repite tiene frecuencia = 60; por lo tanto, la
moda en esa serie de datos está ubicada en el intervalo con dicha frecuencia, en este
caso 12 - 14
12 / 1 / 12 / 15 / 16 / 1 / 1 / 12 / 9
Cuando hay dos modas, se trata de una muestra bimodal. Si en una muestra aparecen
más de dos modas, estamos frente a una muestra multimodal.
Valores Frecuencia
absoluta
3-5 20
6-8 30
9 - 11 40
12 - 14 60
15 - 17 30
18 - 20 20
200
Moda = 13
Hemos conocido hasta aquí los tres índices de tendencia central más utilizados, pero nos
queda por plantear una pregunta importante: ¿con qué criterios elegimos uno sobre los
demás para representar la magnitud general observada en una serie de valores o para
comparar dos o más grupos de valores?
• La mediana se preferirá a la media cuando la variable esté medida en una escala or-
dinal o cuando haya valores extremos que distorsionen la interpretación de la media.
En algunos casos, los tres índices de tendencia central dan valores parecidos o incluso
pueden coincidir exactamente, pero no necesariamente ha de ser así. Por ejemplo, en dis-
tribuciones unimodales simétricas coinciden exactamente; pero, cuanto más asimétricas
son las distribuciones, más diferencia suele haber entre ellos.
Veámoslo gráficamente.
Verificá tu aprendizaje
Actividad 1
Observá los siguientes datos recogidos en una clínica privada de la ciudad de San Miguel
sobre los casos de varicela durante el año 2005 y resolvé las distintas consignas.
Mes Casos
Enero 18
Febrero 10
Marzo 15
Abril 36
Mayo 40
Junio 12
Julio 10
Agosto 10
Septiembre 28
Octubre 16
Noviembre 10
Diciembre 6
Actividad 2
En una clínica de salud se obtienen las edades de las personas que son atendidas en un fin
de semana. Calculá el promedio de edad de los pacientes que acudieron a recibir atención
médica ese fin de semana. Para ello, completá la tabla de frecuencias y tené en cuenta la
marca de clase.
Actividad 3
Obtené la media aritmética a partir de la siguiente tabla.
Actividad 4
Teniendo en cuenta las calificaciones y los pesos respectivos de cada una de ellas, indique el
promedio que obtuvo el alumno en el curso. Comparar con la media aritmética de las notas.
Actividad 5
Un docente califica su curso de Bioestadística teniendo en cuenta cuatro componentes
para la nota (cada uno con distinto peso en la nota final): parcialitos (25 %), parciales (45
%) , participación en foros (20 %) y elaboración de trabajo (10%). Si un alumno fue
calificado respectivamente con un: 6, 5, 7 y 9. ¿Cuál será su nota calculándolo como media
ponderada y cuál sería la nota calculando la media aritmética?.
Actividad 6
Calculá la mediana de la siguiente serie:
15 / 25 / 3 / 28 / 36 / 98 / 1 / 6 / 8
Actividad 7
Calculá la mediana de la siguiente serie (tené en cuenta que la cantidad de datos es par):
13 / 11 / 26 / 8 / 2 / 25 / 25 / 9 / 60 / 12
Actividad 8
Obtené la moda de la siguiente serie:
12 / 1 / 5 / 12 / 42 / 23 / 12 / 42 / 7 / 6
Actividad 9
Ordená y verificá si las siguientes series de datos son unimodales, bimodales o multimodales:
1. 36 / 24 / 128 / 39 / 36 / 24 / 15 / 1 / 36 / 8 / 18 / 29 / 36
2. 1 / 25 / 89 / 78 / 89 / 1 / 36 / 1 / 60 / 96 / 89 / 27 / 142 / 106
Entre los cuantiles encontramos los cuartilos, los decilos y los percentilos.
2.1. Cuartilos
Los cuartilos son tres valores que distribuyen la serie de datos, ordenada de for-
ma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de
ellos concentra el 25% de los resultados. Se simboliza con la letra Q, seguida por
el subíndice para identificar el cuartil al cual nos referimos (Q1, Q2, Q3).
Como vemos, el primer cuartil incluye al 25% de los datos en una distribución ordenada
de menor a mayor. En el caso del segundo cuartil, podemos ver que incluye al 50% de los
datos, por lo que coincide con la mediana. El tercer cuartil es un valor que incluye al 75%
de los datos.
• Si N es impar:
(N + 1) × Q / 4
• Si N es par:
N/4
Número de
observaciones
3 / 1 / 5 / 2 / 9 / 4 / 11
1 / 2 / 3 / 4 / 5 / 9 / 11
Cálculo del Q1
(N + 1) × Q / 4 (7 + 1) × 1 / 4 = 2
En nuestro ejemplo, el número 2 indica la posición hasta el primer cuartil; esto corres-
ponde con dos días de recuperación.
Cálculo del Q2
(N + 1) × Q / 4 (7 + 1) × 2 / 4 = 4
(N + 1) × Q / 4 (7 + 1) × 3 / 4 = 6
Por lo tanto, el tercer cuartil se define como 6; esto significa que el 75% de los
2.2. Decilos
Los decilos son nueve valores que distribuyen la serie de datos, ordenada de for-
ma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados.
Para los decilos, tomaremos el total de los datos divididos en 10 partes iguales; por lo tan-
to, existirán 9 decilos representado como Dk.
2.3. Percentilos
Los percentilos son 99 valores que distribuyen la serie de datos, ordenada de for-
ma creciente o decreciente, en 100 tramos iguales, en los que cada uno de ellos
concentra el 1% de los resultados.
Los percentilos indican la posición de los datos, mostrando a partir de cuál observación o
intervalo de clase se ha acumulado determinado porcentaje de observaciones. Es decir, el
percentil de orden k identifica una observación (en el caso de datos discretos) o un intervalo
de clase (en el caso de datos continuos) de tal manera que la frecuencia asociada a ese
valor lleva acumulada el k% de las observaciones.
Los percentilos de mayor importancia son los cuartiles y los deciles. Podemos inferir, ade-
más, que el percentil de orden 50 es la mediana.
Si una variable pudiese asumir muchos valores, la representación de la proporción del total,
menor o igual que un valor, tendría una forma creciente, tal como lo muestra el gráfico. Por
ejemplo, si queremos hallar el percentil 20, podemos comprobar que dicho percentil toma
un valor un poco mayor que 2.
Para calcular un percentil, primero debemos ordenar los datos de menor a mayor y luego
usar las siguientes fórmulas:
• Cuando N es par:
N × Q /100
• Cuando N es impar:
(N + 1) × Q
Estamos observando la cantidad de hijos por hogar en una localidad del Gran Buenos
Aires. Los datos que recolectamos son los siguientes:
Queremos averiguar el percentil 65, es decir, en qué valor de la variable se ubican el 65%
de los hogares.
Ingresamos a una casa y anotamos la cantidad de hijos. Las ordenamos de menor a mayor,
por valor de la variable:
0/0/0/0/0/0/0/0/1/1/1/1/1/1/1/1/1/1/1/1/1/1/
1/2/2/2/2/2/2/2/2/2/2/2/2/3/3/3/3/3/4/4/5/6
Si contamos la posición, el lugar 28,6 está ubicado en familias con hasta dos hijos.
Verificá tu aprendizaje
Actividad 10
Dados los siguientes datos recogidos en un hospital acerca de la cantidad de enfermos
que permanecieron más de una semana internados (el primer dato corresponde al mes y
el segundo a la cantidad de pacientes):
Mes Cantidad de fa
pacientes
1 14 14
2 12 26
3 25 51
4 18 69
5 21 90
6 14 104
7 25 129
8 16 145
9 20 165
10 22 187
11 28 215
12 19 234
Hallá:
1. Segundo cuartil.
2. Quinto decilo.
3. Percentil 80.
4. Percentil 20.
5. Octavo decilo.
Número de observaciones
Frecuencia absoluta
hechas en total
Porcentaje de las observa- acumulada hasta Li
ciones inferiores a Ck
(k × n / 100) - fa
Ck = Li + ×A Amplitud de los intervalos
Valor de la variable
fi
correspondiente al
centil de orden k Frecuencia absoluta del
Límite inferior del intervalo intervalo crítico
que contiene al k% de las
observaciones (intervalo
crítico)
EJEMPLO:
Por lo tanto, podemos decir que estamos buscando el valor de la variable que
deja por debajo de sí a 140 observaciones.
Luego debemos determinar el intervalo crítico, es decir, aquel que contiene el valor
de la variable que buscamos, y se determina comparando las frecuencias absolu-
tas acumuladas hasta el límite superior de los intervalos con la frecuencia hallada
en el paso anterior. Esto corresponde al intervalo “12 - 14” ya que la frecuencia acu-
mulada hasta allí es 150. Este será entonces el intervalo crítico.
Por lo tanto, el C70 o el valor de la variable que deja por debajo de sí al 70% de las
observaciones es 14.
En muchas ocasiones, lo que interesa no es hallar el valor de la variable que deja por de-
bajo de sí cierto porcentaje de las observaciones, sino lo contrario, es decir, el porcentaje
de observaciones que deja por debajo a cierto valor de la variable.
EJEMPLO:
Sabemos que:
Ck = 9,3
(k × 200 / 100) - 50
Ck = 9,3 = 8,5 + ×3
40
Resumiendo, las diferentes fórmulas que usaremos para calcular las medidas de posición
son las siguientes.
Se divide por 100 por- Se divide por 4 porque Se divide por 10 porque
que son percentilos, estamos hablando de estamos hablando de
es decir, son los 99 va- los 3 valores que divi- los 9 valores que divi-
lores que dividen a la den a la serie en 4 tra- den a la serie en 10 tra-
muestra en segmentos mos, donde cada uno mos, donde cada uno
con el 1% de los resul- de ellos concentra el de ellos concentra el
tados 25% de los resultados. 10% de los resultados.
(k × n / 100) - fa (k × n / 4) - fa (k × n / 10) - fa
Ck = Li + ×A Ck = Li + ×A Ck = Li + ×A
fi fi fi
Como ya señalamos, existe una equivalencia directa entre los distintos cuantiles, que re-
sumimos a continuación:
D1 C10
D2 C20
Q1 C25
D3 C30
D4 C40
Q2 D5 C50
D6 C60
D7 C70
Q3 C75
D8 C80
D9 C90
Actividad 1
1.
(18 + 10 + 15 + 36 + 40 + 12 + 10 + 10 + 28 + 16 + 10 + 6) / 12 = 17,58
Actividad 2
Actividad 3
Actividad 4
Reemplacemos en la ecuación:
8.2 * 1.5 + 10 * 1 + 9.5 * 3 + 7.8 * 0.25 + 10 * 0.5 + 9.5 * 0.75 + 6.7 * 3
1.5 + 1 + 3 + 0.25 + 0.5 + 0.75 + 3
Actividad 5
Media ponderada:
(8.2 * 1.5 + 10 * 1 + 9.5 * 3 + 7.8 * 0.25 + 10 * 0.5 + 9.5 * 0.75 + 6.7 * 3) / 10
84.97 / 10 = 8.49
Actividad 6
Primero se ordenan los datos de la serie y luego se busca el valor que divide a la serie
en dos partes iguales:
1 / 3 / 6 / 8 / 15 / 25 / 28 / 36 / 98
Actividad 7
Primero se ordenan los datos de la serie y luego se busca el valor que divide a la serie
en dos partes iguales. Como la cantidad de elementos de la serie es par, la mediana
se obtiene tomando el valor medio de los datos centrales.
Datos ordenados:
2 / 8 / 9 / 11 / 12 / 13 / 25 / 25 / 26 / 60
Actividad 8
Actividad 9
1. Unimodal.
2. Bimodal.
3. Bimodal.
Actividad 10
1. Segundo cuartil
n / 4 × 2 = 234 / 4 × 2 = 117
Por lo tanto, mirando la tabla, podemos inferir que la cantidad de pacientes in-
ternados que se aproxima al segundo cuartil se produjo durante el mes de julio,
en el que la cantidad de pacientes no supera el 50% de las observaciones.
Decir quinto decilo equivale a decir percentilo 50. Por lo tanto, aplicando la fór-
mula de percentilo o la fórmula de decilo vamos a llegar al mismo resultado:
N × D / 10 = 234 × 5 / 10 = 117
Percentil 80
Percentil 20
N × D / 10 = 234 × 8 / 10 = 187,20