Está en la página 1de 27

BIOESTADISTICA

Docente: Mg. Gloria Pérez Salgado


Mail: gloriap@docente.ubo.cl
Primavera 2023

Clase 2
Contenidos de la clase

UNIDAD I: ESTADÍSTICA DESCRIPTIVA Y ANALITICA

• Valores típicos
• Medidas de Tendencia Central
• Medidas de Posición
• Blox plot
Valores típicos

Una vez confeccionada la Tabla de Distribución de Frecuencias de la variable en


estudio, corresponde continuar con el proceso descriptivo. Es momento de
calcular una serie de números cuyo propósito es sintetizar, caracterizar la
información que aportan los 𝑛 datos de la muestra en estudio.
Esta fase del estudio solo tiene sentido cuando la variable en estudio es
cuantitativa.

Medidas de Medidas de Medidas de Medidas de


Tendencia Central Posición Forma Dispersión
Población y Muestra
Población y Muestra
Población y Muestra
Fórmulas

𝑅𝑎𝑛𝑔𝑜 = 𝑚á𝑥 − 𝑚𝑖𝑛

𝑘 = 1 + 3,32 log 𝑛 = 1 + 3,32 log 18

𝑅𝑎𝑛𝑔𝑜
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 =
𝑘
Fases y problemas del proceso estadístico

Teniendo en cuenta estas consideraciones, podemos distinguir tres fases en


el proceso estadístico:

Muestreo: selección de la muestra que se analizará.

Estadística Descriptiva: análisis particular de los


datos de la muestra seleccionada.

Inferencia Estadística: estudio de la posible


generalización de los resultados obtenidos en la
muestra al global de la población.
Medidas de Tendencia Central

• Son medidas estadísticas que se usan para describir como se


puede resumir la localización de los datos.

• Ubican e identifican el punto alrededor del cual se centran los


datos.

• Las medidas de tendencia central nos indican hacia donde se


inclina (no se agrupan más los datos).

• Las más utilizadas son: la media, la mediana y la moda.


Medidas de Tendencia Central
El propósito de las medidas de tendencia central, son:

1. Mostrar en qué lugar se ubica el elemento promedio o típica del


grupo.
2. Sirve como un método para comparar o interpretar cualquier valor
en relación con el puntaje central o típico.
3. Sirve como un método para comparar el valor adquirido por una
misma variable en dos diferentes ocasiones.
4. Sirve como un método para comparar los resultados medios
obtenidos por dos o más grupos.
Nos concentraremos en las tres medidas de
tendencia central más conocidas Media aritmética,
Mediana y Moda.
Medidas de Tendencia Central
Media aritmética

• La media si es de la población se simboliza (µ) y en caso de ser


calculada con los datos de la muestra se llamada promedio (𝑥).
ҧ

• Esta medida se utilizará cuando los datos presentan simetría y si no


se tienen datos extremos, ya que estos afectan el resultado.

Se obtienen de la siguiente forma:


Medidas de Tendencia Central
Mediana
• La mediana (Me), en ocasiones se le llama media posicional, porque
queda exactamente en la mitad de un grupo de datos, luego de que los
datos se han colocado de forma ordenada de menor a mayor. En este caso
la mitad (50%) de los datos estará por encima de la mediana y la otra
mitad (50%) estará por debajo de ella. La mediana es el valor intermedio
cuando los valores de los datos se han ordenado.

Se obtienen de la siguiente forma:


Medidas de Tendencia Central
Moda
La moda (Mo), es el dato que más se repite o el dato que ocurre con mayor
frecuencia. Un grupo de datos puede no tener moda, tener una moda (unimodal), dos
modas (bimodal) o más de dos modas (multimodal).

Única medida de tendencia central que se puede usar, para variables cualitativas.

Se obtienen de la siguiente forma:


Medidas de Posición
• Son medidas estadísticas que se usan para describir como se puede resumir la
localización de los datos, en todo el recorrido de la muestra.

• Las medidas de posición que trabajaremos serán: Cuartiles, Quintiles, Deciles


y Percentiles.

El propósito de las medidas de posición, son:

1. Mostrar en qué lugar se ubica un % determinado del grupo


dentro de la muestra.
2. Sirve como un método para comparar o interpretar cualquier
valor.
3. Sirve como un método para comparar los resultados obtenidos
por dos o más grupos.
Medidas de Posición
Percentiles

• Los percentiles nos permiten analizar la ubicación de un dato respecto al


porcentaje de las observaciones acumuladas.
• Gráficamente, un percentil se visualiza así, lo cual nos permite organizar la
pregunta o lo que debemos calcular:

0% 𝒊% 𝟏𝟎𝟎 − 𝒊 % 𝟏𝟎𝟎 %

Obs. Menor 𝑷𝒊 Obs. Mayor


Medidas de Posición
Ejemplo: Calcular 𝑷𝟐𝟓

Percentiles
Datos NO agrupados, se procede de la
siguiente manera: POSICIÓN
25 ∙ 20
𝑃25 = = 5
100
1. Ordenar los datos en forma creciente
(menor a mayor)
2. Determinar la posición que ocupa el dato
buscado.
1. Ordenar los datos en forma creciente (menor a mayor)

Medidas de Posición 2. Determinar la posición que ocupa el dato buscado.

Ejemplo: Calcular 𝑷𝟐𝟓


Percentiles
Datos Agrupados, se nos presentan dos
casos:

CASO 1. Si nos dan el 𝑘% se busca la fila 𝐹𝑖 , cual es el


primero mayor al 𝑘%.
𝑛∙𝑘
− 𝑁𝑖−1
𝑃𝑖 = 𝐿𝑖𝑛𝑓 + 𝑎𝑖 ∙ 100
𝑛𝑖

Donde:
𝐿𝑖𝑛𝑓 : Límite inferior del intervalo que contiene al percentil.
𝑎𝑖 : amplitud del intervalo
𝑁𝑖−1 : Frecuencia acumulada en la clase anterior al percentil.
𝑛𝑖 : Frecuencias absolutas
Ejemplo:
Medidas de Posición La siguiente tabla de frecuencias presenta el
Percentiles número de pasajeros de 50 vuelos de la
empresa aérea “A”. En base a los datos de la
Datos Agrupados, se nos presentan dos tabla, ¿qué porcentaje de los vuelos lleva
casos: más de 95 pasajeros?

CASO 2. Si se conoce el valor de la variable 𝑃𝑖 , se busca en


los intervalos donde está contenido

𝑃𝑖 − 𝐿𝑖𝑛𝑓
∙ 𝑛𝑖 + 𝑁𝑖−1 ∙ 100
𝑎𝑖
𝑘=
𝑛
Donde:
𝐿𝑖𝑛𝑓 : Límite inferior del intervalo que contiene al percentil.
𝑎𝑖 : amplitud del intervalo
𝑁𝑖−1 : Frecuencia acumulada en la clase anterior al percentil.
𝑛𝑖 : frecuencias absolutas
Ejemplo
Solución 𝑃𝑖 − 𝐿𝑖𝑛𝑓
∙ 𝑛𝑖 + 𝑁𝑖−1 ∙ 100
𝑎𝑖
𝑘=
𝑛

𝒌% = 𝟖𝟖% 𝟏 − 𝒌% = 𝟏𝟐%

50 𝑷𝟗𝟓 110

𝟗𝟓 − 𝟗𝟎 El 12% de los vuelos de la


∙ 𝟖 + 𝟒𝟎 ∙ 𝟏𝟎𝟎 agencia A, llevan 95 pasajeros
𝟏𝟎
𝒌= = 𝟖𝟖 como mínimo.
𝟓𝟎
Relación de los percentiles y otras medidas
Percentiles

• Decil. Se define como aquellos valores que dividen a un conjunto de datos


ordenados en 10 partes iguales, donde cada parte corresponde a un 10% y
se representa por:
𝐷𝑘 , 𝑐𝑜𝑛 𝑘 = 1, 2, 3, … , 9

• Quintil. Se define como aquellos valores que dividen a un conjunto de datos


ordenados en 5 partes iguales, donde cada parte corresponde a un 20% y se
representa por:
𝐾𝑘 , 𝑐𝑜𝑛 𝑘 = 1, 2, 3, 4

• Cuartil. Se define como aquellos valores que dividen a un conjunto de datos


ordenados en 4 partes iguales, donde cada parte corresponde a un 25% y se
representa por:
𝑄𝑘 , 𝑐𝑜𝑛 𝑘 = 1, 2, 3
Relación de los percentiles y otras medidas
Equivalencias
Box Plot: gráfico asociado a los “Cuartiles”

• El gráfico de caja (“box-plot”


en inglés) es una forma de
presentación estadística
destinada, fundamentalmente,
a resaltar aspectos de la
distribución de las
observaciones en una o más
series de datos cuantitativos.

• Permite comparar la
distribución y variabilidad de
los datos de forma visual.

IMAGEN EXTRAÍDA DESDE: http://estadisticando.blogspot.com/2019/06/boxplot-diagrama-de-cajas.html


https://es.slideshare.net/rodrivelp/percentiles-para-datos-sin-agrupar-y-percentiles-para-datos-agrupados

Ejercitemos
• El siguiente histograma presenta el número de a) ¿Cuál es la cantidad máxima de
pasajeros de 50 vuelos de la empresa aérea “A” pasajeros que llevan el 25% de los
vuelos con menos pasajes, de la
agencia A?

b) La compañía “A” asegura que el 50%


de los vuelos lleva al menos 85
pasajeros. ¿Apoya esa afirmación?

c) En la compañía “A” ¿Qué porcentaje


de los vuelos lleva a lo más 90
pasajeros?

• La empresa “B” presenta la siguiente información: d) En la compañía “A” ¿Qué porcentaje


de los vuelos lleva más de 84
55 – 60 – 65 – 70 – 55 – 75 – 98 – 78 – 77 – 99 – 100 – pasajeros?
68 – 70 – 100 – 95.
Ejercitemos
a) ¿Cuál es la cantidad máxima de pasajeros que llevan el 25% de los vuelos con menos pasajes, de la
agencia A?
Solución La empresa “B” presenta la siguiente información:

55 – 55 – 60 – 65 – 68 – 70 – 70 – 75 – 77 – 78 – 95 – 98– 99 – 100 – 100.

25%
110
50 𝑷𝟐𝟓

𝑛∙𝑘
− 𝑁𝑖−1
𝑃𝑖 = 𝐿𝑖𝑛𝑓 + 𝑎𝑖 ∙ 100
𝑛𝑖
𝟓𝟎 ∙ 𝟐𝟓
− 𝟏𝟎
El 25% de los vuelos menos cotizados, viaja 𝑷𝟐𝟓 = 𝟕𝟎 + 𝟏𝟎𝟎 ∙ 𝟏𝟎 = 𝟕𝟏, 𝟑𝟗
con a lo más 71 pasajeros. 𝟏𝟖
Ejercitemos
b) La compañía “A” asegura que el 50% de los vuelos lleva
al menos 85 pasajeros. ¿Apoya esa afirmación?
Solución

50 %
50 𝑷𝟓𝟎 110

𝑛∙𝑘
− 𝑁𝑖−1
𝑃𝑖 = 𝐿𝑖𝑛𝑓 + 𝑎𝑖 ∙ 100
𝑛𝑖

El 50% de los vuelos de la Agencia A, tienen


𝟓𝟎 ∙ 𝟓𝟎
− 𝟏𝟎 a lo más 78 pasajeros. Por lo tanto, no se
𝑷𝟓𝟎 = 𝟕𝟎 + 𝟏𝟎𝟎 ∙ 𝟏𝟎 = 𝟕𝟖, 𝟑𝟗 apoya su afirmación.
𝟏𝟖
Ejercitemos
c) En la compañía “A” ¿Qué porcentaje de los vuelos
lleva a lo más 90 pasajeros?
Solución

90 %
50 𝑷𝟗𝟎 110

Cada vez que el valor del percentil es un límite de los intervalos, para
determinar el porcentaje, solo se puede hacer mirando la tabla

El 80% de los vuelos lleva a lo más 90 pasajeros.

También podría gustarte