Está en la página 1de 44

UNIDADES 2

Análisis de los datos


BIOESTADÍSTICA  Y  
EPIDEMIOLOGÍA  
 
 
Zayne  Milena  Roa  Díaz  
Enfermera,  MSc  en  Epidemiología  

Imagen  encontrada  en  la  web:  h"p://nataliagomezdelpozuelo.com/2012/11/12/analisis-­‐de-­‐los-­‐datos-­‐de-­‐tu-­‐web-­‐o-­‐blog/  


Objetivos de aprendizaje

u  Conocer e interpretar:

1.  Medidas de tendencia central


2.  Medidas de variabilidad o dispersión
3.  Medidas de Posición
4.  Medidas de Forma

2  
Estadística
Es una Estudia
Los Métodos Científicos
disciplina

Recolección Resumen
Organización Análisis
Procesamiento Interpretación
Además

DATOS
Hace inferencia y saca
conclusiones a partir de los datos
de una muestra

Descriptiva
Estadística
Inferencial
Estadística

Aplicación de los métodos estadísticos


Bioestadística Estudia
en problemas médicos y biológicos

Tabulación
Organizar
Herramient Representació
Descriptiva as para: Simplificar Incluye
n
Resumir
Descripción

Conjunto
Información
de Datos

Métodos para estimar las características de


un grupo total (población) basándose en
Inferencial
Proporciona datos de un conjunto pequeño (muestra) de
observaciones
Análisis Descriptivo
1. Medidas de tendencia central

Son estadísticos que llevan información respecto al


valor central o representativo del conjunto de datos.

Sólo se utilizan en datos cuantitativos, bien sea,


continuos o discretos.
Media aritmética

Principales
indicadores de Mediana
tendencia central

Moda
1.1. La media aritmética

La media aritmética, media o simplemente


promedio es la medida de tendencia central más
conocida y ampliamente usada.

Se obtiene sumando todos los valores en una


población o muestra y se divide entre el número de
valores sumados:
1.1. La media aritmética

La media es el centro de
La media es única. Un gravedad de la distribución,
conjunto de datos numéricos es decir, toma en cuenta
tiene una y sólo una media. todos y cada uno de los
datos.

Manifiesta el carácter inadecuado del


promedio como medida de resumen
para presentar datos con valores
Es deseable, extremos o atípicos (muy grandes o
Respecto a pero… muy pequeños)
esta
propiedad: Cuando estos valores extremos se
promedian con otros, pueden afectar la
media, volviendo debatible su valor
como descripción razonable del
“centro” de los datos
1.1. La media aritmética
Ejemplo:

En un estudio sobre respuesta inmune tisular en


pacientes con Leishmaniasis cutánea, se tomaron
biopsias de piel de los mismos y se realizó un conteo
de linfocitos T, obteniéndose los siguientes datos en
ocho improntas:
1.1. La media aritmética

Ejemplo:
Sin embargo, se puede apreciar cómo el valor 15.704 células es
bastante extremo comparado con los demás y por medio de algunas
técnicas de análisis se puede ver que éste es un valor atípico.

¿Qué hacer?
Si el dato atípico fue mal medido o mal digitado se
debe corregir (sí se puede) o eliminar (si no se
puede corregir).
1.1. La media aritmética

Si es un dato
real hay dos
opciones:

1. Si se puede excluir el valor


2. Si no es adecuado excluir el
atípico del conjunto se hace. Se
valor atípico, entonces la media
puede hacer un reporte de caso
no es un buen estadístico
para este individuo y calcular la
resumen y lo mejor es presentar
media de los siete restantes para
otro, como la mediana.
presentar la información sobre
respuesta inmune tisular en
pacientes con Leishmaniasis.
1.2. La Mediana (Me)
La mediana se conoce también como el percentil
50 (P50) ó el cuartil dos (Q2), dado que es la
medida que se encuentra en la posición central
del conjunto de datos, es decir, es la medición que
divide a la distribución en dos partes con igual
cantidad de datos.
50%  de  los  datos   50%  de  los  datos  

Dato  inicial     Mediana   Dato  final  


1.2. La Mediana (Me)

Su cálculo requiere que el conjunto de datos


este ordenado ascendentemente, entonces
la mediana de un conjunto n de datos es el
dato que esta en la posición central.
1.2. La Mediana (Me)

Si el número de datos es impar,


la mediana es el dato de la
posición de la mitad, en este
caso la mediana es uno de los
valores medidos en la muestra.

Si el número de datos es par, la


mediana es el promedio de los
dos datos centrales. En este
caso, la mediana podría no ser
uno de los valores medidos.
1.2. La Mediana (Me)
Ejemplo
1.2. La Mediana (Me)
La interpretación de la mediana es: Al menos el 50% de
los datos son menores o igual que la mediana y al menos
el 50% de los datos son mayores o igual que ella.

1. Es única. Un conjunto de
datos sólo tiene una
mediana.

Propiedades de la 2. Simplicidad. Es muy


mediana sencillo calcularla.

3. Los valores extremos no


tienen efectos importantes
sobre la mediana, lo que sí
ocurre con la media.
1.3. La Moda (Mo)
La Moda es la medición que más se repite
o que mayor frecuencia presenta. Una
distribución puede tener varias modas en
un caso dado, o no tener moda.

Imagen  encontrada  en  la  web:  h"p://estadis>cascma6b.blogspot.com/2012/09/mtc.html  


1.3. La Moda (Mo)
2. Medidas de variabilidad o
dispersión
Son valores que indican qué tanta variabilidad
o variación hay entre las mediciones del
conjunto de datos con respecto a su medida de
tendencia central.

Si todos los valores medidos son iguales, no hay


dispersión, pero si no todos son iguales,
entonces existe dispersión en los datos.

La magnitud de la dispersión es pequeña


cuando los valores, aunque diferentes, son
cercanos entre sí.
2. Medidas de variabilidad o
dispersión

1. Rango

Las  más  uNlizadas  son:   2. Rango


intercuartil

3. Varianza y
desviación estándar
2.1. Rango (R)

Proporciona una idea


También conocido como
El Rango es la vaga acerca de qué tan
diferencia entre el dato grande es la dimensión o
amplitud. mayor y el menor dato amplitud en la que se
del conjunto de datos. mueven los valores de la
variable.

R=Xmax – X min
Donde: Xmax = Dato mayor
X min = Dato
menor
2.1. Rango (R)

Ejemplo
2.2. Rango Intercuartil (RI)
Primero   es   necesario   definir   que   los   cuarNles   son   valores  
que  dividen  los  datos  en  cuatro  partes  iguales.    

El cuartil 2
El cuartil 1
(Q2) es el valor
(Q1) es el
que es mayor
valor que es
que el 50% de
mayor que el
los datos;
25% de los
coincide con la
datos.
mediana.
El rango
El cuartil 3 intercuartil es
(Q3) es el la distancia
valor que es entre el primer
mayor que el y el tercer
75% de los cuartil:
datos.
RI = Q3 - Q1
2.3. Varianza y Desviación
Estándar
La mejor medida de dispersión y
la más generalizada es la
varianza o su raíz cuadrada, la
desviación estándar o
desviación típica.

La varianza muestral y la desviación


estándar muestral son medidas o
indicadores de qué tan cerca o tan
lejos están las medidas respecto al
valor central o media.
2.3. Varianza y Desviación Estándar
La varianza muestral se calcula con la
siguiente fórmula:
2.3. Varianza y Desviación Estándar

Como se aprecia en la forma Esta es una forma bastante


compleja de medir la dispersión
matemática, la varianza es el de los valores, ya que es muy
promedio de las desviaciones grande en magnitud y sus unidades
entre los datos y la media son las de la variable original al
elevadas al cuadrado. cuadrado.

Por ello, en el reporte de la información, se


prefiere presentar la desviación estándar (S),
que se obtiene como la raíz cuadrada de la
varianza. Entonces, la desviación estándar estará
en las mismas unidades de la variable que se está
midiendo.
2.3. Varianza y Desviación Estándar
Ejemplo
3. Medidas de Posición

1. Los
cuartiles

2. Los
deciles

3. Los
percentiles
3.1. Cuartiles
Los   cuar>les   son   números   que   dividen   a   los   datos  
ordenados  en  cuatro  partes  con  igual  porcentaje.    

Primer cuartil Q1: es el valor que es mayor que el 25% de


los datos.

Segundo cuartil Q2: es el valor que es mayor que el


50% de los datos. El cuartil 2 coincide con la mediana.

Tercer cuartil Q3: es el valor que es mayor que el 75% de


los datos.
3.1. Cuartiles
Cuando   los   datos   no   están   agrupados   (datos   en   bruto),  
una  forma  de  resumir  la  información  de  cada  cuarNl,  es:    
3.1. Cuartiles
3.2. Percentiles
Si un conjunto de Los subíndices en
datos está ordenado P sirven para
por magnitud, los distinguir un
valores (de la
variable) que dividen percentil de otro.
a los datos en 100 E l d é c i m o
partes iguales se percentil ó
l l a m a n percentil 10, por
percentiles; de ejemplo, se
igual manera, los designa como P10,
valores que los el percentil 70 se
dividen en 10 partes designa por P70, y
iguales se llaman así sucesivamente.
deciles.
3.2. Percentiles
4. Medidas de Forma
Otro de los objetivos de un análisis descriptivo de los
datos es descubrir la manera como se distribuyen los
datos con relación a su simetría, normalidad y
apuntamiento.

La forma de un conjunto de datos se


puede determinar de varias maneras:

1. Gráficamente: histogramas, polígonos,


diagrama de caja, etc.
2. Ubicación de las medidas de
tendencia central: la media, la moda y la
mediana.
3. Coeficiente de asimetría (Skewness).
4. Curtosis (Kurtosis).
4.1. Asimetría
El concepto de asimetría se refiere a sí la
curva que forman los valores de la serie
presenta la misma forma a izquierda y
derecha de un valor central (media
aritmética).

Para medir el nivel de asimetría de un


conjunto de datos se utiliza el llamado
Coeficiente de Asimetría
(Skewness).
4.1. Asimetría
4.1. Asimetría
4.1. Asimetría
4.2. Curtosis

El Coeficiente de Curtosis (o grado de


apuntamiento de la distribución) analiza el grado
de concentración que presentan los valores
alrededor de la zona central de la distribución.

Se definen 3 tipos de distribuciones según su


grado de curtosis:
4.2. Curtosis
4.2. Curtosis
4.2. Curtosis
Bibliografía
u Hernández Sampieri R, Fernández Collado C,
Baptista Lucio M. Metodología de la investigación.
5ta Edición. Mc Graw Hill, 2010.
ISBN:978-607-15-0291-9.

u Martínez González MA, Sánchez Villegas A,


Faulin Fajardo J. Bioestadística Amigable. 2da
edición. Díaz Santos, 2006. 84-7978-791-0

También podría gustarte