Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de datos
Curso-Taller:
“Estrategias para el Fortalecimiento de la
Investigación en Salud”
09:00 09:30 Registro
Recuerdo de la clase anterior
09:30 10:00
10:00 10:30 Muestra: Conceptos
10:30 11:00 Error tipo 1 y Error tipo 2
11:00 11:30 Receso
Estadística descriptiva: Medidas de tendencia central, Medidas
11:30 12:00 de forma
Estadística descriptiva: Medidas de tendencia central, Medidas
12:00 12:30 de forma
12:30 13:00 Ejercicios
Posible: Introducción a estadística inferencial Medidas de
13:00 13:30 asociación
13:30 14:00 Preguntas y respuestas
Recordemos rápidamente lo aprendido
en la clase anterior
Clasificación
Proceso estadístico
1. Planteamiento del problema/hipótesis
2. Decisión: qué datos se recogerán
3. Recogida de datos
4. Exploración/descripción de los datos
5. Inferencia
Conceptos básicos
• POBLACIÓN
• MUESTRA
• CENSO
• UNIDAD ELEMENTAL
• OBSERVACIÓN
• VARIABLES
• PARÁMETRO
• ESTIMADOR O ESTADÍSTICO
Variables: tipos
Observaciones, variables, datos…
Variables
REPRESENTATIVA NO REPRESENTATIVA
EN CUANTO A LOS ESTUDIOS CLÍNICOS
EXPERIMENTALES
GRUPO DE NO GENERALIZAMOS
ESTUDIO
GRUPO
CONTROL
Conceptos elementales: Muestreo
probabilístico
Azar o suerte
Aleatorio simple
Fórmula :
población de
estudio/muestra
Sistemático
Estratos o
subgrupos (sexo,
edad, etc)
Estratificado
Población muy
grande Conglomerado
Aleatorio simple
Sistemático
Estratificado
Conglomerado
No probabilístico
OBSERVEMOS EN NUESTROS ARTÍCULOS, EN
LAS SECCIONES DE MATERIALES Y MÉTODOS:
TIPO DE MUESTREO
s
IC100% (1 ) x z1 2
n
Tamaño de muestra
• El intervalo de confianza se extiende…
s
z1 2
n
…por arriba y por debajo de la media.
s
L 2 z1 2
n
Podemos también pensar en L como el margen de error en la
estimación del parámetro de interés.
Tamaño de muestra
Ejemplo: nos interesa estimar con un 95% de confianza
la estatura promedio de los estudiantes con un margen
de error de 3cm. Supongamos que la desviación
estándar de la estatura es de 6cm.
2 s
2
n 4 z1 2 2
L
Tamaño de muestra
• Volviendo al ejemplo de estatura, sustituimos en la fórmula…
6
2
2
n 4(1.96) 2
3
n 61.47 62
• ¡Así que el tamaño de muestra necesario para estimar el
promedio de estatura con 95% de confianza y un margen de
error de 3 cm es de 62 sujetos!
Tamaño de muestra
• En el caso de las proporciones se sigue el
mismo razonamiento…
pˆ qˆ
L 2 z1 2
n
2 pˆ qˆ
n 4z 1 2 2
L
Tamaño de muestra
Nunca debemos olvidar que el cálculo de tamaño de
muestra se basa en muchos supuestos y representa
nuestro “mejor estimado”,
pero…
Preguntas Clave:
1. ¿Cuál es el resultado final (outcome) primario?
2. ¿Cuál es su escala de medición?
3. ¿Cuál es la variabilidad?
4. ¿Cuál es el nivel deseado de Significancia y de Poder?
5. ¿Hay características especiales en el diseño del estudio?
6. ¿Qué sería Clínicamente Relevante (tamaño del efecto)?
Tamaño de muestra
1 n
x xi
n i 1
• La media poblacional (parámetro) se denota como m.
Media aritmética, propiedades
Luis 21 Jose 33
Jose 33 Antonio 53
Antonio 53 Pedro 54
Moda
Jose 8 Sara 6
Antonio 4 María 7
R (amplitud) = XL – Xs
Juan 10
R = 54-10 = 44
Luis 21
•Su utilidad es limitada
•Es simple de calcular Jose 33
•Sólo toma 2 valores del conjunto por
lo que es una medida pobre de Antonio 53
dispersión.
Pedro 54
Cuantiles
• Son los valores que, al ordenar los datos por su
magnitud, dividen a la muestra en C partes iguales.
• Ejemplos:
– Los valores que dividen a la muestra en en cien partes iguales se
llaman percentiles
– ...en cuatro partes cuartiles (Q1, Q2, Q3)
– … en tres partes se llaman terciles
– … en diez partes deciles
– Nota: el cuartil 1 coresponde al percentil 25, y el cuartil 3 al
percentil 75.
¿A qué es igual el cuartil 2?
Percentiles
• El percentil k se define como el valor por debajo del
cual están el k-por ciento de los datos.
• Para determinar el percentil k de un conjunto de datos:
– Si nk/100 es entero, el percentil k de los datos es el promedio
de la observación número (nk/100) y la (nk/100 +1) más
grandes.
– Si nk/100 no es entero, el percentil k es la (j+1)-ésima
medición más grande, donde j es el entero menor más
cercano a nk/100.
Ejemplo
Volumen de espiración forzada en 1 s de 13 adolescentes
con asma
Para determinar el p25
Individuo VEF
Individuo VEF nk/100
1 2.30 2 2.15
å ( xi - x ) 2
i =1
s2= 1506.8/5-1=376.7
S2 = n -1
Desviación estándar
• Es la raíz cuadrada positiva de la varianza.
• Se utiliza más que la varianza ya que tiene las
mismas unidades de medición que la media,
en lugar de unidades cuadradas.
• El grupo de datos con menor desviación
estándar tiene las observaciones más
homogéneas.
• La desviación estándar poblacional
(parámetro) se denota como s
Desviación estándar
s = s2
S = 376.7 = 19.4
• Coeficiente de variación:
– La desviación estándar puede ser grande o
pequeña dependiendo del promedio de los
datos, ejemplo:
• Una desviación estándar de 10 cm…
– Denota mucha variabilidad si hablamos de una
población humana con un promedio de estatura de
160 cm
– Denota poca variabilidad si hablamos de una
población de árboles con un promedio de estatura de
16 metros (1600 cm).
Dispersión relativa
• Coeficiente de variación (sigue):
– El coeficiente de variación V nos da una medida de la dispersión
relativa al promedio:
s
V
x
w x w2 x2 ... wk xk w x i i
x 1 1 i 1
k
w1 w2 ... wk
w
i 1
i
Ponderación
• Ejemplo:
– Si el examen final de un curso cuenta 3 veces más que una
evaluación parcial y un estudiante tiene 7.0 y 9.0 en los
parciales y 8.5 en el final. ¿Cuál es su promedio?
• Ejemplo:
• Si se tiene una muestra de 57 pesos de tumores
abdominales
k = 1+ 3.322(1.7558) = 6.8 ≈ 7 intervalos
¿Cúal es la dimensión de los intervalos de
clase?
• w=R
k
R (amplitud) = diferencia entre la observación más grande y más pequeña
w = 79-12 = 67 = 9.6
7 7
Tabla de distribución de frecuencias
PESO DE LOS TUMORES ABDOMINALES
• En ella se muestran
como se distribuyen Intervalos de Frecuencias
los valores dentro clase
de los intervalos de 10-19 5
clase especificados.
20-29 19
30-39 10
40-49 13
50-59 4
60-69 4
70-79 2
Total 57
Tabla de distribución de frecuencias
20
distribución de
frecuencia en una forma
15
gráfica.
• Los valores de la variable
Frequency
10
se ponen en el eje
horizontal y las
5
frecuencias en el eje
vertical.
0
0 20 40 60 80
pesotumor
Gráfico de caja
• En lugar de ubicar cada observación
presentan un resumen de los datos.
80
• La caja se extiende del p25 al p75.
• La línea media de la caja es el p50
• Los “bigotes” o valores adyacentes
son las observaciones más extremas
60
en el conjunto de datos no mayores
de 1.5 veces la altura de la caja más
allá de cada cuartil.
40
– 1.5x(p75-p25). Los datos que
sobrepasan este límite se incluyen
como un punto.
• En los conjuntos de datos
20
aproximadamente simétricos los
valores adyacentes contienen aprox.
el 99% de las mediciones.
0