Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA MÉDICA
1
Estadística
Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los últimos años.
2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.
2
Estadística
Introducción
Ejemplos de su aplicación son:
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una
votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
3
Estadística
Introducción
Etapas de un estudio estadístico
Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado
método científico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigación y
precisar el universo o población.
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la población
4
Estadística
Introducción
Esquema de las etapas de un estudio estadístico
ORGANIZAR Y RESUMIR
Probabilidad
INFORMACIÓN
5
Estadística
Introducción
Ejemplos de algunos problemas a estudiar
6
Estadística
Población: Muestra
7
Estadística
TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo
9
Estadística
Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- Nº de Empleados: se refiere al número de empleados en las líneas de producción. ( cuantitativa
discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de
producción. (cuantitativa continua)
- Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
Datos
Industria nº Tipo Nº Empleados Superficie Calificación
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
. . . . .
. . . . .
. . . . .
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
10
Estadística
Tipo de Frecuencia Frecuencia Porcentaje Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Industria Absoluta (F j) Relativa (fj) (%) Calificación Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
A Muy Bien
B Bien
C Regular
D Mal 300 1 (o 100)
Total 300 1 100 Total 300 1 (o 100)
(2)
(1) Numero de Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Empleados Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<100
[100-150[
. (3)
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (F j) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
(4) [200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%) 11
Estadística
Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1
12
Estadística
13
Estadística
C
D A 40% B
10% 20% 30%
C
B
40%
30%
14
Estadística
variable 1
400 C
300
B
Nº
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1
C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis
grupos. 15
Estadística
TIPOS DE 3. Histograma
GRÁFICOS Histograma
Histograma
Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad - Permite la representación de
15
la frecuencia de una variable
Cuantitativa.
10
Frecuencia
- El eje x se refiere a la
Nº
5
variable.
- El eje y se refiere a la
0
frecuencia (Nº , %).
7 8 9 10 11 12 13 14
edad
edad
- Cada barra representa la
Ejemplo
frecuencia de la variable en la
población en estudio (o la
En el gráfico se puede observar el número de muestra).
hijos , de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de -El histograma se puede
hijos de los trabajadores están entre los 10 y 12 construir desde los datos de la
años. tabla de frecuencia de la
variable en estudio.
16
Estadística
edad cuantitativas.
Nº
5
-El eje x se refiere a la
variable.
0
7 8 9 10 11 12 13 14
- El eje y se refiere a la
edad frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).
17
Estadística
90
80
70
50
(percentiles 25 y 75), mínimo y
40 máximo de una variable.
30 - Sólo es útil para variables
20 cuantitativas.
10 -El eje x permite identificar la
0 poblacion en estudio.
N= 584 1473
- El eje y representa los valores de la
Mujeres Hombres
variable en estudio. 18
Estadística
TIPOS DE 6. Otros
GRÁFICOS
Número de alumnos matriculados en la Número de alumnos matriculados en la
Carrera A según año de ingreso Carrera B según año de ingreso
100 100
Nº de alumnos
Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso
1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
0
2003 70 75
1998 1999 2000 2001 2002 2003
NOTACION
Variables Cuantitativas
i 1 frecuencia. i 1 i 1 i 1
n n n
* Al igual que las tablas, los gráficos deben ser auto-explicativos.
(axi b) (ax1 b) (axn b) a xi b 2
( xi ) ( x1 xn ) 2
i 1 i 1 i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
20
Estadística
Datos Moda
Cualitativos y Cuantitativos M o " el dato que más se repite"
21
Estadística
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los
n datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 22
Estadística
-Rango
MEDIDAS DE DISPERSIÓN -Varianza
-Desviación Estándar
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.
(x
i 1
i x)3 Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA Si CA>0 si la distribución es asimétrica a la derecha
n s3
n
- Si CAp=0 la distribución se dice normal (similar
( xi x ) 4
i 1
a la distribución normal de Gauss) y recibe el
Coeficiente de Apuntamiento CAp nombre de mesocúrtica.
n s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.
24
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
14 30 6
12 5
10
20 4
8
3
10 2
4
V2 V4 V5
25
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Ejemplos
1 4 4 Media 3,9
14
1 4 4 Mediana 4
1 4 5
12 Moda 4
2 4 6 kurtosis -0,43
6
2 4 6 Coeficiente de asimetría -0,02
3 4 6 4 Rango 6
3 4 7 2
Desv. típ. = 1,77 Mínimo 1
Media = 5,4
4 4 7 N = 66,00
Máximo 7
0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Cuenta 30
V1
26
Estadística
(c
k
Mediac x c c j f j j xc ) 4 f j
j 1
j 1 CAp c
s c4
27
Estadística
Bicicleta 8 13,3
Estudia 21 35,0
TOTAL 60 100
28
Estadística
Distribución conjunta
Nº de personas
Tabla 2 Actividad
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
29
Estadística
Distribución conjunta
Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
30
Estadística
Distribución conjunta
Nº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
31
Estadística
- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos
x
x
1
Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x
2 (Varianza y Desviación Estándar) para una
Variable Cuantitativa (x).
x
n
Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
1 n
x y cov( x , y ) ( xi x )( yi y )
y
n i 1
x
(
1) (1
)
Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,
x
(2
)
y
(2) es decir que cuando x aumenta y también aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociación entre x e y es inversamente
x
(n
)
y
(n) proporcional, es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.
32
Estadística
- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos
Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson ( r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas
n
x y
x y r
cov( x , y ) xi yi nx y 1 r 1
(
1) (1
)
sx s y r i 1
x
(2
)
y
(2)
( n 1 )s x s y
Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x
(n
)
y
(n) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.
33
Estadística
r=1 r=-1
34
Estadística
Datos Cuantitativos
Determinar si existe relación x
(n
)
y
(n) Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
35
Estadística
Datos Cuantitativos
i 1 i 1
36
Estadística
x
(2
)
y
(2)
ESTIMADORES ERRORES
x
(n
)
y
(n) a y bx ei y i yˆ i
n n n
n xy xi y i
b i 1 i 1 i 1
2
n
n
n x 2 xi
i 1 i 1
37
Estadística
38
Estadística
b 2 , 44 a 53 , 64
yˆ 53 , 64 2 , 44 x
n
iñ
o e
dad(m
es
es) ta
lla(
c m
)Ta
llaes
tim
ad
a e
rr
o r
i x y ŷ
i e
i 14
( yi yi )2 402,86
i i
1 3 5
5 6
1,0 -6,0
i 1
2 6 6
8 6
8,3 -0,3 14 14
3 5 6
4 6
5,8 -1,8 ( yi yˆi )2 ei2 92,7
4 5 6
6 6
5,8 0
,2 i 1 i 1
5 3 6
2 6
1,0 1
,0
6 4 6
5 6
3,4 1
,6
7 9 7
4 7
5,6 -1,6 Bondad de Ajuste del Modelo
8 8 7
5 7
3,2 1
,8 R2 = 0,77
9 9 7
3 7
5,6 -2,6
1
0 7 6
9 7
0,7 -1,7 De acuerdo al coeficiente de
1
1 6 7
3 6
8,3 4
,7 determinación, el modelo ajustado
1
2 5 6
8 6
5,8 2
,2 a los datos es adecuado (R 2
1
3 8 7
3 7
3,2 -0,2
cercano a 1)
1
4 6 7
1 6
8,3 2
,7
40