Documentos de Académico
Documentos de Profesional
Documentos de Cultura
edad
Histograma
Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad
Ejemplo
En el grfico se puede observar el nmero de
hijos , de menor edad (7-8 aos), las de mayor
edad (13-14 aos); y adems que la mayora de
hijos de los trabajadores estn entre los 10 y 12
aos.
Estadstica
36
TIPOS DE GRFICOS 5. Polgono de Frecuencia
edad
14 13 12 11 10 9 8 7
15
10
5
0
edad
F
r
e
c
u
e
n
c
i
a
N
Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad
-Esta representacin se basa en
el Histograma.
-Slo es til para variables
cuantitativas.
-El eje x se refiere a la
variable.
- El eje y se refiere a la
frecuencia (N , %).
-Los puntos que permiten la
unin de las lneas representa
el centro de clase (o marca de
clase).
Estadstica
37
TIPOS DE GRFICOS 5. Diagrama de Caja
- Permite identificar grficamente la
mediana, los cuartiles 1 y 3
(percentiles 25 y 75), mnimo y
mximo de una variable.
- Slo es til para variables
cuantitativas.
-El eje x permite identificar la
poblacion en estudio.
- El eje y representa los valores de la
variable en estudio.
Estadstica
1473 584 N =
Hombres Mujeres
E
d
a
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron
angioplasta entre 1980 y 2000
38
TIPOS DE GRFICOS 6. Otros
Nmero de alumnos matriculados en la
Carrera A segn ao de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
ao de ingreso
N
d
e
a
l
u
m
n
o
s
Nmero de alumnos matriculados en la
Carrera B segn ao de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
ao de ingreso
N
d
e
a
l
u
m
n
o
s
Nmero de alumnos matriculados en las Carreras
segn ao de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
ao ingreso
N
d
e
a
l
u
m
n
o
s
Carrera B
Carrera A
ao de ingreso Carrera A Carrera B
1998 60 80
1999 55 70
2000 80 50
2001 40 60
2002 68 50
2003 70 75
N de alumnos
Estadstica
39
OBSERVACIONES
* El Tipo de Grfico seleccionado va a depender de la variable en estudio.
* El Grfico debe contener un Ttulo General y la identificacin de cada
eje (variable en estudio y frecuencia).
* En ocasiones resulta ms ilustrativo un grfico que una tabla de
frecuencia.
* Al igual que las tablas, los grficos deben ser auto-explicativos.
Variables Cuantitativas
variable = x
i individuo el en variable la de valor =
i
x
n i ,..., 1 =
nc c c c
n
i
= + + =
=
1
= =
= + + =
n
i
i n
n
i
i
x c cx cx cx
1
1
1
b x a b ax b ax b ax
n
i
i n
n
i
i
+ = + + + + = +
= = 1
1
1
) ( ) ( ) (
2 2
1
1
2
n
n
i
i
x x x + + =
=
2
1
2
1
) ( ) (
n
n
i
i
x x x + + =
=
) ( ) ( ) (
1 1
1
n n
n
i
i i
y x y x y x + + + + = +
=
) ( ) ( ) (
1 1
1
n n
n
i
i i
y x y x y x + + =
=
variable = y
i individuo el en variable la de valor =
i
y
NOTACION
constantes : , , c b a
Estadstica
40
MEDIDAS DE TENDENCIA CENTRAL
-Media Aritmtica (Promedio)
-Mediana
-Moda
n
x
x
n
i
i
=
=
1
Media Aritmtica o Promedio
Mediana
) ( E
M
k
x =
2
M
) 1 ( ) (
E
+
+
=
k k
x x
x
1
x
2
x
n
x
Datos Cuantitativos
x
) 1 (
x
) 2 (
x
) (n
x
Datos Cuantitativos ordenados de menor a mayor
Si n es par
Si n es impar
centro del dato
) (
=
k
x
repite" se ms que dato el " M
o
=
Moda Datos
Cualitativos y Cuantitativos
Estadstica
41
Percentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que rene al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posicin 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posicin 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos estn ordenados de Menor a Mayor
Estadstica
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que rene al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posicin 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posicin 22.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que rene al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posicin 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posicin 64.
42
MEDIDAS DE DISPERSIN
-Rango
-Varianza
-Desviacin Estndar
Rango
Varianza
x
1
x
2
x
n
x
Datos Cuantitativos
Coeficiente de Variacin
Comparacin entre Variables
Se refiere al comportamiento de las variables cuantitativas en un
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que
se les mide Estatura, Peso, Edad: Entre estas variables cul
presenta mayor variacin?
) min( ) max(
i i
x x R =
Desviacin Tpica o Estndar
2
1
2 1 1
2 2
1
2
2
1
) (
1
) (
x x
n n
x
n
x
n
x x
s
n
i
i
n
i
n
i
i i
n
i
i
=
=
=
= = =
2
s s =
x
s
cv =
Estadstica
43
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Adems de la posicin y la dispersin de los datos, otra medida de inters en una distribucin de frecuencias
es la simetra y el apuntamiento o kurtosis.
Coeficiente de Asimetra
3
1
3
) (
s n
x x
CA
n
i
i
=
Si CA=0 si la distribucin es simtrica alrededor de la media.
Si CA<0 si la distribucin es asimtrica a la izquierda
Si CA>0 si la distribucin es asimtrica a la derecha
Coeficiente de Apuntamiento
4
1
4
) (
s n
x x
CAp
n
i
i
=
- Si CAp=0 la distribucin se dice normal (similar
a la distribucin normal de Gauss) y recibe el
nombre de mesocrtica.
- Si CAp>0, la distribucin es ms puntiaguda que
la anterior y se llama leptocrtica, (mayor
concentracin de los datos en torno a la media).
- Si CAp<0 la distribucin es ms plana y se
llama platicrtica.
44
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetra y apuntamiento
V2
7,0 6,0 5,0 4,0 3,0 2,0 1,0
14
12
10
8
6
4
2
0
Desv. tp. = 1,67
Media = 3,9
N = 30,00
V4
2,0 1,0 0,0 -1,0
30
20
10
0
Desv. tp. = ,64
Media = 0,0
N = 30,00
V5
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
6
5
4
3
2
1
0
Desv. tp. = 2,42
Media = 5,2
N = 28,00
45
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos
Media 3,9
Mediana 4
Moda 4
Desviacin estndar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetra -0,02
Rango 6
Mnimo 1
Mximo 7
Cuenta 30
V1
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
16
14
12
10
8
6
4
2
0
Desv. tp. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos
Histograma
Medidas descriptivas
46
Estadstica
Media, Desviacin tpica, Coeficientes de Asimetra y Apuntamiento
para datos Agrupados (tabla de frecuencias)
Intervalo
Centro
de clase Amplitud F f FAA fra
I
1
c
1
a
1
I
2
c
2
a
2
.
.
I
k
c
k
a
k
n 1
Total n 1
f
1
f
2
f
k
n
1
n
2
n
k
Tabla de frecuencia (para variable cuantitativa)
1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase
por sus frecuencias relativas, de la forma:
=
= =
k
j
j j c c
f c x Media
1
Sea c
j
la marca de clase (o centro de clase) y f
j
la
frecuencia relativa de la clase j, donde j=1, 2,, k.
2) La Desviacin tpica para datos
agrupados esta dada por:
=
=
k
j
j c j c
f x c s
1
2
) (
3) El Coeficiente de Asimetra para
datos agrupados esta dado por:
3
1
3
) (
c
k
j
j c j
c
s
f x c
CA
=
=
4) El Coeficiente de apuntamiento para
datos agrupados esta dada por:
4
1
4
) (
c
k
j
j c j
c
s
f x c
CAp
=
=
47
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte N %
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad N %
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
Problema
Interesa estudiar cual es el
principal medio de transporte
preferido por un grupo de
personas a la hora de dirigirse
al centro comercial.
Para esto se consult a cada
persona sobre la actividad a la
que se dedicaba y el medio de
transporte preferido.
48
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
49
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100
50
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100
51
MEDIDAS DE ASOCIACIN LINEAL
- Covarianza
- Correlacin
x
1
x
2
x
n
x
Datos
Cuantitativos
Covarianza:
Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersin
(Varianza y Desviacin Estndar) para una Variable
Cuantitativa (x).
Es una medida de Variabilidad Conjunta entre dos variables (x
1
, x
2
) o bien (x , y)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2
) (n
x
) n (
y
Si Cov(x,y) es positiva: la asociacin entre x e y es directamente proporcional,
es decir que cuando x aumenta y tambin aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociacin entre x e y es inversamente proporcional,
es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociacin entre x e y.
=
=
n
i
i i
) y y )( x x (
n
) y , x cov(
1
1
Estadstica
52
MEDIDAS DE ASOCIACIN LINEAL
- Covarianza
- Correlacin
Datos
Cuantitativos
Coeficiente de Correlacin de Pearson (r): Mide el grado de Asociacin Lineal
entre dos variables Cuantitativas
Se refiere al grado de asociacin entre dos variables (x
1
, x
2
) o bien (x , y)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2
) (n
x
) n (
y
Si r es positivo: la asociacin entre x e y es directamente proporcional, es decir que
cuando x aumenta y tambin aumenta; y viceversa. Si r=1: la asociacin lineal es
perfecta.
Si r es negativo: la asociacin entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociacin lineal es
perfecta.
Si r es cero: no existe asociacin entre x e y.
Correlacin:
1 1 s s r
y x
s s
) y , x cov(
r =
y x
n
i
i i
s s ) n (
y x n y x
r
1
1
=
Estadstica
53
r=1 r=-1
EJEMPLO : Representacin grfica de las variables x e y
Estadstica
54
Objetivo 2
Estudiar si los valores de una
variable pueden ser utilizados para
predecir el valor de la otra
REGRESION LINEAL SIMPLE
Datos Cuantitativos
Determinar si existe relacin
entre las variables x e y:
Coeficiente de Correlacin
Objetivo 1
Determinar si dos variables estn
asociadas y en qu sentido se da
la asociacin.
Estudiar la dependencia de una
variable respecto de la otra:
Modelo de Regresin
Trminos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relacin Lineal (modelo lineal)
Parmetros (intercepto y pendiente)
I ntercepto (respuesta media)
Pendiente(efecto de la variable explicativa sobre la respuesta)
Error (residuo)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2
) (n
x
) n (
y
Estadstica
55
REGRESION LINEAL SIMPLE
Datos Cuantitativos
Notacin
Variable Respuesta: y
Variable Explicativa: x
Modelo de Regresin Lineal Simple: y
i
=o+|x
i
+e
i
I ntercepto: o
Pendiente: |
Error: e
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2
) (n
x
) n (
y
Modelo Estimado
(recta de regresin)
bx a y + =
x b y a =
2
1 1
2
1 1 1
|
.
|
\
|
=
= =
= = =
n
i
i
n
i
n
i
i
n
i
i
n
i
x x n
y x xy n
b
Mtodo de Estimacin: Mnimos Cuadrados
i i i
y y e =
Residuos o Errores
Estadstica
56
REGRESION LINEAL SIMPLE
DATOS
MODELO DE REGRESIN LINEAL SIMPLE
y
i
=o+|x
i
+e
i
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2
) (n
x
) n (
y
MODELO ESTIMADO
bx a y + =
x b y a =
2
1 1
2
1 1 1
|
.
|
\
|
=
= =
= = =
n
i
i
n
i
n
i
i
n
i
i
n
i
x x n
y x xy n
b
ESTIMADORES
i i i
y y e =
ERRORES
Estadstica
57
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
nio edad (meses) talla (cm)
i x
i
y
i
1 3 55
2 6 68
3 5 64
4 5 66
5 3 62
6 4 65
7 9 74
8 8 75
9 9 73
10 7 69
11 6 73
12 5 68
13 8 73
14 6 71
y=talla / x=edad / n=14
956
14
1
=
= i
i
y 3 , 68 = y
6 , 5 =
y
s
84
14
1
=
= i
i
x
6 = x
2 =
x
s
07 , 9 ) , cov( = y x
88 , 0 =
xy
r
5863
14
1
=
= i
i i
y x
556
14
1
2
=
= i
i
x
Estadstica
58
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
Modelo Estimado
bx a y + =
44 , 2 = b 64 , 53 = a
x y 44 , 2 64 , 53 + =
Interpretacin de los resultados
- Existe asociacin o dependencia entre la Talla del nio y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresin lineal simple, se tiene que la talla
media de un nio es de 53,64 cm. Cuando la edad del nio (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
Estadstica
59
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
De acuerdo al coeficiente de
determinacin, el modelo ajustado
a los datos es adecuado (R
2
cercano a 1)
Bondad de Ajuste del Modelo
R
2
= 0,77
nio edad (meses) talla (cm) Talla estimada error
i x
i
y
i
i
y
i
e
1 3 55 61,0 -6,0
2 6 68 68,3 -0,3
3 5 64 65,8 -1,8
4 5 66 65,8 0,2
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6
8 8 75 73,2 1,8
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7
11 6 73 68,3 4,7
12 5 68 65,8 2,2
13 8 73 73,2 -0,2
14 6 71 68,3 2,7
86 , 402 ) (
14
1
2
=
= i
i i
y y
7 , 92 ) (
14
1
2
14
1
2
= =
= =
i
i
i
i i
e y y
Estadstica