Está en la página 1de 20

Estadística

-Media Aritmética (Promedio)


MEDIDAS DE TENDENCIA CENTRAL -Mediana
-Moda

Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor


x x Mediana
x1 Media Aritmética o Promedio x(1) M E = x( k ) Si n es impar
x2 n
x( 2 )

 xi ME =
x( k ) + x( k +1) Si n es par
x= i =1  2
xn n x(n) x( k ) = dato del centro

Datos Moda
Cualitativos y Cuantitativos Mo ="el dato que más se repite"

1
Estadística

-Percentil (ejemplo: 25, 50, 75)


Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 2
Estadística

-Rango
MEDIDAS DE DISPERSIÓN -Varianza
-Desviación Estándar

Datos Cuantitativos Varianza


x Rango n n
1 n
x1  ( xi − x ) 2
 x − ( xi ) 2
2

R = max( xi ) − min( xi ) s 2 = i =1
i
1 n 2
=  xi − x 2
n i =1
= i =1
x2 n n n i =1

Desviación Típica o Estándar
xn
s = s2

Comparación entre Variables


Coeficiente de Variación
Se refiere al comportamiento de las variables cuantitativas en un
s
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que cv =
se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál x
presenta mayor variación? 3
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.

 (x i − x)3 Si CA=0 si la distribución es simétrica alrededor de la media.


Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA = i =1
Si CA>0 si la distribución es asimétrica a la derecha
n  s3

 ( xi − x ) 4
- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
Coeficiente de Apuntamiento CAp = i =1
nombre de mesocúrtica.
n  s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.

4
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento

14 30 6

12 5

10
20 4

8
3

10 2
4

1 Desv. típ. = 2,42


2 Desv. típ. = 1,67 Desv. típ. = ,64
Media = 3,9 Media = 0,0 Media = 5,2

N = 30,00 N = 30,00 0 N = 28,00


0 0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 -1,0 0,0 1,0 2,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0

V2 V4 V5

5
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Ejemplos

Datos Histograma Medidas descriptivas


16

1 4 4 Media 3,9
14
1 4 4 Mediana 4

1 4 5
12 Moda 4

2 4 5 10
Desviación estándar 1,67

2 4 6 Varianza de la muestra 2,78


8
2 4 6 kurtosis -0,43
6
2 4 6 Coeficiente de asimetría -0,02

3 4 6 4 Rango 6

3 4 7 Desv. típ. = 1,77 Mínimo 1


2
Media = 5,4
4 4 7 Máximo 7
0 N = 66,00
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Cuenta 30

V1

6
Estadística

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento


para datos Agrupados (tabla de frecuencias)

Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos


Centro agrupados esta dada por:
Intervalo de clase Amplitud F f FAA fra
k

 (c
n1
I1 c1 a1 f1
sc = j − xc ) 2 f j
I2 c2 a2 n2 f2 j =1
.
.    
Ik ck ak nk fk n 1 3) El Coeficiente de Asimetría para
Total n 1 datos agrupados esta dado por:
k

Sea cj la marca de clase (o centro de clase) y fj la  (c


j =1
j − xc ) 3 f j
frecuencia relativa de la clase j, donde j=1, 2,…, k. CAc =
s c3
1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase 4) El Coeficiente de apuntamiento para
por sus frecuencias relativas, de la forma: datos agrupados esta dada por:
k

 (c − xc ) 4 f j
k
Mediac = xc =  c j f j j =1
j
j =1 CApc =
s c4
7
Estadística

Descripción de 2 variables cualitativas

Problema Distribución conjunta


Interesa estudiar cual es el Tabla 1 Actividad
principal medio de transporte Transporte Estudia Pensionado Trabaja
preferido por un grupo de
personas a la hora de dirigirse Autobus 5 7 0
al centro comercial. Bicicleta 3 3 2
Caminar 2 5 2
Para esto se consultó a cada
Coche 5 4 5
persona sobre la actividad a la
que se dedicaba y el medio de Metro 6 7 4
transporte preferido.
Transporte Nº %
Autobus 12 20,0 Actividad Nº %

Bicicleta 8 13,3
Estudia 21 35,0

Caminar 9 15,0
Pensionado 26 43,3

Coche 14 23,3
Trabaja 13 21,7

Metro 17 28,3
TOTAL 60 100

TOTAL 60 100

8
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas
Tabla 2 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

9
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100

10
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100

11
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

x
x1 Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x2 (Varianza y Desviación Estándar) para una Variable
 Cuantitativa (x).
xn

Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
1 n
x y cov( x, y ) = ( xi − x )( yi − y )
x(1) y( 1 ) n i =1
y( 2 ) Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,
x( 2 ) es decir que cuando x aumenta y también aumenta; y viceversa.
  Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
x(n) y( n ) es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.
12
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas
n
 xi yi − nxy
x y
cov( x , y )
x(1) y( 1 ) r= −1  r  1
sx s y r = i =1
x( 2 ) y( 2 ) ( n − 1 )sx s y
  Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x(n) y( n ) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.

13
Estadística

EJEMPLO : Representación gráfica de las variables x e y

r=1 r=-1

14
Estadística

Datos Cuantitativos

REGRESION LINEAL SIMPLE


Objetivo 1 Objetivo 2
Determinar si dos variables están x y Estudiar si los valores de una
asociadas y en qué sentido se da x(1) y( 1 ) variable pueden ser utilizados para
la asociación. predecir el valor de la otra
x( 2 ) y( 2 )
 
x(n) y( n )
Determinar si existe relación Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
15
Estadística

Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x(1) y( 1 ) Notación
x( 2 ) y( 2 ) Variable Respuesta: y
Variable Explicativa: x
 
x(n) y( n ) Modelo de Regresión Lineal Simple: yi=+xi+ei
Intercepto: 
Pendiente: 
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados
a = y − bx

yˆ = a + bx
n n n Residuos o Errores
n xy −  xi  yi ei = yi − yˆ i
b= i =1 i =1 i =1
2

n x −   xi 

n n
2

i =1  i =1 
16
Estadística

REGRESION LINEAL SIMPLE

MODELO DE REGRESIÓN LINEAL SIMPLE


yi=+xi+ei

DATOS MODELO ESTIMADO


x
x(1)
y
y( 1 )
yˆ = a + bx
x( 2 ) y( 2 )
  ESTIMADORES ERRORES
x(n) y( n ) a = y − bx ei = yi − yˆ i
n n n
n xy −  xi  yi
b= i =1 i =1 i =1
2

n x 2 −   xi 
n n

i =1  i =1 
17
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm)
i xi yi
1 3 55
y=talla / x=edad / n=14
2 6 68
14
3
4
5
5
64
66  yi = 956 y = 68,3 s y = 5,6
i =1
5 3 62 14
6
7
4
9
65
74
 xi = 84 x = 6 sx = 2
i =1
8 8 75
9 9 73 cov(x, y) = 9,07 rxy = 0,88
10 7 69 14 14
11 6 73  xi y i = 5863  xi2 = 556
12 5 68 i =1 i =1
13 8 73
14 6 71

18
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

Modelo Estimado
yˆ = a + bx

b = 2,44 a = 53,64

yˆ = 53,64 + 2,44 x

Interpretación de los resultados


- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
19
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

niño edad (meses) talla (cm) Talla estimada error


i xi yi ŷi ei 14

1 3 55 61,0 -6,0  ( yi − yi ) 2 = 402,86


i =1
2 6 68 68,3 -0,3 14 14
3 5 64 65,8 -1,8  ( yi − yˆ i ) 2 =  ei2 =92,7
4 5 66 65,8 0,2 i =1 i =1
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6 Bondad de Ajuste del Modelo
8 8 75 73,2 1,8 R2 = 0,77
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7 De acuerdo al coeficiente de
11 6 73 68,3 4,7 determinación, el modelo ajustado
12 5 68 65,8 2,2 a los datos es adecuado (R2
13 8 73 73,2 -0,2 cercano a 1)
14 6 71 68,3 2,7

20

También podría gustarte