Está en la página 1de 28

Econometría

UNIDAD 2
REPASO ESTADISTICO
Unidad 2:
Repaso Estadístico Estadística Descriptiva
1) Medidas de posición (tendencia)
central
Suponga una muestra con las sigtes
observaciones de edad en años:

(12,13,14,14,15,17,18,18,18,19,21,23,25,25),
a) Calcule la Media (18), mediana(18),
moda(18).
Unidad 2:
Repaso Estadístico Coeficientes característicos de
una distribución OBS
Esperanza Xi P(Xi) %
1 12 5
E(X)=Σp(Χi ) Χi 2 13 6
3 14 9
E(X)=Χ1* p(Χ1 ) +..xip(Xi) 4 14 9
5 15 5
=Σxif(xi) 6 17 6
7 18 10
8 18 10
9 18 10
E(X)=18,03 10 19 3
11 21 7
Para el caso continuo: 12 23 4

E(X)= xf(x)dx 13
14
25
25
8
8
Unidad 2:
Repaso Estadístico Estadística Descriptiva

Momento central respecto a la media:


Dada la var. aleatoria X con función de prob.
f(x), definimos una función de X tal que
z(x) =(x-μ)k donde k Є z y k>0
Luego E[z(x)] = E[(x-μ)k] k-ésimo momento
de X respecto a la media y se llama μk
1er momento respecto a la media, en este
caso en que k=1, es cero
E[z(x)]= μk
Repaso Estadístico Estadística Descriptiva:
2) Medidas de Dispersión
Varianza: La varianza poblacional corresponde al
2do momento respecto a la media, k=2
Medida de dispersión. Mide qué tan alejado está un
conjunto de valores respecto a la media
aritmética. Menos disperso más cerca del valor
medio.
μ2 = E[(x-μ)2] = σx2 = σ2
σ2 = E[(x-μ)2] = E[x2 ]-μ2 = E[x2]- E[x]2, es decir la
varianza es igual a la media de los cuadrados
menos el cuadrado de la media.
Unidad 2:
Repaso Estadístico Estadística Descriptiva

Varianza:
Para una variable discreta

Para una variable continua


Unidad 2:
Repaso Estadístico Estadística Descriptiva

Varianza muestral:
σ^2 = 1/n Σ (xi – x¯) 2

Otra más sencilla:


Unidad 2: Repaso Estadístico
Xi media Dif2
Xi- x¯
Varianza
12 18 -6 36
V(X)=[1/(14-1)] * 13 18 -5 25
(36+25……….+49) 14 18 -4 16
V(X)=(1/13) * 236 14 18 -4 16

V(X)=18,1538= S2 15 18 -3 9

17 18 -1 1

18 18 0 0
Propiedades: 18 18 0 0
V(X)>=0, hacer consistente la sd. 18 18 0 0

V(aX)=aV(X) 19 18 1 1

V(a+X)=V(a)+V(X), donde 21 18 3 9

23 18 5 25
V(a+X=0+V(X)=V(X)
25 18 7 49

25 18 7 49
Repaso Estadístico

Desviación estándar: En la práctica


es mas utilizada que la varianza
ya que tiene la misma unidad de
medida que los datos originales
Desviaciones estándar en una distribución normal

V(X)=18,1538, luego la
sd= σ^x= σ^2x

σ^= 18,1538

σ^=4.2607
Unidad 2: Repaso Estadístico

Ejemplo: calcular la desviación estándar de


un conjunto de datos. Los datos
representan la edad de los miembros de
un grupo de niños. { 4, 1, 11, 13, 2, 7 }
1. Calcular el promedio o media aritmética .

En este caso, N = 6 porque hay seis


datos:4,1,11,13,2,7.i=nº datos
i=número de datos para sacar desviación
estándar
Repaso Estadístico: desviación típica o estándar

Calcular
Unidad 2: Repaso Estadístico

Covarianza: estadístico que indica si las observaciones


están relacionadas entre sí. Es una manera de
generalizar la varianza. La fórmula es muy parecida a las
de las varianzas .
σ para el cálculo en la población, y
σ^ para el cálculo en la muestra.
cov xy = σ^xy= 1/(n-1) Σ (xi – x¯) (yi – y¯)

Si σ^xy >0 , hay dependencia directa (+)


Si σ^xy =0 , no existe relación lineal entre ambas variables
Si σ^xy <0 , hay dependencia inversa (-)
Unidad 2: Repaso Estadístico

Propiedades de la Covarianza:
Cov(xy)= Cov(yx)
Si X+k, y a Y+k, la COV no varía, donde k= constante.
Si X*k, y a Y*k’, entonces la COV*k*k’.
Ejemplo
Se han clasificado 100 familias según:
nº hijos varones: X=(fam. con Hijos);
nº de hijos mujeres Y=(fam. con Hijas),
en la tabla siguiente:
Unidad 2: Repaso Estadístico

Ejemplo
Hijo / 0 1 2 3 4
Hija
0 4 6 9 4 1
1 5 10 7 4 2
2 7 8 5 3 1
3 5 5 3 2 1
4 2 3 2 1 0
1. Definir las var..X=HV; Y=HM, con las tablas de frecuencias marginales

Yj → y1 y2 y3 y4 y5
Xi 0 1 2 3 4
x1→0 4 6 9 4 1 24 0 0 0
x2→1 5 10 7 4 2 28 28 28 44
x3→2 7 8 5 3 1 24 48 96 62
x4→3 5 5 3 2 1 16 48 144 63
x5→4 2 3 2 1 0 8 32 128 40
23 32 26 14 5 100 156 396 209
0 32 52 42 20 146
0 32 104 126 80 342
Las medias son:

Las varianzas son:

Las sd son:
El número medio de hijas en las familias con 2 hijos varones se obtiene
calculando la distribución condicionada de

n3j n3j yj
7 0
8 8
5 10
3 9
1 4
24 31
Repaso Estadístico: 3) Medidas de Dispersión

CORRELACION: medida sobre el grado de relación entre


dos variables, sin importar causa y efecto.
Existen dos coeficientes de correlación el de Spearman y
el de Pearson.
El coef. de correlación de Pearson es un índice estadístico
que mide la relación lineal entre dos variables
cuantitativas. A diferencia de la covarianza, la correlación
de Person es independiente de la escala de medida de las
variables.
Coef.corr.xy Pearson= ρxy= σxy / σx σy
ρ=-1, corr. inversa (-)
ρ=0, no existe corr. o nula
ρ=1, corr directa (+)
Repaso Estadístico: 4) Medidas de forma

4.1 ) ASIMETRIA: coeficiente de asimetría o skewness,


medida de la asimetría de una distribución de probabilidades
de una variable aleatoria. Debemos usar el tercer momento
respecto a la media. Recordar que: (1er momento: esperanza
E[z(x)]= μk =E[(x-μ)1] = E(x) – μ.). El 2do momento: varianza).

Asimetría= γ= μ3 / σ3 , donde μ3 corresponde al 3er


momento respecto a la media, y σ3 es la sd al cubo.
Para el caso de una muestra la asimetría será:
γ ^=1/n Σ (xi – x¯)3 / (1/n Σ (xi – x¯)2)3/2 , este
estimador suele ser el sesgado de la asimetría poblacional.
Repaso Estadístico: 4) Medidas de forma

La asimetría resulta útil en muchos campos. Muchos modelos


simplistas asumen una distribución normal, esto es, simétrica
en torno a la media. La distribución normal tiene una asimetría
cero. Pero en realidad, los valores no son nunca perfectamente
simétricos y la asimetría de la distribución proporciona una idea
sobre si las desviaciones de la media son positivas o
negativas. Una asimetría positiva implica que hay más valores
distintos a la derecha de la media.
Las medidas de asimetría, sobre todo el coeficiente de
asimetría de Fisher, junto con las medidas de apuntamiento o
Kurtosis se utilizan para contrastar si se puede aceptar que
una distribución estadística sigue la distribución normal. Esto
es necesario para realizar numerosos contrastes estadísticos
en la teoría de inferencia estadística.
Índices de asimetría
1. Índice de asimetría de Pearson

Está basado en la relación entre la media y la moda en


distribuciones simétricas y asimétricas :

X Mo
As
sx
Si la distribución es simétrica As será 0
Si la distribución es asimétrica positiva, As será
mayor que 0
Si la distribución es asimétrica negativa, As
será menor que 0
Índices de asimetría
2. Índice de asimetría de Fisher
Está basado en la diferencia de los datos sobre la
media, como la varianza, si bien esta vez se elevan
los coeficientes al cubo n
( X i X )3 n
i 1
= As
sx3
Si la distribución es simétrica, As será 0
Si la distribución es asimétrica positiva, As será mayor
que 0
Si la distribución es asimétrica negativa, As será
menor que 0
Unidad 2: Repaso Estadístico

ASIMETRIA:
Para hacerlo insesgado se ajusta,quedando:

^insesgado= ( n*(n-1) / n-2)* γ ^

Asimetria (-) Asimetria +)


Unidad 2: Repaso Estadístico

ASIMETRIA: Ejemplo de datos


experimentales con una asimetría positiva
(respuesta gravitrópica de los coleóptilos
del trigo)
Repaso Estadístico: 5) Medidas de concentración

KURTOSIS: o curtosis, es una medida de lo


“puntiaguda” (concentrada en torno a la media) de la
distribución de probabilidad de una variable aleatoria de un
número real. Una mayor kurtosis implica que la mayor parte de
la varianza es debida a desviaciones infrecuentes en los
extremos, que se oponen a desviaciones comunes de medidas
menos pronunciadas.
El estimado poblacional de la curtosis está definida por :

Kurtosis=κ= μ44 / σ4 , donde μ4 es el 4to. momento


respecto a la media (estaba la Esperanza, la Varianza y la
Asimetría), y σ4 es la sd a la 4ta potencia. Para lo muestral:
κ ^=1/n Σ (xi – x¯)4 / (1/n Σ (xi – x¯)2)2 -3
Índice de curtosis
Para una distribución normal (mesocúrtica) sabemos que
n
(Xi X )4 n
i 1
4
3
s x

Y esta va a ser la referencia para el índice de curtosis que vamos a


emplear
n
(Xi X )4 n
i 1
C r 4
3
s x

Si la distribución es normal (mesocúrtica), el índice vale 0


Si la distribución es leptocúrtica, el índice es superior a 0
Si la distribución es platicúrtica, el índice es inferior a 0
Ejemplo de curtosis (dist. Mesocúrtica)
1200

1000

800

600

400

200 Desv. típ. = 1.01


Media = -.00
0 N = 10000.00
-3
-3 5
-2 5
-2 5
-1 5
-1 5

1.
1.
2.
2.
3.
3.
4.
-.7 5
-.2
.2
.7
.7
.2
.7
.2
.7
.2

25
75
25
75
25
75
25
5
5
5
5

NORMAL
Más ejemplos de curtosis

También podría gustarte