Está en la página 1de 13

Revisión de algunos conceptos matemáticos y estadísticos

Francisco Orlando Rosales Pallasco Ph.D

29/11/2021

Contenido

1. Introducción
2. Repaso de probabilidad

2.1. Variable aleatoria


2.2. Distribución de probabilidad
2.3. Momentos
2.4. Dos variables aleatorias
2.5. Distribución normal, chi-cuadrado, t de Student, F
2.6. Muestreo aleatorio y distribución de la media muestral
2.7. Aproximación asintótica

1. Introducción

¿Qué es la econometría?

Es la ciencia que recopila y analiza datos observacionales o no experimentales a traés de métodos estadís-
ticos.Los datos no experimentalesson datos sobre individuos, empresas o segmentos de la economía que no
son obtenidos por medio de experimentos controlados. (A los datos no experimentales en ocasiones también
se les llama datos retrospectivos o datos observacionales, para subrayar el hecho de que el investigador
es recolector pasivo de los datos. La econometría permite el estudio de relaciones economicas-financieras,
contrastar teorías económicas, pronóstico de variables económico-finacieras, evaluación e implementación
de políticas públicas usando métodos estadísticos (Wooldridge 2010). Pero en la actualidad se está dando
enfasis a los datos experimentales a travez de experimentos aleatorizados controlados.

Estructura de los datos económicos:

Existen cuatro tipos de datos económicos:

1
Datos de sección cruzada o corte trasversal

Son datos sobre individuoas, familias, empresas, países en umento determinado del tiempo. Datos usados,
por ejemplo, en microeconomía aplicada (economía laboral, organización industrial, finanzas corporativas,
demografía, economía de la salud, etc.)
Normalmente son datos que proceden de un muestreo aleatorio simple, lo que simplifica sustancialmente el
análisis. Pero a veces no es así:

• Muestreo sobre la riqueza, lo más ricos menos dispuesto a revelar su riqueza → Problema de selección
de la muestra

• Población pequeña: puede existir la dependencia entre países cercanos

library(wooldridge)

## Warning: package ’wooldridge’ was built under R version 4.1.2

data("wage1")
# Explorar la base de datos
head(wage1)

## wage educ exper tenure nonwhite female married numdep smsa northcen south
## 1 3.10 11 2 0 0 1 0 2 1 0 0
## 2 3.24 12 22 2 0 1 1 3 1 0 0
## 3 3.00 11 2 0 0 0 0 2 0 0 0
## 4 6.00 8 44 28 0 0 1 0 1 0 0
## 5 5.30 12 7 2 0 0 1 1 0 0 0
## 6 8.75 16 9 8 0 0 1 0 1 0 0
## west construc ndurman trcommpu trade services profserv profocc clerocc
## 1 1 0 0 0 0 0 0 0 0
## 2 1 0 0 0 0 1 0 0 0
## 3 1 0 0 0 1 0 0 0 0
## 4 1 0 0 0 0 0 0 0 1
## 5 1 0 0 0 0 0 0 0 0
## 6 1 0 0 0 0 0 1 1 0
## servocc lwage expersq tenursq
## 1 0 1.131402 4 0
## 2 1 1.175573 484 4
## 3 0 1.098612 4 0
## 4 0 1.791759 1936 784
## 5 0 1.667707 49 4
## 6 0 2.169054 81 64

tail(wage1)

## wage educ exper tenure nonwhite female married numdep smsa northcen south
## 521 5.65 12 2 0 0 0 0 0 0 0 0
## 522 15.00 16 14 2 0 1 1 2 0 0 0
## 523 2.27 10 2 0 0 1 0 3 0 0 0
## 524 4.67 15 13 18 0 0 1 3 0 0 0
## 525 11.56 16 5 1 0 0 1 0 0 0 0

2
## 526 3.50 14 5 4 1 1 0 2 0 0 0
## west construc ndurman trcommpu trade services profserv profocc clerocc
## 521 1 1 0 0 0 0 0 0 0
## 522 1 0 0 0 0 0 1 1 0
## 523 1 0 0 0 1 0 0 1 0
## 524 1 1 0 0 0 0 0 1 0
## 525 1 0 1 0 0 0 0 0 0
## 526 1 0 0 0 0 0 1 0 1
## servocc lwage expersq tenursq
## 521 0 1.7316556 4 0
## 522 0 2.7080503 196 4
## 523 0 0.8197798 4 0
## 524 0 1.5411590 169 324
## 525 0 2.4475510 25 1
## 526 0 1.2527629 25 16

Series temporales

Son observaciones a lo largo del tiempo. Por ejemplo, datos de cotizaciones, oferta monetaria, ventas de
vehículos, precios, PIB, tipos de interés, commodities

• Es un tipo de datos más difíciles de analizar, y no se puede asumir que las obseraciones son indepen-
dientes
• Lo más relevante: modelización de la dependencia

• Hay que tener en cuenta el efecto de los retardos y efectos estacionales.


• Una característica importante es la cronología, periodicidad, la tendencia y la estacionalidad

data("AirPassengers")
AP <-AirPassengers
AP

## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1949 112 118 132 129 121 135 148 148 136 119 104 118
## 1950 115 126 141 135 125 149 170 170 158 133 114 140
## 1951 145 150 178 163 172 178 199 199 184 162 146 166
## 1952 171 180 193 181 183 218 230 242 209 191 172 194
## 1953 196 196 236 235 229 243 264 272 237 211 180 201
## 1954 204 188 235 227 234 264 302 293 259 229 203 229
## 1955 242 233 267 269 270 315 364 347 312 274 237 278
## 1956 284 277 317 313 318 374 413 405 355 306 271 306
## 1957 315 301 356 348 355 422 465 467 404 347 305 336
## 1958 340 318 362 348 363 435 491 505 404 359 310 337
## 1959 360 342 406 396 420 472 548 559 463 407 362 405
## 1960 417 391 419 461 472 535 622 606 508 461 390 432

# Graficar

plot(AP)

3
600
500
400
AP

300
200
100

1950 1952 1954 1956 1958 1960

Time

# ciclo
boxplot(AP~cycle(AP))

4
600
500
400
AP

300
200
100

1 2 3 4 5 6 7 8 9 10 11 12

cycle(AP)

Combinación de cortes trasversales

Para tener un tamaño mayor de la muestra se pueden combinar los cortes trasversales, juntado la
encuesta de dos años distintos
Combinar (o juntar) los cortes transversales de años distintos suele ser una buena manera de analizar los
efectos de las nuevas políticas públicas. La idea es recolectar datos de años anteriores y posteriores al cambio
de la política.

Datos de panel

Son series temporales para cada individuo de una sección cruzada, es decir, es una combianción entre la serie
de tiempo y el corte trasversal

data("wagepan")
head(wagepan)

## nr year agric black bus construc ent exper fin hisp poorhlth hours manuf
## 1 13 1980 0 0 1 0 0 1 0 0 0 2672 0
## 2 13 1981 0 0 0 0 0 2 0 0 0 2320 0
## 3 13 1982 0 0 1 0 0 3 0 0 0 2940 0
## 4 13 1983 0 0 1 0 0 4 0 0 0 2960 0
## 5 13 1984 0 0 0 0 0 5 0 0 0 3071 0
## 6 13 1985 0 0 1 0 0 6 0 0 0 2864 0

5
## married min nrthcen nrtheast occ1 occ2 occ3 occ4 occ5 occ6 occ7 occ8 occ9 per
## 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0
## 2 0 0 0 1 0 0 0 0 0 0 0 0 1 1
## 3 0 0 0 1 0 0 0 0 0 0 0 0 1 0
## 4 0 0 0 1 0 0 0 0 0 0 0 0 1 0
## 5 0 0 0 1 0 0 0 0 1 0 0 0 0 1
## 6 0 0 0 1 0 1 0 0 0 0 0 0 0 0
## pro pub rur south educ tra trad union lwage d81 d82 d83 d84 d85 d86 d87
## 1 0 0 0 0 14 0 0 0 1.197540 0 0 0 0 0 0 0
## 2 0 0 0 0 14 0 0 1 1.853060 1 0 0 0 0 0 0
## 3 0 0 0 0 14 0 0 0 1.344462 0 1 0 0 0 0 0
## 4 0 0 0 0 14 0 0 0 1.433213 0 0 1 0 0 0 0
## 5 0 0 0 0 14 0 0 0 1.568125 0 0 0 1 0 0 0
## 6 0 0 0 0 14 0 0 0 1.699891 0 0 0 0 1 0 0
## expersq
## 1 1
## 2 4
## 3 9
## 4 16
## 5 25
## 6 36

2. Repaso de probabilidad
• La mayoría de los aspectos en el mundo real presenta algún tipo de aleatoriedad
• La teoría de probabulidad nos ofrece herremientas matemáticas para cuantificar y describir esa aleato-
riead

Variables aleatorias y distribuciones de probabilidad

Espacio muestral (Ω): conjunto de todos los posibles resultados de un experimento (tirar una moneda dos
veces, nro. de veces que se estropea un computador mientras se redacta un trabajo, lazamiento de un dado)
Suceso: subcojunto del espacio muestral
Variable aleatorio (X): es una función X : Ω → R que representa un resumen numérico de un resultado
aleatorio

• Discreta: toma valores sobre un conjunto discreto. Ejemplo: {1,2,3,. . . }


• Continua: toma valores sobre un contínuo de valores. Ejemplo: [0,1]

Distribución de probabilidad de una variable aleatoria discreta:

relación de todos los valores posibles de la variable junto con la probabilidad de que ocurra cada valor

Distribución de probabilidad acumulada:

probabilidad de que la variable aleatoria sea menor o igual a un valor concreto

6
Distribución de probabilidad de una variablea aleatoria contínua

Distribución de probabilidad acumulada: Probabilidad de que la variable aleatoria se menor o igual a


un valor concreto
Función de densidad Función de densidad que determina la probabilidad de que la variable aleatoria se
encuentr entre dos valores (área bajo la función de densidad)

Momentos

Esperanza (o media) de variable aleatoria X

E(x), µx valor medio de la variable aleatoria

• Variable aleatoria discreta: media ponderada de los valores de la variable aleatoria, donde las
ponderaciones son las probabilidades de cada valor

– M : número de veces que la computadora se estropea


E(M ) = 0 × 0.8 + 1 × 0.1 + 2 × 0.06 + 3 × 0.03 + 4 × 0.01 = 0.35

• Variable aleatoria contínua (x con función de densidad de fx (x))


Z ∞
E(X) = xfx (x)dx
−∞

#### Propiedades de la esperanza

– E(cX) = cE(X) donde c es un constante


– E(c) = c
– E(X + Y ) = E(X) + E(Y )

Varianza de una variable aleatoria X

var(x), σx2 mide la dispersión de la variable aleatoria

var(X) = E[(X − µx )2 ]
* Variable aleatoria discreta

• M : número de veces que el pc se daña

var(M ) = (0−0.35)2 ×0.80+(1−0.35)2 ×0.10+(2−0.35)2 ×0.06+(3−0.35)2 ×0.03+(4−0.35)2 ×0.01 = 0.6475

Ecuación general

E(Y ) = y1 p1 + y2 p2 + ... + yk pk = Σki=1 yi pi

# cálculo de la media de los números naturales del 1 al 6

mean(1:6)

7
## [1] 3.5

• variable aleatoria continua (X con función de densidad fx (x))

Z ∞
var(X) = (x − E(x))2 fx (x)dx
−∞

var(1:6)

## [1] 3.5

Desviación estábdar o típica raíz cuadrada de la varianza

p
σX = var(x)
### Otras medidas de forma de la distribución
La media y la desviación típica miden dos características importantes de la distribución de una variable
aleatoria: su centro y su dispersión. Hay otras medidas que recogen información sobre otras características
de la distribución:

• Asimetría mide la falta de simetría de una distribución

E[(X − µx )3 ]
Asimetria : 3
σX
* Curtosis: mide cuanta masa probabilística se encuentra en las colas de la distribución. A mayor curtosis,
más probables son los datos atípicos

E[(X − µx )4 ]
Curtosis 4
σX
* Curtosis mayor 3: distribución leptocúrtica

Dos variables aleatorias

• Muchas cuestiones económicas implican dos o más variables, educación y estatus laboral, renta y
género,. . .
• El análisis de un marco multivariante requiere de la comprensión de los conceptos de distribución
conjunta, marginal y condicional

Distribución conjunta de dos v.a. discretas: probabilidad de que las dos variables tomen valores
concretos simultáneamente. Ejemplo: lluvia(X), tiempo de desplazamiento (Y): P r(X = x, Y = y)
Distribución de probabilidad marginal: distribución de probabilidad de cada una de las variables
aleatorias. Se puede calcular a partir de la función de distribución conjunta

P r(Y = y) = Σli=1 P r(X = xi , Y = y)


Distribución condicional: es la distribución de una variable aleatoria condicionada a que otra variable
aleatoria tome un valor específico

8
P r(Y = y, X = x)
P r(Y = y|X = x) =
P r(X = x)
Esperanza condicional de Y dado X: es la media de la distribución condicional de Y dado X

E(Y |X = x) = Σli=1 yi P r(Y = yi |X = x)


Ley de esperanzas iteradas: media de Y es la media ponderada de la esperanza de Y |X (suponemos que
X toma k valores)

E(Y ) = Σki=1 E(Y |X = xi )P r(X = xi )


Otras forma:

E(Y ) = E(E(Y |X))


Varianza condicional de Y dado X: es la varianza de la distribución condicional de Y dado X

var(Y |X = x) = Σli=1 (yi − E(Y |X = x))2 P r(Y = yi |X = x)


Independencia: dos variable aleatorioas son independientes si el conocimiento del valor de una de las
variables no proporciona información sobre esta.

• P (Y = y|X = x) = P r(Y = y)
• P r(Y = y, X = x) = P r(Y = y)P r(X = x)
• Estas definiciones pueden extnderse a más de dos variables

Covarianza; medida del grado al que dos variables evolucionan conjuntamente

cov(X, Y ) = σXY = E[(X − µX )(Y − µY )]


Correlación es la covarianza estandarizada (desaparece el problema de las unidades)

cov(X, Y ) σXY
corr(X, Y ) = p =
var(X)var(Y ) σX σY
* Si corr(X, Y ) = 0, X e Y están inconrrelacionales

• −1 ≤ corr(X, Y ) ≤ 1

• Si la media condicional de Y |X no depende de X, las variables X, Y están inconrrelacionadas.

E(Y |X) = µy → corr(X, Y ) = 0

Propiedades de la varianza y la covarianza

• var(X) = E(X 2 ) − [E(X)]2


• var(cX) = c2 var(X), donde c es una constante
• var(c + X) = var(X)

9
• var(c) = 0
• var(X + Y ) = var(X) + var(Y ) + 2cov(X, Y )
• var(cX + bY ) = c2 var(X) + b2 var(Y ) + 2cbcov(X, Y )
• Si X e Y son independientes, cov(X, Y ) = 0

• cov(X, X) = var(X)
• cov(c, X) = 0

¡¡Importante:!! la correlación mide la dependencia lineal

Distribución normal, chi-cuadrado, t de Student, F

La distribución normal

Corresponde a una variable aleatoria continua y tiene media µ y varianza σ 2 ⇒ N (µ, σ 2 )


Distribución normal estándar
N (0, 1)
La distribución normal multivariante: generalización de la distribución normal para varias variables
aleatorias. Propiedades:

• Cualquier combinación lineal de esas variables se distribuye como una normal


• La distribución marginal de cualquiera de las variables es normal
• Si dos variables tienen covarianza cero, son independientes

• La esperanza condicional es lineal, es decir E(Y |X = x) = a + bx para las dos constantes a y b

Distribuciones muy usadas en contrastes de hipótesis

2
• La distribución chi-cuadrado con m grados de libertad (Xm ): es la distribución de la suma de
m variables aleatorias normales estándar independientes al cuadrado
• La distribución t de Student con m grados de libertad (tm ): es la distribución del cociente
entre una variable aleatoria normal estándar y la raíz cuadrada de una variable aleatoria chi-cuadrado
independientemente distribuida con m grados de libertad dividida por m. Presenta forma de campana
similar a la normal, con más probabilidad en las colas. Conforme m aumenta se va aproximando a la
normal estándar (para m > 30 buena aproximación)
• La distribución F con m y n grados de libertad* (Fm,n ):es la distribución del cociente entre
una variable aleatoria chi-cuadrado con m grados de libertad dividida por m, y una variable aleatoria
chi-cuadrado independientemente distribuida con n grados de libertad dividida por n

Muchos procedimientos estadísticos y econométricos se basan en medias (ponderadas) de una muestra de


datos

10
Muestreo aletorio y distribución de la media muestral
Muestreo aleatorio simple:

Se seleccionan aleatoriamente n objetos a partir de una población

• El valor de la variable aleatoria Y (tiempo de desplazamiento) para el objeto i-ésimo selecionado


aleatorimanete se expresa mediante Yi (tiempo de desplazamietno en el día i-ésimo)
• Las n observaciones de la muestra se denominan Y1 , Y2 , ..., Yn
• Los miembros de la población incluidos en la muestra fueron seleccionados aleatoriamente. Por lo
tanto, los valores de las observaciones Y1 , Y2 , ..., Yn son asimismo aleatorios (pueden ser tratados como
variables aleatorias).
• Antes del muestreo Y1 , Y2 , ..., Yn , pueden tomar valores diferentes, luego de haber sido elegidos, se
registra un valor específico para cada observación.
• Las variables aleatorias son independientes: dado que la selección es aleatoria, el conocimiento
del valor del tiempo de desplazamiento de un día no proporciona información sobre el tiempo de
desplazamiento en otro día.
• Las variables aleatorias son idénticamente distribuidas: Y1 , Y2 , ..., Yn son extracciones aleatorias
de una misma población

¡¡Importante!!: Bajo el muestreo aleatorio simple, la colección de variables aleatorias Y1 , Y2 , ..., Yn son
independientes e idénticamente distribuidas (i.i.d.)

La distribución de la media muestral

La media muestral de las n observaciones Y1 , Y2 , ..., Yn es:

1 1
(Y1 + Y2 + ... + Yn ) = Σni=1 Yi
Ȳ =
n n
Importante: la media muestral es una variable aleatoria (el valor de Ȳ es distinto para distintas muestras
extraídas aleatoriamente)
Como Ȳ es una variable aleatoria tiene una distribución de probabilidad, se le conoce como La distrbución
muestral de Ȳ
La media de Ȳ
Supongamos que Y1 , Y2 , ..., Yn son i.i.d., tal que E(Yi ) = µY , entonces:

1 n
E(Ȳ ) = Σ E(Yi ) = µY
n i=1
La varianza de Ȳ
Supongamos que var(Yi ) = σY2 , tenmos:

1 n σY2
var(Ȳ ) = Σ i=1 var(Yi ) =
n2 n
La distribución muestral de Ȳ
Supongamos que Y1 , Y2 , ..., Yn son i.i.d. extraidas de una distribución N (µY , σY2 )

Ȳ ∼ N (µY , σY2 /n)

11
Aproximación asintótica

Las distribuciones muestrales tienn un papel fundamental en el desarrollo de métodos estadísticos y


econométricos.
Dos métodos para la caracterización de las distribuciones muestrales

• Método exacto:obtención de la distribución muestral exacta para cualquier valor de n

– Distribución exacto o distribución en muestras finitas


– Problema: en general, su cálculo es muy complicado (exepto la normal)

• Método aproximado: obtención de una aproximación de la distribución muestral

– Distribución asintótica: la aproximación se hace exacta en el límite, cuando n → ∞


– La aproximación puede ser precisa incluso para tamaños muestrales pequeños como n = 30
– Dos herramientas clave para aproximar distribuciones muestrales cuando n es grande. La ley de
los grandes números y Teorema del límite central

La ley de los grandes números y la consistencia

• La ley establece que Ȳ estará cerca de µY con muy alta probabilidad cuando n → ∞
• Cuando n aumenta la distribución muestral de Ȳ va estando cada vez más y más centrada en µY
• Esta propiedad se denominda covergencia en probabilidad lo que implica consistencia
• La ley de los grandes números establece que: bajo condiciones generales, la media muestral
converge a la media poblacional
• De esta forma, diremos que:

– Ȳ converge en probabilidad a µY
– Ȳ es un estimador consistente de µY

• Condiciones generales

– Las variables son i.i.d.


– La varianza de Yi es finita

• Condiciones razonables en el contexto de este curso

El teorema del límite central

• Establece que, bajo ciertas condiciones, la distribución de Ȳ se aproxima a un distribución normal,


cuando n es grande.
• Recordemos que la distribución de Ȳ es exactamente normal cuando la muestra se obtiene a partir
de una población con distribución normal.
• El teorema central del límite dice que esto es aproximadamente cierto cuando n es grande en el caso
en el que Y1 , Y2 , ..., Yn no esten distribuidas normalmente.
• Problema: la varianza tiende a cero, difícil percibir esto para Ȳ
• Solución: estandarizar Ȳ , es decirm restarle la media y dividir para la desviación típica.

12

n(Ȳ −µY )
• Media estandarizada σY

• La distribución de la meida estandarizada se aproxima a una N (1, 0) cuando n → ∞


• ¿Cuánto es suficientemente grande? Depende, pero para n > 100 en general es una buena aproximación
• Ȳ tiene una distribución aproximadamente normal

13

También podría gustarte