Está en la página 1de 38

ESTADÍSTICA Y MICROECONOMETRÍA

CON STATA
SESIÓN 01:
ESTADÍSTICA
CONTENIDO

1.1. Acerca de Estadística


1.2. Distribución de Frecuencias
1.3. Distribución de Probabilidad
1.4. Gráficas
1.5. Pruebas de Hipótesis

© Dat Company
1.1. Acerca de estadística

Estadística es la ciencia que se encarga de planear estudios


y experimentos, obtener datos y luego organizar, resumir,
presentar, analizar e interpretar la información para extraer
conclusiones basadas en los datos. (Triola, 2013, p.4)

Estadística Estadística
Descriptiva Inferencial
Describe un conjunto Por medio de la
de datos mediante inducción determina
tablas, medidas propiedades de una
numéricas o gráficas. población estadística

© Dat Company
1.2. Distribución de Frecuencias

• Una distribución de frecuencias (o tabla de frecuencias)


indica cómo un conjunto de datos se divide en varias
categorías (o clases) al listar todas las categorías junto con
el número de valores de los datos que hay en cada una.
• Por lo que, una distribución de frecuencias nos ayuda a
entender la naturaleza de la distribución de un conjunto de
datos.

© Dat Company
1.2. Distribución de Frecuencias

• Ejemplo

Tabla 1.
Datos del ejercicio
Tamaño muestra N = 104
Valor máximo Xi = 5768
Valor mínimo Xi = 400
Rango o recorrido = 5368
Calculo del Numero de Clases:
Número de clase 1+3.322*LOG(N)= 8
Amplitud = (Rango / Nº Clases) = 671

© Dat Company
1.2. Distribución de Frecuencias
Tabla 2.
Desarrollo del ejercicio
INTERVALOS MARCA FRECUENCIA FRECUENCIA RELATIVA
DE ABSOLUTA
[ Li -----Ls ) CLASE SIMPLE ACUMULADA SIMPLE ACUMULADA
Xi fi Fi hi% Hi%
1 400 1071 735.5 17 17 16.35 16.35
2 1071 1742 1406.5 40 57 38.46 54.81
3 1742 2413 2077.5 17 74 16.35 71.15
4 2413 3084 2748.5 11 85 10.58 81.73
5 3084 3755 3419.5 9 94 8.65 90.38
6 3755 4426 4090.5 2 96 1.92 92.31
7 4426 5097 4761.5 3 99 2.88 95.19
8 5097 5768 5432.5 5 104 4.81 100.00
SUMA N= 104 100

© Dat Company
1.3. Distribución de Probabilidad

1.3.1. Variable Aleatoria


• Dado un experimento aleatorio 𝜀 y 𝛺 el espacio muestral
asociado a 𝜀. Una función 𝑋 que asigna a cada elemento
𝜔 en 𝛺 uno y solamente un número real 𝑥 = 𝑋(𝜔), se
llama variable aleatoria. Es decir, 𝑋 es una función real,
𝑋 : 𝛺 → 𝐼𝑅
• El rango 𝑅𝑋 de la variable aleatoria 𝑋 está dado por el
siguiente conjunto de números reales.

𝑅𝑋 = 𝑥 ∈ 𝐼𝑅 = 𝑋 𝜔 = x, 𝜔 ∈ 𝛺 = 𝑋(𝛺)

© Dat Company
1.3. Distribución de Probabilidad

• Sea 𝛺 un espacio muestral asociado a un experimento


aleatorio 𝜀 , y 𝑋 una variable aleatoria con rango 𝑅𝑋
definida sobre 𝛺 . Un evento 𝐴 en 𝛺 y un evento 𝐸𝑥 en 𝑅𝑋
se dice que son eventos equivalentes, Si,
𝐴 = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥

• Si 𝐴 es un evento en el espacio muestral 𝛺 y 𝐸𝑥 A un


evento en el rango Rx de la variable aleatoria X, entonces
definimos la probabilidad como
𝑃 𝐸𝑥 = 𝑃 𝐴 , donde A = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥

© Dat Company
1.3. Distribución de Probabilidad

1.3.2. Variables Aleatorias Discretas


• Si el rango de la variable aleatoria 𝑋, es un conjunto finito
o infinito numerable de posibles valores, se llama variable
aleatoria discreta. En este caso
𝑅𝑥 = 𝑥1 , 𝑥2 , 𝑥3 , … .
• Sea 𝑋 una variable aleatoria discreta con rango 𝑅𝑥 . Una
función definida por

𝑝 𝑥 =𝑃 𝑋=𝑥 = 𝑃[ 𝜔 ]
𝜔 ∈ 𝛺 / 𝑋 𝜔 =𝑥

© Dat Company
1.3. Distribución de Probabilidad

• Donde la suma es sobre los sucesos 𝜔 𝜖 𝛺 tal que 𝑋 𝜔 =


𝑥 y satisface las siguientes condiciones

𝑝 𝑥 > 0 , ∀ 𝑥 ∈ 𝑅𝑥 ; 𝑝 𝑥 = 𝑃 𝑋=𝑥 =1
𝑥 ∈ 𝑅𝑥 𝑥 ∈ 𝑅𝑥

se llama función de probabilidad o ley de probabilidad de la


variable aleatoria 𝑋
• La función de probabilidad 𝑝 𝑥 debe estar está bien
definida para 𝑥 ∈ 𝑅𝑥 y se asume para los eventos
imposibles 𝑝 𝑥 = 0

© Dat Company
1.3. Distribución de Probabilidad
• El dominio de la función 𝑝 puede considerarse como el
conjunto de los números, reales y su rango el conjunto
< 0,1] ∪ 0 . Es decir, 𝑝: 𝐼𝑅 → 0,1
• La distribución de probabilidad se representa usualmente
en una tabla
Tabla 3. Representación tabular de la distribución de probabilidad

x 𝑥1 𝑥2 𝑥3
𝑝 𝑥 = P[X = x] 𝑝(𝑥1 ) 𝑝(𝑥2 ) 𝑝(𝑥3 ) . . .

© Dat Company
1.3. Distribución de Probabilidad

• Función de distribución de variable aleatoria discreta


Sea X una variable aleatoria discreta con rango
𝑅𝑥 = 𝑥1 , 𝑥2 , 𝑥3 , … . y función de probabilidad,
𝑝 𝑥𝑖 = 𝑃[𝑋 = 𝑥𝑖 ] , sea 𝑥 un número real cualquiera, la
función de distribución de 𝑋 se denota por "𝐹(𝑥)“ y se
define como

𝐹 𝑥 =𝑃 𝑋≤𝑥 = 𝑝( 𝑥𝑖 ) = 𝑃[𝑋 = 𝑥𝑖 ]
𝑥𝑖 ≤𝑥 𝑥𝑖 ≤𝑥

© Dat Company
1.3. Distribución de Probabilidad

• Propiedades de la función de distribución


Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ, pues 𝐹 𝑥 es una
probabilidad para cualquier 𝑥 real y las probabilidades
están limitadas por 0 y 1.
Propiedad 2: 𝐹 𝑥 es una función no creciente.
Sean 𝑥1 , 𝑥2 ∈ 𝐼𝑅 tales que 𝑥1 ≤ 𝑥2 , entonces se tiene
𝑥 𝑋 ≤ 𝑥1 ⊂ 𝑥 𝑋 ≤ 𝑥2
Aplicando probabilidades a ambos eventos,
𝐹 𝑥1 = 𝑃 𝑋 ≤ 𝑥1 ≤ 𝑃[𝑋 ≤ 𝑥2 ]
Obtenemos 𝐹 𝑥1 = 𝐹 𝑥2
© Dat Company
1.3. Distribución de Probabilidad

Propiedad 3:
(a) lim 𝐹(𝑥) = P x / X < ∞ = P X < ∞ = 1, pues el
𝑥→∞
evento x / X < ∞ , es el conjunto de todos los
números reales.
(b) lim 𝐹(𝑥) = P x / X < −∞ = P X < −∞ = 0, pues el
𝑥→−∞
evento x / X < −∞ , es el conjunto nulo.
Propiedad 4:
Sea 𝑥𝑘 , 𝑥𝑘+1 ∈ 𝑅𝑥 , si x es tal que 𝑥𝑘 ≤ 𝑥 < 𝑥𝑘+1 , entonces
𝐹 𝑥 = 𝐹 𝑥𝑘
Es decir, la función 𝐹 𝑥 es constante e igual a 𝐹 𝑥𝑘 para
Company x
todo
© Dat ∈ [𝑥𝑘 , 𝑥𝑘+1 > Esto implica que si 𝑋 es una variable
discreta, F(𝑥) es una función “escalonada"
1.3. Distribución de Probabilidad

1.3.3. Variables Aleatorias Continuas


• Si el rango 𝑅𝑥 , de una variable aleatoria 𝑋 es un intervalo
sobre la recta de los números reales, se llama Variable
Aleatoria Continua.
• Sea 𝑋 una variable aleatoria continua con rango 𝑅𝑥 . La
función de densidad de probabilidad asociado a la
variable aleatoria, es una función 𝑓 𝑥 integrable que
satisface las siguientes condiciones
1. 𝑓 𝑥 ≥ 0, para todo 𝑥 ∈ ℝ (𝑜 𝑓 𝑋 > 0 , 𝑥 ∈ 𝑅𝑥 )
+∞
2. 𝑅𝑥 𝑓 𝑥 𝑑𝑥 = 1 (𝑜 −∞
𝑓 𝑥 𝑑𝑥 = 1 )

© Dat Company
1.3. Distribución de Probabilidad

• La probabilidad de que la variable aleatoria tome los


valores entre a y b, donde el intervalo 𝑎, 𝑏 ⊂ 𝑅𝑥 . Es
decir, queremos calcular la P 𝑎 ≤ 𝑋 ≤ 𝑏
• Por tanto, la probabilidad del evento 𝐴 = {𝑋 / 𝑎 ≤ 𝑋 ≤ 𝑏}
𝑏
se define P A = 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = 𝑎
𝑓 𝑥 𝑑𝑥
• Sea 𝑋 una variable aleatoria continua con función de
densidad 𝑓 𝑥 . La función de distribución acumulada de
la variable aleatoria 𝑋 , denotado por se define por “𝐹 𝑥 ”,
se define por
𝑥
𝐹 𝑥 =𝑃 𝑋≤𝑥 = −∞
𝑓 𝑥 𝑑𝑥 , ∀ 𝑥 ∈ ℝ

© Dat Company
1.3. Distribución de Probabilidad

• Propiedades de la función de distribución


Las tres primeras propiedades son los mismos que el caso
discreto.
Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ
𝑥
Propiedad 2: lim 𝐹(𝑥) = lim ∞
𝑓 𝑡 𝑑𝑡 = 1;
𝑥→∞ 𝑥→∞
𝑥
lim 𝐹(𝑥) = lim 𝑓 𝑡 𝑑𝑡 = 0
𝑥→−∞ 𝑥→−∞ ∞

• Propiedad 3: La función de distribución es no decreciente,


esto es si 𝑎 ≤ 𝑏, entonces 𝐹(𝑎) ≤ 𝐹(𝑏)

© Dat Company
1.3. Distribución de Probabilidad

• Propiedad 4: lim 𝐹(𝑥 + ℎ) = 𝐹 𝑥 , ∀ 𝑥 ∈ ℝ, con h > 0; o


ℎ→0
sea 𝐹 es continua por la derecha, en todos los puntos.
• Propiedad 5: Del segundo teorema fundamental del cálculo
se tiene que si 𝐹(𝑥) es una función derivable, entonces
𝑑
𝑓 𝑥 = 𝐹(𝑥)
𝑑𝑥

© Dat Company
1.3. Distribución de Probabilidad

1.3.4. Características de una variable aleatoria


• La variable aleatoria está completamente determinado por
la distribución de probabilidad [𝑥𝑖 , 𝑝 𝑥𝑖 ; i = 1,2,3, … ] si es
discreta, y por la función de densidad 𝑓 𝑥 si es continua
• Medidas descriptivas de una variable aleatoria
El primer momento alrededor del origen es el valor
esperado a la media de la variable aleatoria
(esperanza matemática); el segundo momento
alrededor de la media es la varianza de la variable
aleatoria; finalmente la moda y la mediana.

© Dat Company
1.3. Distribución de Probabilidad

• El valor esperado o esperanza matemática de 𝑋, se


denota por E(x) y se define
E(x)= x ∈ 𝑅𝑥 𝑥 𝑝 𝑥 , 𝑆𝑖 𝑋 es una variable aleatoria
discreta

E(x)= 𝑅𝑥
𝑥 𝑓 𝑥 𝑑𝑥 = −∞
𝑥 𝑓 𝑥 𝑑 𝑥 , 𝑆𝑖 𝑋 es una
variable aleatoria continua.
• Siempre que x ∈ 𝑅𝑥 𝑥 𝑝 𝑥 sea absolutamente
convergente, es decir x ∈ 𝑅𝑥 |𝑥| 𝑝 𝑥 finita y

−∞
|𝑥| 𝑓 𝑥 𝑑 𝑥 finita respectivamente.

© Dat Company
1.3. Distribución de Probabilidad

• La esperanza matemática de 𝑋 , se llama también, media


de la variable aleatoria, y se denota por 𝜇, o sea 𝜇 = E(X)
Propiedades de la esperanza matemática
• Teorema 1.3.4.1: Si 𝑋 es una variable aleatoria, 𝑎 𝑦 𝑏
constantes. Entonces
(i) 𝐸 𝑎 = 𝑎,
(ii) 𝐸 𝑎 𝐻 𝑋 =𝑎𝐸 𝑎𝐻 𝑋
(iii) 𝐸 𝑎 𝐻 𝑋 + 𝑏 𝐺(𝑋) = 𝑎 𝐸 𝑎 𝐻 𝑥 + 𝑏 𝐸[𝐺(𝑋)]

© Dat Company
1.3. Distribución de Probabilida

• Teorema 1.3.4.2: Caso especial del (iii)


𝐸 𝑎𝑋±𝑏 =𝑎𝐸 𝑋 ±𝑏
Si 𝑏=0, entonces 𝐸 𝑎𝑋 = 𝑎 𝐸 𝑥
•Teorema 1.3.4.3: Sean 𝑋1 , 𝑋2 , … , 𝑋𝑛 , n variables aleatorias
y 𝑎1 𝑖 = 0,1, … , 𝑛 constantes, entonces
𝑛 𝑛

𝐸 𝑎0 + 𝑎𝑖 𝑋𝑖 = 𝑎0 + 𝑎𝑖 𝐸(𝑋𝑖 )
𝑖=1 𝑖=1

• Consecuencia del Teorema 1.3.4.3: Si 𝑋 e 𝑌 son variables


aleatorias y 𝑎, 𝑏 constantes, entonces
𝐸 𝑎 𝑋 + 𝑏𝑌 = 𝑎 𝐸 𝑋 + 𝑏 𝐸(𝑌)
© Dat Company
1.3. Distribución de Probabilida

• La varianza de una variable aleatoria X, se denota por


Var(𝑋) o por 𝜎𝑋2 (o simplemente 𝜎 2 ) y se define como
Var 𝑋 = 𝜎 2 = E X − 𝜇 2

Por lo tanto
𝜎2 = E X − 𝜇 2 = 𝑥 ∈ 𝑅𝑥 (𝑥 − 𝜇)2 𝑝 𝑥 , 𝑠𝑖 𝑋 es discreta


= −∞
(𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥, 𝑠𝑖 𝑋 es continua
• Otra media de dispersión llamada desviación típica de la
variable aleatoria, se define
𝝈 = + 𝜎2

© Dat Company
1.3. Distribución de Probabilida

Propiedades de la varianza y desviación típica


• Teorema 1.3.4.4: Si 𝑋 es una variable aleatoria con media
𝜇, la varianza de 𝑋 está dado por
𝑉𝑎𝑟 𝑋 = 𝜎 2 = 𝐸 𝑋 2 − 𝐸 𝑋 2 = 𝐸 𝑋 2 − 𝜇2
• Teorema 1.3.4.5: Si 𝑋 es una variable aleatoria, a y b
constantes, entonces
𝑉𝑎𝑟 𝑎𝑋 ± 𝑏 = 𝑎2 𝑉𝑎𝑟(𝑋)
• Consecuencia del Teorema 1.3.4.5
1. Si 𝑎=0 , 𝑉𝑎𝑟 𝑏 = 0
2. Si 𝑏=0 , 𝑉𝑎𝑟 𝑎𝑋 = 𝑎2 𝑉𝑎𝑟(𝑋)
© Dat Company
1.3. Distribución de Probabilida

• Teorema 1.3.4.6: Si 𝑋 es una variable aleatoria y 𝑐 una


constante, entonces
i) 𝜎𝑐𝑋 = |𝑐|𝜎𝑋
ii) 𝜎𝑋+𝑐 = 𝜎𝑋

© Dat Company
1.4. Gráficas

Hístograma
45
40
40
35
Frecuencia Absoluta

30
25
20 17 17
15 11
9
10
5
5 2 3
0
1071 1742 2413 3084 3755 4426 5097 5768
400 1071 1742 2413 3084 3755 4426 5097
Sueldo Mensual ($)

© Dat Company
1.4. Gráficas

Poligono de Frecuencias
45
40 40
Frecuencia Absoluta

35
30
25
20
17 17
15
10 11
9
5 5
2 3
0
735.5 1406.5 2077.5 2748.5 3419.5 4090.5 4761.5 5432.5
Marca de Clase (Xi)

© Dat Company
1.4. Gráficas

Gráfico de Caja y Bigotes

X min 400
Q1 1159
Q2 1351
Q3 2589 1
X max 5768

Rango 1430
Intercuartilico
(Q3-Q1) 0 1000 2000 3000 4000 5000 6000 7000

© Dat Company
1.5. Pruebas de Hipótesis

• Una hipótesis estadística es una aseveración que se


hace a cerca de la distribución de una o más variables
aleatorias (o poblaciones).
• Se puede especificar una hipótesis, dando el tipo de
distribución y el valor o valores del parámetro o los
parámetros que la definen. Por ejemplo:
1
(a) 𝑋, tiene una distribución binomial con 𝑝 =
3

(b) 𝑋, tiene una distribución normal con 𝜇 = 50, 𝜎 = 5

© Dat Company
1.5. Pruebas de Hipótesis

• La prueba estadística de una hipótesis, toma los valores


experimentales que son observados y conducen a una
decisión; no rechazar (aceptar) o rechazar la hipótesis bajo
consideración.
• La hipótesis estadisticas se pueden especificar en
hipótesis nula 𝐻0 (es la hipótesis que se quiere probar) y
hipótesis alternativa 𝐻1 (es una suposición contraria a la
que se quiere probar), que se acepta en caso de que la
primera sea rechazada.

© Dat Company
1.5. Pruebas de Hipótesis

• En una terminología de prueba, hablamos de probar la


hipótesis nula contra una alternativa en el supuesto
tentativo que la hipótesis nula es cierta.
• Hay tres tipos principales de pruebas, cada uno de los
cuales es identificado por la forma en que se formulan 𝐻0 y
𝐻1 .
1. Prueba de una cola o unilateral, estas pueden ser:
(a) Prueba de cola inferior o prueba del lado izquierdo:
𝐻0 : 𝜃 = 𝜃0 ; 𝐻1 : 𝜃 < 𝜃0

© Dat Company
1.5. Pruebas de Hipótesis

Este tipo de prueba se emplea cuando se tiene alguna


evidencia que el parámetro no es igual a 𝜃0 ,si no que
debe ser menor.

(b) Prueba de la cola superior o prueba de la cola derecha:


𝐻0 : 𝜃 = 𝜃0 ; 𝐻1 : 𝜃 > 𝜃0
Este tipo de prueba se emplea, en problemas, en que se
tiene algún indicio que el parámetro no es igual al valor
postulado, debe ser mayor que el postulado.

© Dat Company
1.5. Pruebas de Hipótesis

2. Pruebas de dos colas o bilaterales


𝐻0 : 𝜃 = 𝜃0 ; 𝐻1 : 𝜃 ≠ 𝜃0
Este tipo de prueba se emplea, en el caso que el valor
que se prueba no sea verdadera; entonces, todos los
demás valores son posibles.
• Teorema del Limite Central
Una estadística para la media de la población, es la media
muestral 𝑋 Si la población es normal (o si la muestra es
grande 𝑛 ≥ 30, aún cuando la población no es normal),

© Dat Company
1.5. Pruebas de Hipótesis
𝜎2
La distribución de 𝑋 es 𝑁 𝜇, y variable aleatoria
𝑛
𝑋−𝜇0
𝑍= , tiene una distribución 𝑁(0,1).
𝜎/ 𝑛

Entonces, dada una muestra suficientemente grande de la


población, la distribución de las medias muestrales
seguirán una distribución normal.
𝑥
𝑋 − 𝜇0 1 1
−2𝑡 2
lim Pr( ≤ 𝑧) = 𝑒 𝑑𝑡
𝑛→∞ 𝜎/ 𝑛 2𝜋 −∞

© Dat Company
1.5. Pruebas de Hipótesis

• A continuación se muestran algunas distribuciones para


probar hipótesis, suponiendo la normalidad de los errores
del MRSL. Como 𝜎 2 no suele conocerse en los estudios
empíricos, casi siempre se usan las distribuciones 𝑡 y 𝐹.

1 restricción 1 o más restricciones


𝜎 2 conocida 𝑁 𝜒2
𝜎 2 desconocida 𝑡 de Student 𝐹 de Snedecor

© Dat Company
1.5. Pruebas de Hipótesis

• Según el supuesto de normalidad, la variable que se


distribuye como una 𝑡 de Student con 𝑛 − 2 gl, se le
considera como estadístico de prueba 𝒕 (o 𝑡 calculado)
𝛽2 − 𝛽2
𝑡=
𝑒𝑒 𝛽2
• Prueba de hipótesis de 2: prueba 𝜒2
Las conjeturas para una prueba bilateral son:
𝐻0 : 𝜎 2 = 𝜎02
𝐻1 : 𝜎 2 ≠ 𝜎02

© Dat Company
1.5. Pruebas de Hipótesis

• El estadístico de prueba es:


𝜎 2
𝜒2 = 𝑛 − 2 2
𝜎
se distribuye con 𝑛 − 2 gl. Con un nivel de significancia
dado, 𝛼, se obtendrá el 𝜒 2 de tabla.

© Dat Company
1.5. Pruebas de Hipótesis

Método del valor p


• El valor 𝑝 es el nivel de significancia más bajo al cual
puede rechazarse una hipótesis nula.
• Consiste en encontrar la “probabilidad real” (nivel exacto
de significancia) en la tabla de valores pertinente,
utilizando el estadístico de prueba, 𝑡 𝑜 𝜒 𝟐
• Si el valor 𝑝 es menor al nivel de significancia supuesto, 𝛼,
se puede rechazar la hipótesis nula.

© Dat Company

También podría gustarte