Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones de frecuencias:
n1 n2 n3 nn -1 nn
Xn =
n
(X1 ) * (X2 ) * (X3 ) * ... * (Xn -1 ) * (Xn )
Medidas de dispersión
n −1
La varianza siempre será mayor que cero. Mientras más se
aproxima a cero, más concentrados están los valores de la
Probabilidades
Medición de la probabilidad
ESTADÍSTICA INFERENCIAL
Distribuciones de muestreo
Intervalos de confianza
ECM(T) = E(T- )2
O lo que es igual:
ECM(T) = V(T) + (E(T- ))2
= V(T) + sesgo(T)2
Limn--inf P(T- )‹ )
Prueba de Hipótesis.
H0: =
H1: <
>
H0: =
Hay que tener en cuenta que de esta manera se está más seguro
cuando se rechaza una hipótesis que cuando no. Por eso se
fija como H0 lo que se quiere rechazar. Cuando no se rechaza,
no se ha demostrado nada, simplemente no se ha podido
rechazar. Por otro lado, la decisión se toma en base a la
distribución muestral en H0, por eso es necesario que tenga
la igualdad.
Tomado de:
Medina, Eva: “Modelos Econométrico E Información
Estadística”, Febrero 2002
Nivel macro
La función de consumo de un país se especificó en
función de la renta disponible y el número de ocupados.
Se quieren analizar las exportaciones de un país en
función de la producción de bienes, del nivel de renta
de los exportadores y del tipo de cambio real.
En función de la aleatoriedad
En primer lugar debemos tener claro lo que entendemos por
variable aleatoria: aquella debida al azar (por ejemplo, una
variable que mida los resultados obtenidos de lanzar una
moneda al aire) frente a una variable no aleatoria que es
aquella variable conocida que no se debe al azar (por
ejemplo, la medición de la edad entre un grupo de
individuos).
Todo modelo econométrico se caracteriza por la aleatoriedad
frente a los modelos deterministas.
Mientras que un modelo determinista existen relaciones
exactas entre las variables del modelo, y es por ello que
tienen como principal carencia la de no analizar relaciones
de causalidad. Son modelos de “caja negra”, en los que se
parte de uno o varios inputs y a través de ciertas
transformaciones (que no se explicitan en el modelo) se
conoce el comportamiento del output. Sin embargo, los modelos
econométricos son modelos aleatorios o estocásticos, en los
cuales las relaciones no son exactas, ya que siempre existe
UNIVERSIDAD NACIONAL COLOMBIA
27
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA
un componente aleatoria que dejo fuera de la explicación de
la variable endógena, que es lo que se conoce como
perturbación aleatoria. Ese componente aleatorio se debe a la
propia especificación del modelo que me impide incluir todas
las variables que afectan a la endógena, errores en la
medición de las variables, etc.
Así, cuando veíamos como pasar de un modelo económico a un
modelo econométrico partíamos de:
PIB = CP + GP + I + X – M
Y llegábamos a:
PIB = a + b *renta + c *ti + d *renta ALCA + u
Mientras que el primero se trata de una identidad contable,
en el segundo existe un componente aleatorio que queda
expresado a través de la perturbación aleatoria que recoge
todos aquellos factores que no quedan explicitados en el
modelo y que se deben al azar. La gran diferencia entre ambos
modelos es que mientras que el primero únicamente analiza
cambios en el PIB como consecuencia de cambios en sus
componentes, en el segundo estoy analizando exactamente las
causas que generan cambios en el comportamiento del PIB, por
lo tanto solo el segundo (el econométrico) sirve para
analizar relaciones de causalidad entre variables económicas.
Según el tipo de datos de las variables utilizadas en el
modelo:
Series temporales: Los datos pueden corresponder a los
valores de una variable en el tiempo. Estos pueden tener
frecuencia, diaria, semanal, mensual o anual. Así
podemos analizar las cotizaciones en bolsa diarias, los
índices de predio al consumo mensuales, los datos
anuales del PIB de un país, etc.
Series de corte transversal: Los valores corresponden a
distintos sujetos para un mismo momento del tiempo. En
este caso se trataría de series del tipo de consumo de
diferentes familias, inversión de distintas empresas,
paro en diferentes provincias, etc.
Especificación:
Selección del tema objeto de análisis: Este puede ser del
campo de la economía, la gestión de empresas e incluso temas
sociales no estrictamente económicos.
Selección de las variables explicativas más importantes, la
cual se realiza a través del análisis de los antecedentes
económicos. Empleando las teorías económicas, podemos
encontrar aquellas variables que a nivel general influyen de
una manera importante sobre la variable endógena.
Análisis de los antecedentes econométricos: Búsqueda de
modelos similares a la materia objeto de análisis en libros y
revistas sobre econometría. Propio conocimiento del
investigador.
Búsqueda y depuración de datos. Es necesaria la obtención de
datos suficientes, homogéneos y actualizados.
Estimación: Consiste en el cálculo del valor de los
parámetros a través de la ayuda de un programa informático
(SPSS, Eviews, RATS…)
Y = βo+β
β1X1+β
β2X2+U
βo+^β
^Y = ^β β1X1+^β
β2X2
En la expresión estimada no existe el componente de la
perturbación aleatoria, ya que una vez que estimamos el valor
de la endógena estimado se convierte en una combinación
lineal exacta de las variables explicativas que he utilizado
al realizar la estimación. La estimación de la perturbación
aleatoria será el error que cometo con mi modelo al estimar,
que incluirá precisamente las variables que dejo fuera de la
Adaptado de:
www.uesiglo21.edu.ar/pdfs%20dpto%20economia/
microeconomia_Mirta_Santana/UNIDAD06.pdf
Donde
UNIVERSIDAD NACIONAL COLOMBIA
36
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA
Y : variable aleatoria independiente y observable
X : variable no aleatoria dependiente y observable.
También conocida como variable predictora
E: error o perturbación aleatoria
α y β son parámetros que deben estimarse a partir de los
datos
Si (xj, yj) con j= 1,2,….,n observaciones de las variables X
e Y yj= α+ β xj+ εj se satisface para cada observación.
Si αˆ y βˆ son las estimaciones de α y β, entonces
Consecuencias:
Bajo estos supuestos se tiene que:
si
además
donde
O lo que es lo mismo
**
Ya que los dos términos de la ecuación ** son independientes
se sigue que:
o bien
Además esto significa que STC y SCE son iguales. Por lo tanto
si no hay una relación lineal entre X e Y SCR/SCE sería
distinto de cero solamente a consecuencia del muestreo.
Como bajo los supuestos del modelo de regresión lineal
normal, el parámetro de linealidad tiene una distribución
donde
i: indica uno de los valores de la población para cada
variable
α: es la ordenada al origen
βj: es la pendiente de la relación lineal entre y y xj
εj: término de error
Los supuestos del modelo están dados por :
**
y que 3x1 + x2=9 de donde x2=9-x1 reemplazando en ** se tiene
que
sea mínima.
El procedimiento es el mismo que el planteado en el caso de
la regresión lineal simple, sólo que aquí se obtiene un
conjunto de (k+1) ecuaciones normales, que se resuelven
simultáneamente para obtener las (k+1) estimaciones. La
resolución de estas ecuaciones no es particularmente difícil
pero requiere de muchas operaciones matemáticas que no serán
desarrolladas en este módulo. En la práctica se emplean
programas computacionales para obtener estas estimaciones.
En el caso de dos variables predictoras 2 1 x y x los
estimadores por mínimos cuadrados del modelo de regresión
lineal múltiple
donde
Predicción
Autocorrelación:
tanto el estadístico .
Los posibles valores que puede tomar d están entre 0 y 4,
como se muestra a continuación:
ESTADÍSTICA DESCRIPTIVA
Análisis Exploratorio
El procedimiento Explorar nos ofrece las siguientes
posibilidades:
Representar gráficamente los datos,
Examinar visualmente las distribuciones para varios
grupos de datos y
Realizar pruebas Normalidad y Homogeneidad sobre los
mismos.
Tablas
Tablas básicas.
Medias.
Dij = X ij − X j
Dij
Dj = i
nj
k
SCint er = n j ( D j − Dt ) 2
j =1
Calcular la F de Fisher-Snedecor:
MCint er
F=
MCint ra
En este procedimiento
comparamos las medias
de dos poblaciones
normales dependientes
(las mismas medidas
bajo circunstancias
distintas o datos
relacionados). El
procedimiento se elige
con el menú Analizar,
la opción Prueba T para muestras relacionadas de la opción
Comparar Medias.
La ventana que se abre muestra:
Variables relacionadas: este campo recoge los pares de
variables que se van a comparar. Se marcan con el curso
de la lista que muestra el SPSS y se llevan a este campo
pulsando en el botón con un triángulo a la derecha.
Y el botón Opciones: este campo tiene la misma utilidad
que en los procedimientos anteriores.
ANÁLISIS DE VARIANZA
Anova de un factor.
4000000,00
PIB=Bo+ B1G+E
Resumen del modelob
Estadísticos de cambio
R cuadrado Error típ. de la Cambio en Sig. del Durbin-W
Modelo R R cuadrado corregida estimación R cuadrado Cambio en F gl1 gl2 cambio en F atson
1 ,975a ,950 ,949 176824,53150 ,950 1058,815 1 56 ,000 ,770
a. Variables predictoras: (Constante), G
b. Variable dependiente: PIB
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 3,311E+13 1 3,31E+13 1058,815 ,000a
Residual 1,751E+12 56 3,13E+10
Total 3,486E+13 57
a. Variables predictoras: (Constante), G
b. Variable dependiente: PIB
Modelo
1
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para Estadísticos de
estandarizados os B al 95% Correlaciones colinealidad
Límite
B Error típ. Beta t Sig. Límite inferior superior Orden cero Parcial Semiparcial Tolerancia FIV
(Constante)65291,514 24549,234 2,660 ,010 16113,489 114469,5
G ,629 ,019 ,975 32,539 ,000 ,590 ,668 ,975 ,975 ,975 1,000 1,000
a. Variable dependiente: PIB
Variables Variables
Modelo introducidas eliminadas Método
1 a
M, I, G, X . Introducir
a. Todas las variables solicitadas introducidas
b. Variable dependiente: PIB
Estadísticos de cambio
R cuadrado Error típ. de la Cambio en Sig. del Durbin-W
Modelo R R cuadrado corregida estimación R cuadrado Cambio en F gl1 gl2 cambio en F atson
1 ,983a ,965 ,963150644,74598 ,965 370,740 4 53 ,000 1,285
a. Variables predictoras: (Constante), M, I, G, X
b. Variable dependiente: PIB
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 3,365E+13 4 8,41E+12 370,740 ,000a
Residual 1,203E+12 53 2,27E+10
Total 3,486E+13 57
a. Variables predictoras: (Constante), M, I, G, X
b. Variable dependiente: PIB
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 20248,397 41800,143 ,484 ,630 -63592,074 104088,9
G ,623 ,026 ,965 24,382 ,000 ,571 ,674
I -225,113 2835,104 -,003 -,079 ,937 -5911,610 5461,385
X 1,094 ,321 ,161 3,414 ,001 ,451 1,737
M -,902 1,162 -,049 -,777 ,441 -3,232 1,428
a. Variable dependiente: PIB
d
Resumen del modelo
Estadísticos de cambio
R cuadrado Error típ. de la Cambio en Sig. del Durbin-W
Modelo R R cuadrado corregida estimación R cuadrado Cambio en F gl1 gl2 cambio en F atson
1 ,983a ,965 ,963150644,74598 ,965 370,740 4 53 ,000
2 ,983b ,965 ,964149252,24548 ,000 ,006 1 53 ,937
3 ,982c ,965 ,964148865,24719 ,000 ,715 1 54 ,401 1,199
a. Variables predictoras: (Constante), M, I, G, X
b. Variables predictoras: (Constante), M, G, X
c. Variables predictoras: (Constante), G, X
d. Variable dependiente: PIB
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 20248,397 41800,143 ,484 ,630 -63592,074 104088,9
G ,623 ,026 ,965 24,382 ,000 ,571 ,674
I -225,113 2835,104 -,003 -,079 ,937 -5911,610 5461,385
X 1,094 ,321 ,161 3,414 ,001 ,451 1,737
M -,902 1,162 -,049 -,777 ,441 -3,232 1,428
2 (Constante) 18082,689 31382,310 ,576 ,567 -44835,055 81000,433
G ,622 ,025 ,965 24,610 ,000 ,572 ,673
X 1,093 ,317 ,161 3,445 ,001 ,457 1,730
M -,930 1,099 -,051 -,846 ,401 -3,133 1,274
3 (Constante) 1488,385 24427,223 ,061 ,952 -47464,863 50441,633
G ,607 ,017 ,940 35,899 ,000 ,573 ,640
X ,871 ,178 ,128 4,900 ,000 ,515 1,228
a. Variable dependiente: PIB
Estadísticos
de
Correlación colinealidad
Modelo Beta dentro t Sig. parcial Tolerancia
2 I -,003a -,079 ,937 -,011 ,609
3 I -,010b -,326 ,746 -,044 ,668
M -,051b -,846 ,401 -,114 ,178
a. Variables predictoras en el modelo: (Constante), M, G, X
b. Variables predictoras en el modelo: (Constante), G, X
c. Variable dependiente: PIB
Caso 2
Estadísticos de cambio
R cuadrado Error típ. de la Cambio en Sig. del Durbin-W
Modelo R R cuadrado corregida estimación R cuadrado Cambio en F gl1 gl2 cambio en F atson
1 ,896a ,803 ,801 3047,415 ,803 476,786 4 469 ,000
2 ,895b ,802 ,800 3052,771 -,001 2,653 1 469 ,104 1,994
a. Variables predictoras: (Constante), Work experience, Beginning salary, Educational level, Age of employee
b. Variables predictoras: (Constante), Work experience, Beginning salary, Educational level
c. Variable dependiente: Current salary
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1,771E+10 4 4,43E+09 476,786 ,000a
Residual 4,355E+09 469 9286737,8
Total 2,207E+10 473
2 Regresión 1,769E+10 3 5,90E+09 632,605 ,000b
Residual 4,380E+09 470 9319408,2
Total 2,207E+10 473
a. Variables predictoras: (Constante), Work experience, Beginning salary,
Educational level, Age of employee
b. Variables predictoras: (Constante), Work experience, Beginning salary,
Educational level
c. Variable dependiente: Current salary
a
Coeficientes
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95% Correlaciones
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior Orden cero Parcial Semiparcial
1 (Constante) -363,338 1026,807 -,354 ,724 -2381,050 1654,375
Beginning salary 1,750 ,060 ,807 29,270 ,000 1,633 1,868 ,880 ,804 ,600
Educational level282,162 67,774 ,119 4,163 ,000 148,983 415,340 ,661 ,189 ,085
Age of employee-32,901 20,198 -,057 -1,629 ,104 -72,589 6,788 -,146 -,075 -,033
Work experience-45,555 27,450 -,058 -1,660 ,098 -99,494 8,385 -,097 -,076 -,034
2 (Constante) -1464,582 774,204 -1,892 ,059 -2985,912 56,748
Beginning salary 1,749 ,060 ,806 29,198 ,000 1,631 1,866 ,880 ,803 ,600
Educational level294,379 67,476 ,124 4,363 ,000 161,787 426,972 ,661 ,197 ,090
Work experience-80,304 17,305 -,102 -4,641 ,000 -114,309 -46,300 -,097 -,209 -,095
a. Variable dependiente: Current salary
Estadísticos
de
Correlación colinealidad
Modelo Beta dentro t Sig. parcial Tolerancia
2 Age of employee -,057a -1,629 ,104 -,075 ,346
a. Variables predictoras en el modelo: (Constante), Work experience, Beginning salary,
Educational level
b. Variable dependiente: Current salary
40
,5 Desv. típ. = 1,00
20 Media = 0,00
variable dependiente salario
N = 474,00
0 UNIVERSIDAD NACIONAL COLOMBIA
,3 95
FACULTAD DE CIENCIAS ECONÓMICAS
-4
-3 0
-2 0
-1 0
0, 0
1,
2,
3,
4,
5,
6,
00
00
00
00
00
00
00
,0
,0
,0
,0
UNIDAD DE INFORMÁTICA
0,0Regresión Residuo tipificado
0,0 ,3 ,5 ,8 1,0
30000 20000
20000 10000
10000 0
Current salary
Current salary
0 -10000
-10000 -20000
-10000 0 10000 20000 30000 -20 -10 0 10 20 30 40
10000
0
Current salary
Educational level
Estos gráficos de regresión parcial me enfrentan la variable
dependiente con cada una de las variables independientes, de
forma tal que podemos observar el comportamiento de cada uno
de los puntos y su correlación; es útil en el análisis
cualitativo de las variables.
Para realizar un análisis cuantitativo tendríamos que sacar
los análisis de correlación bivariantes como se muestra a
continuación.
Correlaciones
Correlación en SPSS:
1
Este procedimiento se encuentra en la parte estadística de esta guía.
UNIVERSIDAD NACIONAL COLOMBIA
98
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA
Si damos clic en el botón de opciones podemos señalar
estadísticos y exclusión de valores perdidos para el
análisis.
Regresión:
Para realizar un
análisis de regresión,
es necesario haber
establecido la
variable independiente
en función de las
independientes.
Después, vamos al menú
Analizar, Regresión, Lineal y desplegamos la ventana
principal de esta opción:
Aquí se incluyen
MÉTODO EXPLICACIÓN
INTRODUCIR Procedimiento para la selección de
variables en las que todas las variables se
introducen en un primer paso.
PASOS SUCESIVOS En cada paso se introduce la variable
independiente que no esté ya incluida y que
tenga la probabilidad para F más pequeña,
si esa probabilidad es suficientemente
pequeña. Las variables ya introducidas en
la ecuación de regresión se eliminan de
ella si su probabilidad para F llega a ser
suficientemente grande. El método culmina
cuando ya no hay más variables candidatas a
ser incluidas o eliminadas.
ELIMINAR Procedimiento para la selección de
variables en la que todas las variables de
un bloque se eliminan en un solo paso.
HACIA ATRÁS Procedimiento de selección de variables en
el que se introducen todas las variables en
la ecuación y después se van excluyendo una
tras otra. Aquella variable que tenga la
menor correlación parcial con la variable
dependiente será la primera considerada
para la exclusión. Si satisface el criterio
UNIVERSIDAD NACIONAL COLOMBIA
100
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA
de eliminación, será eliminada. Tras haber
excluido la primera variable, se pondrá a
prueba aquella variable, de las que queden
en la ecuación, que presente una
correlación parcial más pequeña. El
procedimiento termina cuando ya no quedan
en la ecuación variables que satisfagan el
criterio de exclusión.
HACIA DELANTE Procedimiento de selección de variables en
el que estas son introducidas
secuencialmente en el modelo. La primera
variable que se considerará para ser
introducida en el modelo, es aquella que
presenta mayor correlación parcial negativa
o positiva con la variable dependiente.
Dicha variable será introducida en la
ecuación sólo si satisface el criterio de
entrada, si ya entró la primera variable,
se considerará la variable independiente
que no esté en la ecuación y cuya
correlación parcial sea la mayor. El
procedimiento termina cuando ya no existan
variables que satisfagan el criterio de
entrada.
Dando clic en la
opción GRÁFICOS se
despliega esta
ventana,
la cual:
El botón
ESTADÍSTICOS me
arroja a la
ventana que se
encuentra a la
izquierda; en
ella, podemos
El estadístico de seleccionar los
Durbin-Watson estadísticos para
sobre los la regresión
residuos, me entre diferentes
permite opciones y
dependiendo de
las necesidades
del investigador.
A = l0 − l n
k
Amplitud de clase =
A
xi
x=
n
www.statsofting.com
www.uesiglo21.edu.ar/pdfs%20dpto%20economia/
microeconomia_Mirta_Santana/UNIDAD06.pdf
www.uesiglo21.edu.ar/pdfs%20dpto%20economia/
microeconomia_Mirta_Santana/UNIDAD07.pdf
www.etsii.upm.es/ingor/estadistica/
docencia/apuntes/tema11.pdf
www.monografías.com
cca.uprm.edu/agronomia/profesores/base/rmacchiavelli/
extra/agro6600/conferencia22.htm
www.economia.ufm.edu.gt/catedraticos/ jhcole/regresion.pdf