Está en la página 1de 31

ECOTRAINING

MANUAL DE STATA BSICO


POR: Eco. DAVID JOEL ESPARTA POLANCO

Contenido
CAPTULO I. INTRODUCCIN AL STATA................................................................3
1.

Entorno del Stata....................................................................................... 3

2.

Estructura de un Do-file............................................................................. 6

3.

Cargar Bases de Datos.............................................................................. 8

4.

3.1.

Cargando una base de datos del Stata................................................8

3.2.

Creando manualmente una base de datos en Stata...........................9

3.3.

Convirtiendo bases de datos...............................................................9

Guardar una Bases de Datos...................................................................11

CAPTULO II. GESTIN DE BASE DE DATOS.......................................................12


1.

Inspeccin de la base de datos................................................................12

2.

Generacin y transformacin de variables..............................................14

3.

Transformacin de bases de datos.........................................................16

4.

Fusin de bases de datos.......................................................................18

CAPTULO III. GRFICOS EN STATA.....................................................................21


1.

Introduccin al Stata Graph.....................................................................21

2.

Tipos de grficos...................................................................................... 21
2.1.

Histograma........................................................................................ 21

2.2.

Dispersin de puntos (Scatter Plot)...................................................22

2.3.

Mltiple dispersin de puntos............................................................23

2.4.

Caja y bigote..................................................................................... 24

2.5.

Pie..................................................................................................... 25

2.6.

Barras................................................................................................ 26

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC).........................27


1.

Especificacin y supuestos del MRLC......................................................27

2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios


(MCO)............................................................................................................. 28

CAPTULO I. INTRODUCCIN AL STATA


1. Entorno del Stata
Al momento de iniciar la sesin en STATA ya sea en cualquiera de su versin
ms actualizada (versin 11 a la versin 13), esta mostrar cuatro ventanas
importantes:

En el transcurso de la capacitacin, aprenderemos a trabajar con otras


ventanas que contiene el Stata, como son:
Otras ventanas a tomar en consideracin son:
a. STATA Viewer: Podemos acceder a la informacin online y a las ayudas
que nos otorga el programa.
b. STATA Do-File Editor: Es una ventana que funciona como editor de
texto

para

programados.

poder

guardar

ejecutar

una

lista

de

comandos

c. STATA Data Editor: Nos permite digitar y modificar los datos de la


misma forma que una hoja de Excel.
d. STATA Browser: Accedemos a la ventana de datos sin poder modificar
su contenido.
e. STATA Graphs: Nos muestra una ventana con el grfico que hemos
ejecutado.

Uno de los archivos principales para comenzar a usar el Stata es el archivo de


programacin Do-file editor, para acceder a este editor podemos hacer clic en
la barra de herramientas el cono

o escribir en la ventana de lnea de

comandos lo siguiente:

A continuacin, nos aparecer una ventana de editor en blanco, donde


podemos elaborar nuestro primer archivo do-file.
Estos archivos son muy importantes por los siguientes motivos:

a. Permite registrar una de serie de comandos, la cual representa todo el


procedimiento de nuestro trabajo.
b. Permite ir corrigiendo posibles errores que se pueden generar en la
elaboracin y ejecucin de nuestro trabajo.
c. Permite

replicar

los

procedimientos

en

sesiones

posteriores

sin

necesidad de crearlo nuevamente.


d. Adems, sirve como un mecanismo de seguridad que permite regresar a
la

base

de

datos

original

despus

de

haberle

hecho

diversas

transformaciones.
Una de las primeras cosas que debemos aprender para elaborar un do-file es
escribir comentarios, para ello existen diversas maneras:
a. Una simple lnea de comentario empieza con un asterisco (*); donde
STATA ignorar tales lneas.
b. Para colocar un comentario en la misma lnea donde fue escrito el
comando utilizamos dos slash (//).
c. Para lneas con mltiples comentarios, colocamos el texto entre los
smbolos (/*) al inicio y (*/) al final.
d. En el caso de que se haga uso de un comando la cual presenta una
expresin muy larga podemos utilizar triple slash (///) en medio de la
expresin y as continuar en la siguiente lnea la parte faltante. STATA
entender como si fuera una nica lnea de comando.
e. Por ltimo, tambin se utilizan los smbolos de comentarios con fines

decorativos.
Por ejemplo, podemos comenzar escribiendo en nuestro do-file lo siguiente

2. Estructura de un Do-file
Generalmente, al momento de comenzar a programar en un do-file del Stata,
es recomendable mantener el siguiente esquema de trabajo:

Siguiendo esta estructura del do-file, procedemos como primer paso a construir
una plantilla de trabajo.
El primer comando que utilizaremos en esta plantilla de trabajo es limpiar
informacin que podra estar utilizndose (como bases de datos, etiqueta,
matrices, escalares, etc.) que se haya trabajado previamente con el comando
clear.
Con respecto a las formas de poder ejecutar los comandos, se puede hacer a
travs del icono

(execute do) ubicado en la parte superior derecha de la

barra de herramientas del archivo Do-file o presionando los teclados Ctrl+D


una vez que sombremos el comando queramos correr.

Una vez realizada esta accin, se reflejar los resultados en la ventana Result
View del Stata.

Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia


una sesin en Stata, por defecto se trabaja en la carpeta en donde se
encuentra instalado el software. Para saber cul es la ruta de trabajo activa se
puede ver la parte inferior izquierda del entorno del STATA.

Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada


Bases en el cual trabajaremos esta primera sesin. Para acceder a la nueva
ruta de trabajo nos ubicamos en la carpeta Bases y copiamos la ruta que se
encuentra en la parte superior de la ventana:

Ahora, utilizamos el comando cd para cambiarnos al nuevo directorio creado,


indicando la nueva ruta entre comillas.

3. Cargar Bases de Datos


Existen diferentes de poder emplear una bases de datos en Stata y en la
presente seccin explicaremos cada una de estas formas.
3.1.

Cargando una base de datos del Stata

STATA cuenta con bases de datos dentro de su sistema como ejemplos


aplicativos, para cargarlos se utiliza el comando sysuse. Un ejemplo, es cargar
la base de datos auto.dta, donde cabe resaltar que todas las bases de datos
en formato del Stata se guardan con la versin .dta.

En la parte inferior izquierda del entorno del STATA se apreciar las variables
que contiene la base de datos auto.dta.

3.2.

Creando manualmente una base de datos en Stata

La manera de editar manualmente una base de datos a travs del dofile es a


travs del comando input.
Para realizar esta accin, hay que limpiar la base de datos utilizada en la
anterior seccin de la siguiente manera. Luego, usamos el comando input,

seguido del nombre de las variables y a partir de la siguiente lnea de comando


se comienza a digitar los datos, finalmente se debe terminar con la palabra
end.

3.3.

Convirtiendo bases de datos

STATA cuenta con una herramienta que permite convertir base de datos de
SPSS, Matlab, Gauss, SAS, Excel, etc. al formato *.dta a travs del software
STAT/TRANSFER.

Para acceder a este software basta con hacerle clic y posteriormente nos saldr
una ventana de dialogo solicitndonos la siguiente informacin:

Input File Type: Indicamos el tipo de archivo en la cual se encuentra

nuestra base de datos original.


File Specification: Indicamos la ruta donde se encuentra nuestra base

de datos original haciendo uso del botn Browse.


Output File Type: Indicamos el tipo de archivo al cual deseamos que la

base de datos se convierta.


File Specification: Indicamos la ruta donde queremos colocar la base
de datos convertida haciendo uso del botn Browse.

Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de


Hogares (ENAHO) en formato de SPSS llamada Enaho01-2014-100.savque se
encuentra en nuestra carpeta de trabajo, el cual queremos convertirlo a un
archivo de base de datos del STATA con el mismo nombre y que se guarde en la
misma carpeta de trabajo.

Para desarrollar esta aplicacin realizamos los siguientes pasos:


a. Abrimos la ventana de dilogo del STAT/TRANSFER.
b. En la seccin Input File Type hacemos clic a la barra desplegable y
elegimos el formato SPSS Data File ya que se debe un archivo de base
de datos del SPSS.

c. En la seccin File Specification hacemos clic en el botn Browse para


definir la ruta donde se encuentra nuestra base original.

d. En la seccin Output File Type hacemos clic a la barra desplegable y


elegimos el formato Stata Version 4-5 la cual es el formato de la base de
datos que queremos obtener.

e. En la seccin File Specification hacemos clic en el botn Browse para


definir la ruta donde queremos que se guarde nuestra base convertida.
Aunque por defecto se ubica en la misma carpeta donde se ubica la base
de datos convertida.

4. Guardar una Bases de Datos


Parta guardar una base de datos que fue modificada se puede hacer usando
con el comando save. No obstante, para las versin actuales de Stata 12 y 13
se sugiere usar el comando soveold, para que las bases de datos pueda ser
reconocido por versiones del Stata anteriores a los mencionados.

Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las


opciones del comando, en este caso es replace lo que significa que si se
vuelve a ejecutar esta sintaxis el Stata guardar la base de datos nuevamente
de la que ya existe.

CAPTULO II. GESTIN DE BASE DE DATOS


1. Inspeccin de la base de datos
En esta seccin aprenderemos comandos que nos permitan dar una revisada a
la base de datos, es decir, saber con qu esquema de datos y tipos de
variables estamos trabajando.
Para ello, vamos a trabajar con una Encuesta de Hogares (ENAHO) del ao
2013, el mdulo de esta encuesta ser las Caractersticas de las viviendas
encuestadas. Previamente establecemos nuestra ruta de trabajo y luego
cargamos la base de datos con el comando use.

Usualmente despus de abrir una base de datos, recurrimos a la siguiente


rutina de inspeccin de una base de datos:

Observar la base de a travs del comando browse, el cual nos permite ver
la base de datos sin poder modificarla. En cambio, existe otro comando
denominado edit que nos permite ver la base de datos pudiendo
modificarlo.

Descripcin de la base de datos con el comando describe.

Generando un diccionario de variables con el comando codebook.

Realizar un cuadro estadstico resumen de diferentes variables numricas


con el comando summarize.

2. Generacin y transformacin de variables


Una primera forma de generar variables es utilizando el comando generate,
que usualmente trabaja conjuntamente con el comando replace. Este
comando nos permite generar variables haciendo uso de expresiones
matemticas, lgicas, numricas.
Si bien es cierto que STATA solamente reconoce los comandos con letras
minsculas, tambin es importante decir que hace diferenciacin de los
nombres de las variables entre si son minsculas o maysculas.
Por ejemplo, a partir de la base de datos se quiere saber el nmero de hogares
que tienen internet, esta informacin se encuentra en la pregunta p1141. Para
ello, creamos una variable dictoma denominada internet donde toma el
valor de 0 si el hogar no tiene internet y 1 cuando si tiene internet.

A esta nueva variable se puede introducir etiquetas para una mejor


descripcin. Si queremos colocar una etiqueta al nombre de la variable
utilizamos el comando label variable, y si se quiere etiquetar los valores de la
variable primero se debe definir una etiqueta con label define y luego se
utiliza el comando label value para utilizar la etiqueta creada en los valores de
la variable, tal y como se muestra a continuacin:

Una vez creada la variable internet se puede hacer una tabla simple de
frecuencia con el comando tabulate para saber cuntos hogares tienen

internet. En este caso, de un total de 39 767 hogares entrevistadas, el 15,84%


tienen internet.

Otra forma de generar variables es empleando en comando egen.

Este

comando es una extensin del anterior, que permite utilizar expresiones que
incluyan funciones ms complejas del STATA, como es el caso de: medias,
mximos,

mnimos,

desviacin

estndar,

promedios

mviles,

variables

estandarizadas, etc.
A manera de ejemplo se puede calcular una variable que capture el valor
promedio, mximo y mnimo del pago de alquiler de una vivienda (p106).

Tambin se puede generar variables a partir de la recodificacin de otras


variables con el comando recode, el cual permite modificar los valores

especficos de una variable. A manera de ejemplo se puede crear una variable


de regiones naturales del pas (costa, sierra y selva) a partir del dominio
geogrfico (dominio). Para ello se suele recomendar realizar una revisin de las
etiquetas de la variable a recodificar con el comando label list.

A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el


fin de luego formas los grupos de recodificacin de la siguiente manera:

3. Transformacin de bases de datos


Hay ocasiones en que la base de datos puede requerirse para colapsarlo de tal
forma que cada grupo de individuos est representada por una observacin en
particular, ya sea por el promedio, la mediana, desviacin estndar, mximo,
mnimo, la suma, etc., de alguna variable en particular. Para hacer esta
operacin recurrimos al comando collapse.
A manera de ilustracin cargamos una nueva base de datos denominada
kids.dta que tiene informacin de nios correspondiente a un cdigo de
familia que pertenece, su nombre, orden de nacimiento, endad, peso y sexo.

A partir de esta pequea base se requiere tener informacin a nivel de familia,


donde se registre el promedio de aos de edad de los nios, el peso mximo, y
el nmero de nios hombres. As, que la lnea de sintaxis sera el siguiente:

Por otro lado, cuando se trabaje con bases de datos de forma panel (un grupo
de individuos que se recogen informacin en un periodo de tiempo), esta
puede tener dos formas: larga y ancha. El comando reshape nos permite
transponer una base de datos panel de forma larga (long) a una de forma
ancha (wide) y viceversa. Como se muestra a continuacin:

Por ejemplo, cargamos otra base de datos llamada ingfam.dta, que contiene
informacin sobre el ingreso de 3 individuos en tres aos (1996, 1997 y 1998).

Como se observar, esta base tiene formato wide, y lo que se quiere en


transponerlo a formato long. Para ello, hay que identificar bien dos cosas: la
parte del nombre de la variable que se repite y que a su vez sirve como una
semilla (ingfam), y la variable que identifique al individuo que se colocar en la
opcin i(codfam), por ltimo se coloca un nuevo nombre a la variable temporal
j(tiempo).

Si se quiere volver al formato anterior, es decir, de long a wide, se debe


ejecutar lo siguiente:

4. Fusin de bases de datos


Es comn la combinacin de varias bases de datos. Se va a mostrar dos
operaciones bsicas: aadir observaciones y aadir variables.
En el primer caso, se utiliza el comando append para fusionar bases de datos
de manera vertical. Aqu ser necesario una base activa o cargada (base
master) y una inactiva que se va a aadir a la base master (base using),
adems la base originada tendrs una forma long.
Para ello, abrimos una nueva base de datos denominada base1.dta el cual
estar activa y ser nuestra base master. Adems, en nuestra carpeta de
trabajo existe otra base llamada

base2.dtael cual estar inactiva (base

using) y ser aadida a la primera base. Ambas bases de datos contiene


informacin de las notas de alumnos (en la primera base existe 3 alumnos y en
la segunda existen 4 alumnos) en los cursos de micro, macro y economa,
adems de su sexo el turno horario.

Para fusionar ambas bases de datos e utiliza la siguiente lnea de sintaxis:

En el segundo tipo de fusin para aadir variables, se utiliza el merge para


fusionar bases de datos de manera vertical. De la misma manera que en el
primer caso, tambin existir una base master y una base using.
Para este ejemplo, se usaran dos bases de datos que ya fueron fusionados de
manera vertical base12.dta y base34.dta, el primero ser la base using y la
segunda la base master. Ambas bases contienen informacin de alumnos, por
lo cual ser un fusin de individuo contra individuo (1:1).

Como se puede observar en la fusin, automticamente se crea una variable


denominada _merge el cual toma valores dependiendo si el registro de los
datos est presente en una de las bases o en ambos. Cuando el valor de la
variable _merge es 1 quiere decir que el dato solo aparece en la base master, 2
cuando aparece en la base using y 3 cuando aparece en ambos. Usualmente,
despus de cada fusin se suele eliminar esta variable con el comando drop.

CAPTULO III. GRFICOS EN STATA


1. Introduccin al Stata Graph
Stata presenta una amplia variedad de grficos, la cual abarca figuras como:
matrices

de

ploteos,

histogramas,

reas,

lneas,

caja

bigote,

etc.

Comenzaremos demostrando siete tipos de grficos:

histogram: Histogramas
graph twoway: Scatterplot, lneas, y otros entre dos variables.
graph matrix: Matrices de Scatterplots.
graph box: Grficas de caja y bigotes.
graph bar: Grficas de barras
graph pie: Grficas de pastel o pie.

Para cada uno de estos grficos existen muchas opciones 1.


2. Tipos de grficos
Los comandos del Stata Graph empiezan con la palabra graph (aunque en
algunos casos esto es opcional) seguido por la palabra que indica el tipo de
grfico.
A continuacin describiremos los diferentes tipos de grficos que se puede
elaborar en el ambiente del Stata.
2.1.

Histograma

La funcin de densidad de una variable puede ser estimada usando un


histograma a travs del comando histogram. Para ilustrar este comando,
utilizaremos

la

base

de

la

Encuesta

Permanente

de

Empleo

(EPE)

correspondiente al trimestre mvil Enero-Febrero-Marzo del ao 2014, la cual


contiene informacin referente a la situacin de empleo que tiene un individuo
en el mercado laboral.
En esta base se tiene informacin de los ingresos laborales totales de los
trabajadores al mes (ingtot), el cual se quiere obtener su grfico de frecuencias
1

Para observa otras tipos de grficos y comandos relacionados a estos, se recomienda escribir en la venta
de comandos help graph other.

del logaritmo natural de estos ingresos con el fin de reducir la varianza.


Adems, comparamos con la distribucin para observar si se guardan

.2

Density
.4

.6

.8

caractersticas similares, tal y como se muestra a continuacin:

2.2.

6
lningtot

10

Dispersin de puntos (Scatter Plot)

Los diagramas de dispersin de puntos (scatter plot) se accede a travs del


comando graph twoway scatter. Por ejemplo, queremos ver la relacin que

lningtot
6

10

guardan el ingreso laboral total (en logaritmos) con la edad (p108).

20

40
60
edad ( en aos )

80

100

No obstante, se puede ajustar un lnea recta (lfit) a este grfico, y al mismo


tiempo ajustar por una relacin cuadrtica (qfit), para ver si existe

10

rendimientos decrecientes en los ingresos laborales.

20

40
60
edad ( en aos )
lningtot
Fitted values

2.3.

80

100

Fitted values

Mltiple dispersin de puntos

El comando graph matrix nos muestra un til anlisis multivariado. Este


comando otorga una grfica compacta de la relacin entre un nmero de
variables por pareja, permitindole al analista observar los signos de no
linealidad, outliers o cluester que puedan afectar al modelamiento estadstico.
Este tipo de grfico tambin es til si se quiere observar la influencia de una
lista de variables explicativas a una variable dependiente.
Por ejemplo, si se quiere ver grficamente la relacin de un conjunto de
factores que pueden influir en los ingresos laborales de la persona, como es el
caso de la edad (p108), las horas de trabajo (p209t) y el nivel educativo
(p109b), se puede ealizar de la siguiente manera:

50

100

10
10

lningtot

5
0

100

edad (
en aos
)

50
0

100

total de
horas
trabajadas

50
0

10

aos de
estudios

5
0
0

2.4.

10

50

100

Caja y bigote

La grfica de caja y bigote brinda informacin acerca del centro, amplitud,


simetra y outliers con solo un vistazo. Para obtener este grfico, se debe
empelar el comando graph box.
Si seguimos analizando la distribucin de los ingresos laborales con un grfico

lningtot
6

10

de caja y bigotes se programara la siguiente lnea de comando.

Si se quiere el mismo grfico pero de manera horizontal, se debera usar el


comando graph hbox.

2.5.

6
lningtot

10

Pie

Este estilo es muy popular en las presentaciones de grficas, siempre y cuando


tengan pocos valores para trabajar. El comando bsico del grfico de pastel es
graph pie.
Si se quiere saber la distribucin de las personas por nivel educativo (p109a)
que fue recodificada a una menor cantidad de niveles (sin nivel, primaria,
secundaria, superior) que lleva como nuevo nombre niveduc, se puede
obtener utilizando el comando mencionado con la opcin over() para que los
pedazos del pie lo conformen los cuatro niveles educativos:

Sin nivel
Secundaria

2.6.

Primaria
Superior

Barras

El grfico de barras provee una simple y verstil exhibicin conjunto de


resmenes estadsticos como media, mediana, suma o conteo. Para obtener
barras verticales se debe utilizar el comando graph bar.
Por ejemplo, si se desea comparar en un grfico de barras el valor de la media
y la mediana del ingreso laboral, se debera especificar los estadsticos a
utilizar, en este caso (mean) y (median). Adems, si se quiere mostrar los

1,500

valores de estos estadsticos se debe colocar la opcin blabel(bar).

1440.19

500

1,000

1083

mean of ingtot

p 50 of ingtot

S que quiere las barras de manera horizontal basta con usar el comando
graph hbar.

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC)


1. Especificacin y supuestos del MRLC
En los modelos de regresin lineal se requiere explicar el comportamiento de
una variable (dependiente

Y ) a partir de otras (regresoras o explicativas

X ). Utilizamos el concepto de distribucin de probabilidad condicionada,


pues se busca conocer los estimadores de los parmetros de regresin con la
finalidad de estimar finalmente el
valor esperado de Y, dado que

E ( Y X =x ) , es decir buscamos conocer el


X =x

(la variable regresora toma un

x ).

determinado valor

y i= 0 + 1 x i + i

La variable

yi

es la variable dependiente, las variables

variables explicativas o regresoras, y

comnmente llamado trmino de error. Los

xi

son las

es la perturbacin aleatoria o

son los parmetros asociados

a cada una de las variables explicativas, tambin llamados coeficientes de


regresin y miden el impacto de cada variable independiente en relacin al
comportamiento de la variable endgena.
Los parmetros

son no conocidos. Sin embargo, utilizando informacin

muestral se pueden obtener estimadores de los parmetros (o coeficientes).


Dado la expresin anterior, se considera que se cumplen las siguientes
hiptesis clsicas bsicas:

Linealidad en los parmetros.

No singularidad o multicolinealidad. No existen relaciones lineales


entre las variables explicativas o regresores y estos no son variables

aleatorias.
Exogeneidad estricta o no endogeneidad. La esperanza del vector

E ( )=0 .

de la variable aleatoria es cero:

Errores esfricos. La matriz de varianzas y covarianzas del vector de


variables aleatorias es:

del vector

E ( ' )= 2 I . Es decir, todos los componentes

tienen varianza idntica (homoscedasticidad), y adems

las covarianzas son 0, es decir, los elementos del vector

no estn

correlacionados (no autocorrelacin).


Normalidad de los errores. La distribucin de probabilidad del vector
de perturbaciones aleatorias es:

N ( 0, 2 I ) , es decir, es un vector

normal esfrico. Por tanto, las perturbaciones son variables aleatorias


independientes e igualmente distribuidas, normales con media cero y
varianza

2 I . Dado que

probabilidad

del

perturbaciones

vector

X
Y

no es aleatoria, la distribucin de
se

deriva

partir

del

vector

de

Y N ( X , 2 I ) .

2. Estimacin del MRL por el mtodo de Mnimos Cuadrados


Ordinarios (MCO)
El mtodo de Mnimos Cuadrados Ordinarios (MCO) permite encontrar los
parmetros desconocidos del modelo, cuyo criterio es minimizar los errores al
cuadrado del MRLC.
A partir de este criterio, se puede estimar el valor de los parmetros de la
siguiente manera:

^=( X ' X )1 X ' Y


Y a su vez la matriz de varianza y covarianza, que servir para calcular los
errores estndar de los estimadores, se obtiene de la siguiente relacin:

Var ( ^ ) = 2 ( X ' X )

Donde el parmetro

se puede estimar de la siguiente manera:

^ ' ^ ( Y X ^ ) ' ( Y X ^ )
^2=
=
nk
nk
Siendo n el tamao de la muestra y k el nmero de parmetros.
A manera de un ejercicio aplicativo, se emplea la base del sistema del Stata
auto.dta. En esta ocasin se desea explicar el precio del auto (price) en
funcin de los millages por galn (mpg), su peso (weight) y su procedencia
(foreign). Es decir:

pricei= 0 + 1 mpg i + 2 weighti + 3 foreign i+ i


El comando en Stata para estimar un MORLC por la tcnica de MCO es
regress, tal y como se muestra a continuacin:

Los resultados ms importantes de esta regresin se detallan en el cuadro de


la parte inferior, donde en la segunda columna se encuentra los coeficientes o
parmetros estimados asociado a cada variable explicativa. Y en la columna de
a lado, se presenta los errores estndar de estos estimadores el cual servirn
como insumo para calcular el estadstico t-student, y este ltimo a su vez
servir para calcular la probabilidad acumulada.
Tanto el estadstico t-student y la probabilidad son importantes para realizar las
pruebas de significancia individual, para saber si las regresoras obtenidos
influyen significativamente o no sobre la variable dependiente. Por tanto, la
hiptesis para evaluar esta significancia individual es el siguiente:
Ho :

=0

(hiptesis nula)

Ha :

(hiptesis alternativa)

La regla de decisin es la siguiente:

Se acepta Ho si: t-calculado < 1.96. Si p-value > 0.05.


Se rechaza Ho si: t-calculado > 1.96. Si p-value < 0.05.

En el caso del ejemplo, se puede apreciar que para la variable mpg tiene un
valor de t-calculado igual a

0.29, menor a 1.96, por lo cual se rechaza la

hiptesis nula de significancia individual. La misma conclusin se obtendra por


el lado de la probabilidad ya que esta es 0.769 mayor al umbral de 0.05.

En cuanto a la significancia conjunta del modelo, es decir, si las regresoras en


conjunto explican el comportamiento de la variable dependiente, es necesario
fijarnos el cuadro superior de lado derecho donde se encuentra el estadstico
de Fisher. Para ello hay que observar el valor de la probabilidad Prob. > F y
sigue la misma regla de la significancia individual, es decir, si es mayor a 0.05
se acepta la hiptesis nula de no significancia individual, caso contrario se
rechaza esta hiptesis nula, lo cual indicar que las variables si explican
significativamente en su conjunto. Para el caso del ejemplo, esta probabilidad
es 0.0 menor al 0.05, por lo cual se rechaza la hiptesis nula, lo que significa
que son estadsticamente significativos de manera global.
Otro resultado importante es la bondad de ajuste del modelo que se mide por
el Coeficiente de Determinacin, o tambin llamado R-squared (R 2). El valor de
este estadstico es 0.4996 que es igual a decir 49.96%, lo que significa que el
49.96% de la variabilidad o varianza de Price est siendo explicada por la
varianza de las variables explicativas. Se espera que mientras ms cercano a la
unidad este estadstico es mejor el modelo.

También podría gustarte