Está en la página 1de 30

ECOTRAINING

MANUAL DE STATA BSICO


POR: Eco. DAVID JOEL ESPARTA POLANCO

Contenido
CAPTULO I. INTRODUCCIN AL STATA .............................................................................. 3
1.

Entorno del Stata .................................................................................................................. 3

2.

Estructura de un Do-file ...................................................................................................... 6

3.

Cargar Bases de Datos ......................................................................................................... 8

4.

3.1.

Cargando una base de datos del Stata....................................................................... 8

3.2.

Creando manualmente una base de datos en Stata ................................................. 9

3.3.

Convirtiendo bases de datos ....................................................................................... 9

Guardar una Bases de Datos ............................................................................................. 11

CAPTULO II. GESTIN DE BASE DE DATOS ....................................................................... 12


1.

Inspeccin de la base de datos .......................................................................................... 12

2.

Generacin y transformacin de variables ..................................................................... 14

3.

Transformacin de bases de datos .................................................................................. 16

4.

Fusin de bases de datos .................................................................................................. 18

CAPTULO III. GRFICOS EN STATA...................................................................................... 21


1.

Introduccin al Stata Graph .............................................................................................. 21

2.

Tipos de grficos................................................................................................................. 21
2.1.

Histograma .................................................................................................................. 21

2.2.

Dispersin de puntos (Scatter Plot) ......................................................................... 22

2.3.

Mltiple dispersin de puntos ................................................................................. 23

2.4.

Caja y bigote ................................................................................................................ 24

2.5.

Pie ................................................................................................................................. 25

2.6.

Barras............................................................................................................................ 26

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC)............................... 27


1.

Especificacin y supuestos del MRLC............................................................................. 27

2.

Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO) ..... 28

CAPTULO I. INTRODUCCIN AL STATA


1. Entorno del Stata
Al momento de iniciar la sesin en STATA ya sea en cualquiera de su versin ms
actualizada (versin 11 a la versin 13), esta mostrar cuatro ventanas importantes:

En el transcurso de la capacitacin, aprenderemos a trabajar con otras ventanas que


contiene el Stata, como son:
Otras ventanas a tomar en consideracin son:
a. STATA Viewer: Podemos acceder a la informacin online y a las ayudas que nos
otorga el programa.
b. STATA Do-File Editor: Es una ventana que funciona como editor de texto para
poder guardar y ejecutar una lista de comandos programados.
c. STATA Data Editor: Nos permite digitar y modificar los datos de la misma forma
que una hoja de Excel.

d. STATA Browser: Accedemos a la ventana de datos sin poder modificar su


contenido.
e. STATA Graphs: Nos muestra una ventana con el grfico que hemos ejecutado.

Uno de los archivos principales para comenzar a usar el Stata es el archivo de


programacin Do-file editor, para acceder a este editor podemos hacer clic en la barra de
herramientas el cono

o escribir en la ventana de lnea de comandos lo siguiente:

A continuacin, nos aparecer una ventana de editor en blanco, donde podemos elaborar
nuestro primer archivo do-file.
Estos archivos son muy importantes por los siguientes motivos:
a. Permite registrar una de serie de comandos, la cual representa todo el
procedimiento de nuestro trabajo.

b. Permite ir corrigiendo posibles errores que se pueden generar en la elaboracin y


ejecucin de nuestro trabajo.
c. Permite replicar los procedimientos en sesiones posteriores sin necesidad de
crearlo nuevamente.
d. Adems, sirve como un mecanismo de seguridad que permite regresar a la base de
datos original despus de haberle hecho diversas transformaciones.
Una de las primeras cosas que debemos aprender para elaborar un do-file es escribir
comentarios, para ello existen diversas maneras:
a. Una simple lnea de comentario empieza con un asterisco (*); donde STATA
ignorar tales lneas.
b. Para colocar un comentario en la misma lnea donde fue escrito el comando
utilizamos dos slash (//).
c. Para lneas con mltiples comentarios, colocamos el texto entre los smbolos (/*) al
inicio y (*/) al final.
d. En el caso de que se haga uso de un comando la cual presenta una expresin muy
larga podemos utilizar triple slash (///) en medio de la expresin y as continuar
en la siguiente lnea la parte faltante. STATA entender como si fuera una nica
lnea de comando.
e.

Por ltimo, tambin se utilizan los smbolos de comentarios con fines decorativos.

Por ejemplo, podemos comenzar escribiendo en nuestro do-file lo siguiente

2. Estructura de un Do-file
Generalmente, al momento de comenzar a programar en un do-file del Stata, es
recomendable mantener el siguiente esquema de trabajo:

Siguiendo esta estructura del do-file, procedemos como primer paso a construir una
plantilla de trabajo.
El primer comando que utilizaremos en esta plantilla de trabajo es limpiar informacin
que podra estar utilizndose (como bases de datos, etiqueta, matrices, escalares, etc.) que
se haya trabajado previamente con el comando clear.
Con respecto a las formas de poder ejecutar los comandos, se puede hacer a travs del
icono

(execute do) ubicado en la parte superior derecha de la barra de herramientas

del archivo Do-file o presionando los teclados Ctrl+D una vez que sombremos el
comando queramos correr.

Una vez realizada esta accin, se reflejar los resultados en la ventana Result View del
Stata.

Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia una sesin
en Stata, por defecto se trabaja en la carpeta en donde se encuentra instalado el software.
Para saber cul es la ruta de trabajo activa se puede ver la parte inferior izquierda del
entorno del STATA.

Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada Bases en
el cual trabajaremos esta primera sesin. Para acceder a la nueva ruta de trabajo nos
ubicamos en la carpeta Bases y copiamos la ruta que se encuentra en la parte superior de
la ventana:

Ahora, utilizamos el comando cd para cambiarnos al nuevo directorio creado, indicando la


nueva ruta entre comillas.

3. Cargar Bases de Datos


Existen diferentes de poder emplear una bases de datos en Stata y en la presente seccin
explicaremos cada una de estas formas.
3.1.

Cargando una base de datos del Stata

STATA cuenta con bases de datos dentro de su sistema como ejemplos aplicativos, para
cargarlos se utiliza el comando sysuse. Un ejemplo, es cargar la base de datos auto.dta,
donde cabe resaltar que todas las bases de datos en formato del Stata se guardan con la
versin .dta.

En la parte inferior izquierda del entorno del STATA se apreciar las variables que
contiene la base de datos auto.dta.

3.2.

Creando manualmente una base de datos en Stata

La manera de editar manualmente una base de datos a travs del dofile es a travs del
comando input.
Para realizar esta accin, hay que limpiar la base de datos utilizada en la anterior seccin
de la siguiente manera. Luego, usamos el comando input, seguido del nombre de las
variables y a partir de la siguiente lnea de comando se comienza a digitar los datos,
finalmente se debe terminar con la palabra end.

3.3.

Convirtiendo bases de datos

STATA cuenta con una herramienta que permite convertir base de datos de SPSS, Matlab,
Gauss, SAS, Excel, etc. al formato *.dta a travs del software STAT/TRANSFER.

Para acceder a este software basta con hacerle clic y posteriormente nos saldr una
ventana de dialogo solicitndonos la siguiente informacin:

Input File Type: Indicamos el tipo de archivo en la cual se encuentra nuestra base
de datos original.

File Specification: Indicamos la ruta donde se encuentra nuestra base de datos


original haciendo uso del botn Browse.

Output File Type: Indicamos el tipo de archivo al cual deseamos que la base de
datos se convierta.

File Specification: Indicamos la ruta donde queremos colocar la base de datos


convertida haciendo uso del botn Browse.

Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de Hogares
(ENAHO) en formato de SPSS llamada Enaho01-2014-100.savque se encuentra en nuestra
carpeta de trabajo, el cual queremos convertirlo a un archivo de base de datos del STATA
con el mismo nombre y que se guarde en la misma carpeta de trabajo.
Para desarrollar esta aplicacin realizamos los siguientes pasos:
a. Abrimos la ventana de dilogo del STAT/TRANSFER.
b. En la seccin Input File Type hacemos clic a la barra desplegable y elegimos el
formato SPSS Data File ya que se debe un archivo de base de datos del SPSS.

c. En la seccin File Specification hacemos clic en el botn Browse para definir la


ruta donde se encuentra nuestra base original.

d. En la seccin Output File Type hacemos clic a la barra desplegable y elegimos el


formato Stata Version 4-5 la cual es el formato de la base de datos que queremos
obtener.

e. En la seccin File Specification hacemos clic en el botn Browse para definir la


ruta donde queremos que se guarde nuestra base convertida. Aunque por defecto
se ubica en la misma carpeta donde se ubica la base de datos convertida.

4. Guardar una Bases de Datos


Parta guardar una base de datos que fue modificada se puede hacer usando con el
comando save. No obstante, para las versin actuales de Stata 12 y 13 se sugiere usar el
comando soveold, para que las bases de datos pueda ser reconocido por versiones del
Stata anteriores a los mencionados.

Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las opciones del
comando, en este caso es replace lo que significa que si se vuelve a ejecutar esta sintaxis el
Stata guardar la base de datos nuevamente de la que ya existe.

CAPTULO II. GESTIN DE BASE DE DATOS


1. Inspeccin de la base de datos
En esta seccin aprenderemos comandos que nos permitan dar una revisada a la base de
datos, es decir, saber con qu esquema de datos y tipos de variables estamos trabajando.
Para ello, vamos a trabajar con una Encuesta de Hogares (ENAHO) del ao 2013, el
mdulo de esta encuesta ser las Caractersticas de las viviendas encuestadas.
Previamente establecemos nuestra ruta de trabajo y luego cargamos la base de datos con el
comando use.

Usualmente despus de abrir una base de datos, recurrimos a la siguiente rutina de


inspeccin de una base de datos:

Observar la base de a travs del comando browse, el cual nos permite ver la base de
datos sin poder modificarla. En cambio, existe otro comando denominado edit que
nos permite ver la base de datos pudiendo modificarlo.

Descripcin de la base de datos con el comando describe.

Generando un diccionario de variables con el comando codebook.

Realizar un cuadro estadstico resumen de diferentes variables numricas con el


comando summarize.

2. Generacin y transformacin de variables


Una primera forma de generar variables es utilizando el comando generate, que
usualmente trabaja conjuntamente con el comando replace. Este comando nos permite
generar variables haciendo uso de expresiones matemticas, lgicas, numricas.
Si bien es cierto que STATA solamente reconoce los comandos con letras minsculas,
tambin es importante decir que hace diferenciacin de los nombres de las variables entre
si son minsculas o maysculas.
Por ejemplo, a partir de la base de datos se quiere saber el nmero de hogares que tienen
internet, esta informacin se encuentra en la pregunta p1141. Para ello, creamos una
variable dictoma denominada internet donde toma el valor de 0 si el hogar no tiene
internet y 1 cuando si tiene internet.

A esta nueva variable se puede introducir etiquetas para una mejor descripcin. Si
queremos colocar una etiqueta al nombre de la variable utilizamos el comando label
variable, y si se quiere etiquetar los valores de la variable primero se debe definir una
etiqueta con label define y luego se utiliza el comando label value para utilizar la etiqueta
creada en los valores de la variable, tal y como se muestra a continuacin:

Una vez creada la variable internet se puede hacer una tabla simple de frecuencia con el
comando tabulate para saber cuntos hogares tienen internet. En este caso, de un total de
39 767 hogares entrevistadas, el 15,84% tienen internet.

Otra forma de generar variables es empleando en comando egen. Este comando es una
extensin del anterior, que permite utilizar expresiones que incluyan funciones ms
complejas del STATA, como es el caso de: medias, mximos, mnimos, desviacin
estndar, promedios mviles, variables estandarizadas, etc.
A manera de ejemplo se puede calcular una variable que capture el valor promedio,
mximo y mnimo del pago de alquiler de una vivienda (p106).

Tambin se puede generar variables a partir de la recodificacin de otras variables con el


comando recode, el cual permite modificar los valores especficos de una variable. A
manera de ejemplo se puede crear una variable de regiones naturales del pas (costa, sierra
y selva) a partir del dominio geogrfico (dominio). Para ello se suele recomendar realizar
una revisin de las etiquetas de la variable a recodificar con el comando label list.

A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el fin de
luego formas los grupos de recodificacin de la siguiente manera:

3. Transformacin de bases de datos


Hay ocasiones en que la base de datos puede requerirse para colapsarlo de tal forma que
cada grupo de individuos est representada por una observacin en particular, ya sea por
el promedio, la mediana, desviacin estndar, mximo, mnimo, la suma, etc., de alguna
variable en particular. Para hacer esta operacin recurrimos al comando collapse.
A manera de ilustracin cargamos una nueva base de datos denominada kids.dta que
tiene informacin de nios correspondiente a un cdigo de familia que pertenece, su
nombre, orden de nacimiento, endad, peso y sexo.

A partir de esta pequea base se requiere tener informacin a nivel de familia, donde se
registre el promedio de aos de edad de los nios, el peso mximo, y el nmero de nios
hombres. As, que la lnea de sintaxis sera el siguiente:

Por otro lado, cuando se trabaje con bases de datos de forma panel (un grupo de
individuos que se recogen informacin en un periodo de tiempo), esta puede tener dos
formas: larga y ancha. El comando reshape nos permite transponer una base de datos
panel de forma larga (long) a una de forma ancha (wide) y viceversa. Como se muestra a
continuacin:

Por ejemplo, cargamos otra base de datos llamada ingfam.dta, que contiene informacin
sobre el ingreso de 3 individuos en tres aos (1996, 1997 y 1998).

Como se observar, esta base tiene formato wide, y lo que se quiere en transponerlo a
formato long. Para ello, hay que identificar bien dos cosas: la parte del nombre de la
variable que se repite y que a su vez sirve como una semilla (ingfam), y la variable que
identifique al individuo que se colocar en la opcin i(codfam), por ltimo se coloca un
nuevo nombre a la variable temporal j(tiempo).

Si se quiere volver al formato anterior, es decir, de long a wide, se debe ejecutar lo


siguiente:

4. Fusin de bases de datos


Es comn la combinacin de varias bases de datos. Se va a mostrar dos operaciones
bsicas: aadir observaciones y aadir variables.
En el primer caso, se utiliza el comando append para fusionar bases de datos de manera
vertical. Aqu ser necesario una base activa o cargada (base master) y una inactiva que se
va a aadir a la base master (base using), adems la base originada tendrs una forma long.

Para ello, abrimos una nueva base de datos denominada base1.dta el cual estar activa y
ser nuestra base master. Adems, en nuestra carpeta de trabajo existe otra base llamada
base2.dtael cual estar inactiva (base using) y ser aadida a la primera base. Ambas
bases de datos contiene informacin de las notas de alumnos (en la primera base existe 3
alumnos y en la segunda existen 4 alumnos) en los cursos de micro, macro y economa,
adems de su sexo el turno horario.

Para fusionar ambas bases de datos e utiliza la siguiente lnea de sintaxis:

En el segundo tipo de fusin para aadir variables, se utiliza el merge para fusionar bases
de datos de manera vertical. De la misma manera que en el primer caso, tambin existir
una base master y una base using.
Para este ejemplo, se usaran dos bases de datos que ya fueron fusionados de manera
vertical base12.dta y base34.dta, el primero ser la base using y la segunda la base
master. Ambas bases contienen informacin de alumnos, por lo cual ser un fusin de
individuo contra individuo (1:1).

Como se puede observar en la fusin, automticamente se crea una variable denominada


_merge el cual toma valores dependiendo si el registro de los datos est presente en una
de las bases o en ambos. Cuando el valor de la variable _merge es 1 quiere decir que el
dato solo aparece en la base master, 2 cuando aparece en la base using y 3 cuando aparece
en ambos. Usualmente, despus de cada fusin se suele eliminar esta variable con el
comando drop.

CAPTULO III. GRFICOS EN STATA


1. Introduccin al Stata Graph
Stata presenta una amplia variedad de grficos, la cual abarca figuras como: matrices de
ploteos, histogramas, reas, lneas, caja y bigote, etc. Comenzaremos demostrando siete
tipos de grficos:

histogram: Histogramas

graph twoway: Scatterplot, lneas, y otros entre dos variables.

graph matrix: Matrices de Scatterplots.

graph box: Grficas de caja y bigotes.

graph bar: Grficas de barras

graph pie: Grficas de pastel o pie.

Para cada uno de estos grficos existen muchas opciones1.


2. Tipos de grficos
Los comandos del Stata Graph empiezan con la palabra graph (aunque en algunos casos
esto es opcional) seguido por la palabra que indica el tipo de grfico.
A continuacin describiremos los diferentes tipos de grficos que se puede elaborar en el
ambiente del Stata.
2.1.

Histograma

La funcin de densidad de una variable puede ser estimada usando un histograma a


travs del comando histogram. Para ilustrar este comando, utilizaremos la base de la
Encuesta Permanente de Empleo (EPE) correspondiente al trimestre mvil Enero-FebreroMarzo del ao 2014, la cual contiene informacin referente a la situacin de empleo que
tiene un individuo en el mercado laboral.
En esta base se tiene informacin de los ingresos laborales totales de los trabajadores al
mes (ingtot), el cual se quiere obtener su grfico de frecuencias del logaritmo natural de

Para observa otras tipos de grficos y comandos relacionados a estos, se recomienda escribir en la venta de comandos help
graph other.

estos ingresos con el fin de reducir la varianza. Adems, comparamos con la distribucin
para observar si se guardan caractersticas similares, tal y como se muestra

.2

.4

Density

.6

.8

continuacin:

2.2.

6
lningtot

10

Dispersin de puntos (Scatter Plot)

Los diagramas de dispersin de puntos (scatter plot) se accede a travs del comando graph
twoway scatter. Por ejemplo, queremos ver la relacin que guardan el ingreso laboral total

6
4
2

lningtot

10

(en logaritmos) con la edad (p108).

20

40
60
edad ( en aos )

80

100

No obstante, se puede ajustar un lnea recta (lfit) a este grfico, y al mismo tiempo ajustar
por una relacin cuadrtica (qfit), para ver si existe rendimientos decrecientes en los

10

ingresos laborales.

20

40
60
edad ( en aos )
lningtot
Fitted values

2.3.

80

100

Fitted values

Mltiple dispersin de puntos

El comando graph matrix nos muestra un til anlisis multivariado. Este comando otorga
una grfica compacta de la relacin entre un nmero de variables por pareja,
permitindole al analista observar los signos de no linealidad, outliers o cluester que
puedan afectar al modelamiento estadstico. Este tipo de grfico tambin es til si se
quiere observar la influencia de una lista de variables explicativas a una variable
dependiente.
Por ejemplo, si se quiere ver grficamente la relacin de un conjunto de factores que
pueden influir en los ingresos laborales de la persona, como es el caso de la edad (p108),
las horas de trabajo (p209t) y el nivel educativo (p109b), se puede ealizar de la siguiente
manera:

50

100

10
10

lningtot

5
0

100

edad (
en aos
)

50

0
100

total de
horas
trabajadas

50
0

10

aos de
estudios

0
0

2.4.

10

50

100

Caja y bigote

La grfica de caja y bigote brinda informacin acerca del centro, amplitud, simetra y
outliers con solo un vistazo. Para obtener este grfico, se debe empelar el comando graph
box.
Si seguimos analizando la distribucin de los ingresos laborales con un grfico de caja y

6
4
2

lningtot

10

bigotes se programara la siguiente lnea de comando.

Si se quiere el mismo grfico pero de manera horizontal, se debera usar el comando graph
hbox.

2.5.

6
lningtot

10

Pie

Este estilo es muy popular en las presentaciones de grficas, siempre y cuando tengan
pocos valores para trabajar. El comando bsico del grfico de pastel es graph pie.
Si se quiere saber la distribucin de las personas por nivel educativo (p109a) que fue
recodificada a una menor cantidad de niveles (sin nivel, primaria, secundaria, superior)
que lleva como nuevo nombre niveduc, se puede obtener utilizando el comando
mencionado con la opcin over() para que los pedazos del pie lo conformen los cuatro
niveles educativos:

Sin nivel
Secundaria

2.6.

Primaria
Superior

Barras

El grfico de barras provee una simple y verstil exhibicin conjunto de resmenes


estadsticos como media, mediana, suma o conteo. Para obtener barras verticales se debe
utilizar el comando graph bar.
Por ejemplo, si se desea comparar en un grfico de barras el valor de la media y la
mediana del ingreso laboral, se debera especificar los estadsticos a utilizar, en este caso
(mean) y (median). Adems, si se quiere mostrar los valores de estos estadsticos se debe

1,500

colocar la opcin blabel(bar).

1440.19

500

1,000

1083

mean of ingtot

p 50 of ingtot

S que quiere las barras de manera horizontal basta con usar el comando graph hbar.

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC)


1. Especificacin y supuestos del MRLC
En los modelos de regresin lineal se requiere explicar el comportamiento de una variable
(dependiente ) a partir de otras (regresoras o explicativas ). Utilizamos el concepto de
distribucin de probabilidad condicionada, pues se busca conocer los estimadores de los
parmetros de regresin con la finalidad de estimar finalmente el ( | = ), es decir
buscamos conocer el valor esperado de Y, dado que = (la variable regresora toma un
determinado valor ).
= 0 + 1 +
La variable es la variable dependiente, las variables son las variables explicativas o
regresoras, y es la perturbacin aleatoria o comnmente llamado trmino de error. Los
son los parmetros asociados a cada una de las variables explicativas, tambin llamados
coeficientes de regresin y miden el impacto de cada variable independiente en relacin al
comportamiento de la variable endgena.
Los parmetros son no conocidos. Sin embargo, utilizando informacin muestral se
pueden obtener estimadores de los parmetros (o coeficientes).
Dado la expresin anterior, se considera que se cumplen las siguientes hiptesis clsicas
bsicas:

Linealidad en los parmetros.

No singularidad o multicolinealidad. No existen relaciones lineales entre las


variables explicativas o regresores y estos no son variables aleatorias.

Exogeneidad estricta o no endogeneidad. La esperanza del vector de la variable


aleatoria es cero: () = 0.

Errores esfricos. La matriz de varianzas y covarianzas del vector de variables


aleatorias es: () = 2 . Es decir, todos los componentes del vector tienen
varianza idntica (homoscedasticidad), y adems las covarianzas son 0, es decir, los
elementos del vector no estn correlacionados (no autocorrelacin).

Normalidad de los errores. La distribucin de probabilidad del vector de


perturbaciones aleatorias es: ~(0, 2 ), es decir, es un vector normal esfrico.
Por tanto, las perturbaciones son variables aleatorias independientes e igualmente
distribuidas, normales con media cero y varianza 2 . Dado que no es aleatoria,
la distribucin de probabilidad del vector se deriva a partir del vector de
perturbaciones ~(, 2 ).

2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO)


El mtodo de Mnimos Cuadrados Ordinarios (MCO) permite encontrar los parmetros
desconocidos del modelo, cuyo criterio es minimizar los errores al cuadrado del MRLC.
A partir de este criterio, se puede estimar el valor de los parmetros de la siguiente
manera:
= ()1
Y a su vez la matriz de varianza y covarianza, que servir para calcular los errores
estndar de los estimadores, se obtiene de la siguiente relacin:
( ) = 2 ()1
Donde el parmetro 2 se puede estimar de la siguiente manera:

( )( )
2 =
=

Siendo n el tamao de la muestra y k el nmero de parmetros.


A manera de un ejercicio aplicativo, se emplea la base del sistema del Stata auto.dta. En
esta ocasin se desea explicar el precio del auto (price) en funcin de los millages por
galn (mpg), su peso (weight) y su procedencia (foreign). Es decir:
= 0 + 1 + 2 + 3 +
El comando en Stata para estimar un MORLC por la tcnica de MCO es regress, tal y como
se muestra a continuacin:

Los resultados ms importantes de esta regresin se detallan en el cuadro de la parte


inferior, donde en la segunda columna se encuentra los coeficientes o parmetros
estimados asociado a cada variable explicativa. Y en la columna de a lado, se presenta los
errores estndar de estos estimadores el cual servirn como insumo para calcular el
estadstico t-student, y este ltimo a su vez servir para calcular la probabilidad
acumulada.
Tanto el estadstico t-student y la probabilidad son importantes para realizar las pruebas
de

significancia

individual,

para

saber

si

las

regresoras

obtenidos

influyen

significativamente o no sobre la variable dependiente. Por tanto, la hiptesis para evaluar


esta significancia individual es el siguiente:
Ho : = 0 (hiptesis nula)
Ha : 0 (hiptesis alternativa)
La regla de decisin es la siguiente:

Se acepta Ho si: t-calculado < 1.96. Si p-value > 0.05.

Se rechaza Ho si: t-calculado > 1.96. Si p-value < 0.05.

En el caso del ejemplo, se puede apreciar que para la variable mpg tiene un valor de tcalculado igual a

0.29, menor a 1.96, por lo cual se rechaza la hiptesis nula de

significancia individual. La misma conclusin se obtendra por el lado de la probabilidad


ya que esta es 0.769 mayor al umbral de 0.05.
En cuanto a la significancia conjunta del modelo, es decir, si las regresoras en conjunto
explican el comportamiento de la variable dependiente, es necesario fijarnos el cuadro
superior de lado derecho donde se encuentra el estadstico de Fisher. Para ello hay que
observar el valor de la probabilidad Prob. > F y sigue la misma regla de la significancia
individual, es decir, si es mayor a 0.05 se acepta la hiptesis nula de no significancia
individual, caso contrario se rechaza esta hiptesis nula, lo cual indicar que las variables si
explican significativamente en su conjunto. Para el caso del ejemplo, esta probabilidad es
0.0 menor al 0.05, por lo cual se rechaza la hiptesis nula, lo que significa que son
estadsticamente significativos de manera global.
Otro resultado importante es la bondad de ajuste del modelo que se mide por el
Coeficiente de Determinacin, o tambin llamado R-squared (R2). El valor de este
estadstico es 0.4996 que es igual a decir 49.96%, lo que significa que el 49.96% de la
variabilidad o varianza de Price est siendo explicada por la varianza de las variables
explicativas. Se espera que mientras ms cercano a la unidad este estadstico es mejor el
modelo.