Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Son datos de sección cruzada importados del fichero Salarios.xlsx en gretl. Número
total de observaciones en la muestra N=49 empleados de una empresa.
ArchivoGuardar datos Salarios.gdt (formato gretl tiene la extensión gdt)
Datos guardados en el fichero gretl Salarios.gdt en el directorio elegido.
2. Tipo de variables: Cuantitativas: Continua S, Discretas ED, EX, ED. Cualitativa: G con
dos categorías (Hombre, Mujer)
3. Variables ficticias para la variable G:
DHi = 1 si el empleado i-ésimo es hombre, 0 en otro caso
DMi = 1 si el empleado i-ésimo es mujer, 0 en otro caso
Se generan en gretl seleccionando la variable G y en el botón derecho (Hacer variables
ficticias) o en el menú Añadir Variables ficticias para la variable discreta
En este caso hemos codificado o generado tantas variables ficticias como categorías.
PARTE B. ANÁLISIS DESCRIPTIVO
1. Completa la siguiente tabla: 1
1
En castellano, los millares se escriben con un punto (1.000, 2.000, etc.), mientras que en inglés se escriben con una
coma (1,000, 2,000, etc.). En el caso de los decimales, pasa justo lo contrario. En castellano se escriben con una coma
(1,5, 3,2, etc.); sin embargo, en inglés es al revés: se escriben con un punto (1.5, 3.2, etc.). Hay que tener en cuenta
que gretl muestra los resultados haciendo uso de la forma inglesa. En la tabla está en la forma en castellano.
D. T. denota la desviación típica de las observaciones de la variable en la muestra. Y se
calcula como sigue, por ejemplo, la correspondiente al Salario (S):
∑𝑵𝑵 � 𝟐𝟐
𝟏𝟏 (𝑺𝑺𝒊𝒊 − 𝑺𝑺) 𝟏𝟏
D.T.(S) = � donde 𝑺𝑺� = ∑𝑵𝑵
𝟏𝟏 𝑺𝑺𝒊𝒊 es la media muestral
𝑵𝑵−𝟏𝟏 𝑵𝑵
2. Para calcular la media del salario para el grupo de mujeres en la muestra, en el menú
de la ventana principal
Muestra Restringir a partir de criterio Utilizar una variable ficticia DM
Gretl nos avisa que ha quitado 23 observaciones (empleados hombres) y nos quedamos
con la submuestra de mujeres (26). Ahora con el botón derecho sobre la variable S
elegimos Estadísticos principales:
Estadísticos principales, usando las observaciones 1 - 26
para la variable S (26 observaciones válidas)
Media Mediana Mínimo Máximo
2086.9 1882.5 981.00 3833.0
Gretl nos avisa que ha quitado 26 observaciones (empleados mujeres) y nos quedamos
con la submuestra de mujeres (23). Con el botón derecho sobre la variable S elegimos
Estadísticos principales:
Estadísticos principales, usando las observaciones 1 - 23
para la variable S (23 observaciones válidas)
Media Mediana Mínimo Máximo
1518.7 1345.0 1144.0 2365.0
S ED EX
1.0000 0.4118 0.2620 S
1.0000 -0.2738 ED
1.0000 EX
3500
3000
2500
S
2000
1500
1000
500
5 10 15 20
EX
Para el salario (S) y los años de educación (ED)
4000
3500
3000
2500
S
2000
1500
1000
500
10 12 14 16 18
ED
A la vista de los gráficos parece existir una relación lineal positiva entre S y EX, y entre S
y ED dado que en ambos casos los puntos parecen disponerse alrededor de una recta
con pendiente positiva.
5. Utilizando los gráficos de dispersión y los coeficientes de correlación entre:
En cuanto a la relación del salario con el género, utilizando la información de las medias
muestrales de cada grupo (hombres y mujeres), en media las mujeres tienen un salario
mayor que los hombres en esta muestra.
PARTE C. MODELOS DE REGRESIÓN LINEAL
Especificación de tres modelos de regresión lineal. En todos los casos se ha incluido
como regresor un término independiente o variable constante que toma el valor 1 para
todo i= 1, .., N que es la que acompaña al parámetro β1 .
Modelo 1 Salario en función de la experiencia del empleado como único factor
explicativo
𝑆𝑆𝑖𝑖 = 𝛽𝛽1 + 𝛽𝛽2 𝐸𝐸𝑋𝑋𝑖𝑖 + 𝑢𝑢𝑖𝑖 𝑖𝑖 = 1, … , 𝑁𝑁 (1)
Para incorporar la variable cualitativa sexo del empelado se ha incluido como regresor
la variable ficticia DMi = 1 si el empleado i es mujer, 0 en otro caso. Por lo tanto, como
grupo de referencia se ha considerado a la categoría Hombre. Los coeficientes o
parámetros poblacionales 𝛽𝛽1 , 𝛽𝛽 2 y 𝛽𝛽3 son valores numéricos desconocidos. El término
de perturbación 𝑢𝑢𝑖𝑖 es una variable aleatoria no observable que recoge todo lo que
puede influir en el salario de un empleado dada su experiencia y su sexo que no viene
recogido por la parte explicativa del modelo 𝛽𝛽1 + 𝛽𝛽2 𝐸𝐸𝑋𝑋𝑖𝑖 + 𝛽𝛽3 𝐷𝐷𝑀𝑀𝑖𝑖 en función de la
experiencia y del sexo.
Otra posibilidad es incluir en lugar de la variable ficticia DM, la variable ficticia DH.
𝑆𝑆𝑖𝑖 = 𝛽𝛽1 + 𝛽𝛽2 𝐸𝐸𝑋𝑋𝑖𝑖 + 𝛽𝛽3 𝐷𝐷𝐻𝐻𝑖𝑖 + 𝑢𝑢𝑖𝑖 𝑖𝑖 = 1, … , 𝑁𝑁 (3B)
Por lo tanto, en este caso se ha considerado a la categoría Mujer como grupo de
referencia. Los coeficientes o parámetros poblacionales son 𝛽𝛽1 , 𝛽𝛽2 y 𝛽𝛽3, valores
numéricos desconocidos y que, como veremos 𝛽𝛽1 y 𝛽𝛽3tendrán una interpretación
diferente a los de la especificación (3A), aunque ambos modelos son equivalentes. Se
puede utilizar cualquiera de las dos especificaciones. El término de perturbación 𝑢𝑢𝑖𝑖 es
una variable aleatoria no observable que recoge, al igual que en la especificación (3A)
todo lo que puede influir en el salario de un empleado dado su género que no viene
recogido por la parte explicativa del modelo 𝛽𝛽1 + 𝛽𝛽2 𝐸𝐸𝑋𝑋𝑖𝑖 + 𝛽𝛽3 𝐷𝐷𝐻𝐻𝑖𝑖 en función de la
experiencia y del sexo.