Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guias de Laboratorio
Guias de Laboratorio
Observe que en este archivo se han registrado 474 observaciones para un total de 10
variables.
Puede solicitar un reporte de frecuencias para alguna variable de inters, como por
ejemplo Categora laboral (catlab)
2
Ejercicio 1.
Seleccione una muestra aleatoria simple de 50 empleados
Por defecto siempre estarn activos Todos los casos. Elija Muestra aleatoria de casos,
haga clik en el botn Ejemplo
3
Importante:
4
Si usted vuelve a solicitar un reporte de frecuencias para la variable catlab, observar
que ahora solo son consideradas las 50 observaciones que han sido seleccionadas.
Observacin:
5
Observe que ahora ya no se encuentran tachados los nmeros correspondientes a cada
caso. Nuevamente tenemos disponibles TODOS los casos, a pesar que la variable
filter_$ permanezca.
6
Muestreo Aleatorio Sistemtico
La aplicacin del muestreo sistemtico se har siempre sobre el mismo archivo de datos
Employee data.sav :
Ejercicio 2.
Seleccione una muestra aleatoria sistemtica de 50 empleados
N 474
K 9,48 K 9
n 50
Para lograr esto con ayuda del SPSS, se debe seguir los pasos siguientes:
7
En nuestro caso se ha seleccionado como Punto de arranque el caso 7: A = X7
8
Luego elegimos la opcin condicional para la seleccin de casos.
9
Al hacer picar en el botn S la op se mostrar la siguiente ventana, que ofrece una
serie de funciones dentro del Grupo de funciones
10
Dentro del Grupo de funciones Aritmticas podemos encontrar la funcin Mod
(Mdulo) que como seala el cuadro explicativo permite determinar el resto o residuo
de dividir una expresin numrica entre el mdulo.
11
Tenga en cuenta que:
A = 7 : es el punto de arranque
n = 50 : es el tamao de la muestra
12
Lo que se busca en la primera expresin es encontrar los registros cuya divisin con el
valor de K nos de residuo CERO. La segunda expresin busca establecer un tope hasta
donde se debe verificar estos cocientes. Dado que el valor de K, al ser redondeado al
menor entero, suele ocasionar que sobren casos para realizar ms selecciones, esta
segunda expresin evitar que se tomen ms observaciones que las establecidas para la
muestra.
Observe que:
13
Observe en el cuadro siguiente que el primer registro seleccionado corresponde al punto
de arranque A = X7 seguido del X7 + 9 = X16
Observe que los dos ltimos casos seleccionados son precisamente: X439 y X448
Ejercicio 3.
Seleccione una muestra aleatoria estratificada de 50 empleados con asignacin
proporcional a la categora laboral.
En seguida hacemos los clculos para la determinacin del tamao de muestra para cada
estrato (categora laboral)
15
Seleccionamos la variable catlab y la igualamos a 1 esto permitir seleccionar todos
los casos cuya categora laboral sea Administrativo (1).
Algo muy importante con el Resultado, ahora solicitaremos que Copie los casos
seleccionados a un nuevo conjunto de datos que llamaremos Administrativo,
obteniendo de esta manera nuestro primer estrato.
16
El resultado ser un nuevo archivo de datos que considera solo los 363 casos
correspondientes a Administrativos.
17
18
Observe que hasta aqu se ha logrado conformar el estrato que llamaremos Seguridad
que cuenta con 27 casos registrados.
19
Tenemos el estrato llamado Directivo conformado por 84 casos.
21
Ahora puede hacer uso de la tercera opcin de Resultados: Eliminar casos no
seleccionados
Es importante que est conciente que al elegir esta opcin los casos no seleccionados
sern eliminados sin posibilidad de volverles a recuperar.
22
Observe que el archivo correspondiente a la muestra seleccionada del estrato de
Administrativos cuenta con 38 casos.
SEGURIDAD
Del estrato Seguridad seleccionaremos con una muestra aleatoria simple de 3 de los 27
casos
23
DIRECTIVO
Finalmente puede unir los tres archivos en uno solo teniendo la muestra total de 50
registros
24
Solicite un reporte de frecuencias para este ltimo archivo
25
Este resultado confirma que la muestra ha sido seleccionada conforme se ha solicitado,
respetando la asignacin proporcional a la categora laboral.
26
GUA DE LABORATORIO 2
Introduccin
Media poblacional ()
Antes de iniciar el uso del programa para este tema, cabe indicar lo siguiente:
El SPSS asume siempre (ya sea para analizar uno o dos poblaciones) que las
muestras provienen de poblaciones infinitas. Es decir, no considera en sus clculos
el factor de correccin de poblaciones finitas (f.c.p.f.).
Para el caso de una media poblacional y dos medias poblacionales solo analiza el
caso cuando la varianza poblacional es desconocida. Es decir, siempre usa la
distribucin T tanto para obtener los estadsticos de prueba como los intervalos de
confianza.
Para el caso de pruebas de diferencia de medias poblacionales de muestras
independientes o muestras relacionadas solo realiza la hiptesis cuando el valor
hipottico es igual a cero.
La prueba de hiptesis para la razn de varianzas poblacionales lo realiza mediante
la prueba de Levene y no mediante la prueba F de Fisher.
El p-valor solo lo obtiene para pruebas de tipo bilateral, por lo que se debe tener
mucho cuidado si se quiere utilizar estos valores en casos unilaterales.
26
Conceptos
El p valor (o sig)
Cuando se interpretan los reportes en pruebas de hiptesis, las conclusiones estn
basadas en una regla de decisin; sta se establece tendiendo en cuenta el riesgo que
asume el investigador de cometer un error de tipo I, siendo la probabilidad de este error
el nivel de significacin . Pero en algunas ocasiones, sin embargo, la decisin a tomar
puede realizarse con un nivel de significacin diferente, con lo cual seria til conocer
que tipo de decisin se puede adoptar segn el nivel de significacin real de una prueba
basndose en los datos observados. Este concepto actuar como contrapuesto al nivel de
significacin elegido antes de realizar la prueba.
Ejemplo1
27
Los conductores metlicos o tubos huecos se usan en el cableado elctrico. En una
prueba de tubos de una pulgada, se obtuvieron los datos siguientes respecto del
dimetro exterior (en pulgadas).
1,281 1,288 1,292 1,289 1,291 1,293 1,293 1,291 1,289 1,288
1,287 1,291 1,290 1,286 1,289 1,286 1,295 1,296 1,291 1,286
a) Determine un intervalo del 90% de confianza para la media del dimetro exterior.
Solucin:
Dado que desea un intervalo al 90% de confianza se debe dar un clic en el botn
Opciones con lo cual aparecer la siguiente ventana
28
y all se debe indicar el nivel de confianza, posteriormente dar clic en Continuar para
volver a la ventana principal.
Valor de prueba = 0
90% Interv alo de
conf ianza para la
Dif erencia dif erencia
t gl Sig. (bilateral) de medias Inf erior Superior
Dimetro exterior 1647.613 19 .000 1.289600 1.28825 1.29095
Solucin:
Para probar la hiptesis de que la longitud media del dimetro exterior es de 1,29
procedemos de la misma manera que en la parte a)
29
Las hiptesis a contrastar son:
H 0 : 1,29
H1 : 1,29
= 0,05.
Procedimiento:
A pesar que nos indiquen que se utiliza un nivel de significacin de 0,05 este no es
ingresado en la ventana de Opciones como si ocurri en el intervalo de confianza.
Error tp. de la
N Media Desviacin tp. media
Como H 0 : 1,29 frente a H1 : 1,29 se trata por tanto de una prueba de hiptesis
Prueba para una muestra
de dos colas (bilateral), el estadstico de prueba toma el valor -0,511. En este caso no
Valor de prueba = 1.29
podemos rechazar la hiptesis nula, el valor p de 0,615 es mayor que el nivel de
90% Interv alo de
significacin de 0,10. conf ianza para la
Dif erencia dif erencia
t gl Sig. (bilateral) de medias Inf erior Superior
Dimetro exterior -.511 19 .615 -.000400 -.00175 .00095
30
Bajo un nivel de significacin del 10% concluimos que la longitud media del dimetro
exterior de los tubos usados en el cableado elctrico es de 1,29 pulgadas
Si el t calculado es positivo:
El sig de una prueba unilateral izquierda es 1-sig/2; y el sig de una prueba
unilateral derecha es sig/2.
H 0 : 1, 29
H1 : 1, 29
H 0 : 1, 29
H1 : 1, 29
31
Intervalo de Confianza y Prueba de Hiptesis para la diferencia de
medias poblacionales (1- 2) cuando las varianzas poblacionales son
desconocidas y las muestras provienen de poblaciones independientes.
Ejemplo 2.
Premium 35,0 34,5 31,6 32,4 34,8 31,7 35,4 35,3 36,6 36,0
Normal 40,0 29,6 32,1 35,4 34,0 34,8 34,6 34,8 32,6 32,2
34.5
32
a) Determine e interprete un intervalo del 99% de confianza para la diferencia
promedio poblacional del rendimiento de la gasolina sin plomo Premium y de la
gasolina sin plomo Normal
Solucin:
Comenzamos introduciendo los datos en el editor Vista de datos del SPSS creando
dos variables (columnas): en la primera columna se deben ingresar todos los datos
de los rendimientos de los dos tipos de gasolinas y en la segunda columna se debe
ingresar cdigos que identifiquen el tipo de gasolina:
1: gasolina sin plomo Premium (deben existir tantos 1 como repeticiones tiene el
tipo de gasolina sin plomo Premium) y
2: gasolina sin plomo normal (deben existir tantos 2 como repeticiones tiene el tipo
de gasolina sin plomo Normal)
En Variable de agrupacin se debe definir los cdigos de los grupos que se desean
comparar. Para definir los cdigos se ingresa el al botn Definir grupos y
posteriormente se da un clic en el botn Continuar:
33
Como nos piden un intervalo del 99% de confianza dar un clic al botn Opciones
para definir ah el nivel de confianza.
Estadsticos de grupo
Lmite inferior de
0,535 >0,01: No se confianza para la Lmite Superior de
rechaza la hiptesis diferencia de confianza para la
nula de varianzas medias asumiendo diferencia de
iguales varianzas iguales medias asumiendo
varianzas iguales
Podemos apreciar que el SPSS nos brinda los resultados para varianzas
desconocidas asumiendo varianzas iguales y diferentes.
Para determinar cual de los dos intervalos es el correcto debemos utilizar la Prueba
de Levene y comparar el Sig =0.535 de la Prueba de Levene con el . Como en este
caso el sig> asumimos los resultados obtenidos para varianzas homogneas
34
La interpretacin para el intervalo sera la siguiente:
H 0 : P2 N2
H 1 : P2 N2
De igual manera que para intervalos de confianza, para determinar si las varianzas
son homogneas o no, debemos hacer uso del Sig =0.535 de la Prueba de Levene y
compararlo con el .
Como en este caso el sig> asumimos los resultados obtenidos para varianzas
homogneas
H0 : P N
H1 : P N
=0,01
35
Conclusin:
Ejemplo 3.
Exportador
Ao
1 2 3 4 5 6 7 8 9 10
2006 17,5 17,2 15,8 16,2 17,4 15,8 17,7 17,6 18,3 18.0
2007 19,2 17,4 16.0 18,1 17.0 16,3 18,3 16,4 18.0 19,2
36
Solucin:
Si quiere hacer la diferencia del segundo grupo menos el primer grupo puede hacer
uso del botn
Error tp. de la
Media N Desviacin tp.
media
N Correlacin Sig.
37
Prueba de muestras relacionadas
Diferencias relacionadas
Par 1 ao1 - ao2 -,46000 ,96171 ,30412 -1,14797 ,22797 -1,513 9 ,165
H0 : D 0
H1 : D 0
=0,01
Conclusin
Por lo tanto no podemos afirmar que los niveles de exportacin han variado.
38
GUA DE LABORATORIO 3
39
ANLISIS DE VARIANZA DE UNA VA
DISEO COMPLETO AL AZAR
1) Un exceso de ozono en el aire es seal de contaminacin. Se tomaron seis muestras
de aire en cada uno de cuatro sitios industriales y se determin el contenido de
ozono. Las concentraciones de ozono (en partes por milln) se presentan en la
siguiente tabla.
Sitios
N I II III IV
1 0,08 0,15 0,13 0,05
2 0,10 0,09 0,10 0,11
3 0,09 0,11 0,15 0,07
4 0,07 0,10 0,09 0,09
5 0,09 0,08 0,09 0,11
6 0,06 0,13 0,17 0,08
Creacin del archivo
En la ventana de Vista de variables: genere las variables: ozono y sitio. Los valores de
la variable sitio deben estar codificadas de la siguiente forma:
40
a) Los datos proporcionan prueba suficiente que indiquen diferencias en el
contenido medio de ozono entre los cuatro sitios? Use 0,05 .
41
b) Verifique el supuesto de homogeneidad de varianzas. Use 0,05 .
c) A partir de los resultados de (a), use las pruebas de Duncan y DMS para probar
diferencias en los contenidos de concentraciones de ozono de los diferentes
sitios. Use 0,05 .
Para ello, en la ventana de Post hoc, seleccione las pruebas solicitadas.
42
Los resultados obtenidos se muestran a continuacin:
ANOVA de un factor
H0: Las varianzas del contenido de ozono entre los cuatro sitios son iguales
Con relacin a la pregunta (a), los datos proporcionan prueba suficiente que indiquen
diferencias en el contenido medio de ozono entre los cuatro sitios? Use =0,05.
H0: No hay diferencias en el contenido medio de ozono entre los cuatro sitios
H1: S hay diferencias en el contenido medio de ozono entre los cuatro sitios
Como sig =0.035 < 0,05 , entonces se concluye que s hay diferencias en el
contenido medio de ozono entre los cuatro sitios.
43
Pruebas post hoc
44
Seleccionamos la variable de Dependiente (Concentracin de ozono) y el Factor
(Sitio) lo ubicamos como Factor Fijo.
45
Continuamos y vamos a Guardar, en donde activaremos los Residuos
Estandarizados
46
Los resultados que se obtienen son los siguientes:
47
Pruebas post hoc
Sitio
Subconjuntos homogneos
48
Hasta aqu no se ha presentado ninguna salida que permita evaluar la
Normalidad de los Residuos, sin embargo en el archivo correspondiente a vista
de datos podemos observar que aparece una nueva columna denominada RES_1
que corresponden a los Residuos de la variable en estudio
49
Seleccionamos la variable Residuo para Concentracin de ozono y la
tomamos como variable a contrastar
50
DISEO FACTORIAL: ANOVA DE DOS VAS
Se condujo un experimento para determinar si la temperatura del fuego o la posicin en
el horno afectan la densidad de endurecimiento de un nodo de carbn. Los datos son
los siguientes:
Temperatura (C)
Posicin 800 825 850
570 1063 565
565 1080 510
1 583 1043 590
528 988 526
547 1026 538
2 521 1004 532
51
En Variable dependiente:
colocar densidad
En factores fijos:
posicin y temperatura
En modelo
52
En la primera pantalla, dar clic en Opciones y solicitar el anlisis para verificar la
homogeneidad de varianzas. Tambin solicite las estimaciones para las medias
marginales.
Para obtener las comparaciones mltiples, en la primera pantalla dar click en Post Hoc
y seleccionar DMS (en ingls LSD) y la prueba de Duncan.
53
Para estimar los residuales, siga el procedimiento siguiente:
54
yijk yij.
y ij.
Salidas
Factores inter-sujetos
Eti queta
del valor N
Temperatura 800 800 C 6
825 825 C 6
850 850 C 6
Posicin 1 Posicin 1 9
2 Posicin 2 9
55
a
Contraste de Levene sobre la igualdad de las varianzas error
1. Media global
2. Temperatura
Estimaciones
56
Comparaciones por pares
Contrastes univariados
3. Posicin
Estimaciones
57
Contrastes univariados
4. Temperatura * Posicin
Temperatura
Comparaciones mltiples
58
Subconjuntos homogneos
Densi dad
Subconjunto
Temperatura N 1 2
Duncana,b 850 C 6 543.50
800 C 6 552.33
825 C 6 1034.00
Significacin .483 1.000
Se muestran las medias para los grupos en subconjuntos homogneos.
Basado en la suma de cuadrados tipo I
El trmi no error es la Media cuadrti ca (Error) = 447.556.
a. Usa el tamao muestral de la media armnica = 6.000
b. Alfa = .05.
Grficos de perfil
Posicin
1100
Posicin 1
Posicin 2
1000
Medias marginales estimadas
900
800
700
600
500
Temperatura
Temperatura
1100
800 C
825 C
1000 850 C
Medias marginales estimadas
900
800
700
600
500
Posicin 1 Posicin 2
Posicin
59
DISEO BLOQUES COMPLETOS ALEATORIOS
60
61
Los resultados obtenidos son:
62
Pruebas post hoc
Distribucin
Subconjuntos homogneos
63
Cuadrilla
64
Subconjuntos homogneos
Grficos de perfil
65
Anlisis de Normalidad de los Residuos
66
Ejecutamos la prueba de K-S para los Residuos
67
Anlisis de Homogeneidad de varianzas para el Factor Distribucin. Observe
que en esta ocasin ya no consideramos al bloque (Cuadrilla) como un Factor
fijo.
68
Continuar y Aceptar
69
GUA DE LABORATORIO 4
70
Contenido Terico:
Prueba de Independencia
Prueba de Homogeneidad
Prueba de Bondad de ajuste
Introduccin
Una de las mayores utilidades de la distribucin Ji-Cuadrado est en que permite
comparar frecuencias observadas (frecuencias obtenidas en un experimento o
muestreo) con frecuencias esperadas segn un modelo supuesto (hiptesis nula).
Esta caracterstica de la distribucin Ji-cuadrado permite efectuar las siguientes
pruebas:
Prueba de independencia.
Prueba de homogeneidad de subpoblaciones.
Pruebas de bondad de ajuste a una distribucin de probabilidades.
La metodologa en cada uno de los tres casos es muy similar. La diferencia principal
est en la forma en que se calculan las frecuencias esperadas, ya que estas
dependern de la hiptesis nula en cuestin.
Frecuencias observadas
Departamento Valor del vale
$10 $50 $100+
Electrodomsticos 22 26 54
Ropa 33 31 22
Herramientas 41 43 19
Pruebe si el valor del vale se relaciona con lo que el cliente compra. Use = 0,05.
71
2 Ponderar los casos.
72
3 Finalmente correr el programa para tablas de contingencia.
Para obtener las frecuencias esperadas y los porcentajes fila, columna y total,
ingresar a Casillas y marcar lo que se necesite analizar:
73
Ho: Existe independencia entre variables (departamento y valor del vale)
Por lo tanto, con un nivel de significacin del 5% no podemos afirmar que exista
independencia entre las variables sujetas a evaluacin.
74
Luego, en la opcin: estadsticos marcar chi-cuadrado
75
Los resultados que se obtienen se muestran a continuacin:
Por lo tanto, con un nivel de significacin del 5% podemos afirmar que existe
independencia entre las variables sujetas a evaluacin.
76
NOTA: Cabe recordar que la prueba chi-cuadrado propone como condicin que las
frecuencias esperadas sean mayores que 5. En el ltimo reporte del SPSS se indica que
el 48% de las casillas tienen frecuencia esperada inferior a 5 por lo que ser necesario
juntar columnas (en este caso).
SPSS nos permite realizar pruebas de bondad de ajuste. Es decir, contrastar si las
frecuencias observadas en cada una de las clases de una variable categrica varan de
forma significativa de las frecuencias que se esperara encontrar si la muestra hubiese
sido extrada de una poblacin con una determinada distribucin de frecuencias.
Debe recordarse que la suma de los valores observados en la muestra debe ser igual a la
suma de valores esperados.
77
Seleccionaremos la variable NIVEDUC (Nivel educativo) para determinar, inicialmente
si el porcentaje de personas para cada categora de nivel educativo es el mismo.
La opcin que aparece marcada por defecto en Rango esperado, es decir obtener de
los datos, implica que cada valor de la variable ser considerado una categora.
La opcin que aparece marcada por defecto en Valores esperados, es decir todas las
categoras iguales, implica que la distribucin de probabilidades es uniforme para
todas las categoras consideradas (para nuestro ejemplo 296 datos entre 5 categoras).
78
Ho: La distribucin de nivel educativo es la misma para las 5 categoras
79
Asumamos que lo que se propone como hiptesis estipula que el porcentaje de la
categora Primaria es 20%, Secundaria 50%, Preparatoria10%, Universidad 15%,
Especializacin 5%.
80
A la vista de los resultados el Valor-P = 0.000 es menor que nuestro nivel de
significacin 5% por lo que se rechaza la hiptesis nula.
81
GUA DE LABORATORIO 5
82
Contenido Terico:
Matriz de correlaciones.
Regresin lineal simple.
Regresin curvilineal.
Introduccin
En el anlisis estadstico se tienen mtodos que nos permiten determinar si dos o ms
variables se relacionan. La relacin entre variables nos permite disponer de los
elementos suficientes para, en base a una muestra de pares de datos de las variables,
realizar estimaciones de las proyecciones para uno o ms datos de una de las variables
involucradas.
Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en las
que una compaa opera. Dicha compaa se dedica a la venta de repuestos para
automviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero de
distribuidoras establecidas en cada regin y el nmero de automviles vendidos para
cada regin.
83
MATRIZ DE CORRELACIONES
El primer paso que daremos consiste en revisar si existe correlacin entre las variables
de esta base de datos, con este fin realizaremos la matriz de correlaciones. Analizando
esta matriz se podr determinar cul de las variables independientes: Regin, N de
distribuidoras o N de autos vendidos, est ms correlacionada con la variable
dependiente Ventas.
Arrastra y suelta las variables en el
panel en blanco Variables.
84
Clic en aceptar.
85
Analizar >> Regresin >> Lineal, se mostrar el siguiente cuadro de dilogo:
Arrastre la Variable
Ventas a la casilla de
Dependientes.
Arrastre la variable
Nro_distrb a la casilla de
Independiente.
Clic en Aceptar.
86
Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos
valores representativos para la validacin de dicho modelo.
Resultados obtenidos:
ANOVAb
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 1033.836 1 1033.836 10.827 .009a
Residual 859.393 9 95.488
Total 1893.229 10
a. Variables predictoras: (Constante), Nro distribuidoras
b. Variable dependient e: Ventas (mills $)
Coeficientesa
Coef icientes
Coef icientes no estandarizad
estandarizados os
Modelo B Error tp. Beta t Sig.
1 (Constante) 10.881 6.409 1.698 .124
Nro distribuidoras .012 .004 .739 3.290 .009
a. Variable dependiente: Ventas (mills $)
87
El modelo estimado para el presente caso ser:
Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de
verificacin global.
Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de
dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable
dependiente e independiente.
88
En este cuadro dialogo se
elige Dispersin simple.
89
REGRESIN NO LINEAL / CURVILINEAL
Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar
cul de ellos es el mejor. Los datos se muestran a continuacin:
Arrastre la variable
Salario a Dependientes
Arrastre la variable
Experiencia a
Independientes
Verifique que este
activados los Modelos
de regresin.
Aceptar
90
Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Para
desarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisis
de varianza de los modelos: Lineal, Cuadrtico, Potencia y Exponencial.
Se puede apreciar que los Valores P (Sig) son inferiores a = 0.05, por tanto en todos
los casos existe correlacin.
Para decidir realizamos nuevamente el anlisis con los modelos con mayor eficiencia
(mayor R2)
91
Logartmica
ANOVA
Total 1939,178 19
Coeficientes
En este caso el valor P para el coeficiente de la variable independiente (aos de experiencia) es menor que
= 0.05, por tanto se puede decir que es significativa para el modelo.
92
Cuadrtico
ANOVA
Total 1939,178 19
Coeficientes
En este caso el valor P para los coeficientes de la variable independiente (aos de experiencia) son
menores que = 0.05, por tanto se puede decir que son significativas para el modelo.
93
Cbico
ANOVA
Total 1939,178 19
Coeficientes
En este caso el valor P para los coeficientes de grado 2 y 3 de la variable independiente (aos de
experiencia) son mayores que = 0.05, por tanto se puede decir que no son significativas para el modelo.
94
Entonces para la relacin Experiencia Salario el modelo que mejor se ajusta es el
cuadrtico con una eficiencia de 0.876 (R2).
95
GUA DE LABORATORIO 6
96
Contenido:
Correlacin entre las variables del modelo.
Anlisis de Multicolinealidad
Mtodo de seleccin de variables: Hacia delante.
Modelo final.
Supuestos: Normalidad de los errores y homocedasticidad.
97
Se considera las variables independientes: Nivel de endeudamiento de la empresa emisora
(D), Dividendo, nmero de acciones en circulacin
Para determinar la tabla de correlacin entre las variables involucradas en el modelo realizamos
lo siguiente:
98
Aqu seleccionamos las variables de inters, para obtener el siguiente resultado:
Correlaciones
Nivel de Nmero de
Precio de
endeudamient Dividendo (X2) acciones en
una accin
o (X1) (x100 (US$) circulacin
(Y) (US$)
US$) (X3) (miles)
Correlacin de ** ** **
1 ,995 ,985 ,991
Precio de una Pearson
accin (Y) Sig. (bilateral) ,000 ,000 ,000
(US$)
N 10 10 10 10
Correlacin de ** ** **
Nivel de ,995 1 ,965 ,991
Pearson
endeudamien
to (X1) (x100 Sig. (bilateral) ,000 ,000 ,000
US$) N 10 10 10 10
Correlacin de ** ** **
,985 ,965 1 ,975
Pearson
Dividendo
(X2) (US$) Sig. (bilateral) ,000 ,000 ,000
N 10 10 10 10
Correlacin de ** ** **
Nmero de ,991 ,991 ,975 1
Pearson
acciones en
circulacin Sig. (bilateral) ,000 ,000 ,000
(X3) (miles) N 10 10 10 10
**. La correlacin es significativa al nivel 0,01 (bilateral).
Podemos observar que existe una alta correlacin entre la variable dependiente (precio
de una accin) y independientes, pero tambin la correlacin es alta entre las variables
independientes.
99
Traslade la variable
Precio de una Accin
(P) a la casilla de
Dependientes.
Traslade las
variables restantes a la
casilla de
Independientes.
Aceptar
a
ANOVA
Total 1686,359 9
100
En forma conjunta las variables son significativas para el modelo, considerando un nivel
de significacin del 5% (P-Valor = 0,000). Las hiptesis que se proponen son las
siguientes:
H0 : i = 0
H1 : i 0
Coeficientes no Coeficientes
estandarizados tipificados
Modelo t Sig.
B Error tp. Beta
Nivel de endeudamiento
3,371 ,294 ,771 11,452 ,000
(X1) (x100 US$)
1
Dividendo (X2) (US$) 10,727 1,022 ,422 10,493 ,000
Nmero de acciones en
-,097 ,042 -,185 -2,297 ,061
circulacin (X3) (miles)
101
Procedimiento:
En el cuadro
dialogo slo se debe
elegir Adelante en
Mtodo.
Aceptar
a
ANOVA
Total 1686,359 9
c
Regresin 1684,879 2 842,440 3985,359 ,000
Total 1686,359 9
102
a
Coeficientes
Modelo Coeficientes no Coeficientes t Sig.
estandarizados tipificados
B Error tp. Beta
a
Variables excluidas
Modelo Beta dentro t Sig. Correlacin Estadsticos de
parcial colinealidad
Tolerancia
b
Dividendo (X2) (US$) ,371 8,706 ,000 ,957 ,069
b
1 Nmero de acciones en ,279 1,020 ,342 ,360 ,017
circulacin (X3) (miles)
c
Nmero de acciones en -,185 -2,297 ,061 -,684 ,012
2
circulacin (X3) (miles)
a. Variable dependiente: Precio de una accin (Y) (US$)
b. Variables predictoras en el modelo: (Constante), Nivel de endeudamiento (X1) (x100 US$)
c. Variables predictoras en el modelo: (Constante), Nivel de endeudamiento (X1) (x100 US$), Dividendo (X2) (US$)
Modelo final.
Luego, el programa nos entrega el mejor modelo. En este caso las variables de
prediccin seleccionadas son Nivel de endeudamiento (X1) y Dividendos(X2), observe
que X1 y X3 no deberan de estar juntos en el modelo. Aqu se descart la variable X3.
103
Resumen del modelo
b
ANOVA
Suma de
Modelo cuadrados gl Media cuadrtica F Sig.
a
1 Regresin 1684,879 2 842,440 3985,359 ,000
Total 1686,359 9
a
Coeficientes
Coeficientes no Coeficientes
estandarizados tipificados
t Sig.
Interpretacin: b0: No tiene sentido b1: Para un dividendo constante, por cada $100
adicionales en el Nivel de endeudamiento, el Precio de una accin aumenta en $2,785.
b2: Para un Nivel de endeudamiento constante, por cada dlar adicional en los
dividendos, el Precio de una accin aumenta en $9,437.
104
Supuestos de la regresin lineal mltiple
El modelo de regresin lineal mltiple tiene como supuestos la normalidad de los
errores y la homocedasticidad (igualdad de varianzas a lo largo de la distribucin). Una
forma de diagnostico de estos supuestos se realiza mediante la observacin de la nube
de puntos de la relacion entre los valores predichos (pronosticados) y los errores. La
grfica debe realizarse colocando en el eje Y (eje vertical) los valores de los errores y en
el eje X (eje horizontal) los valores predichos, se espera que los puntos se distribuyan
alrededor del valor de error 0. Si los errores estn ms distribuidos en la zona superior
(errores mayores que cero) o en la zona inferior (errores menores que cero) es seal de
falta de normalidad de los errores. Si la distribucin de los errores tiene forma de
embudo es indicativo de heterocidad y si los errores tienen forma curva indican falta de
linealidad. Otra forma de verificar la normalidad de los errores es la siguiente:
Supuesto de normalidad.
Otro supuesto del modelo es la
normalidad que presentan los
errores. Para verificar este supuesto
podemos realizar el grfico de
probabilidad normal.
105
El siguiente paso es ingresar a la opcin grficos y marcar la opcin de grfico de
probabilidad normal.
106
Supuesto de homocedasticidad
Analizar/Regresin/lineales en grficos , se selecciona y se transfiere al eje Y la
variable ZRESISD , se selecciona y se transfiere al eje X la variable ZPRED ,
Continuar/ Aceptar.
107