Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso Basico de Analisis Estadistico en Spss
Curso Basico de Analisis Estadistico en Spss
ESTADSTICO EN SPSS.
EL PROGRAMA
ESTADSTICO SPSS
1.
1.1
INTRODUCCIN
1.2
ARCHIVO A travs de este men se realizan las operaciones de abrir, crear o grabar
ficheros, que pueden ser de datos, instrucciones, resultados o procesos. Tambin se
controlan las tares de impresin
EDICIN
Se realizan las tareas habituales de edicin de texto, disponibles en la
mayor parte de los programas del entorno Windows: modificar, borrar, copiar, pegar,
seleccionar, buscar, etctera.
DATOS
Permite definir variables y fechas, modificar los ficheros de datos
activos, segmentar archivos, seleccionar y ponderar casos, etc... Las funciones de este
men son temporales y slo permanecen activas mientras dure la sesin.
UTILIDADES
Incluye diferentes opciones para visualizar el contenido de los
ficheros de datos y crear subconjuntos de variables.
VENTANA Desde esta opcin podemos controlar la ventana que queremos tener
activa (ver apartado 1.3).
AYUDA
El programa permite acceder al manual de ayuda a travs de un completo
men de opciones:
1.3
El SPSS dispone de ocho tipos de ventanas desde las cuales se pueden efectuar
diversas operaciones.
Ventana del editor de datos. En esta ventana estn los datos del fichero con
el que se est trabajando. Slo puede haber un conjunto de datos activo (un
solo fichero). Los ficheros de datos en SPSS se nombran: *.sav
Ventana del visor de resultados. En esta ventana se guardan los diferentes
resultados que generamos: salidas de los diferentes procedimientos, listados,
subprogramas, mensajes de error, grficos, etctera. Una ventana de este tipo
se abre automticamente cuando se genera el primer resultado de la sesin.
Se pueden tener tantas ventanas abiertas como se quiera. Los ficheros de
resultados en SPSS se nombran: *.spo
Algunas posibilidades del SPSS slo son accesibles a travs del lenguaje
de comandos.
ESTADSTICA
DESCRIPTIVA
10
2. ESTADSTICA DESCRIPTIVA
2.1. INTRODUCCIN
2.2. MEDIDAS DE POSICIN
Medidas de posicin central
Media aritmtica
Media geomtrica
Media armnica
La mediana
La moda
Medidas de posicin no central
Cuartiles
Deciles
Percentiles
2.3. MEDIDAS DE DISPERSIN
Medidas de dispersin absoluta
Recorrido
Recorrido intercuartilico
Desviacin absoluta media respecto a la media aritmtica
Desviacin absoluta media respecto a la mediana
La varianza
La desviacin tpica o estndar
Medidas de dispersin relativa
Coeficiente de apertura
Recorrido relativo
Recorrido semi-intercuartlico
Coeficiente de variacin de Pearson
ndice de dispersin de la mediana
2.4. TIPIFICACIN DE VARIABLES
11
Medidas de asimetra
Coeficiente de asimetra de Fisher
Coeficiente de asimetria de Bowley
Medida de asimetra de Pearson
Medidas de apuntamiento o curtosis
Coeficiente de apuntamiento o curtosis
2.6. MEDIDAS DE CONCENTRACIN
ndice de Gini
Curva de Lorenz
2.7. LA REPRESENTACIN GRFICA DE LOS DATOS
Diagrama de Pareto
Grficos de barras
Histograma
Grficos de series temporales
Grficos de sectores
Grficos de dispersin
Diagramas de caja
Diagramas de tallos y hojas (Stem an Leaf)
Otras representaciones grficas
Creacin de grficos con Excel
12
2.1.
INTRODUCCIN
13
A)
PRESENTACIN DE TIPO I
La notacin ms utilizada en Estadstica y que se asume en este trabajo es la
siguiente:
N ->
Xi ->
Por lo tanto, los datos se representan como la sucesin: X1, X2, X3, ..., XN.
B)
PRESENTACIN DE TIPO II
La notacin utilizada es la siguiente:
N ->
k ->
Xi ->
14
ni ->
valor
Xi,
i = 1, ..., k.
Por lo tanto, cada dato Xi, tendr asociada su frecuencia de aparicin, ni.
Bajo esta notacin, la suma de todos los ni ser igual al nmero de datos, es
decir, N.
k
N = ni
i =1
C)
notacin:
N ->
K ->
ni ->
Ni ->
N = ni
i =1
Se muestra a continuacin una tabla resumen en la que aparecen los tres tipos de
presentaciones:
15
Tabla 2.1.
Formas de presentacin de los datos
Tipo I
Xi
---X1
X2
.
.
.
Xi
.
.
.
XN
Tipo II
Xi
---X1
X2
.
.
.
Xi
.
.
.
Xk
ni
---n1
n2
.
.
.
ni
.
.
.
nk
Ni
---N1
N2
.
.
.
Ni
.
.
.
Nk
Tipo III
Intervalo i
-------------L0, L1
L1, L2
.
.
.
Li-1, Li
.
.
.
Lk-1, Lk
ni
---n1
n2
.
.
.
ni
.
.
.
nk
Ni
---N1
N2
.
.
.
Ni
.
.
.
Nk
En los apartados que siguen utilizaremos esta nomenclatura para las sucesivas
definiciones.
16
2.2.
MEDIDAS DE POSICION
+
+ ....+
x = x1n1 x 2 n2 x n nn = x i ni
N
N
i =1
n
( x x )n = 0
i =1
2.
( x x ) nN
n
i =1
es mnima
17
siendo o y
xi o
c
x o
cx = x o x = cx + o
c
Sin embargo est muy afectada por los valores extremos que presenten los datos,
lo que puede originar que a veces las conclusiones no sean muy atinadas.
18
N
1
n+
1
n +.....+
2
i =1
N
1
Xn
Tiene como inconvenientes que est muy influenciada por los valores
pequeos y no est determinada cuando algn valor de la variable es igual a cero.
N
. Para distribuciones agrupadas en intervalos aplicamos la siguiente
2
frmula:
N
N i 1
2
M e = Li1 +
ci
i 1
n
n
i 1
N
4
Para distribuciones
i +1
+ ni+1 ci
donde ni-1 ni+1 son las frecuencias asociadas a los intervalos anterior y posterior del
intervalo que ms se repite.
M
Siendo
d =n
c
i 1
i +1
c
d i1 + d i+1 i
y el primer percentil
N
10
lugar
N
100
r/k
r
. N N i 1
= Li1 + k
. ci
Tabla 2.2.
Distribucin de los salarios que paga la empresa XXX S.A.
Salario
Mensual
60.000-80.000
80000-100000
100000-120000
120000-140000
140000-160000
160000-180000
180000-200000
200000-220000
220000-240000
240000-260000
260000-280000
280000-30000
320000-340000
Marca
de
clase
N de
Trabajadores
N acumulado
de trabajadores
Total de
Salarios
Xn
70.000
90.000
110.000
130.000
150.000
170.000
190.000
210.000
230.000
250.000
270.000
290.000
310.000
160
200
100
110
100
85
10
14
25
47
24
40
85
160
360
460
570
670
755
765
779
804
851
875
915
1.000
11.200.000
18.000.000
11.000.000
14.300.000
15.000.000
14.450.000
1.900.000
2.940.000
5.750.000
11.750.000
6.480.000
11.600.000
26.350.000
150.720.000
Para calcular la mediana partimos del intervalo central, el intervalo 120.000140.000, en donde sabemos que ha de estar la mitad de nuestra distribucin (N/2). Esto
21
implica que 460 sea el valor que toma Ni-1 (frecuencia acumulada del intervalo
inmediatamente anterior), y 110 el valor de ni (frecuencia relativa del intervalo).
N
N i 1
500 460
2
M e = Li1 +
ci = 120.000 + 110 20.000 = 127.273
ni
En el clculo de la moda dado que el intervalo que ms se repite es el de 80.000100.000, el valor de ni-1 es 160 y el de ni+1 es 100.
i 1
n
n
i 1
i +1
+ ni+1
= 80.000 +
100
20.000 = 87.692
160 + 100
22
2.3.
MEDIDAS DE DISPERSION
R =C C
1
Dx =
i =1
X X nN
DM
=
i =1
X M nN
e) La Varianza
= ( X i
i =1
)2
23
( X X ) nN
2
i =1
de escala)
X
X
n
1
RR =
R
X
24
R = C +C
C C
3
S
X
S
.100
X
X
V
Me
D
M
i =1
Me
e
M n
e
N
. Me
25
2.4.
LA TIPIFICACIN DE VARIABLES
La tipificacin de variables consiste en expresar la diferencia entre la media y
XX
S
26
Tabla 2.3.
Notas de las clases A y B
NOTAS
Clase A
Clase B
Alumno 1
5,00
5,50
Alumno 2
2,00
7,00
Alumno 3
6,75
7,25
Alumno 4
9,00
5,00
Alumno 5
7,50
8,25
Alumno 6
6,75
2,80
Alumno 7
3,50
7,75
Alumno 8
5,30
8,25
Alumno 9
8,50
6,75
Alumno 10
2,75
7,25
Alumno 11
4,00
8,75
Alumno 12
2,75
6,75
Alumno 13
4,75
9,50
Alumno 14
3,00
8,25
Alumno 15
4,00
7,50
Alumno 16
3,00
5,25
Alumno 17
4,50
6,25
Alumno 18
4,75
6,50
Alumno 19
6,50
8,50
Alumno 20
5,00
5,75
Alumno 21
5,00
5,25
Alumno 22
4,50
4,75
Alumno 23
7,25
6,75
Alumno 24
6,00
8,50
Alumno 25
5,50
8,00
Las notas medias y las desviaciones tpicas para cada aula son las siguientes:
Media
Desviacin tpica
Clase A
5,10
1,80
Clase B
6,88
1,52
27
Clase A Clase B
0,00
0,00
1,00
1,00
Alumno 1
Nota
Nota tipificada
Clase A
5,00
-0,06
Clase B
5,50
-0,91
Diferencia
-0,50
0,85
28
2.5.
Medidas de asimetra
Las medidas de asimetra son indicadores que permiten establecer el grado de
simetra de una distribucin de valores estadsticos sin necesidad de realizar el grfico
de la distribucin.
( x x ) 3 ni
g=
( ( x x ) 2 nN )
i
i =1
3
2
i =1
la distribucin es simtrica
Si g1 < 0
Si g1 > 0
=
B
C +C 2 M
C C
3
la distribucin es simtrica
Si AB >0
Si AB <0
x M
3( X
Ap =
3( x M )
e
la distribucin es simtrica
Si Ap >0
Si Ap <0
Para estudiar el apuntamiento hay que definir una distribucin tipo que nos sirva
de referencia. Esta distribucin es conocida como distribucin Normal o curva de Gauss
y se corresponde con numerosos fenmenos de la naturaleza. Su forma es la de una
campana en donde la gran mayora de los valores se encuentran concentrados alrededor
de la media, siendo escasos los valores que estn muy distanciados de sta.
30
Grfico 2.1.
Representacin grfica de la distribucin normal
DISTRIBUCIN NORMAL
0,5
0,5
0,4
0,4
0,3
0,3
0,2
0,2
0,1
0,1
0,0
-4
-3
-2
-1
m4 =
(x
i =1
x)
ni
n
2
2 n
= 3 ( x i x ) i = 3( S 2 ) = 3S 4
i =1
N
N
m4
3
S4
Mesocrtica(Normal)
si
Leptocrtica
si
Platicrtica
si
g
g
g
2
2
2
llamamos
=0
>0
<0
31
2.6.
MEDIDAS DE CONCENTRACION
Tabla 2.5.
Clculo del ndice de Gini y la curva de Lorenz
xi
ni
xini
Ni
Ui
x(1)
x(2)
.
.
x(i)
.
x(n)
n1
n2
.
.
ni
.
nn
x1 n1
x2 n2
N1
N2
.
.
Ni
.
Nn
U1
U2
.
.
Ui
.
Un
un
xini
xn nn
pi =
Ni
100
N
qi =
p1
p2
.
.
pi
.
pn
Ui
100
Un
q1
q2
.
.
qI
.
qn
U
U
1
2
Xn
= X n+X n
1
Un =
X 1 n1 +
X 2 n2 +....+
X n nn =
i =1
Xn
i
32
ndice de Gini
IG =
( p q )
i =1
n 1
p
i =1
p =q
i
Gini tome un valor prximo a cero. Por el contrario, si el total de la distribucin est
muy concentrado en el ltimo valor de la variable el ndice se aproximara a 1.
Curva de Lorenz
33
Tabla 2.6.
ndice de Gini y curva de Lorenz de la distribucin de salarios
Salario
Mensual
N de
N
Marca de Trabajado acumulado
clase
res
de
trabajadores
X
60.00080.000
80.000100.000
100.000120.000
120.000140.000
140.000160.000
160.000180.000
180.000200.000
200.000220.000
220.000240.000
240.000260.000
260.000280.000
280.000300.000
320.000340.000
Total de
Salarios
N
U = X n pi = i 100 q i = U i 100
N
i
Xn
i
70.000
160
160
90.000
200
360
110.00
0
130.00
0
150.00
0
170.00
0
190.00
0
210.00
0
230.00
0
250.00
0
270.00
0
290.00
0
310.00
0
100
460
110
570
100
670
85
755
10
765
11.200.00
0
18.000.00
0
11.000.00
0
14.300.00
0
15.000.00
0
14.450.00
0
1.900.000
14
779
25
i =1
Un
Ui
pi
11.200.000
16
29.200.000
36
19
40.200.000
46
27
54.500.000
57
36
69.500.000
67
46
83.950.000
76
56
85.850.000
77
57
2.940.000
88.790.000
78
59
804
5.750.000
94.540.000
80
63
47
851
71
875
88
75
40
915
92
83
85
1.000
106.290.00
0
112.770.00
0
124.370.00
0
150.720.00
0
85
24
11.750.00
0
6.480.000
100
100
11.600.00
0
26.350.00
0
Al analizar las dos ltimas columnas se observa que el 16% de los trabajadores
se reparte el 7% de los salarios de la empresa y que el 46% de los trabajadores perciben
solamente el 27% del total de los salarios .Si los salarios estuvieran equidistribuidos
entonces el 16% de los trabajadores recibira el 16% de los salarios, el 46% recibira el
46% del total de los salarios, etc. Comprobamos a travs del ndice de Gini que los
salarios no estn equidistribuidos.
34
( p q )
i
i =1
n 1
p
i =1
= 0, 25
Grfico 2.2.
Curva de Lorenz de la distribucin de salarios
100
90
80
70
60
50
40
30
20
10
0
0
20
40
60
80
100
35
2.7.
Diagramas de Pareto
Se emplea para representar datos cualitativos y su construccin se realiza en dos
pasos:
a) Ordenamos las clases o categoras segn la frecuencia relativa de su aparicin
b) Cada clase se representa por un rectngulo con una altura igual a la frecuencia
relativa
El diagrama de Pareto representa los valores de las variables en el eje de
abscisas y las frecuencias absolutas y relativas acumuladas en el eje de ordenadas.
Grfico 2.3.
Ejemplo de diagrama de Pareto
Frecuencia
25
100,00%
90,00%
20
80,00%
70,00%
15
60,00%
50,00%
10
40,00%
30,00%
20,00%
10,00%
,00%
A
Frecuencia
y mayor...
Clase
% acumulado
36
Grficos de barras
En general, se emplean para variables discretas en distribuciones de frecuencias
de datos sin agrupar. Su mayor utilidad es comparar valores discretos a partir de dos o
ms series. Estos diagramas representan los valores de las variables en el eje de abscisas
y en el de ordenadas se levanta, para cada punto, una barra con un valor igual a la
frecuencia absoluta o relativa.
Grfico 2.4.
Ejemplo de diagrama de barras
130
120
117
11 3
1 12
1 10
110
100
92
89
90
80
79
77
65
61
60
57
60
75
74
70
67
70
51
53
52
12
13
51
50
40
30
20
10
0
1
10
11
Clase
14
15
16
17
18
19
20
N alumnos
Histograma
Los histogramas son las representaciones ms frecuentes para ver los datos
37
Grfico 2.5.
Ejemplo de histograma
12
10
8
6
4
2
0
0
Clases
Grfico 2.6.
Ejemplo de serie temporal
VENTAS MENSUALES. 1996-1998
25
20
15
10
5
1/11/98
1/09/98
1/07/98
1/05/98
1/03/98
1/01/98
1/11/97
1/09/97
1/07/97
1/05/97
1/03/97
1/01/97
1/11/96
1/09/96
1/07/96
1/05/96
1/03/96
1/01/96
38
Grficos de sectores
Estos grficos se utilizan para mostrar las contribuciones relativas de cada punto
de los datos al total de la serie. En un grfico de sectores slo se representa una serie.
Grfico 2.7.
Ejemplo de grfico de sectores
EXPORTACIONES POR DESTINO
ECONMICO. CASTILLA Y LEN. AO 1997.
BIENES
INTERM EDIOS
26%
BIENES DE
CAPITAL
16%
BIENES DE
CONSUM O
58%
Grficos de dispersin
39
Grfico 2.8.
Ejemplo de grfico de dispersin
2900
2700
Ventas
2500
2300
2100
1900
1700
1500
90
100
110
120
130
140
Gastos en publicidad
Diagramas de caja
Los diagramas de caja son representaciones semigrficas de un conjunto de
datos que muestran las caractersticas principales de la distribucin y sealan los datos
atpicos (outliers).
Lmite inferior
LI = Q1 - 1,5 (
Q3 - Q1
)
2
L5 = Q3 + 1,5 (
Q3 - Q1
)
2
Lmite superior
d) Se dibuja una lnea que vaya desde cada extremo del rectngulo central hasta
el valor ms alejado y que no sea atpico.
40
Grfico 2.9.
Ejemplo de diagrama de caja (box plot)
datos cuantitativos de una forma sinttica, siempre y cuando, stos no sean muy
numerosos.
41
170,4
158,9
160,7
161,2
158,2
160,4
170,6
166,2
158,1
160,9
155,1
160,4
157,2
170,1
170,4
158,3
161,4
170,7
166,5
160
170
159
161
161
158
160
171
166
158
161
155
160
157
170
170
158
161
171
166
Grfico 2.10.
Ejemplo de diagrama de tallos y hojas
15
16
16
17
5
0
6
0
7 8 8 8 9
0 0 1 1 1 1
6
0 0 1 1
42
datos, la naturaleza de las variables nos pueden sugerir otras representaciones distintas
de las anteriores. Dos ejemplos de ello se muestran a continuacin:
Grfico 2.11.
Ejemplo de mapa o cartograma
Grfico 2.12.
Ejemplo de pictograma
MATRICULACIN DE VEHCULOS EN CASTILLA Y LEN
80000
70000
60000
50000
40000
30000
20000
10000
0
1992
1993
1994
1995
1996
1997
43
44
45
EDAD
N Vlidos 2465
Perdido
169
s
Media
40,62
Error tp. de la
,31
media
Mediana
39,00
Moda
40
Desv. tp.
15,36
Varianza
235,85
Asimetra
,466
Error tp. de
,049
asimetra
Curtosis
-,377
Error tp. de
,099
curtosis
Rango
90
Mnimo
9
Mximo
99
Suma
10013
4
Percentiles
25 28,00
50 39,00
75 50,00
46
EDAD
400
300
Frecuencia
200
100
Desv. tp. = 1 5,36
Media = 40,6
N = 24 65,00
0
0,
10
,0
95
,0
90
,0
85
,0
80
,0
75
,0
70
,0
65
,0
60
,0
55
,0
50
,0
45
,0
40
,0
35
,0
30
,0
25
,0
20
,0
15
,0
10
EDAD
En Descriptivos tenemos dos pantallas una para introducir las variables y otra
para elegir las medidas estadsticas
47
48
Descriptivos
EDAD
SEXO
Hombre
Mujer
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Lmite inferior
Lmite superior
Lmite inferior
Lmite superior
Lmite inferior
Lmite superior
Estadstico
43,12
42,33
Error tp.
,40
43,91
42,85
43,00
239,960
15,49
11
84
73
22,00
,200
-,669
36,53
35,64
,063
,127
,45
37,41
35,74
34,00
195,239
13,97
9
99
90
17,00
,850
,439
56,50
38,52
,079
,157
6,99
74,48
56,28
55,00
293,500
17,13
41
76
35
31,25
,074
-3,110
,845
1,741
49
Stem &
7,00
79,00
130,00
116,00
136,00
173,00
150,00
198,00
157,00
108,00
65,00
89,00
50,00
28,00
7,00
Stem width:
Each leaf:
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
Leaf
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4&
556667778889999
00011111222222233333344444
5555666777788888899999
001111122222222333344444444
55555555556666777778888889999999999
00000000011122222223334444444
5555555566666666667777778888888899999999
0000000001111222222333334444444
555555666677778888899
000012223344
555556667777888889
00001122234
55678&
2&
10
5 case(s)
50
Normal esperado
0
-1
-2
-3
-4
-20
20
40
60
80
100
Valor observado
Algunos de los resultados que nos presenta SPSS, con las opciones elegidas, se
:muestran a continuacin
Resumen del procesamiento de los casos
EDAD
SEXO
Hombre
Mujer
9
Vlidos
N
Porcentaje
1493
96,0%
963
95,3%
6
12,8%
Casos
Perdidos
N
Porcentaje
62
4,0%
48
4,7%
41
87,2%
Total
N
Porcentaje
1555
100,0%
1011
100,0%
47
100,0%
51
DISTRIBUCIONES DE
PROBABILIDAD Y
CONTRASTES DE
HIPTESIS
52
53
Medidas de asociacin
Odds Ratio
Coeficiente de contingencia
Coeficiente V de Cramer
Q de Yule
54
3.1.
INTRODUCCIN
55
3.2.
Definicin de probabilidad
nA
n n
P(A) = lim
56
nA
nA
n
lim
c) De las definiciones anteriores se deducen tres axiomas que son los que
constituyen la definicin axiomtica de la probabilidad.
Axioma 1. P(A) es un nmero real tal que P(A) 0 para todo suceso A de S,
es decir, la probabilidad de cualquier suceso en un experimento es siempre
mayor o igual que 0.
57
P(A) = 1 - P(A)
ya que P(A U A) = P(S) = P(A) +P(A) = 1 P(A) = 1 - P(A)
Sealar por ltimo que el conjunto de todos los sucesos posibles, S, puede ser:
58
puntos del eje X y es medible, entonces se dice que X es una variable aleatoria (variable
aleatoria unidimensional). Una variable aleatoria es, por tanto, una regla o mecanismo que
asigna un valor numrico a todos y cada uno de los sucesos asociados a un experimento.
Supongamos que se lanzan al aire tres monedas, entonces los sucesos posibles son
los siguientes:
X(S)
CCC
XCC
CXC
CCX
CXX
XCX
XXC
XXX
59
Sealar que una variable aleatoria se dice discreta si toma solamente un nmero
finito o numerable de valores y continua si puede tomar cualesquiera de los infinitos
valores de un intervalo.
1
3
3
1
E ( X ) = 0 * + 1 * + 2 * + 3 * = 1,5
8
8
8
8
E ( X ) = x * f ( x)
E( X ) =
x * f ( x)dx
E (h( X )) = h( x ) * f ( x )
60
E (h( X )) =
h( x) * f ( x)dx
de la variable aleatoria
Si calculamos el valor para h(x) = x2 estaramos calculando el valor esperado,
esperanza o media de la variable aleatoria al cuadrado, y si a este valor le restamos (E(X))2,
obtendremos la varianza de la variable aleatoria, es decir:
+
Var ( X ) = x 2 f ( x ) E ( X ) 2
Var ( X ) =
1
3
3
1 1
Var ( X ) = x P( x ) E ( X ) = 0 2 * + 12 * + 2 2 * + 32 * = 0,75
8
8 5
8
8
61
3.3.
DISTRIBUCIONES DE PROBABILIDAD
1)
P( x) 0 x
si es discreta o bien
f ( x )dx 0
si es
continua.
2)
f ( x )dx = 1
si es continua
62
Distribucin binomial
y q respectivamente.
P[i = 1] = p
P[i = 0] = q
p+q=1
E(i) = 1p + 0q=p
La varianza se calcula mediante la siguiente expresin:
2 = E(i - p)2 = pq
siendo q = 1-p
63
= 1 + 2 + ..+ n
La funcin de cuanta o de probabilidad viene expresada por la siguiente
funcin:
n
P[ = x ] =
x
pq
n x
n2 negras, siendo el suceso a medir el nmero de bolas blancas extradas. Cada vez que
efectuemos una extraccin se volver a introducir la bola dentro de la urna.
Ahora bien, hemos de tener en cuenta que el orden no influye y, por tanto,
obtenemos dos casos favorables sobre los cuatro posibles, teniendo cada uno
probabilidad pq:
Blanca, negra
Negra, blanca Casos favorables
Casos posibles
Negra, negra
Blanca, blanca
64
2 = npq
Por ejemplo, la probabilidad de obtener x caras en 10 lanzamientos de una
moneda ser igual a:
n
10
P[ = x ] = p x q 10 x = 0,5 x 0,510 x siendo 0 x 10
x
x
65
Distribucin hipergeomtrica
Una variable aleatoria, , que toma todos los valores comprendidos entre 0 y n,
se dice que sigue una distribucin hipergeomtrica cuando:
Np Nq
r n r
P = r =
n
N
r
N n
npq
N 1
66
Decimos que una variable aleatoria que toma los valores x (desde -
hasta + ) se distribuye normalmente con parmetros (0, 1), es decir, con media 0
y varianza 1, cuando su funcin de distribucin viene dada por la siguiente
expresin:
P[ x ] = F ( x ) =
1 12 x 2
e dx
2
-<x<
f (X ) =
= +
siendo > 0
f (X ) =
1
2
1 x
1
Karl Friedrich Gauss, 1977-1855, investig el comportamiento de los errores de medida y lleg a la expresin matemtica que se
conoce como Ley de los errores o Ley de Gauss.
67
a) y = 0 asntota para x y x -
b) Simetra respecto a x =
c) Creciente cuando x <
d) Decreciente cuando x >
e) Hay un Mximo en x =
Grfico 3.1.
Funcin de densidad y de distribucin de la normal (0,1)
68
Grfico 3.2.
Probabilidad comprendida entre los valores -1 y 1 en
una distribucin normal de parmetros (0,1)
69
Tabla 3.1.
Distribucin normal estndar acumulativa
Valor
70
Valor
Probabilidad
0,0
0,50000000
1,5
0,93319277
3,0
0,99865003
0,1
0,53982790
1,6
0,94520071
3,1
0,99903233
0,2
0,57925969
1,7
0,95543457
3,2
0,99931280
0,3
0,61791136
1,8
0,96406973
3,3
0,99951652
0,4
0,65542170
1,9
0,97128351
3,4
0,99966302
0,5
0,69146247
2,0
0,97724994
3,5
0,99976733
0,6
0,72574694
2,1
0,98213564
3,6
0,99984085
0,7
0,75803642
2,2
0,98609660
3,7
0,99989217
0,8
0,78814467
2,3
0,98927592
3,8
0,99992763
0,9
0,81593991
2,4
0,99180247
3,9
0,99995188
1,0
0,84134474
2,5
0,99379032
4,0
0,99996831
1,1
0,86433390
2,6
0,99533878
4,1
0,99997933
1,2
0,88493027
2,7
0,99653298
4,2
0,99998665
1,3
0,90319945
2,8
0,99744481
4,3
0,99999145
1,4
0,91924329
2,9
0,99813412
4,4
0,99999458
3.4.
Distribucin 2 de Pearson.
Consideramos la siguiente variable n2 = 12 +...+n2 donde las variables i son
distribuciones normales e independientes. El nmero de distribuciones normales
utilizadas para construir la variable 2 recibe el nombre de grados de libertad.
( x) =
2
n
n
1
1
1 x
2
2
x e
n
n
2
2
2
Var ( n2 ) = 2n
71
Grfico 3.3.
Funcin de densidad y de distribucin de la 2
72
Tabla 3.2.
Distribucin Chi-cuadrado de Pearson
2
Pr( n > x ) = p
VALORES DE
REFERENCIA
0,05
=PRUEBA.CHI.INV(B2;B1)
Grados
de
0,005
0,010
0,025
0,05
0,10
0,25
0,50
7,88
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
66,77
79,49
91,95
104,21
116,32
128,30
140,17
6,63
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,43
112,33
124,12
135,81
5,02
7,38
9,35
11,14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34,17
35,48
36,78
38,08
39,36
40,65
41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,63
118,14
129,56
3,84
5,99
7,81
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,88
113,15
124,34
2,71
4,61
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,77
25,99
27,20
28,41
29,62
30,81
32,01
33,20
34,38
35,56
36,74
37,92
39,09
40,26
51,81
63,17
74,40
85,53
96,58
107,57
118,50
1,32
2,77
4,11
5,39
6,63
7,84
9,04
10,22
11,39
12,55
13,70
14,85
15,98
17,12
18,25
19,37
20,49
21,60
22,72
23,83
24,93
26,04
27,14
28,24
29,34
30,43
31,53
32,62
33,71
34,80
45,62
56,33
66,98
77,58
88,13
98,65
109,14
0,45
1,39
2,37
3,36
4,35
5,35
6,35
7,34
8,34
9,34
10,34
11,34
12,34
13,34
14,34
15,34
16,34
17,34
18,34
19,34
20,34
21,34
22,34
23,34
24,34
25,34
26,34
27,34
28,34
29,34
39,34
49,33
59,33
69,33
79,33
89,33
99,33
libertad
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
73
Distribucin t de Student.
Consideramos la variable
t=
1 2
1 + 22 +...+n2 )
(
n
n + 1
2
t n ( x) =
n
n
2
x
1 + n
n +1
2
Grfico 3.4.
Funcin de densidad y de distribucin de la t de Student
74
Tabla 3.3.
Distribucin t de Student (dos colas)
Pr( T < x ) = p
VALORES DE
REFERENCIA
0,05
=DISTR.T.INV(B3;B2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
75
0,005
127,32
14,09
7,45
5,60
4,77
4,32
4,03
3,83
3,69
3,58
3,50
3,43
3,37
3,33
3,29
3,25
3,22
3,20
3,17
3,15
3,14
3,12
3,10
3,09
3,08
3,07
3,06
3,05
3,04
3,03
2,97
2,94
2,91
2,90
2,89
2,88
2,87
0,010
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75
2,70
2,68
2,66
2,65
2,64
2,63
2,63
0,025
25,45
6,21
4,18
3,50
3,16
2,97
2,84
2,75
2,69
2,63
2,59
2,56
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,41
2,41
2,40
2,39
2,38
2,38
2,37
2,37
2,36
2,36
2,33
2,31
2,30
2,29
2,28
2,28
2,28
0,05
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,04
2,02
2,01
2,00
1,99
1,99
1,99
1,98
0,10
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70
1,68
1,68
1,67
1,67
1,66
1,66
1,66
0,25
2,41
1,60
1,42
1,34
1,30
1,27
1,25
1,24
1,23
1,22
1,21
1,21
1,20
1,20
1,20
1,19
1,19
1,19
1,19
1,18
1,18
1,18
1,18
1,18
1,18
1,18
1,18
1,17
1,17
1,17
1,17
1,16
1,16
1,16
1,16
1,16
1,16
0,50
1,00
0,82
0,76
0,74
0,73
0,72
0,71
0,71
0,70
0,70
0,70
0,70
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
Fn ,m
m + n
m
1
2
x2
=
( m+ n )
n m
[1 + x ] 2
2 2
76
Tabla 3.4.
Distribucin F de Fisher-Snedecor
Pr( F < x ) = p
1
n
3
0,500
1,0000
1,5000
1,7092
1,8227
1,8937
1,9422
0,750
5,8284
7,5000
8,1999
8,5809
8,8198
8,9832
0,900
39,8636
49,5002
53,5933
55,8330
57,2400
58,2045
0,950
161,4462
199,4995
215,7067
224,5833
230,1604
233,9875
0,975
647,7931
799,4822
864,1509
899,5994
921,8347
937,1142
1
1
1
1
1
1
1
2
2
2
2
2
2
2
3
3
3
3
3
3
3
4
4
4
4
4
4
4
5
5
5
5
5
5
5
6
6
6
6
6
6
6
77
0,990
4052,1845
4999,3396
5403,5336
5624,2570
5763,9554
5858,9503
0,995
16212,4634
19997,3583
21614,1343
22500,7534
23055,8217
23439,5266
0,500
0,6667
1,0000
1,1349
1,2071
1,2519
1,2824
0,750
2,5714
3,0000
3,1534
3,2321
3,2799
3,3121
0,900
8,5263
9,0000
9,1618
9,2434
9,2926
9,3255
0,950
18,5128
19,0000
19,1642
19,2467
19,2963
19,3295
0,975
38,5062
39,0000
39,1656
39,2483
39,2984
39,3311
0,990
98,5019
99,0003
99,1640
99,2513
99,3023
99,3314
0,995
198,5027
199,0120
199,1575
199,2448
199,3030
199,3321
0,500
0,5851
0,8811
1,0000
1,0632
1,1024
1,1289
0,750
2,0239
2,2798
2,3555
2,3901
2,4095
2,4218
0,900
5,5383
5,4624
5,3908
5,3427
5,3091
5,2847
0,950
10,1280
9,5521
9,2766
9,1172
9,0134
8,9407
0,975
17,4434
16,0442
15,4391
15,1010
14,8848
14,7347
0,990
34,1161
30,8164
29,4567
28,7100
28,2371
27,9106
0,995
55,5519
49,8003
47,4683
46,1951
45,3911
44,8381
0,500
0,5486
0,8284
0,9405
1,0000
1,0367
1,0617
0,750
1,8074
2,0000
2,0467
2,0642
2,0723
2,0766
0,900
4,5448
4,3246
4,1909
4,1072
4,0506
4,0097
0,950
7,7086
6,9443
6,5914
6,3882
6,2561
6,1631
0,975
12,2179
10,6490
9,9792
9,6045
9,3645
9,1973
0,990
21,1976
17,9998
16,6942
15,9771
15,5219
15,2068
0,995
31,3321
26,2844
24,2599
23,1539
22,4563
21,9752
0,500
0,5281
0,7988
0,9071
0,9646
1,0000
1,0240
0,750
1,6925
1,8528
1,8843
1,8927
1,8947
1,8945
0,900
4,0604
3,7797
3,6195
3,5202
3,4530
3,4045
0,950
6,6079
5,7861
5,4094
5,1922
5,0503
4,9503
0,975
10,0069
8,4336
7,7636
7,3879
7,1464
6,9777
0,990
16,2581
13,2741
12,0599
11,3919
10,9671
10,6722
0,995
22,7847
18,3136
16,5301
15,5560
14,9394
14,5133
0,500
0,5149
0,7798
0,8858
0,9419
0,9765
1,0000
0,750
1,6214
1,7622
1,7844
1,7872
1,7852
1,7821
0,900
3,7760
3,4633
3,2888
3,1808
3,1075
3,0546
0,950
5,9874
5,1432
4,7571
4,5337
4,3874
4,2839
0,975
8,8131
7,2599
6,5988
6,2271
5,9875
5,8197
0,990
13,7452
10,9249
9,7796
9,1484
8,7459
8,4660
0,995
18,6346
14,5442
12,9166
12,0276
11,4637
11,0731
Grfico 3.5.
Funcin de densidad y de distribucin de la F de Fisher-Snedecor
78
3.5.
Y = X 1 + X 2 +...+ X n
cuando el nmero de variables (n) crece, tiende a una distribucin normal con
parmetros ( i ,
2
i
Z=
Y i
2
i
79
3.6.
DISTRIBUCIONES MUESTRALES
Tabla 3.5.
Distribucin de valores de la variable X para una determinada poblacin
Poblacin
1 2 3 4 5 6 7 8 9 10
Variable X
2 5 7 3 4 1 10 9 8 6
X
X =
N
55
=
= 5,5
10
(X
= 8,25
80
Tabla 3.6.
Muestras posibles de tamao 2 para la variable X
Primera
Segun
muestra
da
1
10
1, 1
1, 2
1, 3
1, 4
1, 5
1, 6
1, 7
1, 8
1, 9
1, 10
(1)
(1,5)
(2)
(2,5)
(3)
(3,5)
(4)
(4,5)
(5)
(5,5)
2, 1
2, 2
2, 3
2, 4
2, 5
2, 6
2, 7
2, 8
2, 9
2, 10
(1,5)
(2)
(2,5)
(3)
(3,5)
(4)
(4,5)
(5)
(5,5)
(6)
3, 1
3, 2
3, 3
3, 4
3, 5
3, 6
3, 7
3, 8
3, 9
3, 10
(2)
(2,5)
(3)
(3,5)
(4)
(4,5)
(5)
(5,5)
(6)
(6,5)
4, 1
4, 2
4, 3
4, 4
4, 5
4, 6
4, 7
4, 8
4, 9
4, 10
(2,5)
(3)
(3,5)
(4)
(4,5)
(5)
(5,5)
(6)
(6,5)
(7)
5, 1
5, 2
5, 3
5, 4
5, 5
5, 6
5, 7
5, 8
5, 9
5, 10
(3)
(3,5)
(4)
(4,5)
(5)
(5,5)
(6)
(6,5)
(7)
(7,5)
6, 1
6, 2
6, 3
6, 4
6, 5
6, 6
6, 7
6, 8
6, 9
6, 10
(3,5)
(4)
(4,5)
(5)
(5,5)
(6)
(6,5)
(7)
(7,5)
(8)
7, 1
7, 2
7, 3
7, 4
7, 5
7, 6
7, 7
7, 8
7, 9
7, 10
(4)
(4,5)
(5)
(5,5)
(6)
(6,5)
(7)
(7,5)
(8)
(8,5)
muestra
8, 1
8, 2
8, 3
8, 4
8, 5
8, 6
8, 7
8, 8
8, 9
8, 10
(4,5)
(5)
(5,5)
(6)
(6,5)
(7)
(7,5)
(8)
(8,5)
(9)
9, 1
9, 2
9, 3
9, 4
9, 5
9, 6
9, 7
9, 8
9, 9
9, 10
(5)
(5,5)
(6)
(6,5)
(7)
(7,5)
(8)
(8,5)
(9)
(9,5)
10
10, 1
10, 2
10, 3
10, 4
10, 5
10, 6
10, 7
10, 8
10, 9
10, 10
(5,5)
(6)
(6,5)
(7)
(7,5)
(8)
(8,5)
(9)
(9,5)
(10)
Vamos a construir ahora las distribuciones de la media muestral x del ejemplo que
figura en la tabla 3.6.
81
Tabla 3.7.
Distribucin muestral de la media de las muestras de tamao n=2
x
Probabilidad
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
10,0
1/100
2/100
3/100
4/100
5/100
6/100
7/100
8/100
9/100
10/100
9/100
8/100
7/100
6/100
5/100
4/100
3/100
2/100
1/100
100/100
En la tabla 3.7. observamos que se cumplen las condiciones que se exigen a una
distribucin de probabilidad: que cada una de las probabilidades sea mayor o igual que 0, y
que la suma de todas las probabilidades sea igual a 1.
X
=
550
=
= 5,5
100
100
i
x2
(X
=
x )
100
= 4,125
82
2
n
N
combinaciones de N elementos tomados de n en n , que para nuestro ejemplo seran:
n
10 10!
= 45 (las 45 muestras que figuran por encima o por debajo de
=
2 8!2 !
la diagonal principal, excluyendo sta)
x =
247,5
= 5,5
45
=
2
x
= 3,67
por el factor
N n
llamado factor de correccin de
N 1
83
,
~
N
x n
Z=
~ N (0,1)
En este caso, se puede afirmar que sin tener en cuenta la forma funcional de la
poblacin de donde se extrae la muestra, la distribucin de la media muestral, calculada
con muestras de tamao n extradas de una poblacin con media y varianza 2, se
distribuye como una distribucin normal con media y varianza 2/n. Si n es grande, la
distribucin de las medias muestrales pueden aproximarse mucho a una distribucin
normal. Muchos expertos sugieren que tamaos muestrales superiores a 30 justifican el
uso del Teorema Central del Lmite.
84
S
n
siendo S la desviacin tpica muestral, la cual sigue una distribucin t de Student con n-1
grados de libertad.
12 22
, es decir:
x1 x 2 se distribuye como una normal con parmetros 1 2 ,
+
n1 n2
2 2
x1 x 2 N 1 2 , 1 + 2
n1
n2
y por tanto la variable tipificada seguir una distribucin normal con parmetros (0, 1).
Z=
(x
x 2 ) ( 1 2 )
12
n1
22
N (0,1)
n2
iguales:
T=
(x
x 2 ) ( 1 2 )
sp
1
1
+
n1 n2
85
t n1 + n2 2
(n 1) s + (n 1)s
s =
n +n 2
2
2
2
T=
(x
x 2 ) ( 1 2 )
s12 s22
+
n1 n2
t n1 +n2 2
(( n
(n
si2
donde Si =
(i = 1, 2)
ni
p$ = p y la desviacin tpica:
p$ =
86
p(1 p)
n
N n
.
N 1
p(1 p)
, respectivamente.
n
p$ p$ = p1 p2
1
p$ p$ =
1
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
p$ 1 p$ 2 es aproximadamente
normal.
Si s 2 =
(x
x)
n 1
n21 =
( n 1) s 2
2
87
F=
s22
2
1
2
2
2, ya que:.
Fn1 ,n2
(n
(n
88
12
1)
22
1)
3.7.
INTERVALOS DE CONFIANZA
Por esta razn, a la estimacin que obtenemos en una investigacin por muestreo la
acompaamos con un intervalo de valores posibles. La amplitud de dicho intervalo
depender del grado de confianza que establezcamos.
P[ X a x
X b] = 1
(1)
se distribuye como una normal de parmetros (0, 1) y, por tanto, puede determinarse, a
travs de la tabla de la normal, un valor K que verifique lo siguiente:
P( K
89
x x
n K ) = 1 (2)
Dividiendo por
n:
P(
( x x )
K
n
) = 1
P( x
K
n
x x +
K
n
) = 1
P( x
K
n
x x +
K
n
) = 1 (3)
Xa=
Xb=
+k
Como vemos los extremos del intervalo se acaban expresando en funcin del error
tpico de la distribucin del estadstico y de K. A ste ltimo se le denomina factor de
confiabilidad.
Se muestra en el grfico 3.6. el esquema de construccin de intervalos de
confianza.
90
Grfico 3.6.
Esquema de construccin de intervalos de confianza
P[5,5 1,965
91
3
100
x 5,5 + 1,965
3
100
] = 0,95
y decimos que la probabilidad de que el parmetro desconocido est entre los puntos
X a = 5,5 1,965
3
100
3
100
= 6,09
es igual a 0,95.
Si para cada muestra posible obtenemos los intervalos de confianza para la media
X 1 k
, X k , X k
2
3
n
n
..
la media
92
Grfico 3.7.
Significado del nivel de confianza
93
pq
p$ k
n
94
N n
N 1
3.8.
CONTRASTE DE HIPTESIS
95
Sealar que un estadstico de prueba es una frmula que nos dice como confrontar
la hiptesis nula con la informacin de la muestra, y es por tanto una variable aleatoria
cuyo valor cambia de muestra a muestra.
paramtricos. Las pruebas estadsticas paramtricas requieren que los valores de las
caractersticas de la poblacin analizada sean producto de una medicin en una escala
de intervalo, de tal forma que sea posible utilizar operaciones aritmticas (sumas,
productos, medias, etc.). Las no paramtricas se utilizan cuando el modelo no especifica
las condiciones de los parmetros de la poblacin de donde se sac la muestra.
96
Los principales test de hiptesis que se pueden aplicar son los siguientes:
97
Contraste de la mediana.
Contraste de Wilcoxon-Mann-Whitney.
Contraste de Siegel-Tukey.
Contraste de Kruskal-Wallis.
Comparaciones Mltiples.
Contraste X2 de independencia.
Contraste G2 de independencia.
Test de Tocher.
Test binomial.
Test de McNemar.
Test de Gart.
Contraste X2 de homogeneidad.
A continuacin se desarrolla un ejemplo que nos sirve para ilustrar algunos de los
conceptos anteriormente descritos.
98
1.-
Planteamiento de la hiptesis
Se contrasta la hiptesis nula de que el 25% o ms de la poblacin toma dicha
bebida, frente a la hiptesis alternativa de que menos de un 25% la toma.
H0: p 0,25
2.-
H1: p<0,25
3.-
Descripcin de la poblacin
La poblacin es binomial, ya que est compuesta por bebedores y no bebedores
de dicha bebida. La poblacin es suficientemente grande en relacin con la
muestra para que podamos pasar por alto el factor de correccin y la muestra es
suficientemente grande para que podamos aplicar la aproximacin a la
distribucin normal en la verificacin de la hiptesis.
4.-
El Estadstico pertinente.
Bajo la hiptesis nula, la distribucin muestral de p$
es de forma
p$ =
p0 (1 p0 )
n
0,25x 0,75
= 0,0395
120
hiptesis nula es verdadera hasta que haya suficiente evidencia para rechazarla.
5.-
99
Z=
6.-
p$
7.-
p$ p0
p$ p0
p$
0,167 0,25
= 2,108
0,0395
Decisin estadstica.
Dado que -2,108 es menor que -1,645 rechazamos la H0: p 0,25 y, por tanto,
concluimos que menos del 25 % de la poblacin ha probado alguna vez la
bebida.
100
3.9.
DISTRIBUCIONES BIDIMENSIONALES
y1
y2
yj
yk
ij
j =1
X
x1
O11
O12
O1j
O1k
O1
x2
O21
O22
O2j
O2k
O2
xi
Oi1
Oi2
Oij
Oik
Oi
xr
Or1
Or2
Orj
Ork
Or
Oij
O1
O2
Oj
Ok
i =1
O
i =1 j =1
Si llamamos fr ( xi , y j ) =
entonces se verifica que
Oij
relativas es igual a 1.
En el anlisis conjunto de las dos variables nos interesa de forma especial la
relacin existente entre ambas variables.
101
= O
fr ( x , y
i
ij
Distribuciones marginales
fr ( xi ) = fr ( xi , y j ) =
j
Oij
O
fr ( y j ) = fr ( xi , y j ) =
i
Oij
O
=
=
1
O
1
O
ij
ij
Oi
O
O j
O
Distribuciones condicionadas
Son las distribuciones de una determinada variable, condicionada sta por los
valores de la otra, es decir:
fr ( y j / xi ) =
fr ( y
Ha de verificarse que
fr ( xi , y j )
fr ( xi )
Oij / O
Oi / O
Oij
Oi
/ x i ) = 1 ya que:
fr ( y
/ xi ) =
fr ( x i , y j )
fr ( x i )
1
1
fr ( x i , y j ) =
* fr ( x i ) = 1
fr ( x i ) j
fr ( x i )
Dependencia lineal
Las dos medidas de las que dispone la estadstica descriptiva para medir la relacin
lineal que hay entre cada par de variables son: la covarianza y el coeficiente de
correlacin.
La covarianza entre dos variables viene reflejada por la siguiente expresin:
Cov (x,y) =
102
Si los valores altos de una variable estn asociados con los valores altos de la
otra variable, la covarianza ser positiva; y su valor ser negativo cuando los valores
altos de una variable se asocian con los valores bajos de la otra variable.
r=
Cov (x, y)
Sx Sy
103
Para ello, realizamos una tabla cruzada de doble entrada en donde resumimos
los resultados obtenidos en la encuesta:
Tabla 3.9.
Opiniones a favor y en contra en funcin del sexo
A favor
En contra
Total
Varn
32
11
43
Mujer
10
27
37
Total
42
38
80
104
Estadstico 2
La hiptesis nula, H0, que implicara que existe independencia entre los factores
(en el ejemplo anterior el sexo y las opiniones), se prueba a travs de :
2 =
(O
i =1 j =1
ij
E ij
E ij
Siendo:
r el nmero de filas
k el nmero de columnas
Oij (frecuencia observada) el nmero de casos observados clasificados en la
fila i de la columna j
Tabla 3.10.
Frecuencias esperadas para las opiniones a favor y en contra en funcin del sexo
A favor
En contra
Total
105
Varn
23
20
43
Mujer
19
18
37
Total
42
38
80
E11 =
O1 O1
= (42*43)/80 = 23
O
E12 =
O1 O2
= (42*37)/80 = 19
O
E21 =
O2 O1
= (38*43)/80 = 20
O
E22 =
O2 O 2
= (38*37)/80 = 18
O
=
2
i =1 j =1
(O
ij
E ij
E ij
23
19
(11 20) 2
20
(27 18) 2
18
= 17,91
el cual bajo la hiptesis nula sigue una distribucin con 1 grado de libertad.
2
3,84. Como el valor del estadstico = 17,91, es mayor que este percentil se rechaza la
2
hiptesis de independencia lo que significa que el sexo tiene influencia a la hora de estar
a favor o en contra.
106
Medidas de asociacin
O11
O
OR = 1
O21
O2
O12
O1 O11O22
=
O22 O12 O21
/
O2
/
OR = ln( OR )
la cual es una medida simtrica cuyo rango de variacin es (- , + ), tomando el valor
0 en el caso de independencia y - o + en el caso de asociacin perfecta.
En el ejemplo, OR y OR toman los siguientes valores:
OR =
32 * 27
= 7,85
10 * 11
32 * 27
OR = ln
= 2,06
10 * 11
lo cual quiere decir que los hombres muestran una opinin ms favorable que las
mujeres.
107
C=
2
2 + n
C=
2
+ n
2
17,91
= 0,4277
17,91 + 80
V =
2
n * min( k 1, r 1)
V =
2
n * min( k 1, r 1)
17,91
= 0,4732
80
108
Q=
nD11
O11O22 O12 O21
donde
D11=O11-E11
Q=0 independencia
Q>0 asociacin positiva
Q<0 asociacin negativa
Tabla 3.11.
Diferencias entre las frecuencias observadas y esperadas para las opiniones a favor
y en contra en funcin del sexo
Nivel 1
D11=O11-E11= 9
D21=O21-E21= -9
Nivel 1
Nivel 2
Nivel 2
D12=O12-E12= -9
D22=O22-E22= 9
Q=
nD11
80 * 9
=
= 0,74
O11O22 O12 O21 32 * 27 + 10 * 11
109
Con los datos del ejemplo del anexo n 1, se eligen las variables Valoracin
general sobre los productos de la empresa y el Sexo. Nuestro objetivo es probar si
existe dependencia entre las respuestas a las preguntas de valoracin de los
productos de la empresa y el sexo de los encuestados.
110
111
N
Valoracin general
sobre los productos de
la empresa * SEXO
Casos
Perdidos
N
Porcentaje
Vlidos
Porcentaje
2613
99,2%
21
,8%
2634
Valoracin
general sobre
los productos
de la empresa
NS/NC
Muy buena
Buena
Normal
Mala
Muy deficiente
Total
SEXO
Mujer
16
135
381
393
61
25
1011
Hombre
47
207
548
615
111
27
1555
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Valor
56,135a
40,315
,042
10
10
Sig. asint.
(bilateral)
,000
,000
,837
gl
2613
112
Total
8
1
9
26
2
1
47
Total
Porcentaje
71
343
938
1034
174
53
2613
100,0%
ANALISIS DE LA
VARIANZA, REGRESIN
Y SERIES TEMPORALES
113
4.1.ANLISIS DE LA VARIANZA
Modelo matemtico
Fases del anlisis
Estimacin de los parmetros del modelo
Tabla de anlisis de la varianza
Anlisis de los residuos
4.3ANLISIS DE REGRESIN
Tendencia
114
Las producciones en una y otra parcela sern tambin dependientes de una serie
de factores no controlables y muchas veces desconocidos, como por ejemplo diferencias
en la maquinaria utilizada, cualificacin de los agricultores, variaciones en la calidad de
la parcela de cultivo, etc. Estos factores estn englobados en un trmino al que
denominamos error experimental o perturbacin.
Por tanto, se parte de la hiptesis de que cada tipo de abono tendr asociada una
produccin, la cual es desconocida, y los valores observados se determinan como la
suma de esta produccin y el error experimental o perturbacin.
115
MODELO MATEMTICO
y ij = + i + u ij
siendo:
yij
->
j=1,,50)
+ i ->
las
cuatro
parcelas.
De
esto
se
deduce
que:
1 + 2 + 3 + 4 = 0 .
uij
->
116
VE = ni ( yi . y.. ) 2
i =1
ni
VNE = ( yij yi . ) 2
i =1 j =1
ni
Tabla 4.1.
Esquema de Tabla de anlisis de la varianza con un factor
Origen de las
Suma de
Grados de
Promedio de los
variaciones
cuadrados
libertad
cuadrados
VE
L -1
VE / (L-1) = Se2
VNE
n-L
VT
n-1
VT / (n-1) = Sy2
Entre grupos
Dentro de los grupos
Total
F
SR2 / Se2
117
Analizar
Comparar medias
ANOVA de un factor...
118
Adems de determinar que existen diferencias entre las medias, es posible que desee
saber qu medias difieren. Existen dos tipos de contrastes para comparar medias: los
contrastes a priori y las pruebas post hoc. Los contrastes a priori se plantean antes de
ejecutar el experimento y las pruebas post hoc se realizan despus de haber llevado a
cabo el experimento. Tambin puede contrastar las tendencias existentes a travs de las
categoras.
Estadsticos. Para cada grupo: nmero de casos, media, desviacin tpica, error tpico de
la media, mnimo, mximo, intervalo de confianza al 95% para la media. Prueba de
Levene sobre la homogeneidad de varianzas, tabla de anlisis de varianza para cada
variable dependiente, contrastes a priori especificados por el usuario y las pruebas de
rango y de comparaciones mltiples post hoc: Bonferroni, Sidak, diferencia
honestamente significativa de Tukey, GT2 de Hochberg, Gabriel, Dunnett, prueba F de
Ryan-Einot-Gabriel-Welsch (R-E-G-W F), prueba de rango de Ryan-Einot-GabrielWelsch (R-E-G-W Q), T2 de Tamhane, T3 de Dunnett, Games-Howell, C de Dunett,
prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K), Tukey b,
Waller-Duncan, Scheff y diferencia menos significativa.
119
Datos. Los valores de la variable de factor deben ser enteros y la variable dependiente
debe ser cuantitativa (nivel de medida de intervalo).
CONTRASTES A PRIORI
121
Pruebas. Una vez que se ha determinado que existen diferencias entre las medias, las
pruebas de rango post hoc y las comparaciones mltiples por parejas
permiten
122
Nota: Posiblemente le resulte ms fcil interpretar el resultado de los contrastes post hoc
si desactiva Ocultar filas y columnas vacas en el cuadro de dilogo Propiedades de
tabla (en una tabla pivote activada, seleccione Propiedades de tabla en el men
Formato).
123
OPCIONES
Excluir casos segn anlisis. Un caso que tenga un valor perdido para la
variable dependiente o la variable de factor en un anlisis determinado, no se
utiliza en ese anlisis. Adems, los casos fuera del rango especificado para la
variable de factor no se utilizan.
Excluir casos segn lista. Se excluyen de todos los anlisis los casos con
valores perdidos para la variable de factor o para cualquier variable
dependiente incluida en la lista de variables dependientes en el cuadro de
dilogo principal. Si no se han especificado varias variables dependientes,
esta opcin no surte efecto.
124
RESULTADOS
Descriptivos
Produccin por hectrea de trigo
N
1
2
3
4
Total
50
50
50
50
200
Media
49,4650
61,3217
70,2058
49,5379
57,6326
Desviacin
tpica
5,8170
6,0250
5,8848
6,4286
10,5989
Error tpico
,8227
,8521
,8322
,9091
,7495
Mnimo
39,08
48,51
54,39
37,03
37,03
Mximo
61,88
74,90
81,60
60,78
81,60
gl1
3
gl2
196
Sig.
,787
ANOVA
Produccin por hectrea de trigo
Inter-grupos
(Combinadas)
Trmino lineal
Intra-grupos
Total
Contraste
Desviacin
Suma de
cuadrados
15196,488
207,154
3
1
Media
cuadrtica
5065,496
207,154
F
138,691
5,672
Sig.
,000
,018
14989,334
7494,667
205,200
,000
7158,652
22355,140
196
199
36,524
gl
125
Coeficientes de contraste
Contraste
1
2
3
Abono utilizado
2
3
0
1
0
1
1
-,5
-,5
4
0
0
1
-1
-,5
-,5
Error tpico
1,2087
1,0468
1,0468
1,2261
1,0497
1,0337
t
-,060
11,292
19,779
-,059
11,261
20,030
Pruebas de contraste
Produccin por
hectrea de trigo
Suponer igualdad
de varianzas
No asume igualdad
de varianzas
Contraste
1
2
3
1
2
3
Valor de
contraste
-7,29E-02
11,8203
20,7044
-7,29E-02
11,8203
20,7044
gl
196
196
196
97,037
99,409
101,511
Sig. (bilateral)
,952
,000
,000
,953
,000
,000
Se observa que, efectivamente, las medias para el primer y cuarto abono no son
significativamente diferentes.
Las medias del segundo y tercer abono son significativamente mayores que las del
primero y el cuarto.
126
Comparaciones mltiples
Variable dependiente: Produccin por hectrea de trigo
HSD de Tukey
Scheff
Diferencia de
medias (I-J)
Error tpico
Sig.
Intervalo de confianza al
95%
Lmite
superior
Lmite inferior
-11,8567*
-20,7408*
-7,2904E-02
11,8567*
1,2087
1,2087
1,2087
1,2087
,000
,000
1,000
,000
-14,9619
-23,8460
-3,1781
8,7515
-8,7515
-17,6357
3,0323
14,9619
-8,8841*
11,7838*
20,7408*
8,8841*
1,2087
1,2087
1,2087
1,2087
,000
,000
,000
,000
-11,9893
8,6786
17,6357
5,7789
-5,7789
14,8890
23,8460
11,9893
20,6679*
7,290E-02
-11,7838*
-20,6679*
1,2087
1,2087
1,2087
1,2087
,000
1,000
,000
,000
17,5628
-3,0323
-14,8890
-23,7731
23,7731
3,1781
-8,6786
-17,5628
-11,8567*
-20,7408*
-7,2904E-02
11,8567*
1,2087
1,2087
1,2087
1,2087
,000
,000
1,000
,000
-15,2652
-24,1493
-3,4814
8,4483
-8,4483
-17,3324
3,3355
15,2652
-8,8841*
11,7838*
20,7408*
8,8841*
1,2087
1,2087
1,2087
1,2087
,000
,000
,000
,000
-12,2926
8,3754
17,3324
5,4757
-5,4757
15,1923
24,1493
12,2926
20,6679*
7,290E-02
-11,7838*
-20,6679*
1,2087
1,2087
1,2087
1,2087
,000
1,000
,000
,000
17,2595
-3,3355
-15,1923
-24,0764
24,0764
3,4814
-8,3754
-17,2595
127
HSD de Tukeya
Scheffa
Abono utilizado
1
4
2
3
Sig.
1
4
2
3
Sig.
N
50
50
50
50
50
50
50
50
Por ltimo, se muestra a continuacin el grfico de medias para los distintos abonos.
80
70
60
50
40
1
Abono utilizado
128
4.4.
ANLISIS DE REGRESIN
El anlisis de regresin de dos variables nos permite ajustar una lnea a la serie
de observaciones ( x i , y i ) que obtenemos con dos variables aleatorias X, Y. Cuando
realizamos un diagrama de dispersin con ellas, obtenemos una representacin que se
denomina nube de puntos (grfico 3.12.), que nos ayuda a conocer si las dos variables
estn relacionadas. Si suponemos la existencia de una relacin lineal, la funcin a
ajustar ser:
y i = a + bx i
Grfico 4.1.
Nube de puntos o grfico de dispersin con variables relacionadas linealmente
Minimizar
129
i =1
i =1
ei2 = ( yi a bxi ) 2
y
i =1
= na + b x i
i =1
i =1
i =1
i =1
yi xi = a x i + b xi2
A los trminos ei = yi a bxi se les denomina residuos, y expresan la
diferencia entre los valores observados para la variable y los predichos a travs de la
recta de regresin.
Despejando a en la primera ecuacin: a = y bx
Sustituyendo a por su valor en la segunda ecuacin:
yi xi = nyx b
i =1
n
xi
i =1
n
2
n
n
n
xi
n
i =1
y i x i nyx = b x i2
Cov ( x , y ) = bS x2
=> b =
Cov ( x , y )
S x2
a=y
130
Cov ( x , y )
x
S x2
E(ei) = 0
i=1,,n
Var(ei) = 2 constante
Cov(ei,ej) = 0 i, j
i=1,,n
(Supuesto de homocedasticidad)
(y
SR =
- a - bxi )2
n -2
Sin embargo, hay que tener presente que esta medida no es til para comparar
rectas de regresin de variables distintas ya que depende de las unidades de medida de
la variable y.
La medida utilizada para medir el ajuste del modelo a los datos es el coeficiente
de determinacin R 2 , que se define como el cociente entre la variabilidad explicada por
el modelo ajustado y la variabilidad total, y cuya expresin es la siguiente.
R2 =
(n 2) S R2
VE
VNE
= 1
= 1
VT
VT
(n 1) S y2
En el caso del anlisis de regresin con una nica variable dependiente este
coeficiente coincide con el coeficiente de correlacin al cuadrado.
131
aplicando
Si denominamos:
Yi = log yi
A = log a
X i = log xi
entonces
Yi = A + bX i
Y = log y
X = log x
La recta resultante mediante esta transformacin es la siguiente:
Y = 2X
Deshaciendo la transformacin, llegaramos a la relacin realmente existente.
132
Grfico 4.2.
Nube de puntos o grfico de dispersin con variables relacionadas de forma no lineal
Si tenemos ms de una variable explicativa, se supone que cada una de ellas est
incorrelacionada con el resto. Si esto no es as, existen tres modos de proceder:
-
133
134
135
A travs del botn grfico, realizamos el grfico de residuos por valores pronosticados.
Regresin
Variables introducidas/eliminadasb
Modelo
1
Variables
introducidas
arena, Valor
medio por a
variedades
Variables
eliminadas
Mtodo
,
Introducir
Modelo
1
R
,926a
R cuadrado
,857
R cuadrado
corregida
,854
Error tp. de la
estimacin
,5196
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
145,374
24,298
169,672
gl
2
90
92
Media
cuadrtica
72,687
,270
F
269,230
136
Sig.
,000a
Coeficientesa
Modelo
1
Coeficientes no
estandarizados
B
Error tp.
1,355
,483
(Constante)
Valor medio
por variedades
arena
Coeficient
es
estandari
zados
Beta
t
2,807
Sig.
,006
Estadsticos de
colinealidad
Tolerancia
FIV
,990
,044
,909
22,706
,000
,993
1,007
-1,90E-02
,007
-,117
-2,917
,004
,993
1,007
a. Variable dependiente: IG
Diagnsticos de colinealidada
Modelo
1
Dimensin
1
2
3
Autovalor
2,871
,122
6,672E-03
Indice de
condicin
1,000
4,852
20,745
Proporciones de la varianza
Valor medio
por
(Constante)
variedades
arena
,00
,02
,00
,01
,93
,02
,99
,05
,98
a. Variable dependiente: IG
Mnimo
,6164
-1,1221
-1,700
-2,160
Valor pronosticado
Residual
Valor pronosticado tip.
Residuo tip.
Mximo
4,8105
1,5898
1,637
3,060
Media
2,7529
1,504E-16
,000
,000
Desviacin
tp.
1,2570
,5139
1,000
,989
N
93
93
93
93
a. Variable dependiente: IG
Grficos
Grfico de dispersin
Variable dependiente: IG
4
3
2
1
0
-1
-2
-3
-2,0
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
2,0
137
138
Estimacin curvilnea
MODEL:
_
MOD_1.
Independent:
Dependent Mth
BG47941
IT
Rsq
QUA
,994
d.f.
21 1620,59
Sigf
b0
,000 -4,2644
b1
b2
,0198 -6,E-06
BG47941
12
11
10
9
8
7
6
5
Observada
Cuadrtico
4
400
600
800
1000
1200
1400
1600
1800
IT
A pesar de que el ajuste es bueno los residuos son poco aceptables porque estn
Error for BG47941 with IT from CURVEFIT, MOD_2 QUADRATIC
correlacionados:
TSPLOT
MODEL:
MOD_3.
,4
,3
,2
,1
0,0
-,1
-,2
-,3
-,4
1
Nmero secuencial
139
11
13
15
17
19
21
23
Y=T+C+S+I
multiplicativa
Y=TCSI
Un ejemplo de una serie temporal de datos discretos es la que se genera a partir de las
opiniones de los empresarios en la Encuesta Trimestral de Opiniones de Castilla y Len.
En dicha encuesta se pregunta, entre otras cosas, a una muestra regional de empresarios
si sus ventas: aumentan, disminuyen o se mantienen. La serie como se ve se genera a
partir de respuestas categricas o datos discretos.
3
Son datos flujo datos generados en un perodo determinado de tiempo : un da, un mes,
un ao, etc... y datos stock los referidos a una fecha determinada: 31 de diciembre de
cada ao. Un ejemplo de datos flujos son las ventas de una empresa ya que stas tendrn
un valor si se toma al cabo de un da, una semana, un mes un ao; sin embargo, el
valor de las acciones de esa misma empresa solo puede ser registrado a una fecha
determinada por ejemplo a 31 de diciembre. Ntese que con datos stock tambin se
puede tomar una serie diaria, semanal, mensual o anual, lo que depender de la
frecuencia con la que registremos el dato, si lo hacemos cuando cierra la jornada de la
bolsa generaremos una serie diaria, si lo hacemos nicamente un da determinado de la
semana estaremos generando una serie semanal, si fuera a determinada fecha de cada
mes una mensual o si lo hacemos al finalizar el ao una serie anual.
140
Y=TCS+I
LA TENDENCIA
Analizamos la tendencia con dos objetivos diferentes: para conocer cuales son
las pautas de comportamiento a lo largo del tiempo de la variable objeto de estudio, y
para predecir sus valores futuros. En este apartado se examinarn los mtodos clsicos
de anlisis de la tendencia: los semipromedios, ajustes de una funcin por mnimos
cuadrados y el mtodo de los promedios mviles.
Xt =+t nt t= 1, 2, ..,t
Una tendencia polinmica de grado p se ajustar a una funcin del siguiente
tipo:
141
f(t) = aert
Xt =0+1xt-1 + ut
siendo >0
T (t ) =
T
1 be rt
T (t) = T.be-rt
donde T, r, b son parmetros positivos.
T(t) = a + b 1/t
B<0
estar originada por diversos ciclos: un ciclo de medio plazo, otro ciclo de largo plazo,
etc.
En teora cabe entender una serie temporal como una suma de un nmero
indeterminado de ciclos de amplitud y perodo diferentes, y puede demostrarse que la
varianza que muestra en el tiempo una serie temporal se obtiene a partir de la suma de
las amplitudes de los diferentes ciclos en que se descompone la serie temporal (relacin
de Parseval).
En el grfico 6.5. representamos una serie temporal construida a partir dos ciclos
de seno, uno de perodo 4 y amplitud 10, y otro de perodo 10 y amplitud 20. La
representacin grfica de la serie reproduce los dos ciclos, el que tiene lugar cada 25
periodos, es decir, 4 veces cada 100 periodos y el que tiene lugar cada 10 periodos, 10
veces cada 100 periodos. La serie temporal descrita obedece a la siguiente ecuacin:
143
Grfico 4.3.
Serie temporal formada por dos ciclos de frecuencia (4/100) y (10/100).
30
20
10
-10
-20
49
46
43
40
37
34
31
28
25
22
19
16
13
10
-30
Para conocer los ciclos que dominan la evolucin temporal de la serie temporal
se utiliza las Transformadas de Fourier, que Excel incluye en la macro de Herramientas
para el Anlisis. Dicha Transformada de Fourier es una funcin de nmeros complejos
que puede operarse en Excel a travs de las funciones de ingeniera del men Funcin.
siendo i = 1 , e [ 2 iux ] = cos(2 ux) + isen(2 ux) y u una variable que representa las
distintas frecuencias.
144
Para que una funcin tenga Transformada de Fourier han de verificarse algunas
condiciones (Condiciones de Dieterlich). No obstante, hay que destacar que, por regla
general, las funciones con las que tratamos los problemas reales verifican todas las
condiciones que es necesario imponer para que las expresiones anteriores puedan
calcularse.
F (u ) =
R 2 (u ) + I 2 (u )
I( u )
R( u )
( u ) = arctg
145
Las series temporales no son consideradas funciones continuas como tal, sino
muestras de seales continuas tomadas a una misma distancia temporal a partir de un
valor inicial x 0 . El par de Transformadas de Fourier Discretas asociadas a una sucesin
finita de valores se obtiene entonces a travs de las siguientes expresiones:
F(u) =
1
N
f (x) =
146
N 1
f(x)e[
2 i ux/ N ]
para u=0,1,...,N-1
x=0
N 1
f( u )e[
x =0
2 i ux/ N ]
para x=0,1,,N-1
147
Como se puede apreciar, hemos realizado una seleccin de todos los modelos,
incluyendo una constante en la funcin y utilizando como regresor la variable temporal.
A continuacin se presentan los resultados obtenidos.
_
Independent:
Time
Dependent Mth
SP500
SP500
SP500
SP500
SP500
SP500
SP500
SP500
SP500
SP500
SP500
LIN
LOG
INV
QUA
CUB
COM
POW
S
GRO
EXP
LGS
Rsq
d.f.
Sigf
,874
,554
,104
,947
,948
,919
,657
,140
,919
,919
,919
116
116
116
115
114
116
116
116
116
116
116
801,26
144,20
13,48
1024,67
697,67
1316,38
221,96
18,82
1316,38
1316,38
1316,38
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
,000
Upper
bound
b0
b1
b2
b3
,8489
,0333
-,8525
,9688
2,9911 -3,5992
1,6018 -,0044
,0003
1,4719
,0084 4,8E-05 1,5E-06
1,2922 1,0118
,6565
,3613
1,0166 -1,4277
,2564
,0117
1,2922
,0117
,7739
,9884
SP500 = 1.4719+0.0084t+0.00005t2+0.0000015t3
148
SP500
6
2
Observada
1
Cbico
0
20
40
60
80
100
120
Serie
149
1,0
,5
0,0
-,5
-1,0
1
13
7
25
19
37
31
49
43
61
55
73
67
85
79
97
91
109
103
115
Nmero secuencial
150
Anlisis espectral
MODEL:
_
MOD_2.
2,0
1,5
Periodograma
1,0
,5
0,0
0,0
Frecuencia
151
,1
,2
,3
,4
,5
152