MINIMOS CUADRADOS

Esta es otra técnica de tipo cuantitativo que permite el cálculo de los pronósticos para
períodos futuros, para lo cual requiere de registros históricos que sean consistentes, reales y
precisos. Esta técnica como su nombre lo indica se trata de sacar el total de las desviaciones
elevadas al cuadrado a un valor mínimo: su objetivo es determinar los coeficientes a y b, que
son conocidos como coeficientes de regresión, donde x es la variable independiente (tiempo),
y es la variable dependiente (pronóstico de la demanda).
En la práctica se pueden utilizar dos métodos para calcular los pronósticos a través de mínimos
cuadrados: Fórmula general y Métodos simplificado.
Para aplicar este método en el cálculo de pronósticos de la demanda, se deben tener en
cuenta las siguientes expresiones matemáticas:

Donde:
n = tamaño de la muestra o el número de períodos
x = período en el que se desea el pronóstico
y = el pronóstico
El método simplificado como su nombre lo indica, en la práctica es más simple y se llega al
resultado de forma más rápida. Las expresiones a usar son:

Donde:
n = tamaño de la muestra o el número de períodos
x = período en el que se desea el pronóstico
y = el pronóstico
¿Cuándo será par y cuando será non?
Pares: Debemos entender por pares el numero de períodos expresados de dos en dos (2, 4, 6,
8...)
Nones: Es cuando los períodos considerados en los cálculos son impares (1, 3, 5, 7, 9...)

Ejemplo 1: “MINIMOS CUADRADOS”

Panasonic, empresa internacional en su área de pilas desechables, desea calcular el pronóstico
de ventas para el año 2003, teniendo como antecedentes los datos que se muestran en la
tabla. El cálculo del pronóstico se deberá emitir mediante la formula general y corroborarse
con el método simplificado que corresponda.


Periodos Ventas (miles) X XY X^2
1990 85 1 85 1
1991 89 2 178 4
1992 92 3 276 9
1993 95 4 380 16
1994 93 5 465 25
1995 98 6 588 36
suma 552 21 1972 91

Calculamos los promedios de las variables “x” y “y”:


Calculamos la variable y la pendiente:




Cálculo del pronóstico:



X son los períodos desde el primer dato histórico hasta el pronóstico a calcular

Pares porque el número de períodos es par (6)
Periodos Ventas (miles) X XY X^2
1990 85 -5 -425 25
1991 89 -3 -267 9
1992 92 -1 -92 1
0 0 0
1993 95 1 95 1
1994 93 3 279 9
1995 98 5 490 25
suma 552 0 80 70
NOTA: A x se le asignan valore impares por que es un problema par.
Calculamos los promedios de las variables “x” y “y”:



Calculamos la variable y la pendiente:


y = 2.2857x + 84
84
86
88
90
92
94
96
98
100
0 1 2 3 4 5 6 7
Serie1
Lineal (Serie1)

*los períodos se cuentan a partir de 1993 con números consecutivos impares de los asignados
a x en un principio hasta llegar a 2003:
Periodos
93-1
94-3
95-5
96-7
97-9
98-11
99-13
2000-15
2001-17
2002-19
2003-21
Ejemplo 2: “MINIMOS CUADRADOS”
Sabritas S.A de C.V. desea elaborar el pronóstico de ventas para uno de sus productos en el
año 2003 y en torno a éste resultado, se hará la planeación de los recursos a utilizar en el
sistema; para lo cual cuenta con el volumen de ventas anuales que se indican en la siguiente
tabla.
El cálculo de éste pronóstico se deberá hacer a través de Fórmula General y Método
Simplificado.
Periodos Ventas (miles) X XY X^2
1987 120 1 120 1
1988 121 2 242 4
1989 117 3 351 9
1990 118 4 472 16
1991 124 5 620 25
1992 125 6 750 36
1993 120 7 840 49
1994 118 8 944 64
1995 130 9 1170 81
suma 1093 45 5509 285

Calculamos los promedios de las variables “x” y “y”:

Calculamos la variable y la pendiente:




Cálculo del pronóstico


Nones porque el número de períodos es impar (9)
Periodos Ventas (miles) X XY X^2
1987 120 -4 -480 16
1988 121 -3 -363 9
1989 117 -2 -234 4
1990 118 -1 -118 1
1991 124 0 0 0
1992 125 1 125 1
1993 120 2 240 4
1994 118 3 354 9
1995 130 4 520 16
suma 1093 0 44 60

Aplicando el método simple:






*los períodos se cuentan a partir de 1992 con números consecutivos de los asignados a x en un
principio hasta llegar a 2003:
Periodos
93-2
94-3
95-4
96-5
97-6
98-7
99-8
2000-9
2001-10
2002-11
2003-12
PROMEDIO MÓVIL

E método de promedios móviles es un número de valores de datos históricos reales para
generar un pronóstico. Los promedios móviles son útiles si podemos suponer que la demanda
del mercado permanecerá relativamente estable en el tiempo. Un promedio móvil de 4 meses
se encuentra simplemente sumando la demanda de los últimos 4 meses y dividiéndolo entre
cuatro. Al concluir cada mes, los datos del mes más reciente se agregan a la suma de los meses
anteriores y se elimina el dato del mes más antiguo. Esta práctica tiende a suavizar las
irregularidades del corto plazo en la serie de datos.
Matemáticamente, el promedio móvil simple (que sirve como estimaciones de la demanda del
siguiente periodo) se expresa como.

Donde n es el número de periodos que comprende el promedio móvil; por ejemplo,4,5 o 6
meses respectivamente , para un promedio móvil de 4, 5 o 6 periodos

Ejemplo 1: “PROMEDIO MOVIL”
Las ventas de cobertizos de almacenamiento en Donna`s Garden Suplí se muestran en la
columna central siguiente tabla. A la derecha se da el promedio móvil de tres meses.

Mes Ventas reales de Cobertizos Promedio móvil de 3 meses
Enero 10


Febrero 12
Marzo 13 11.67
Abril 16 13.67
Mayo 19 16
Junio 23 19.33
Julio 26 22.67
Agosto 30 26.33
Septiembre 28 28
Octubre 18 25.33
Noviembre 16 20.67
Diciembre 14 16

Por tanto, vemos que el pronóstico para diciembre es .Para proyectar la demanda de
cobertizos en enero próximo, sumamos las ventas de octubre, noviembre y diciembre y divide
dimos entre tres: pronostico para enero = (18+16+14)/3=16



PROBLEMA DE PROMEDIOS MÓVILES - PRINCIPIO DE ADMINISTRACION DE OPERACIONES –
JAY HEIZER [P-109]

Ejemplo 2: “PROMEDIO MOVIL”
Aplicar el método de promedios móviles para el pronóstico de ventas de gasolina a partir de la
siguiente información:
Se considerará el promedio móvil a partir de las tres observaciones más recientes. En este caso
se utilizará la siguiente ecuación:
0
5
10
15
20
25
30
35
E
n
e
r
o

F
e
b
r
e
r
o
M
a
r
z
o
A
b
r
i
l
M
a
y
o
J
u
n
i
o
J
u
l
i
o
A
g
o
s
t
o
S
e
p
t
i
e
m
b
r
e
O
c
t
u
b
r
e
N
o
v
i
e
m
b
r
e
D
i
c
i
e
m
b
r
e
Serie1
Serie2

Resumen de cálculos para promedios móviles de tres semanas:
Semana Valor de la serie Pronóstico de la i-ésima
de tiempo(miles de semana con
galones) Promedios móviles
1 17
2 21
3 19
4 23 (17+21+19)/3=19
5 18 (21+19+23)/3=21
6 16 (19+23+18)/3=20
7 20 19
8 18 18
9 22 18
10 20 20
11 15 20
12 22 19

Los promedios móviles también se pueden construir tomando en cuenta valores adyacentes
de las observaciones, por ejemplo: En el caso de determinar el promedio móvil para tres
observaciones adyacentes de la tabla anterior, se tiene:

Semana Valor de la serie Pronóstico de la i-ésima
de tiempo(miles de semana con
galones) Promedios móviles para 3 años
1 17
2 21 (17+21+19)/3=19
3 19 (21+19+23)/3=21
4 23 (19+23+18)/3=20
5 18 (23+18+16)/3=19
6 16 18
7 20 18
8 18 20
9 22 20
10 20 19
11 15 19
12 22


Promedios móviles ponderados
Para mostrar el uso de éste método, se utilizará la primera parte del ejemplo anterior de la
venta de gasolina. El método consiste en asignar un factor de ponderación distinto para cada
dato. Generalmente, a la observación o dato más reciente a partir del que se quiere hacer el
pronóstico, se le asigna el mayor peso, y este peso disminuye en los valores de datos más
antiguos. En este caso, para pronosticar las ventas de la cuarta semana, el cálculo se realizaría
de la siguiente manera:

Puede observarse que el dato más alejado (correspondiente a la primera semana) tiene el
factor de ponderación más pequeño, el siguiente tiene un factor de ponderación del doble que
el primero y el dato más reciente (que corresponde a la tercera semana) tiene un factor de
ponderación del triple del primero. Los pronósticos para las diversas semanas se presentan en
la siguiente tabla. En todos los casos, la suma de los factores de ponderación debe ser igual a
uno.


-SUAVIZAMIENTO EXPONENCIAL
El suaviza miento exponencial emplea un promedio ponderado de la serie de tiempo pasada
como pronóstico; es un caso especial del método de promedios móviles ponderados en el cual
sólo se selecciona un peso o factor de ponderación: el de la observación más reciente. En la
práctica comenzamos haciendo que F1, el primer valor de la serie de valores uniformados, sea
igual a Y1, que es el primer valor real de la serie. El modelo básico de suavizamiento
exponencial es el siguiente:


En base a lo anterior, el pronóstico para el período dos se calcula de la siguiente manera:

Como se observa, el pronóstico para el período 2 con suavizamiento exponencial es igual al
valor real de la serie de tiempo en el período uno.
Para el período 3, se tiene que:


Para el período 4 se tiene:

Para mostrar el método de suaviza miento exponencial, retomamos el ejemplo de la gasolina,
utilizando como constante de suaviza miento = 0.2:


REGRESIÓN LINEAL MÚLTIPLE
El modelo de regresión múltiple no es más que una generalización a varias variables de un
modelo de regresión simple. La ecuación de la regresión lineal simple es:
y a bx = +
Donde “y“ es la variable dependiente y “x“ es la variable independiente. Pero esta ecuación se
puede generalizar para el caso en que haya más de una variable independiente. Supongamos
que haya 3 variables independientes: x
1
, x
2
, x
3
. Podemos construir la ecuación:
3
x
3
b
2
x
2
b
1
x
1
b a y + + + =
Cada variable independiente x
i
tiene un coeficiente de regresión o pendiente propia b
i
. Este
coeficiente se interpretará como el cambio en la variable dependiente (“y”), por unidad de
cambio en cada variable independiente (x
1
, x
2
ó x
3
) a igualdad de nivel de las otras variables
independientes. Es imposible interpretar una regresión si no se conocen las unidades de
medida de cada variable. Esto se aplica tanto a la regresión simple como a la múltiple.
Ejemplo 1: REGRESION MULTIPLE:
Supongamos que la Tensión Arterial Sistólica (TAS, mmHg) de una muestra de adultos con alto
riesgo cardiovascular se utiliza como variable dependiente “y” intentando predecirla a partir
de tres variables independientes, x
1
, x
2
y x
3
que corresponden respectivamente a la edad en
años (EDAD: x
1
), el índice de masa corporal en kg/m
2
(IMC: x
2
) y el sexo (SEXO: x
2
,
codificado
como sexo=0 para hombres y sexo=1 para mujeres). Resulta la siguiente ecuación:
3 2 1
4,9x 0,6x 7x 0 85 y ÷ + + = ,
Y sustituyendo x
i
por sus nombres, tendremos:
SEXO) 4,9 (- IMC) (0,6 EDAD) (0,7 85 TAS × + × + × + =
La interpretación será que por cada año más de edad, la TAS aumentará en 0,7 mmHg
por término medio, independientemente de cuál sea el sexo y el IMC. Por cada kg/m
2
más de
IMC subirá la TAS en 0,6 mmHg por término medio (en ambos sexos y sea cual sea la edad). La
diferencia entre hombres y mujeres será de 4,9 mmHg menos en las mujeres, a igualdad de
edad y de IMC. Quizás esto último es más difícil de entender, se aclarará si construimos dos
ecuaciones, una para hombres y otra para mujeres, sustituyendo la variable "SEXO" por sus
respectivos valores. La variable sexo se codificó así:
Hombres: SEXO= 0
Mujeres: SEXO= 1
En los hombres, la ecuación será: IMC) (0,6 EDAD) (0,7 85 TAS × + × + =
En las mujeres, la ecuación será: 4,9 - IMC) (0,6 EDAD) (0,7 85 TAS × + × + =
Por lo tanto, las mujeres, a igualdad de edad e IMC, tendrán una TAS 4,9 mmHg
inferior. Es posible introducir variables categóricas (sexo en el ejemplo) en el modelo.
En la figura se ha asumido un IMC constante (IMC=25 kg/m2) para poder representar
la TAS sólo en función de la edad y el sexo. Se puede observar que, según el modelo de
regresión múltiple, las dos ecuaciones (una para hombres y otra para mujeres) son paralelas,
ya que como se ha visto anteriormente únicamente difieren en una constante.


Figura La ecuación y=a+b
1
x
1
+b
2
x
2
da lugar a dos rectas paralelas,
si x
2
es una variable dicotómica. En el ejemplo “y” es la TAS, x
1
es la edad y x
2
el sexo.

(se ha prescindido del IMC, considerándolo fijo en 25 kg/m
2
)
Estimaciones ajustadas por factores de confusión en regresión múltiple
Un examen atento de la figura conduce a concluir que, sea cual sea la edad, la
diferencia entre la TAS de hombres y mujeres es constante y vale 4,9 mmHg. Se dice que esta
esta diferencia (4,9 mmHg) está ajustada por edad. "Ajustar por" significa equiparar a los
grupos que se comparan en cuanto a la variable por la que se ajusta, en este caso es crear una
comparación entre hombres y mujeres, igualándolos en cuanto a su edad. Para el ajuste se ha
usado un método multivariable, que es la regresión múltiple.
En cambio si comparásemos la TAS entre hombres y mujeres usando un método
bivariante (t de Student) encontrariamos que la diferencia es sólo de 2,4 mmHg. El método
bivariante no tiene en cuenta la edad, pues sólo considera las dos variables comparadas (sexo
y TAS)
¿Cómo es posible que siendo la TAS media de los hombres 2,4 mmHg mayor que la de
las mujeres, sin embargo en la figura 12.1 la diferencia a cualquier edad entre la TAS media de
hombres y mujeres sea casi el doble (4,9 mmHg). Esto se puede explicar con los datos
aportados por la tabla 12.2.


130
135
140
145
150
155
160
55 57 59 61 63 65 67 69 71 73 75 77 79
T
A
S

p
r
e
d

(
m
m
H
g
)

Edad
Tabla Comparación entre hombres y mujeres de tensión arterial (TAS), edad e IMC.
Hombres (n=326) Mujeres (n=413)
Tensión arterial sistólica
media (DE)

151,8 (18,2)

149,4 (20,2)
Diferencia de medias en TAS 151,8 - 149,4 = 2,4 mmHg

t de Student (compara medias TAS)
1,7
1,43
149,4 151,8
t
737
=
÷
= ÷ p=0,09 (2 colas)
Edad media 67,6 69,9
IMC medio 28,8 30,2

Observando la tabla puede apreciarse que los hombres de la muestra son más jóvenes que las
mujeres (diferencia de edad = 2,2 años) y por eso su TAS es sólo 2,4 mmHg superior cuando se
comparan de manera bruta con las mujeres, ya que la TAS aumenta a medida que aumenta la
edad. Si, en la muestra, los hombres son más jóvenes que las mujeres, comparar sus medias en
la muestra (t de Student) infraestimará la verdadera diferencia existente entre hombres y
mujeres. Por eso no basta la comparación bruta, sino que es necesario igualar por edad a
hombres y mujeres usando un método multivariable para poder realizar una verdadera
comparación válida. Esto libera del efecto distorsionador de la edad. Sólo mediante el método
multivariable que ajusta por edad se puede realizar una generalización científicamente
rigurosa de las diferencias en TAS entre hombres y mujeres. La verdad es que los hombres
tienen la TAS 4,9 mmHg por encima de las mujeres, sea cual sea su edad. Si esto es verdad a
todas las edades, debe ser verdad también para el conjunto.
En este ejemplo, al comparar la TAS según sexo, se dice que la variable edad actúa como factor
de confusión (. Un factor de confusión es una variable que se asocia tanto con la variable
independiente (supuesta "causa") como con el supuesto "efecto" y que hace que la
comparación bruta o "cruda" (t de Student) sea inválida. Cuando hay factores de confusión se
debe usar el análisis multivariable. La figura 12.2 representa gráficamente el papel de la edad
como factor de confusión:


Figura La edad actúa como factor de confusión
al valorar la relación entre edad y tensión arterial sistólica (TAS)




Sexo
Edad
(factor de confusión)
TAS
Usando terminología de gráficos causales se diría que la edad abre una puerta trasera que
comunica sexo y TAS (Hernán, 2002; de Irala, 2002). Se cierra dicha puerta trasera al "ajustar"
por edad. La comparación bruta (diferencia = 2,4 mmHg entre hombres y mujeres) no es
válida. La comparación ajustada (diferencia = 4,9 mmHg) está libre de confusión por edad. La
figura presenta esto mismo
1
según SPSS.

Tabla Modelos de regresión múltiple con la tensión arterial (TAS), edad, sexo e IMC.

Modelo B Error típ. Beta t Sig.
1 (Constante) 151,827 1,070 141,952 0,000
Sexo
1
-2,407 1,431 -0,062 -1,683 0,093
2 (Constante) 85,000 9,212 9,227 0,000
Sexo
1
-4,909 1,427 -0,126 -3,439 0,001
Edad 0,741 0,109 0,246 6,801 0,000
IMC 0,582 0,168 0,125 3,455 0,001
1
Sexo=0 para hombres y Sexo=1 para mujeres.
IMC = índice de masa corporal (kg/m
2
)
Variable dependiente: tensión arterial sistólica (TAS, mmHg).

Interpretación:
Se han ajustado dos modelos, ambos con TAS como variable dependiente. El primero sólo
incluye una variable independiente, que es el sexo. Este primer modelo representa la
comparación cruda o bruta (bivariante). Su coeficiente de regresión o pendiente (b = -2,407)
corresponde exactamente a la diferencia de medias que se hubiese obtenido usando la t de
Student. En este sentido, puede afirmarse que la t de Student es un caso particular de
regresión.
El segundo modelo usa 3 variables independientes. Además del sexo, incluye la edad y el índice
de masa corporal (IMC). Este modelo ha controlado la posible confusión por edad y por IMC en
la comparación de la tensión arterial sistólica (TAS) entre sexos. La verdadera diferencia, una
vez ajustada por edad e IMC es de –4,9 mmHg (TAS inferior en las mujeres).
Los valores p de significación estadística indican que cada una de las tres variables del segundo
modelo se asocia independientemente a la TAS de manera significativa. El valor p del primer
modelo (p = 0,093) no es significativo, pero no sería válido, ya que está confundido por edad e
IMC. El verdadero valor p para la comparación entre sexos es el ajustado (p=0,001) que está en
el segundo modelo.


.

Interacción o modificación del efecto en regresión múltiple
En el ejemplo anterior se asume implicitamente que hay una diferencia en la TAS constante
(4,9 mmHg) entre hombres y mujeres, sea cual sea su edad. Pero hay veces que la diferencia
entre hombres y mujeres no es constante para todas las edades. Por ejemplo pudiera pasar
que, a medida que sea mayor la edad, sean menores las diferencias entre hombres y mujeres.
A esto se le llama "modificación del efecto" o "interacción", pues significa que la edad modifica
las diferencias entre sexos (o viceversa: que el efecto de la edad sobre la TAS es diferente en
uno y otro sexo). La interacción puede valorarse introduciendo una nueva variable que es el
producto de las dos que podrían interactuar entre sí.
Término de interacción = sexo * edad
En el ejemplo, el término de producto sexo*edad valdrá 0 en varones, ya que la
variable sexo vale 0 para ellos. Pero esta nueva variable equivale a la edad en mujeres (edad*1
= edad). Se debe ajustar un tercer modelo (tabla del modelo 3) incluyendo el término de
producto.
Tabla Regresión múltiple con TAS (dependiente), edad, sexo e IMC, añadiendo un término de
interacción (modelo 3) entre sexo y edad.

Modelo B Error típ. Beta t Sig.
1 (Constante) 151,827 1,070 141,952 0,000
Sexo -2,407 1,431 -0,062 -1,683 0,093
2 (Constante) 85,000 9,212 9,227 0,000
Sexo -4,909 1,427 -0,126 -3,439 0,001
edad 0,741 0,109 0,246 6,801 0,000
IMC 0,582 0,168 0,125 3,455 0,001
3 (Constante) 96,051 12,060 7,965 0,000
sexo -26,089 15,000 -0,670 -1,739 0,082
edad 0,576 0,159 0,192 3,625 0,000
IMC 0,584 0,168 0,125 3,470 0,001
sexo*edad 0,308 0,217 0,559 1,418 0,156
1
Sexo=0 para hombres y Sexo=1 para mujeres.
IMC = índice de masa corporal (kg/m
2
)
sexo*edad = término de producto (equivale a la edad en mujeres y a 0 en varones)
Variable dependiente: tensión arterial sistólica (TAS, mmHg).



Interpretación:

El modelo 3 proporciona dos ecuaciones, una para hombres y otra para mujeres.

Varones: IMC) (0,584 EDAD) (0,576 96,051 TAS × + × + =
Mujeres: EDAD) 0,308 IMC) (0,584 EDAD) (0,576 26,089 - 96,051 TAS × + × + × + = (


Sumando las constantes y los coeficientes de la edad, la ecuación en mujeres será:

Mujeres (simplificada): IMC) (0,584 EDAD) (0,884 69,962 TAS × + × + =

Sin embargo, al valorar una interacción debe comprobarse si su coeficiente tiene un valor p
significativo o no. Si no es significativo debe suprimirse. Aquí el valor p no es significativo
(p=0,156) y preferiremos el modelo sin interacción, ya que no hay evidencia para rechazar la
hipótesis nula de que su coeficiente (0,308) sea 0 en la población. No obstante, a efectos
demostrativos, representaremos gráficamente el modelo con interacción para interpretar su
significado.

Figura Interacción. La ecuación y=a+b
1
x
1
+b
2
x
2
+ b
2
(x
1
*x
2
) da lugar a dos rectas que ya no son
paralelas. En el ejemplo “y” es la TAS, x
1
es la edad y x
2
el sexo.

(se ha prescindido del IMC, considerándolo fijo en 25 kg/m
2
)

Observando la figura se aprecia que las diferencias entre hombres y mujeres ya no son
constantes, sino que dependen de la edad (la edad es un modificador del efecto del sexo).
También puede interepretarse al revés: la pendiente de la recta que relaciona TAS y edad es
diferente en hombres y mujeres, es decir el sexo es un modificador del efecto de la edad.

130
135
140
145
150
155
160
55 57 59 61 63 65 67 69 71 73 75 77 79
T
A
S

p
r
e
d

(
m
m
H
g
)

Edad
Variables cualitativas con más de dos categorías y variables dummy
Cuando se desea introducir como independiente una variable cualitativa que tenga 3 o más
categorías, se debe elegir primero cuál será la categoría de referencia y crear una nueva
variable para cada una de las demás categorías.
Por ejemplo, Estruch et al desean comparar 3 dietas en cuanto a su eficacia para reducir los
niveles de colesterol. Usaron 3 dietas, una rica en aceite de oliva virgen (AOV), otra rica en
frutos secos (FS) y una dieta control baja en grasas (control). La variable cualitativa "dieta "
tendrá, por tanto estos 3 niveles o categorías. Se considerá el grupo control como categoría de
referencia y se crearán dos nuevas variables (AOV y FS). Esto sirve para comparar cada una de
ellas dos frente al grupo control. La nueva variable AOV valdrá 1 cuando el participante sea
asignado al grupo de aceite de oliva virgen y 0 en caso contrario (control o FS). La nueva
variable FS valdrá 1 cuando el participante sea asignado al grupo de frutos secos y 0 en caso
contrario (control o AOV). Se ha usado este procedimiento para valorar las diferencias en
cuanto al cambio de peso al cabo de 3 meses en ese ensayo.
Tabla Dos variables "dummy" sustituyen a una variable con 3 categorías

CODIFICACIÓN Nuevas variables (variables "dummy"")
Variable original
Categorías:

AOV

FS
1 = Aceite de oliva 1 0
2 = Frutos secos 0 1
3 = control 0 0

SPSS B Error típ. Beta t Sig.
(Constante) -0,280 0,191 -1,461 0,144
AOV 0,031 0,262 0,005 0,119 0,905
FS 0,161 0,267 0,027 0,605 0,546

Variable dependiente: cambio de peso (kg) a 3 meses (DIF_PES.)

Interpretación:

El listado de salida de SPSS sirve para crear tres ecuaciones de cambio de peso, una
para cada grupo. Así, se puede comparar el cambio de peso (kg) predicho por el modelo para
el grupo de dieta rica en aceite de oliva virgen, lo predicho para dieta rica en frutos secos y lo
predicho para el grupo control (baja en grasa).

Modelo para dieta rica en aceite de oliva virgen (AOV=1, FS=0):

DIF_PES = -0,28 + 0,031*1 + 0,161*0
DIF_PES = -0,28 + 0,031 = -0,249

Modelo para dieta rica en frutos secos (AOV=0, FS=1):

DIF_PES = -0,28 + 0,031*0 + 0,161*1
DIF_PES = -0,28 + 0,161 = -0,119

Modelo para dieta baja en grasa (grupo control) (AOV=0, FS=0):

DIF_PES = -0,28 + 0,031*0 + 0,161*0
DIF_PES = -0,28

La interpretación de los dos coeficientes (0,031 y 0,161) es, por tanto, muy sencilla y
directa. El primero (+0,031) es la diferencia en el cambio de peso entre el grupo de aceite y el
grupo control, el segundo (+0,161) es la diferencia entre el grupo de frutos secos y el grupo
control. Ninguna de estas diferencias resultó estadísticamente significativa.
Esto se podría haber hecho también por ANOVA, con dos contrastes a priori
(coeficientes: –1, 0 y +1 para el primer contraste y coeficientes: 0, -1 y +1 para el segundo). El
resultado sería exactamente idéntico al de la regresión, como puede verse debajo.




La ventaja de hacerlo por regresión es que basta con introducir también otras variables
en el modelo (p. ej. sexo, edad, peso inicial, etc.) para obtener estas mismas estimaciones ya
ajustadas por esos posibles factores de confusión.

Supuestos o condiciones de aplicación del modelo de regresión múltiple
El procedimiento utilizado para calcular una regresión lineal simple es el ajuste por
mínimos cuadrados El objetivo es encontrar la ecuación que mejor se ajuste a los puntos
observados. En una regresión múltiple el procedimiento de estimación es semejante al
utilizado en la regresión lineal simple, se estima la superficie que mejor se ajusta a la nube de
puntos observados. El método se denomina ajuste por mínimos cuadrados. Es un método que
minimiza las distancias desde cada punto observado hasta el plano (residuales)
Cuando se ajusta un modelo de regresión múltiple, el ordenador devuelve coeficientes
b
i
para cada una de las variables independientes x
i
que pueden considerarse predictores de la
variable cuantitativa considerada como respuesta (variable dependiente).
Contraste Valor del
contraste Error típico t Sig. (bilateral)
1 -0,031 0,262 -0,119 0,905
2 -0,161 0,267 -0,605 0,546

Por lo tanto, al igual que en la regresión lineal simple, el modelo se basa unos
supuestos similares,que son los siguientes.
- Las variables están relacionadas linealmente.
- La distribución de la variable dependiente condicionada a cada posible combinación
de valores de las independientes es una distribución normal multivariable.
- Las variables son independientes unas de otras.
- Homogeneidad de las varianzas (homocedasticidad): las varianzas de la variable “y”
condicionadas a los valores de “x” son homogéneas.
Para comprobar estos supuestos se deben guardar los residuales y valorar si se adaptan a la
normalidad, igual que se hace en regresión simple. Si el tamaño muestral es grande,
habitualmente resultarán significativos los test de normalidad de los residuales, pero esto
tiene poca relevancia práctica. En esta situación un test de normalidad significativo es sólo una
consecuencia del tamaño muestral. Resulta entonces más importante valorar la magnitud del
apartamiento de la normalidad usando métodos gráficos. Habitualmente, con tamaños
muéstrales grandes (n>500) la regresión suele ser suficientemente robusta.
Cuando haya un apartamiento notorio de la normalidad en los residuales se puede probar un
término cuadrático para alguna de las variables independientes cuantitativas más importantes.
Esto conduciría a modelos polinómicos y permitiría incluir relaciones curvilíneas. Existen
amplias posibilidades de modelización no lineal en regresión.

Ejemplo 2: PRÁCTICO DEL MODELO DE REGRESIÓN MÚLTIPLE
Por ejemplo, con SPSS se obtuvo el listado que aparece en la tabla 1 al predecir el índice de
masa corporal (IMC) en función de diversas características (edad, hábito tabáquico, nivel de
estudios y actividad física en el tiempo libre) en los varones de una muestra representativa de
la población adulta (>15 años) de la Unión Europea.



La codificación de las variables fue:
Edad: variable cuantitativa (años) Estudios:
0 = Estudios medios o superiores
1 = Estudios primarios

Actividad física en el tiempo libre:
variable cuantitativa medida en
METs-horas/semana


Tabaco:
0 = No fumador
1 = Fumador actual
2 = Ex-fumador (lo dejó hace < 1 año)
3 = Ex-fumador (lo dejó hace >= 1 año)

Tabla Aspecto parcial de los resultados de SPSS en regresión múltiple.
Coeficientes
Coeficientes no
estandarizados
Coeficientes
estandarizados
t Sig.
B Error típ. Beta
(Constante) 18,767 ,287 65,448 ,000
EDAD ,266 ,014 1,229 19,672 ,000
EDAD AL CUADRADO -2,364E-03 ,000 -,993 -15,872 ,000
FUMADOR -,468 ,087 -,064 -5,390 ,000
EXFUMADOR < 1 AÑO ,478 ,245 ,022 1,956 ,051
EXFUMADOR 1 AÑO+ ,530 ,127 ,050 4,177 ,000
ESTUDIOS PRIMARIOS ,534 ,091 ,067 5,867 ,000
ACTIV. FISICA (METs-h./sem) -8,501E-03 ,002 -,049 -4,404 ,000
Variable dependiente: BMI
Interpretación:
La edad guardaba en esta base de datos una relación curvilínea con el IMC (BMI), el
IMC correspondiente a cada edad será: IMC = 18,767 + (0,266edad) – (0,002364edad
2
). Para
entender mejor esta relación, es preferible representar la ecuación gráficamente como se hace
en la figura 12.4.

Figura Relación entre edad e índice de masa corporal (BMI). Muestra representativa varones
europeos mayores de 15 años (n=7.375).
Además, es preciso considerar que este efecto de la edad es independiente de los
otros factores (tabaco, estudios y actividad física) incluidos en el modelo.
La variable categórica "tabaco" tenía 4 categorías, por lo tanto se han introducido 3
términos en el modelo (todas las categorías menos una). La categoría que no se introduce
(aquí son los nunca fumadores) es la que queda como estrato de referencia frente al cual se
realizan todas las comparaciones. Así, los fumadores tenían (independientemente de cuál
fuese su edad, estudios y actividad física) por término medio 0,468 kg/m
2
menos de IMC que
los nunca fumadores. En cambio los ex-fumadores tenían por término medio mayor IMC que
los nunca fumadores. Para los que habían dejado de fumar hacía menos de un año esta
diferencia media fue de +0,478 kg/m
2
, y para los que dejaron de fumar hacía más de un año
fue de +0,530 kg/m
2
, en comparación con los nunca fumadores (siempre independientemente
de cuál fuese su edad, estudios y actividad física).
Los hombres cuyo nivel de estudios era primario o menor (Estudios=primarios) presentaron
mayor IMC medio que quienes tenían estudios más elevados. La diferencia media en el IMC
fue de +0,534 kg/m
2
(independientemente de cuál fuese su edad, hábito tabáquico y actividad
física).
Cada MET-hora más a la semana de actividad física en el tiempo libre se asoció a una
reducción del IMC de 0,0085 kg/m2 (independientemente de cuál fuese la edad, hábito
tabáquico y nivel de estudios de los participantes). Los METs son una medición de la cantidad
de esfuerzo que se hace en una actividad física o deporte. Se suman a lo largo de la semana
multiplicada por las horas que se dedican por término medio a esa actividad o deporte (METS-
horas/semana).
Las 4 variables resultaron ser predictores independientes y estadísticamente significativos de
la variabilidad en el IMC.
La representación gráfica de la figura asume que los sujetos tenían el valor 0 en las otras 3
variables (nivel de estudios, hábito tabáquico y actividad física). Tener un valor de 0 en estas 3
variables supone no ser fumador, tener estudios superiores o medios y no realizar ninguna
actividad física en el tiempo libre.
22
23
24
25
26
27
15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
Edad
IMC

MÉTODO DE PROMEDIOS MÓVILES CON PONDERACIÓN EXPONENCIAL
Panasonic, empresa internacional en su área de pilas desechables, desea calcular el pronóstico
de ventas para el año 2003, teniendo como antecedentes los datos que se muestran en la
tabla. El cálculo del pronóstico se deberá emitir mediante la fórmula general y corroborarse
con el método simplificado que corresponda.

Períodos Y Ventas (miles)
1990 85
1991 89
1992 92
1993 95
1994 93
1995 98
Σ 552

TENIENDO EN CUENTA QUE:
()

PARA 1996:

() ( )

Para 1997
() ( )



Para 1998
() ( )

Para 1999
() ( )


Para 2000
() ( )


Para 2001
() ( )


Para 2002
() ( )

Para 2003
() ( )

Luego los pronósticos para los siguientes años serán :

Períodos Y Ventas (miles)
1996 96.00
1997 96.80
1998 96.48
1999 96.60
2000 96.55
2001 96.57
2002 96.56
2003 96.56
-MÉTODO DE REGRESIÓN EXPONENCIAL
Ejemplo:

Panasonic, empresa internacional en su área de pilas desechables, desea calcular el pronóstico
de ventas para el año 2003, teniendo como antecedentes los datos que se muestran en la
tabla. El cálculo del pronóstico se deberá emitir mediante la fórmula general y corroborarse
con el método simplificado que corresponda.

Períodos Y Ventas (miles) x x
2
log y x log y
1990 85 -5 25 1,9294 -9,6471
1991 89 -3 9 1,9494 -5,8482
1992 92 -1 1 1,9638 -1,9638
1993 95 1 1 1,9777 1,9777
1994 93 3 9 1,9685 5,9054
1995 98 5 25 1,9912 9,9561
Σ 552 0 70 11,7800 0,3803
Para esto tenemos que :


∑( )

()

Luego hallando b:


∑( )

()

Luego la ecuación de pronóstico es:

Luego para el pronóstico para el 2003 será:

Períodos Y Ventas (miles) x
1996 100 7
1997 103 9
1998 105 11
1999 108 13
2000 111 15
2001 114 17
2002 117 19
2003 120 21








70
80
90
100
1 2 3 4 5 6
V
a
l
o
r

Punto de datos
exponencial
Real
Pronóstico
-METODO DE REGRESION PARABOLICA DE PRONOSTICOS
- Ajuste de una función parabólica: Y
*
= a + b X + c X
2

X Y X
2
X
3
X
4
XY X
2
Y Y
*
e=Y-Y
*
e
2
1 1,25 1 1 1 1,25 1,25 1,18 0,07 0,0049
2 5 4 8 16 10 20 5,11 -0,11 0,0121
3 11,25 9 27 81 33,75 101,5 11,32 -0,07 0,0049
4 20 16 64 256 80 320 19,81 0,19 0,0361
5 30,5 25 125 625 152,5 762,5 30,58 -0,08 0,0064
E 15 68 55 225 979 277,5 1205 68 0 0,0644
1/5E 3 13,6 11 55,5 13,6 0 0,0128

Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones:
¦
)
¦
`
¹
+ + =
+ + =
+ + =
¬
¦
)
¦
`
¹
+ + =
+ + =
+ + =
¿ ¿ ¿ ¿
¿ ¿ ¿ ¿
¿ ¿ ¿
979c 225b 55a 1205
225c 55b 15a 277,5
55c 15b 5a 68

X c X b X a Y X
X c X b X a XY
X c X b Na Y
4 3 2 2
3 2
2

Resolviendo este sistema se obtiene: a= -0,47 b= 0,51 c= 1,14
Y
*
= -0,47 + 0,51 X + 1,14 X
2


Bondad del Ajuste:
Coeficiente de determinación: R
2
= 0,9998
111,715
0,01288
- 1
S
S
- 1
S
S
2
Y
2
2
Y
2
Y e
*
= = =
0,01288
N
e
ECM S
2
2
2
e
= = =
¿


2) Ejemplo de Regresión Parabólica
Dadas dos variables, x e y, ajustar a los datos una función de tipo parabólico.

x y x
2
x
3
x
4
xy x
2
y
1 1.25 1 1 1 1.25 1.25
2 5 4 8 16 10 20
3 11.25 9 27 81 33.75 101.25
4 20 16 64 256 80 320
5 30.5 25 125 625 152.5 762.5
15 68 55 225 979 277.5 1205
Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones:

¬
¦
¦
)
¦
¦
`
¹
= + +
= + +
= + +
¿ ¿ ¿ ¿
¿ ¿ ¿ ¿
¿ ¿ ¿
y x x c x b x a
xy x c x b x a
y x c x b na
2 4 3 2
3 2
2
1205 979 225 55
5 . 277 225 55 15
68 55 15 5
= + +
= + +
= + +
c b a
c b a
c b a

Resolviendo este sistema se obtiene:

14 . 1
51 . 0
47 . 0
=
=
÷ =
c
b
a

Por tanto, la ecuación de la parábola de grado dos que mejor se ajusta a la nube de
puntos es:
2
14 . 1 51 . 0 47 . 0 x x y + + ÷ =



-CORRELACION
-COEFICIENTE DE CORRELACIÓN SIMPLE DE PEARSON (MODELO RECTILÍNEO)
El coeficiente de correlación es una medida de asociación entre dos variables y se simboliza
con la literal r.
Los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual corresponde a
ausencia de correlación. Los primeros dan a entender que existe una correlación directamente
proporcional e inversamente proporcional, respectivamente.
De lo anterior referimos que:
- +1 ó -1 = Correlación perfecta.
- 0.95 = Correlación fuerte.
- 80% = Correlación significativa.
- 70% = Correlación moderada.
- 50% = Existe una relación parcial.
Las 3 gráficas en coordenadas cartesianas posteriores, se muestra la variable independiente (X)
se ubica en las abscisas y la dependiente (Y) en el eje de las ordenadas. Los coeficientes de
correlación significan esa asociación entre los cambios que se observan en la variable
dependiente con respecto a la variable independiente.
La gráfica (a) representa una correlación positiva, es decir, conforme los valores de X
aumentan, también aumentan los valores de Y. A su vez, la gráfica (b) muestra una correlación
negativa, de modo que al incrementarse los valores de la variable independiente, los valores
de la dependiente disminuyen. La gráfica (c) no indica correlación.
Representación de los 4 modelos de regresión
X (tiempo)
5 4 3 2 1
Y

r
e
a
l

y

t
e
ó
r
i
c
a
s

(
P
r
o
d
u
c
c
i
ó
n
)
40
30
20
10
0
-10
Y (producción)
X (tiempo)
Y*1 lineal
X (tiempo)
Y*2 parábola
X (tiempo)
Y*3 potencial
X (tiempo)
Y*4 exponencial
X (tiempo)

El coeficiente de correlación lineal de Pearson se define matemáticamente con la ecuación
siguiente:


Donde:
r = coeficiente de correlación de Pearson.



2
= sumatoria de los valores al cuadrado de la variable independiente.
2
= sumatoria de los valores al cuadrado de la variable dependiente.
N = tamaño de la muestra en función de parejas.
Este procedimiento estadístico es aplicable cuando las observaciones se miden según una
escala de intervalo, por otra parte, el fenómeno debe ser lineal.
Al igual que las otras pruebas paramétricas, la varianza de las variables X y Y deben guardar
homogeneidad.

Pasos.
1. Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la
variable independiente (X).
2. Elevar al cuadrado cada valor X y de Y.
3. Obtener los productos de X y Y, para lo cual se deben multiplicar independientemente
ambos valores.
4.
2 2

5. Calcular el tamaño de la muestra en función de parejas de X y Y.
6. Aplicar la ecuación.
7. Calcular los grados de libertad (gl): gl = N parejas -1.
8. Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en
función de la probabilidad.
9. Decidir si se acepta o rechaza la hipótesis.
Ejemplo:
Elección de la prueba estadística para medir la asociación o correlación. Las edades en días
están en escala de tipo intervalo, tenemos dos variables, entonces aplicamos esta prueba.
Objetivo: Conocer que grado de asociación existe entre la edad y peso corporal de niños de
edades desde el nacimiento hasta los 6 meses.
Hipótesis.
Ha. Entre las observaciones de edad de los niños y peso corporal existe correlación
significativa.
Ho. Entre las observaciones de edad de los niños y pero corporal no existe correlación
significativa.




gl = 21 - 2 = 19


rc = 0.91
rt = 0.444
rc > rt se rechaza Ho. Entre las variables edad del niño y el peso corporal existe una correlación
muy significativa. Elevando r al cuadrado obtenemos el error existente r
2
= 0.8281 = 0.83,
donde el 83% de los cambios observados en el peso de los niños se debe a los incrementos de
la edad, sin embargo, el 17% se ignora.
Creamos ahora una gráfica (hecha con el programa estadístico SPSS) para representar la
correlación obtenida. Encontramos entonces una correlación positiva, es decir, conforme la
edad aumenta, también aumenta el peso corporal de los niños.































REFERENCIAS BIBLIOGRAFICAS
BIBLIOGRAFIA DEL EJEMPLO DE PRONOSTICOS MOVILES
www.estadistica.mat.uson.mx/.../seriesdetiempo.pdf
BIBLIOGRAFÍA DEL EJEMPLO DE MINIMOS CUADRADOS
www.monografias.com/.../placo.shtml
BIBLIOGRAFIA DEL EJEMPLO DEL EJEMPLO DE REGRESIÓN EXPONENCIAL
http://www.monografias.com/trabajos13/placo/placo.shtml
BIBLIOGRAFÍA DEL EJEMPLO DE CORRELACION

Altman DG, Deeks JJ, Sackett DL (1998). Odds ratios should be avoided when events are
common. BMJ 1998;317:1318.
Altman DG, Goodman SN (1994). Transfer of technology from statistical journals to the
biomedical literature. Past trends and future predictions. JAMA 1994;272:129-32.
Bautista LE (1995). “Razón relativa” y “tasa relativa” como traducciones de odds ratio y de
hazard ratio. Bol Ofic Sanit Panam 1995;119:278-80.
BIBLIOGRAFIA DEL EJEMPLO DE REGRESIÓN PARABOLICO
http://www.google.com/search?hl=es&q=M%C3%A9todo+de+regresi%C3%B3n+parab%C3%B
3lica+de+pron%C3%B3sticos+ejemplo+explicativo%29&aq=f&aqi=&aql=&oq=&gs_rfai=
http://www.scribd.com/doc/41357597/Regresion-Parabolica#




Ejemplo 1: “MINIMOS CUADRADOS”

Panasonic, empresa internacional en su área de pilas desechables, desea calcular el pronóstico de ventas para el año 2003, teniendo como antecedentes los datos que se muestran en la tabla. El cálculo del pronóstico se deberá emitir mediante la formula general y corroborarse con el método simplificado que corresponda.

Periodos 1990 1991 1992 1993 1994 1995 suma

Ventas (miles) 85 89 92 95 93 98 552

X 1 2 3 4 5 6 21

XY 85 178 276 380 465 588 1972

X^2 1 4 9 16 25 36 91

Calculamos los promedios de las variables “x” y “y”:

Calculamos la variable y la pendiente:

Cálculo del pronóstico:

100 98 96 94 92 90 88 86 84 0 1 2 3 4 5 6 7 Serie1 Lineal (Serie1) y = 2.2857x + 84

X son los períodos desde el primer dato histórico hasta el pronóstico a calcular

Pares porque el número de períodos es par (6) Periodos 1990 1991 1992 1993 1994 1995 suma Ventas (miles) 85 89 92 95 93 98 552 X -5 -3 -1 0 1 3 5 0 XY -425 -267 -92 0 95 279 490 80 X^2 25 9 1 0 1 9 25 70

NOTA: A x se le asignan valore impares por que es un problema par. Calculamos los promedios de las variables “x” y “y”:

Calculamos la

variable y la pendiente:

*los períodos se cuentan a partir de 1993 con números consecutivos impares de los asignados a x en un principio hasta llegar a 2003: Periodos 93-1 94-3 95-5 96-7 97-9 98-11 99-13 2000-15 2001-17 2002-19 2003-21 Ejemplo 2: “MINIMOS CUADRADOS” Sabritas S. El cálculo de éste pronóstico se deberá hacer a través de Fórmula General y Método Simplificado. se hará la planeación de los recursos a utilizar en el sistema. desea elaborar el pronóstico de ventas para uno de sus productos en el año 2003 y en torno a éste resultado. Periodos 1987 1988 1989 1990 1991 1992 1993 1994 1995 suma Ventas (miles) 120 121 117 118 124 125 120 118 130 1093 X 1 2 3 4 5 6 7 8 9 45 XY 120 242 351 472 620 750 840 944 1170 5509 X^2 1 4 9 16 25 36 49 64 81 285 Calculamos los promedios de las variables “x” y “y”: . para lo cual cuenta con el volumen de ventas anuales que se indican en la siguiente tabla.A de C.V.

Calculamos la variable y la pendiente: Cálculo del pronóstico Nones porque el número de períodos es impar (9) Periodos 1987 1988 1989 1990 1991 1992 1993 1994 1995 suma Ventas (miles) 120 121 117 118 124 125 120 118 130 1093 X -4 -3 -2 -1 0 1 2 3 4 0 XY -480 -363 -234 -118 0 125 240 354 520 44 X^2 16 9 4 1 0 1 4 9 16 60 Aplicando el método simple: .

Los promedios móviles son útiles si podemos suponer que la demanda del mercado permanecerá relativamente estable en el tiempo. A la derecha se da el promedio móvil de tres meses. para un promedio móvil de 4. los datos del mes más reciente se agregan a la suma de los meses anteriores y se elimina el dato del mes más antiguo. Matemáticamente.4. el promedio móvil simple (que sirve como estimaciones de la demanda del siguiente periodo) se expresa como.*los períodos se cuentan a partir de 1992 con números consecutivos de los asignados a x en un principio hasta llegar a 2003: Periodos 93-2 94-3 95-4 96-5 97-6 98-7 99-8 2000-9 2001-10 2002-11 2003-12 PROMEDIO MÓVIL E método de promedios móviles es un número de valores de datos históricos reales para generar un pronóstico.5 o 6 meses respectivamente . Un promedio móvil de 4 meses se encuentra simplemente sumando la demanda de los últimos 4 meses y dividiéndolo entre cuatro. Mes Enero Ventas reales de Cobertizos 10 Promedio móvil de 3 meses . Esta práctica tiende a suavizar las irregularidades del corto plazo en la serie de datos. 5 o 6 periodos Ejemplo 1: “PROMEDIO MOVIL” Las ventas de cobertizos de almacenamiento en Donna`s Garden Suplí se muestran en la columna central siguiente tabla. por ejemplo. Al concluir cada mes. Donde n es el número de periodos que comprende el promedio móvil.

33 28 25.33 22.67 16 19.67 13.67 16 Por tanto.PRINCIPIO DE ADMINISTRACION DE OPERACIONES – JAY HEIZER [P-109] Ejemplo 2: “PROMEDIO MOVIL” Aplicar el método de promedios móviles para el pronóstico de ventas de gasolina a partir de la siguiente información: Se considerará el promedio móvil a partir de las tres observaciones más recientes.Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre 12 13 16 19 23 26 30 28 18 16 14 11.Para proyectar la demanda de cobertizos en enero próximo.33 20.67 26. En este caso se utilizará la siguiente ecuación: En er Fe o br er o M ar zo Ab ril M ay o Ju ni o Ju li Ag o Se os to pt ie m b O re ct u No bre vie m b Di ci r e em br e . noviembre y diciembre y divide dimos entre tres: pronostico para enero = (18+16+14)/3=16 35 30 25 20 15 10 5 0 Serie1 Serie2 PROBLEMA DE PROMEDIOS MÓVILES . sumamos las ventas de octubre. vemos que el pronóstico para diciembre es .

Resumen de cálculos para promedios móviles de tres semanas: Semana Valor de la serie de tiempo(miles de galones) 17 21 19 23 18 16 20 18 22 20 15 22 Pronóstico de la i-ésima semana con Promedios móviles 1 2 3 4 5 6 7 8 9 10 11 12 (17+21+19)/3=19 (21+19+23)/3=21 (19+23+18)/3=20 19 18 18 20 20 19 Los promedios móviles también se pueden construir tomando en cuenta valores adyacentes de las observaciones. se tiene: Semana 1 2 3 4 5 6 7 8 9 10 11 12 Valor de la serie de tiempo(miles de galones) 17 21 19 23 18 16 20 18 22 20 15 22 Pronóstico de la i-ésima semana con Promedios móviles para 3 años (17+21+19)/3=19 (21+19+23)/3=21 (19+23+18)/3=20 (23+18+16)/3=19 18 18 20 20 19 19 . por ejemplo: En el caso de determinar el promedio móvil para tres observaciones adyacentes de la tabla anterior.

es un caso especial del método de promedios móviles ponderados en el cual sólo se selecciona un peso o factor de ponderación: el de la observación más reciente. El método consiste en asignar un factor de ponderación distinto para cada dato. El modelo básico de suavizamiento exponencial es el siguiente: . para pronosticar las ventas de la cuarta semana. la suma de los factores de ponderación debe ser igual a uno. el cálculo se realizaría de la siguiente manera: Puede observarse que el dato más alejado (correspondiente a la primera semana) tiene el factor de ponderación más pequeño. En este caso. a la observación o dato más reciente a partir del que se quiere hacer el pronóstico. se le asigna el mayor peso. Generalmente. se utilizará la primera parte del ejemplo anterior de la venta de gasolina. el siguiente tiene un factor de ponderación del doble que el primero y el dato más reciente (que corresponde a la tercera semana) tiene un factor de ponderación del triple del primero.Promedios móviles ponderados Para mostrar el uso de éste método. sea igual a Y1. En la práctica comenzamos haciendo que F1. -SUAVIZAMIENTO EXPONENCIAL El suaviza miento exponencial emplea un promedio ponderado de la serie de tiempo pasada como pronóstico. el primer valor de la serie de valores uniformados. Los pronósticos para las diversas semanas se presentan en la siguiente tabla. En todos los casos. y este peso disminuye en los valores de datos más antiguos. que es el primer valor real de la serie.

Para el período 3.En base a lo anterior. se tiene que: Para el período 4 se tiene: Para mostrar el método de suaviza miento exponencial. el pronóstico para el período 2 con suavizamiento exponencial es igual al valor real de la serie de tiempo en el período uno. retomamos el ejemplo de la gasolina. utilizando como constante de suaviza miento = 0.2: . el pronóstico para el período dos se calcula de la siguiente manera: Como se observa.

por unidad de cambio en cada variable independiente (x1.REGRESIÓN LINEAL MÚLTIPLE El modelo de regresión múltiple no es más que una generalización a varias variables de un modelo de regresión simple. x2 ó x3) a igualdad de nivel de las otras variables independientes. Es imposible interpretar una regresión si no se conocen las unidades de medida de cada variable. Podemos construir la ecuación: y  ab x b x b x 1 1 2 2 3 3 Cada variable independiente xi tiene un coeficiente de regresión o pendiente propia bi. La ecuación de la regresión lineal simple es: y  a  bx Donde “y“ es la variable dependiente y “x“ es la variable independiente. Pero esta ecuación se puede generalizar para el caso en que haya más de una variable independiente. mmHg) de una muestra de adultos con alto riesgo cardiovascular se utiliza como variable dependiente “y” intentando predecirla a partir . x2. Supongamos que haya 3 variables independientes: x1. Esto se aplica tanto a la regresión simple como a la múltiple. Ejemplo 1: REGRESION MULTIPLE: Supongamos que la Tensión Arterial Sistólica (TAS. Este coeficiente se interpretará como el cambio en la variable dependiente (“y”). x3.

según el modelo de regresión múltiple.de tres variables independientes. Resulta la siguiente ecuación: y  85  0. la ecuación será: TAS  85  (0. se aclarará si construimos dos ecuaciones. sustituyendo la variable "SEXO" por sus respectivos valores. Se puede observar que. las dos ecuaciones (una para hombres y otra para mujeres) son paralelas. La diferencia entre hombres y mujeres será de 4. x1. Por cada kg/m2 más de IMC subirá la TAS en 0.6  IMC) En las mujeres. las mujeres. una para hombres y otra para mujeres.9 mmHg inferior. x2 y x3 que corresponden respectivamente a la edad en años (EDAD: x1). ya que como se ha visto anteriormente únicamente difieren en una constante. la ecuación será: TAS  85  (0. En la figura se ha asumido un IMC constante (IMC=25 kg/m2) para poder representar la TAS sólo en función de la edad y el sexo.6 mmHg por término medio (en ambos sexos y sea cual sea la edad).6  IMC)  (. Figura La ecuación y=a+b1x1+b2x2 da lugar a dos rectas paralelas. Es posible introducir variables categóricas (sexo en el ejemplo) en el modelo. independientemente de cuál sea el sexo y el IMC.4.9 mmHg menos en las mujeres. Quizás esto último es más difícil de entender.9x 3 Y sustituyendo xi por sus nombres.7 mmHg por término medio. codificado como sexo=0 para hombres y sexo=1 para mujeres). tendremos: TAS  85  (0. La variable sexo se codificó así: Hombres: SEXO= 0 Mujeres: SEXO= 1 En los hombres. tendrán una TAS 4.6x 2  4. a igualdad de edad y de IMC.7x 1  0. En el ejemplo “y” es la TAS. a igualdad de edad e IMC. x1 es la edad y x2 el sexo.7  EDAD)  (0. . la TAS aumentará en 0.9  SEXO) La interpretación será que por cada año más de edad. si x2 es una variable dicotómica.7  EDAD)  (0. el índice de masa corporal en kg/m2 (IMC: x2) y el sexo (SEXO: x2.9 Por lo tanto.4.6  IMC) .7  EDAD)  (0.

En cambio si comparásemos la TAS entre hombres y mujeres usando un método bivariante (t de Student) encontrariamos que la diferencia es sólo de 2.4 mmHg.1 la diferencia a cualquier edad entre la TAS media de hombres y mujeres sea casi el doble (4. "Ajustar por" significa equiparar a los grupos que se comparan en cuanto a la variable por la que se ajusta. El método bivariante no tiene en cuenta la edad. sea cual sea la edad. que es la regresión múltiple. Para el ajuste se ha usado un método multivariable.2. sin embargo en la figura 12. .9 mmHg). en este caso es crear una comparación entre hombres y mujeres. la diferencia entre la TAS de hombres y mujeres es constante y vale 4. Se dice que esta esta diferencia (4. considerándolo fijo en 25 kg/m2) Estimaciones ajustadas por factores de confusión en regresión múltiple Un examen atento de la figura conduce a concluir que.9 mmHg) está ajustada por edad.9 mmHg. Esto se puede explicar con los datos aportados por la tabla 12. igualándolos en cuanto a su edad. pues sólo considera las dos variables comparadas (sexo y TAS) ¿Cómo es posible que siendo la TAS media de los hombres 2.160 155 TAS pred (mmHg) 150 145 140 135 130 55 57 59 61 63 65 67 Edad 69 71 73 75 77 79 (se ha prescindido del IMC.4 mmHg mayor que la de las mujeres.

en la muestra. al comparar la TAS según sexo. los hombres son más jóvenes que las mujeres.9 mmHg por encima de las mujeres. En este ejemplo.149. edad e IMC. debe ser verdad también para el conjunto.2) 151. Hombres (n=326) Tensión arterial sistólica media (DE) Diferencia de medias en TAS 151.7  p=0.4 (20.4  1. La verdad es que los hombres tienen la TAS 4. Esto libera del efecto distorsionador de la edad. Si. comparar sus medias en la muestra (t de Student) infraestimará la verdadera diferencia existente entre hombres y mujeres. La figura 12.Tabla Comparación entre hombres y mujeres de tensión arterial (TAS).09 (2 colas) 1.4 = 2. sea cual sea su edad. sino que es necesario igualar por edad a hombres y mujeres usando un método multivariable para poder realizar una verdadera comparación válida. Un factor de confusión es una variable que se asocia tanto con la variable independiente (supuesta "causa") como con el supuesto "efecto" y que hace que la comparación bruta o "cruda" (t de Student) sea inválida.4 mmHg t 737  151. Si esto es verdad a todas las edades.43 Mujeres (n=413) t de Student (compara medias TAS) Edad media IMC medio 67.8 .2 años) y por eso su TAS es sólo 2.2 representa gráficamente el papel de la edad como factor de confusión: Figura La edad actúa como factor de confusión al valorar la relación entre edad y tensión arterial sistólica (TAS) Sexo Edad (factor de confusión) TAS .2 Observando la tabla puede apreciarse que los hombres de la muestra son más jóvenes que las mujeres (diferencia de edad = 2. Por eso no basta la comparación bruta.4 mmHg superior cuando se comparan de manera bruta con las mujeres.8 69. Sólo mediante el método multivariable que ajusta por edad se puede realizar una generalización científicamente rigurosa de las diferencias en TAS entre hombres y mujeres.8  149. ya que la TAS aumenta a medida que aumenta la edad. se dice que la variable edad actúa como factor de confusión (.2) 149.6 28.9 30.8 (18. Cuando hay factores de confusión se debe usar el análisis multivariable.

001) que está en el segundo modelo. La comparación bruta (diferencia = 2. Su coeficiente de regresión o pendiente (b = -2. incluye la edad y el índice de masa corporal (IMC).427 0.741 0. Tabla Modelos de regresión múltiple con la tensión arterial (TAS). de Irala.001 Sexo=0 para hombres y Sexo=1 para mujeres. En este sentido. ya que está confundido por edad e IMC. ambos con TAS como variable dependiente.000 0. 0.952 -1.582 Error típ.246 0.093 0.126 0.212 1.000 -4. Los valores p de significación estadística indican que cada una de las tres variables del segundo modelo se asocia independientemente a la TAS de manera significativa.093) no es significativo.000 0.001 0. edad. 2002). . La figura presenta esto mismo1 según SPSS. .070 1. sexo e IMC. Interpretación: Se han ajustado dos modelos. mmHg).439 6. Este primer modelo representa la comparación cruda o bruta (bivariante).407) corresponde exactamente a la diferencia de medias que se hubiese obtenido usando la t de Student. El valor p del primer modelo (p = 0. La comparación ajustada (diferencia = 4. Además del sexo. 1. El segundo modelo usa 3 variables independientes.9 mmHg (TAS inferior en las mujeres).909 0. 2002.431 9.000 0.Usando terminología de gráficos causales se diría que la edad abre una puerta trasera que comunica sexo y TAS (Hernán.455 Sig.801 3. Modelo 1 (Constante) Sexo1 2 (Constante) Sexo1 Edad IMC 1 B 151.227 -3. puede afirmarse que la t de Student es un caso particular de regresión.9 mmHg) está libre de confusión por edad. Se cierra dicha puerta trasera al "ajustar" por edad. La verdadera diferencia. pero no sería válido.109 0.683 9. El verdadero valor p para la comparación entre sexos es el ajustado (p=0.827 -2.168 Beta -0. que es el sexo.407 85. IMC = índice de masa corporal (kg/m2) Variable dependiente: tensión arterial sistólica (TAS. una vez ajustada por edad e IMC es de –4.062 -0. El primero sólo incluye una variable independiente. Este modelo ha controlado la posible confusión por edad y por IMC en la comparación de la tensión arterial sistólica (TAS) entre sexos.4 mmHg entre hombres y mujeres) no es válida.125 t 141.

407 85.308 Error típ.001 0. Se debe ajustar un tercer modelo (tabla del modelo 3) incluyendo el término de producto.168 12. mmHg). 0.000 0.125 0.212 1.001 0. IMC = índice de masa corporal (kg/m2) sexo*edad = término de producto (equivale a la edad en mujeres y a 0 en varones) Variable dependiente: tensión arterial sistólica (TAS. La interacción puede valorarse introduciendo una nueva variable que es el producto de las dos que podrían interactuar entre sí.246 0.000 0.126 0. sea cual sea su edad.909 0.584 0. pues significa que la edad modifica las diferencias entre sexos (o viceversa: que el efecto de la edad sobre la TAS es diferente en uno y otro sexo).582 96.000 0.625 3. a medida que sea mayor la edad.168 0.000 -4.455 7.217 Beta -0. Modelo 1 (Constante) Sexo 2 (Constante) Sexo edad IMC 3 (Constante) sexo edad IMC sexo*edad 1 B 151.439 6.741 0.576 0.093 0. sean menores las diferencias entre hombres y mujeres.Interacción o modificación del efecto en regresión múltiple En el ejemplo anterior se asume implicitamente que hay una diferencia en la TAS constante (4. Término de interacción = sexo * edad En el ejemplo. añadiendo un término de interacción (modelo 3) entre sexo y edad. Pero esta nueva variable equivale a la edad en mujeres (edad*1 = edad).000 0.062 -0.125 -0. Pero hay veces que la diferencia entre hombres y mujeres no es constante para todas las edades.070 1.965 -1.001 0. .559 t 141.156 Sexo=0 para hombres y Sexo=1 para mujeres.801 3.739 3. ya que la variable sexo vale 0 para ellos. A esto se le llama "modificación del efecto" o "interacción". el término de producto sexo*edad valdrá 0 en varones. sexo e IMC.159 0.470 1.418 Sig.000 0.683 9.192 0. edad.089 0.051 -26.082 0. 1. Tabla Regresión múltiple con TAS (dependiente).9 mmHg) entre hombres y mujeres.109 0. Por ejemplo pudiera pasar que.000 0.427 0.227 -3.060 15.431 9.670 0.827 -2.952 -1.

160 155 TAS pred (mmHg) 150 145 140 135 130 55 57 59 61 63 65 67 Edad 69 71 73 75 77 79 (se ha prescindido del IMC. sino que dependen de la edad (la edad es un modificador del efecto del sexo). En el ejemplo “y” es la TAS. x1 es la edad y x2 el sexo. Aquí el valor p no es significativo (p=0.308  EDAD) Sumando las constantes y los coeficientes de la edad. Si no es significativo debe suprimirse. es decir el sexo es un modificador del efecto de la edad. Varones: TAS  96.576  EDAD)  (0.884  EDAD)  (0.308) sea 0 en la población.584  IMC)  (0. una para hombres y otra para mujeres. También puede interepretarse al revés: la pendiente de la recta que relaciona TAS y edad es diferente en hombres y mujeres.962  (0.576  EDAD)  (0.051 . considerándolo fijo en 25 kg/m2) Observando la figura se aprecia que las diferencias entre hombres y mujeres ya no son constantes. a efectos demostrativos. .Interpretación: El modelo 3 proporciona dos ecuaciones. ya que no hay evidencia para rechazar la hipótesis nula de que su coeficiente (0. al valorar una interacción debe comprobarse si su coeficiente tiene un valor p significativo o no.089  (0. La ecuación y=a+b1x1+b2x2+ b2(x1*x2) da lugar a dos rectas que ya no son paralelas. No obstante. representaremos gráficamente el modelo con interacción para interpretar su significado.26.156) y preferiremos el modelo sin interacción.584  IMC) Sin embargo. la ecuación en mujeres será: Mujeres (simplificada): TAS  69.584  IMC) Mujeres: TAS  96.051  (0. Figura Interacción.

Por ejemplo. FS=0): . La nueva variable AOV valdrá 1 cuando el participante sea asignado al grupo de aceite de oliva virgen y 0 en caso contrario (control o FS). Se considerá el grupo control como categoría de referencia y se crearán dos nuevas variables (AOV y FS).031 0.161 Error típ. por tanto estos 3 niveles o categorías. Tabla Dos variables "dummy" sustituyen a una variable con 3 categorías CODIFICACIÓN Variable original Categorías: 1 = Aceite de oliva 2 = Frutos secos 3 = control Nuevas variables (variables "dummy"") AOV 1 0 0 FS 0 1 0 SPSS (Constante) AOV FS B -0. La nueva variable FS valdrá 1 cuando el participante sea asignado al grupo de frutos secos y 0 en caso contrario (control o AOV).546 Variable dependiente: cambio de peso (kg) a 3 meses (DIF_PES.) Interpretación: El listado de salida de SPSS sirve para crear tres ecuaciones de cambio de peso. Así.Variables cualitativas con más de dos categorías y variables dummy Cuando se desea introducir como independiente una variable cualitativa que tenga 3 o más categorías. Estruch et al desean comparar 3 dietas en cuanto a su eficacia para reducir los niveles de colesterol.027 0.267 0.144 0. Modelo para dieta rica en aceite de oliva virgen (AOV=1.191 -1. otra rica en frutos secos (FS) y una dieta control baja en grasas (control). Se ha usado este procedimiento para valorar las diferencias en cuanto al cambio de peso al cabo de 3 meses en ese ensayo.461 0.605 0. una para cada grupo. Esto sirve para comparar cada una de ellas dos frente al grupo control. lo predicho para dieta rica en frutos secos y lo predicho para el grupo control (baja en grasa). se debe elegir primero cuál será la categoría de referencia y crear una nueva variable para cada una de las demás categorías. 0. Beta t Sig.005 0.119 0.262 0.905 0. Usaron 3 dietas. una rica en aceite de oliva virgen (AOV).280 0. se puede comparar el cambio de peso (kg) predicho por el modelo para el grupo de dieta rica en aceite de oliva virgen. La variable cualitativa "dieta " tendrá.

sexo.) para obtener estas mismas estimaciones ya ajustadas por esos posibles factores de confusión. Esto se podría haber hecho también por ANOVA.031) es la diferencia en el cambio de peso entre el grupo de aceite y el grupo control.161*0 DIF_PES = -0.546 La ventaja de hacerlo por regresión es que basta con introducir también otras variables en el modelo (p.161) es la diferencia entre el grupo de frutos secos y el grupo control.28 + 0. El primero (+0. Contraste Valor del contraste Error típico 1 -0.262 2 -0. con dos contrastes a priori (coeficientes: –1. el ordenador devuelve coeficientes bi para cada una de las variables independientes xi que pueden considerarse predictores de la variable cuantitativa considerada como respuesta (variable dependiente).161 0.031*0 + 0.161*0 DIF_PES = -0. peso inicial.28 La interpretación de los dos coeficientes (0.249 Modelo para dieta rica en frutos secos (AOV=0.267 t Sig.DIF_PES = -0.031 0.605 0. 0 y +1 para el primer contraste y coeficientes: 0.161*1 DIF_PES = -0. El resultado sería exactamente idéntico al de la regresión. Es un método que minimiza las distancias desde cada punto observado hasta el plano (residuales) Cuando se ajusta un modelo de regresión múltiple.161 = -0. El método se denomina ajuste por mínimos cuadrados. por tanto. (bilateral) -0.031 = -0.031 y 0.161) es. el segundo (+0. -1 y +1 para el segundo).28 + 0.031*0 + 0.28 + 0.905 -0. etc. edad.119 0. En una regresión múltiple el procedimiento de estimación es semejante al utilizado en la regresión lineal simple. . Supuestos o condiciones de aplicación del modelo de regresión múltiple El procedimiento utilizado para calcular una regresión lineal simple es el ajuste por mínimos cuadrados El objetivo es encontrar la ecuación que mejor se ajuste a los puntos observados. muy sencilla y directa. como puede verse debajo. se estima la superficie que mejor se ajusta a la nube de puntos observados.28 + 0.031*1 + 0. Ninguna de estas diferencias resultó estadísticamente significativa. FS=1): DIF_PES = -0. ej.28 + 0.119 Modelo para dieta baja en grasa (grupo control) (AOV=0. FS=0): DIF_PES = -0.

Cuando haya un apartamiento notorio de la normalidad en los residuales se puede probar un término cuadrático para alguna de las variables independientes cuantitativas más importantes. al igual que en la regresión lineal simple. con tamaños muéstrales grandes (n>500) la regresión suele ser suficientemente robusta. Habitualmente. nivel de estudios y actividad física en el tiempo libre) en los varones de una muestra representativa de la población adulta (>15 años) de la Unión Europea.  Las variables están relacionadas linealmente.que son los siguientes. Para comprobar estos supuestos se deben guardar los residuales y valorar si se adaptan a la normalidad.  Las variables son independientes unas de otras. Ejemplo 2: PRÁCTICO DEL MODELO DE REGRESIÓN MÚLTIPLE Por ejemplo. igual que se hace en regresión simple. pero esto tiene poca relevancia práctica. En esta situación un test de normalidad significativo es sólo una consecuencia del tamaño muestral. el modelo se basa unos supuestos similares. habitualmente resultarán significativos los test de normalidad de los residuales. Existen amplias posibilidades de modelización no lineal en regresión.  La distribución de la variable dependiente condicionada a cada posible combinación de valores de las independientes es una distribución normal multivariable. Esto conduciría a modelos polinómicos y permitiría incluir relaciones curvilíneas.Por lo tanto. con SPSS se obtuvo el listado que aparece en la tabla 1 al predecir el índice de masa corporal (IMC) en función de diversas características (edad. Si el tamaño muestral es grande. Resulta entonces más importante valorar la magnitud del apartamiento de la normalidad usando métodos gráficos. .  Homogeneidad de las varianzas (homocedasticidad): las varianzas de la variable “y” condicionadas a los valores de “x” son homogéneas. hábito tabáquico.

534 .000 .229 -.000 .767 .000 .266 .064 .993 -.000 .177 5.364E-03 .091 ACTIV.050 .872 -5. (Constante) 18.468 .067 -.956 4. el IMC correspondiente a cada edad será: IMC = 18.000 .390 1.002 Variable dependiente: BMI Interpretación: La edad guardaba en esta base de datos una relación curvilínea con el IMC (BMI).672 -15.478 .La codificación de las variables fue: Edad: variable cuantitativa (años) Estudios: 0 = Estudios medios o superiores Tabaco: 1 = Estudios primarios 0 = No fumador 1 = Fumador actual Actividad física en el tiempo libre: 2 = Ex-fumador (lo dejó hace < 1 año) variable cuantitativa medida en 3 = Ex-fumador (lo dejó hace >= 1 año) METs-horas/semana Tabla Aspecto parcial de los resultados de SPSS en regresión múltiple.014 EDAD AL CUADRADO -2.022 . 65.530 .002364edad2).049 t Sig. Para entender mejor esta relación.287 EDAD . Coeficientes estandarizados Beta 1.000 .266edad) – (0.404 . FISICA (METs-h.501E-03 .127 ESTUDIOS PRIMARIOS ./sem) -8. es preferible representar la ecuación gráficamente como se hace en la figura 12.448 19.087 EXFUMADOR < 1 AÑO .867 -4. Coeficientes Coeficientes no estandarizados B Error típ.051 .000 FUMADOR -.245 EXFUMADOR 1 AÑO+ .000 .4.767 + (0.

estudios y actividad física) incluidos en el modelo. . hábito tabáquico y nivel de estudios de los participantes). En cambio los ex-fumadores tenían por término medio mayor IMC que los nunca fumadores. Las 4 variables resultaron ser predictores independientes y estadísticamente significativos de la variabilidad en el IMC. hábito tabáquico y actividad física). los fumadores tenían (independientemente de cuál fuese su edad. estudios y actividad física). en comparación con los nunca fumadores (siempre independientemente de cuál fuese su edad. La representación gráfica de la figura asume que los sujetos tenían el valor 0 en las otras 3 variables (nivel de estudios. por lo tanto se han introducido 3 términos en el modelo (todas las categorías menos una). Muestra representativa varones 27 26 IMC 25 24 23 22 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 Edad europeos mayores de 15 años (n=7.468 kg/m 2 menos de IMC que los nunca fumadores. tener estudios superiores o medios y no realizar ninguna actividad física en el tiempo libre. Tener un valor de 0 en estas 3 variables supone no ser fumador.530 kg/m2. Los METs son una medición de la cantidad de esfuerzo que se hace en una actividad física o deporte. es preciso considerar que este efecto de la edad es independiente de los otros factores (tabaco. Los hombres cuyo nivel de estudios era primario o menor (Estudios=primarios) presentaron mayor IMC medio que quienes tenían estudios más elevados. y para los que dejaron de fumar hacía más de un año fue de +0. La variable categórica "tabaco" tenía 4 categorías.Figura Relación entre edad e índice de masa corporal (BMI).534 kg/m2 (independientemente de cuál fuese su edad. Cada MET-hora más a la semana de actividad física en el tiempo libre se asoció a una reducción del IMC de 0. Para los que habían dejado de fumar hacía menos de un año esta diferencia media fue de +0.0085 kg/m2 (independientemente de cuál fuese la edad. La categoría que no se introduce (aquí son los nunca fumadores) es la que queda como estrato de referencia frente al cual se realizan todas las comparaciones. Se suman a lo largo de la semana multiplicada por las horas que se dedican por término medio a esa actividad o deporte (METShoras/semana). hábito tabáquico y actividad física). La diferencia media en el IMC fue de +0.375).478 kg/m2. Además. Así. estudios y actividad física) por término medio 0.

El cálculo del pronóstico se deberá emitir mediante la fórmula general y corroborarse con el método simplificado que corresponda. Períodos 1990 1991 1992 1993 1994 1995 Σ Y Ventas (miles) 85 89 92 95 93 98 552 TENIENDO EN CUENTA QUE: ( ) PARA 1996: ( ) ( ) Para 1997 ( ) ( ) Para 1998 ( ) ( ) . teniendo como antecedentes los datos que se muestran en la tabla. desea calcular el pronóstico de ventas para el año 2003. empresa internacional en su área de pilas desechables.MÉTODO DE PROMEDIOS MÓVILES CON PONDERACIÓN EXPONENCIAL Panasonic.

00 96.80 96.57 96.48 96.56 .Para 1999 ( ) ( ) Para 2000 ( ) ( ) Para 2001 ( ) ( ) Para 2002 ( ) ( ) Para 2003 ( ) ( ) Luego los pronósticos para los siguientes años serán : Períodos 1996 1997 1998 1999 2000 2001 2002 2003 Y Ventas (miles) 96.55 96.56 96.60 96.

desea calcular el pronóstico de ventas para el año 2003.9685 1. El cálculo del pronóstico se deberá emitir mediante la fórmula general y corroborarse con el método simplificado que corresponda.9494 1.7800 x log y -9.9777 1.8482 -1. empresa internacional en su área de pilas desechables.9777 5. Períodos 1990 1991 1992 1993 1994 1995 Σ Y Ventas (miles) 85 89 92 95 93 98 552 x -5 -3 -1 1 3 5 0 x2 25 9 1 1 9 25 70 log y 1. teniendo como antecedentes los datos que se muestran en la tabla.9638 1.9561 0.9054 9.9912 11.6471 -5.-MÉTODO DE REGRESIÓN EXPONENCIAL Ejemplo: Panasonic.9638 1.3803 Para esto tenemos que : ∑( ) ( ) Luego hallando b: ∑( ∑ ) .9294 1.

( ) Luego la ecuación de pronóstico es: Luego para el pronóstico para el 2003 será: Períodos 1996 1997 1998 1999 2000 2001 2002 2003 Y Ventas (miles) 100 103 105 108 111 114 117 120 x 7 9 11 13 15 17 19 21 exponencial 100 Valor 90 80 70 1 2 3 4 5 6 Punto de datos Real Pronóstico .

5 X2Y 1.58 68 13.9998 111.14 Resolviendo este sistema se obtiene: a= -0.25 5 11.32 19. x e y.25 20 101.01288  0.14 X Bondad del Ajuste: Coeficiente de determinación: R = 2 * 2 b= 0.25 5 11.5  15a  55b  225c  1205  55a  225b  979c   c= 1.47 Y = -0.47 + 0.01288 2) Ejemplo de Regresión Parabólica Dadas dos variables.25 10 33.5 1205 Y* 1.0128 Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones:  Y  Na  b  X  c  X  XY  a X  b X  c  X  X Y  a X  b X  c  X 2 2 2 3 2 3 4       68  5a  15b  55c   277.0361 0.5 68 13.-METODO DE REGRESION PARABOLICA DE PRONOSTICOS .07 -0.51 S2 * S Y 2 Y  1- 2 Se S 2 Y  1- 0.0049 0.25 20 30.51 X + 1.0121 0.11 -0.5 55.75 80 152.5 277.25 20 30.5 x2y 1.5 15 68 55 225 979 277.18 5.11 11.25 320 762.Ajuste de una función parabólica: Y* = a + b X + c X2 X 1 2 3 4 5 15  1/5 3 Y 1.5 x2 1 4 9 16 25 x3 1 8 27 64 125 x4 1 16 81 256 625 xy 1.25 20 101.75 80 152.25 10 33.07 0.0049 0.81 30.0064 0.715 S e  ECM 2 2 e  N 2  0.6 X2 1 4 9 16 25 55 11 X3 1 8 27 64 125 225 X4 1 16 81 256 625 979 XY 1. ajustar a los datos una función de tipo parabólico. x 1 2 3 4 5 y 1.6 e=Y-Y* 0.0644 0.19 -0.5 1205 Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones: .5 320 762.08 0 0 e2 0.

47 b  0.14 x 2 .na  b x  c  x 2   y  5a  15b  55 c  68   a  x  b x 2  c  x 3   xy   15 a  55b  225 c  277 .51x  1.47  0.51 c  1.5  a  x 2  b x 3  c  x 4   x 2 y  55 a  225 b  979 c  1205  Resolviendo este sistema se obtiene: a  0. la ecuación de la parábola de grado dos que mejor se ajusta a la nube de puntos es: y  0.14 Por tanto.

0. 50% = Existe una relación parcial. Las 3 gráficas en coordenadas cartesianas posteriores. pasando por el cero. se muestra la variable independiente (X) se ubica en las abscisas y la dependiente (Y) en el eje de las ordenadas. el cual corresponde a ausencia de correlación.Representación de los 4 modelos de regresión 40 30 Y (producc ión) X (tiempo) 20 Y*1 lineal X (tiempo) 10 Y*2 parábola X (tiempo) Y*3 potencial 0 X (tiempo) Y*4 exponencial -10 1 2 3 4 5 X (tiempo) X (tiempo) -CORRELACION -COEFICIENTE DE CORRELACIÓN SIMPLE DE PEARSON (MODELO RECTILÍNEO) El coeficiente de correlación es una medida de asociación entre dos variables y se simboliza con la literal r. La gráfica (c) no indica correlación. De lo anterior referimos que:      +1 ó -1 = Correlación perfecta. A su vez.1. es decir. de modo que al incrementarse los valores de la variable independiente. respectivamente. Los valores de la correlación van de + 1 a . los valores de la dependiente disminuyen. la gráfica (b) muestra una correlación negativa. 80% = Correlación significativa.95 = Correlación fuerte. La gráfica (a) representa una correlación positiva. también aumentan los valores de Y. 70% = Correlación moderada. . conforme los valores de X aumentan. Los primeros dan a entender que existe una correlación directamente proporcional e inversamente proporcional. Los coeficientes de correlación significan esa asociación entre los cambios que se observan en la variable dependiente con respecto a la variable independiente.

Aplicar la ecuación. Calcular el tamaño de la muestra en función de parejas de X y Y. tenemos dos variables. = sumatoria de los valores al cuadrado de la variable dependiente. N = tamaño de la muestra en función de parejas. 3. Ejemplo: Elección de la prueba estadística para medir la asociación o correlación. por otra parte. Decidir si se acepta o rechaza la hipótesis. entonces aplicamos esta prueba. Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en función de la probabilidad. . 9. Elevar al cuadrado cada valor X y de Y. Obtener los productos de X y Y. = sumatoria de los valores al cuadrado de la variable independiente. Al igual que las otras pruebas paramétricas. para lo cual se deben multiplicar independientemente ambos valores. 1. la varianza de las variables X y Y deben guardar homogeneidad. 7. 2. Pasos. 5.El coeficiente de correlación lineal de Pearson se define matemáticamente con la ecuación siguiente: Donde: r = coeficiente de correlación de Pearson. 6. Las edades en días están en escala de tipo intervalo. Calcular los grados de libertad (gl): gl = N parejas -1. 2 2 Este procedimiento estadístico es aplicable cuando las observaciones se miden según una escala de intervalo. Objetivo: Conocer que grado de asociación existe entre la edad y peso corporal de niños de edades desde el nacimiento hasta los 6 meses. el fenómeno debe ser lineal. Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la variable independiente (X). 8. 2 2 4.

444 rc > rt se rechaza Ho.2 = 19 rc = 0. Entre las observaciones de edad de los niños y pero corporal no existe correlación significativa. Elevando r al cuadrado obtenemos el error existente r2 = 0. Ha. gl = 21 . . Entre las variables edad del niño y el peso corporal existe una correlación muy significativa.Hipótesis. Entre las observaciones de edad de los niños y peso corporal existe correlación significativa. Ho.83.8281 = 0.91 rt = 0.

Creamos ahora una gráfica (hecha con el programa estadístico SPSS) para representar la correlación obtenida. Encontramos entonces una correlación positiva. sin embargo. . conforme la edad aumenta. el 17% se ignora.donde el 83% de los cambios observados en el peso de los niños se debe a los incrementos de la edad. también aumenta el peso corporal de los niños. es decir.

Transfer of technology from statistical journals to the biomedical literature.com/doc/41357597/Regresion-Parabolica# .com/trabajos13/placo/placo.shtml BIBLIOGRAFÍA DEL EJEMPLO DE CORRELACION Altman DG..scribd.estadistica.119:278-80. Deeks JJ. Sackett DL (1998)..272:129-32..monografias.shtml BIBLIOGRAFIA DEL EJEMPLO DEL EJEMPLO DE REGRESIÓN EXPONENCIAL http://www. JAMA 1994.com/. Past trends and future predictions. Goodman SN (1994)./placo. BMJ 1998.mx/.. Bol Ofic Sanit Panam 1995. BIBLIOGRAFIA DEL EJEMPLO DE REGRESIÓN PARABOLICO http://www. Bautista LE (1995).317:1318.uson.REFERENCIAS BIBLIOGRAFICAS BIBLIOGRAFIA DEL EJEMPLO DE PRONOSTICOS MOVILES www.monografias.google. “Razón relativa” y “tasa relativa” como traducciones de odds ratio y de hazard ratio.com/search?hl=es&q=M%C3%A9todo+de+regresi%C3%B3n+parab%C3%B 3lica+de+pron%C3%B3sticos+ejemplo+explicativo%29&aq=f&aqi=&aql=&oq=&gs_rfai= http://www. Odds ratios should be avoided when events are common.pdf BIBLIOGRAFÍA DEL EJEMPLO DE MINIMOS CUADRADOS www. Altman DG.mat./seriesdetiempo.

Sackett DL (1998).monografias.mx/. JAMA 1994.www.com/search?hl=es&q=M%C3%A9todo+de+regresi %C3%B3n+parab%C3%B3lica+de+pron %C3%B3sticos+ejemplo+explicativo%29&aq=f&aqi=&aql=&oq=&gs_rfai= http://www.. Deeks JJ.272:129-32.shtml BIBLIOGRAFÍA DEL EJEMPLO DE CORRELACION Altman DG.uson..com/trabajos13/placo/placo.com/doc/41357597/Regresion-Parabolica# ...monografias.119:278-80. Bol Ofic Sanit Panam 1995. BMJ 1998.317:1318.mat. Past trends and future predictions./placo.scribd. Bautista LE (1995). Goodman SN (1994). “Razón relativa” y “tasa relativa” como traducciones de odds ratio y de hazard ratio. Odds ratios should be avoided when events are common.estadistica./seriesdetiempo.shtml BIBLIOGRAFIA DEL EJEMPLO DEL EJEMPLO DE REGRESIÓN EXPONENCIAL http://www. Transfer of technology from statistical journals to the biomedical literature. Altman DG.google.pdf BIBLIOGRAFÍA DEL EJEMPLO DE MINIMOS CUADRADOS www.com/. BIBLIOGRAFIA DEL EJEMPLO DE REGRESIÓN PARABOLICO http://www.

Sign up to vote on this title
UsefulNot useful