Clase02 - Regresion y Correlacion PDF

Universidad Nacional San Agustín
Facultad Ingeniería de Producción

y Servicios
Segunda Especialidad
INGENIERÍA DE PROYECTOS
CURSO:
ESTADISTICA Y TOMA DE DECISIONES
TEMA: REGRESION Y
CORRELACION
Ing. Hernán Miguel Marquina Avellaneda
ÍNDICE
 INTRODUCCIÓN
 CAP. I: Regresión Lineal
Otros Modelos básicos de pronóstico
 Caso Estudio: conductividad térmica
 CAP. II: Regresión Multilineal
 Caso Estudio: Extracción de aceite
 CAP. III: Medidas de asociación
 Caso Estudio:
 CAP. IV: Series de Tiempo
 Caso Estudio: Fabricación de camperas
 CAP. V: Regresión Dicotómica
 Caso Estudio: Importaciones Peruanas
 CAP. VI: Diseño de Experimentos
 Caso Estudio: Empaque almacenamiento
 CAP. VII: Análisis Multivariante
 Caso Estudio: Segmentación de clientes Jean
 Proyecto de Investigación
 Plan de Proyección Social
 ANEXOS
INTRODUCCIÓN
 ESTADÍSTICA EN INGENIERÍA: Es la disciplina cuyo
método científico tiene como misión, la búsqueda de
verdades empíricas, sistemáticamente demostrables; y
sustentadas en la:
 TOMA .. (Colecta, acopio, levantamiento, etc.)
 ORGANIZACIÓN .. (Tablas, archivos, etc.)
 REPRESENTACIÓN .. (Histogramas, ojivas, diagramas,
etc.)
 PRESENTACIÓN.. (Informes, resumen, formatos, etc.) y
 ANÁLISIS de los DATOS .. (Inferencia, ANVA, etc.)
 de los PROCESOS PRODUCTIVOS y de SERVICIOS
dentro del campo de la ingeniería,
• con el propósito de obtener resultados objetivos y
confiables, que permitan la Toma de Decisiones de
manera eficiente y eficaz, por los sistemas
organizacionales.
Índice Siguiente
PRONÓSTICO
 El Pronóstico es una alternativa clave, para

tomar decisiones sobre el futuro de un
suceso, en base a hechos del pasado o los
antecedentes del evento.
 A continuación se muestran algunos
campos de aplicación de los Pronósticos:
Siguiente
Índice
PLANEAMIENTO Y CONTROL DE
OPERACIONES
 Administración de inventarios
 Planeamiento de la producción:
¿Qué producir?
 ¿ Cuánto producir?
 ¿ Cuándo producir?
 ¿Dónde producir?
Siguiente
Índice
MARKETING
 Administración del equipo de ventas
 Pronósticos de precios
 Fijación de precios
 Canales de distribución
 Gastos de publicidad
 Ingreso a mercados nuevos
 Pronóstico de ventas
Siguiente
Índice
ECONOMÍA
 Pronóstico del Producto Bruto Interno
 Pronóstico de desempleo por sectores
 Inversiones
 Nivel de precios y las tasas de interés
 Pronósticos sobre política monetaria y fiscal
 Pronóstico de la tasa de inflación
 Pronóstico exportaciones no tradicionales
 Pronóstico sobre ahorro e ingreso personal
Siguiente
Índice
ÁMBITO FINANCIERO
 Pronósticos de rendimientos de acciones,

tasas de interés, tasas de cambio, precios y
valores en general
 Pronósticos de volatilidad de rendimientos
accionarios
 Pronósticos de probabilidad de insolvencia
Siguiente
Índice
Técnica Regresión bivariable
CAPITULO I
MODELOS DE REGRESIÓN BÁSICOS
OBJETIVO:
Modelar un conjunto de datos, mediante
la técnica de regresión bivariable, para
obtener una ecuación de pronóstico
Índice Ver 1
Diagrama de dispersión
 Sean los datos de las
cantidades vendidas de un Ventas de un articulo
articulo y sus precios.
 El diagrama de dispersión,
muestra la relación entre las
variables: precios y ventas. 20
 La variable independiente 10
“X”, es el estimador: precio
 La variable dependiente “Y” 2 4

es la que se estima: ventas
Índice Siguiente
MODELO LINEAL
Ventas
(mill S/.)
Y  a  bX Siguiente
Y  0.03  0.04 X 2
d   (Yei  Yi )  min
0.11 d   (a  bX i  Yi )
P2
2
Pendiente:
0.11  0.07
b  0.04 0.04 b
0.07 P1 2.0  1.0
0.04
b  0.04
1 1
Intercepto: a = 0.03 b  0.04
1.0 2.0
Gastos publicidad
Índice (mil. S/.)
FORMULAS DE LOS COEFICIENTES
Ventas
(mill S/.)
DEL MODELO LINEAL
a
 Y
b
 X
n n
N  XY   X  Y
b
N  X 2   X 
2
Gastos publicidad
(mil. S/.)
Índice Modelo Biv Siguiente
Pendiente de la recta: b
 Indica un cambio en Y para una variación
en X.
 Un valor positivo para “b” indica una
relación directa entre las dos variables, y
un valor negativo, una relación inversa.
 El signo de “b” y el signo de “r”
(coeficiente de correlación), siempre son
iguales.
Siguiente
Índice
Intercepto de la Recta: a
 “a” es el intercepto de la recta con el eje Y
 X  Y   X  XY
2
a
n  X  ( X )
2 2
 Valor de “a” en base a la pendiente “b”
a
 Y
b
 X
n n
Siguiente
Índice
OTROS MODELOS BÁSICOS
DE PRONÓSTICO
Índice
MODELO DE CURVA EXPONENCIAL
 Se presenta cuando los valores de las variables X
e Y graficados en papel aritmético se aproximan a
una línea curva creciente a decreciente,
 pero trasladado los valores X e Y a una gráfica
semilogarítmica, se aproximan a una línea recta,
 es decir que la variable independiente X
evoluciona en forma aritmética y la variable
dependiente Y evoluciona en forma geométrica,
su ecuación es :
Y = a.bx
CURVA EXPONENCIAL
Y
200
Y = a.bX
log Y  log a  log b. X
180
160
140
120
100
80
60
40
20
X
0
0 1 2 3 4 5 6 7
Índice Modelo Biv
CURVA EXPONENCIAL ESCALA SEMILOGARITMICA
1000
log Y
100
X
10
0 1 2 3 4 5 6 7
Índice Modelo Biv

COEFICIENTES DE LA CURVA
EXPONENCIAL
n  X . log Y   X  log Y
log b 
n  X  ( X )
2 2
log a 
 log Y
 b.
 X
n n

MODELO DE CURVA GEOMÉTRICA
 La variable independientemente X y la variable
dependiente Y aumentan o disminuyen en
progresión geométrica,
 por tanto los valores X e Y son expresados en
forma logarítmica.
 Un crecimiento geométrico es una curva
 En papel logarítmico o doblemente logarítmico, se
aproximan a una recta
 La expresión exponencial de la ecuación es:
Y  aX b

CURVA GEOMÉTRICA
Curva Geometrica
9
Y = a.Xb
8
log Yc  log a  log b. log X
7
Y: Demanda
4
X: población
3
2 2.5 3 3.5 4 4.5 5 5.5
n log X . log Y   log X . log Y

b a
 log Y b log X

N  log X   ( log X ) 2
2
n n
MODELO DE CURVA POBLACIONAL
 Es una variación de la curva exponencial o
semilogarítmica, basada en la fórmula de interés
compuesto.
 Sirve exclusivamente para proyectar la población, pero se
le puede dar otros usos, siempre y cuando se ajusten a las
características de esta curva, que considera dos puntos o
valores de referencia en el tiempo.
 En el caso de poblaciones, tener en cuenta los censos
poblacionales.
 También se le denomina curva del crecimiento, porque se
basa en una tasa de crecimiento (K), cuya ecuación
exponencial es:
Pn = Po (1 + K) n
Índice Siguiente
CURVA POBLACIONAL
Curva Poblacional
200
180 n
160
Pn =Po(1 + K)
P: población
140
120
100
80
60
40
20
n: tiempo
0
0 1 2 3 4 5 6 7
Índice Siguiente
CURVA DE GOMPERTZ
 Modelo bivariante que 12000
representa una serie 10000

de datos que tienen 3
8000
momentos o fases:
 1ra. Fase: crecimiento 6000
lento (aprendizaje) 4000

Yreal
 2da fase: crecimiento 2000
rápido (dominancia) Yestim
 3ra fase: crecimiento 0
0 5 10 15 20 25
constante (tope).
Índice Archivo Siguiente

CURVA DE GOMPERTZ
Y: Curva Gompertz
30000
25000 Yc  a.b Cx
20000
15000
log Yc  log a  log b.c x
10000
5000
X: tiem po
0
0 1 2 3 4 5 6 7 8 9
PROCESO CÁLCULO GOMPERTZ
log Yc  log a  log b.c x
3. Constante c:
1. Tamaño periodo m: D2 D2
C m
 C m  log
n
m  Constante c
D1 D1
3 4. Constante b:
D1 (C  1)
2. Diferencias D1, D2: log b 
D1   2 log Y   1 log Y C m

1
2
5. Constante a:
D2   3 log Y   2 log Y
1 D1  
log a   1 logY  m  
m C 1
CURVA EXPONENCIAL MODIFICADA
Y Curva exponencial modificada
300
Y = a + b.c X
250
200
150
100
50
X: tiem po
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Índice Archivo
CURVA LOGÍSTICA
2500
1 1
 a  bc x  Y
y a  bc x
2000
1500
Y: PBI
1000
500
X: año
0
0 1 2 3 4 5 6 7 8 9
CURVA PARABÓLICA
70
Yc  a  bX  cX 2
Y
60
50
40
30
20
10
X
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Modelo Biv
CURVA CÚBICA
Y
Tendencia Cúbica
35
30
25 YC  a  bX  cX  dX 2 3
20
15
10
5
X
0
3 3,2 3,4 3,6 3,8 4
Índice Archivo Modelo Cúbico
Aplicación a la Ingeniería:
Conductividad Térmica
Carga de arrabio
al convertidor
Índice Ver 1
OBJETIVO:
 Determinar el modelo de
regresión de la conductividad
térmica del material, en función
de la temperatura.
K = b1 + b2 (T)
Índice Ver archivo Siguiente

OBTENER DATOS EXPERIM.
ELABORAR DIAGRAMA DISPERS.
TABLA DE CALCULOS
Pasos para OBTENER COEFICIENTES DE REGRESION Y EL

resolver el MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES K
CONDUCTIVIDAD TERMICA
OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Datos Experimentales: T - K
T K K ESTIMADO
ºF Btu/h.ft.ºF
150 0.022
200 0.025
300 0.032
400 0.040
600 0.056
800 0.070
Índice Ver archivo
Diagrama de Dispersión
0.08
0.07
y = 8E-05x + 0.0101
K: Btu/h.ft.ºF
2
0.06 R = 0.9991
0.05
0.04
0.03
0.02
0.01
0.00 T: ºF
0 100 200 300 400 500 600 700 800 900
Índice Ver archivo
Tabla de Cálculos
Conductivid Temperatur Modelo completo: K = b1 + b2 T

K T K^2 T^2 K.T
0.022 150 0.000484 22500 3.3
0.025 200 0.000625 40000 5.0
0.032 300 0.001024 90000 9.6
0.040 400 0.001600 160000 16.0
0.056 600 0.003136 360000 33.6
0.070 800 0.004900 640000 56.0
Σ: 0.245 2450 0.011769 1312500 123.5
Índice Ver archivo

COEFICIENTES MODELO DE REGRESIÓN
Y = b1 + b2.X
b2: PENDIENTE:
N 6
N  T .K   T . K
 TK  123.5 b2 
N  T 2  ( T ) 2
 T  2450
6 *123.5  2450 * 0.245
 K  0.245 b2 
6 *1312500  (2450) 2
 0.000075
 T  1312500
2
b1: INTERCEPTO:
b1 
K  b2
 T
N N
0.245 2450
b1   0.000075  0.01014
6 6
MODELO DE REGRESION: Ke  0.01014  0.000075 (T )
Valores pronosticados Ke
Ke  0.01014  0.000075 (T ) Ver archivo
Ke  0.01014  0.000075 (150)  0.021

T K Ke
ºF Btu/h.ft.ºF Btu/h.ft.ºF
150 0.022 0.021
200 0.025 0.025
300 0.032 0.033
400 0.040 0.040
600 0.056 0.055
800 0.070 0.070
Índice Siguiente
Coeficientes de Correlación y Determinación
N 6
Coeficiente de Correlación
 TK  123.5
 T  2450 N  K .T   K . T
r
 K  0.245 N  K 2  ( K ) 2 N  T 2  ( T ) 2
 T  1312500
2
 K  0.01177
2
6 *123.5  0.245 * 2450

r  0.99955
6 * 0.01177  (0.245) 2
6 *1312500  (2450) 2
Coeficiente de Determinación: R = r2
R 2  (0.99955) 2  0.999125

ANÁLISIS DE VARIANZA
Hipótesis Ho: No existe regresión entre las variables

Nivel de confianza: 95%
Suma
Fuentes GL Cuadrado Medio ESTADISTICO F
Cuadrados
Temperatura SCF 0.00176 1 MCF 0.00176 Fc 4569.91
Residuo SCE 0.00000 4 MCE 0.00000 Ft(1,4) 7.71
TOTAL SCT 0.00176 5 MCT 0.00035 R2 0.999125

INTERPRETACIÓN PRUEBA F
Hipótesis Ho: No existe regresión

entre las variables del modelo
 Interpretación: 4569.9 es muy mayor a 7.71

por tanto, se rechaza la Ho; el modelo de
regresión planteado es significativo al 95%
PRUEBA T STUDENT
Hipótesis Ho: Los coeficientes poblacionales son cero

Coeficientes Menor
Variable Cii Sbi Tci P: 0.975
Regresión ii
Cte b1: 0.01014 1312500 0.701 0.00052 19.5

Tt :
3.18
Temperat
b2: 0.000075 6.0 0.000 0.000 67.60
ura

INTERPRETACIÓN PRUEBA T
 Interpretación: 67.6 es mayor a 3.18 por tanto,

se rechaza la Ho, el coeficiente de regresión
relativo a la temperatura es significativo al 95%
INTERVALO DE CONFIANZA
PARAMETRO POBLACIONAL “B”
 Superadas las pruebas F y T, entonces el modelo
puede ser usado con fines de predicción.
 Por tanto, se requiere determinar el Intervalo de
Confianza del Parámetro Poblacional B2 a un
nivel de confianza del 95%:
Ke  0.01014  0.000075 (T )
P(bi  Tt * Sbi  Bi  bi  Tt * Sbi)  1  
P(7.5E 5  3.18 *1.1E 6  B2  7.5E 5  3.18 *1.1E 6 )  1  0.05
P(7.16E 5  B2  7.84E 5 )  0.95
INTERVALO DE CONFIANZA
PREDICCIÓN DE K MEDIA y Ki

INTERVALO DE CONFIANZA K media
Error Estándar de la estima:
N 6
T  150 _
1 ( X i  X )2
_ Symi  Syx * 
T  408 N
( X 2 
(  X ) 2
)
 T  2450 N
 T  1312500
2
Sk mi  6 E 4 *
1

(150  408) 2
 0.0383
Tt  3.18
2
6 2450
(1312500  )
6
Intervalo de Confianza para la predicción K media:
P(Ti  Tt * Ski  Ui  Ti  Tt * Ski)  1  
P(150  3.18 * 0.0383  Ui  150  3.18 * 0.0383)  1  0.05
P(0.020  Ui  0.023)  0.95

INTERVALO DE CONFIANZA Ki
Error Estándar de la estima:
N 6
_
T  150 1 ( X i  X )2
Syi  Syx * 1 
( X 2  
_
2
T  408 N ( X )
)
 T  2450 N
 T  1312500
2
4 1 (150  408) 2
Tt  3.18 Ski  6 E * 1  2
 0.0073
6 2450
(1312500  )
6
Intervalo de Confianza para una observación K individual
P(Ti  Tt * Ski  Ui  Ti  Tt * Syi )  1  

P(150  3.18 * 0.0073  Ui  150  3.18 * 0.0073)  1  0.05
P(0.019  Ui  0.024)  0.95
CONCLUSIONES
 La conductividad térmica del material en estudio es
una función directa de la temperatura.
 De acuerdo al coeficiente de determinación, el
99.91% de los puntos, se ajustan perfectamente al
modelo lineal propuesto.
 De acuerdo a la prueba ANVA, el modelo de
regresión para proyectar la conductividad térmica
en base a la temperatura es significativo al 95%
 De acuerdo a la prueba t Student, el coeficiente de
regresión de la temperatura permite pronosticar la
conductividad térmica del material de manera
significativa al 95%.
Índice
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”, Editorial
Limusa - México 1994.
 FRANCIS DIEBOLD: “Elementos de Pronóstico”, Thomson
Editores. México - 1999.
 MOTHES, TORRENS "Estadística Aplicada a la
Ingeniería”. Ediciones Ariel - 1970.
 MURRAY SPIEGEL: “Estadística”. colección Schaum.
Editorial Mc Graw Hill - 1991.
 RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma edición.
México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfaomega Grupo Editor.
10ma edición. Colombia, 2003.
Índice
CAPITULO II
REGRESIÓN MÚLTIPLE
OBJETIVO:
Modelar un conjunto de datos, con mas de
dos variables,
mediante la técnica de regresión múltiple,
para obtener una ecuación de pronóstico.
Índice
INTRODUCCIÓN
 Los procesos industriales, los fenómenos de la
naturaleza, los acontecimientos sociales, entre otros;
rara vez obedecen a modelos bivariables;
 Generalmente, son muchas las variables que

intervienen directa o indirectamente, de manera
dinámica e interactiva sobre un suceso o evento; lo
que hace muy complejo su análisis e interpretación.
 Ejemplo: en un proceso, se quiere investigar como

influye analíticamente, el espesor de las hojuelas de
semilla de girasol, la temperatura de extracción y el
tiempo de extracción; sobre la fracción % de aceite
residual en las hojuelas de semilla de girasol.
Índice Siguiente
FACTORES EXTRACCIÓN ACEITE
Espesor hojuelas - % Aceite residual
 X1: % aceite residual en 35
X1: % aceite residual en

30
hojuelas semilla de girasol 25
hojuela
20
 X2: espesor de las hojuelas 15
 X3: temperatura de 10
5
extracción 0
0.2 0.25 0.3 0.35 0.4 0.45
 X4: tiempo de extracción X2: espesor hojuelas, en mm
Tiempo - % Aceite residual Temperatura - % Aceite residual

35
35 30
X1: % Aceite residual

30
X1: % Aceite resudual
25
25
20
20
15 15
10 10
5
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60 0
X4: tiempo extracción, en min. 20 30 40 50 60
X3: Temperatura ºC
MODELO LINEAL MÚLTIPLE

ECUACIONES NORMALES
MODELO: X 1  b1  b2 X 2  b3 X 3  b4 X 4
Ecuaciones normales del modelo de regresión:
n.b1  b2  X 2  b3  X 3  b4  X 4  X
1
b1  X 2  b2  X 2  b3  X 2 X 3  b4  X 2 X 4 X X
2
2 1
b1  X 3  b2  X 2 X 3  b3  X 3  b4  X 3 X 4 X X
2
3 1
b1  X 4  b2  X 2 X 4  b4  X 3 X 4  b4  X 4 X X
2
4 1
Matriz de las ecuaciones normales:

 n

X 2 X 3 X 4 X 1 

 X 2 X X X X X X X
2
2 2 3 2 4 2 1
 X 3 X X X
2
X X X X 
 
2 3 3 3 4 3 1
 X 4 X X X X X X X
2
2 4 3 4 4 4 1
MODELO CURVO MÚLTIPLE

Extracción de aceite de la
semilla de girasol
Ver 2.2
Índice
Producción de aceite de girasol
Objetivo
Índice Siguiente
CASO ESTUDIO EXPERIMENTAL
 Se obtienen los datos experimentales de la

cinética de extracción del aceite de la semilla
girasol empleando hexano como solvente.
 Las variables independientes son: espesor de
las hojuelas de semilla de girasol (X2),
temperatura de extracción (X3) y tiempo de
extracción (X4).
 La variable dependiente es la fracción de
aceite residual en las hojuelas de semilla de
girasol (X1).
Diagrama de Dispersión X1 – X2
Espesor hojuelas - % Aceite residual
35
X1: % aceite residual en
y = 56.926x - 8.9602
30 2
R = 0.2888
25
hojuela
20
15
10
5
0
0.2 0.25 0.3 0.35 0.4 0.45
X2: espesor hojuelas, en mm
Índice Ver archivo
Diagrama de Dispersión X1- X4
Tiempo - % Aceite residual
35
30 -0.7013
X1: % Aceite resudual
y = 54.036x
25 2
R = 0.5204
20
15
10
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60
X4: tiempo extracción, en min.

Índice Ver archivo
Diagrama de Dispersión X1- X3
Temperatura - % Aceite residual
35
X1: % Aceite residual
y = -0.1397x + 14.517
30 2
25 R = 0.0727
20
15
10
5
0
20 30 40 50 60
X3: Temperatura ºC
Índice Ver archivo
OBJETIVOS:
 Obtener el modelo que mejor represente los datos
experimentales.
 Modelo Nº 1:
X1 = b1 + b2.X2 + b3.X3 + b4.X4
 Modelo Nº 2:
X1 = b1(X2b2)(X3b3)(X4b4)
 Determinar los Indicadores sobre la bondad de
ajuste del modelo matemático elegido.
 Calcular la variación del error de los valores
calculados con los dos modelos.
OBTENER DATOS EXPERIM.
TABLA DE CALCULOS Ver archivo
Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Siguiente
Tabla Datos Experimentales
Aceite (%) Espesor (mm) Temperatura (ºC) Tiempo (min)
X1 X2 X3 X4
13.15 0.25 24 5
7.7 0.25 24 10
5.94 0.25 24 15
4.73 0.25 24 20
3.45 0.25 24 30
2.06 0.25 24 55
7.92 0.25 52 5
4.88 0.25 52 10
3.66 0.25 52 15
2.86 0.25 52 20
… … … …

Diagrama Temperatura - Tiempo
y Rendimiento
Siguiente Ver archivo

Índice
Tabla de cálculos Modelo Nº 1
Modelo Nº 1: X1 = b1 + b2.X2 + b3.X3 + b4.X4
(X1)^2 (X2)^2 (X3)^2 (X4)^2 X1X2 X1X3 X1X4 X2X3 X2X4 X3X4
172.92 0.0625 576 25 3.2875 315.6 65.8 6 1.3 120
59.29 0.0625 576 100 1.925 184.8 77.0 6 2.5 240
35.28 0.0625 576 225 1.485 142.56 89.1 6 3.8 360
22.37 0.0625 576 400 1.1825 113.52 94.6 6 5.0 480
11.90 0.0625 576 900 0.8625 82.8 103.5 6 7.5 720
4.24 0.0625 576 3025 0.515 49.44 113.3 6 13.8 1320
62.73 0.0625 2704 25 1.98 411.84 39.6 13 1.3 260
23.81 0.0625 2704 100 1.22 253.76 48.8 13 2.5 520
13.40 0.0625 2704 225 0.915 190.32 54.9 13 3.8 780
… … … … … … … … … …
Siguiente Ver archivo

Índice
COEFICIENTES MODELO LINEAL
MATRIZ “M” DEL DISCRIMINANTE MATRIZ INVERSA DE M
30 9.78 1056 675 1.112 -2.428 -0.006 -0.003
9.78 3.3234 343.92 220.1 -2.429 7.402 0.0004 5E-16
1056 343.92 42816 23760.0 -0.006 0.0004 0.0002 2E-20

675 220.1 23760.0 23375 -0.003 6E-17 2E-20 0.0001
MATRIZ INVERSA M VECTOR TD VECTOR SOLUCION
1.112 -2.428 -0.006 -0.003 287.93 b1 = 1.6619
-2.429 7.402 0.0004 5E-16 101.557 b2 = 56.587

* =
-0.006 0.0004 0.0002 2E-20 9346.32 b3 = -0.1364
-0.003 6E-17 2E-20 0.0001 4400.2 b4 = -0.2538

Ver archivo
MODELO: X1 = 1.6619 + 56.587X2 – 0.1364X3 – 0.2538X4
Índice Siguiente
Tabla de cálculos Modelo Nº 2
Modelo Nº 2: X1 = b1(X2b2)(X3b3)(X4b4)
ln(X1) = ln(b1) + b2.ln(X2) + b3.ln(X3) + b4. ln(X4)
(LX1)^2 (LX2)^2 (LX3)^2 (LX4)^2 LX1LX2 LX1LX3 LX1LX4 LX2LX3 LX2LX4 LX3LX4
6.66 1.9321 10.1124 3 -3.5862 8.2044 4.2 -4.4202 -2.2 5
4.16 1.9321 10.1124 5 -2.8356 6.4872 4.7 -4.4202 -3.2 7
3.17 1.9321 10.1124 7 -2.4742 5.6604 4.8 -4.4202 -3.8 9
2.40 1.9321 10.1124 9 -2.1545 4.929 4.7 -4.4202 -4.2 10
1.54 1.9321 10.1124 12 -1.7236 3.9432 4.2 -4.4202 -4.7 11
0.52 1.9321 10.1124 16 -1.0008 2.2896 2.9 -4.4202 -5.6 13
4.28 1.9321 15.6025 3 -2.8773 8.1765 3.3 -5.4905 -2.2 6
2.53 1.9321 15.6025 5 -2.2101 6.2805 3.7 -5.4905 -3.2 9
1.69 1.9321 15.6025 7 -1.807 5.135 3.5 -5.4905 -3.8 11
1.10 1.9321 15.6025 9 -1.4595 4.1475 3.2 -5.4905 -4.2 12
… … … … … … … … … …

Coeficientes modelo logarítmico
MATRIZ “M” DEL DISCRIMINANTE MATRIZ INVERSA DE M
30.00 -34.28 104.62 85.12 4.1889 0.8094 -0.7953 -0.161
-34.28 40.51 -119.64 -97.27 0.8094 0.7504 0.0138 0.0000
104.62 -119.64 369.15 296.85 -0.7953 0.0138 0.2326 0.0000
85.12 -97.27 296.85 259.13 -0.1611 0.0000 0.0000 0.0568
MATRIZ INVERSA M VECTOR TD VECTOR SOLUCION

4.1889 0.8094 -0.7953 -0.161 59.995 b1 = 8.4969
0.8094 0.7504 0.0138 0.0000 -65.634 b2 = 2.1588

* =
-0.7953 0.0138 0.2326 0.0000 206.534 b3 = -0.5850
-0.1611 0.0000 0.0000 0.0568 157.879 b4 = -0.7013

Ver archivo
MODELO: X1 = 8.4969(X2)2.1588 (X3)-0.5850 (X4)-0.7013
Siguiente
Valores pronosticados X1e
MODELO1: X1 = 1.6619 + 56.587X2 – 0.1364X3 – 0.2538X4
MODELO2: X1 = 8.4969(X2)2.1588 (X3)-0.5850 (X4)-0.7013

X1 Modelo Lineal Modelo Log
Real X1e d^2 X1e d^2
13.15 11.27 3.55 12.38 0.59
7.70 10.00 5.28 7.61 0.01
5.94 8.73 7.77 5.73 0.04
4.73 7.46 7.45 4.68 0.00
3.45 4.92 2.16 3.52 0.01
2.06 -1.42 12.15 2.30 0.06
7.92 7.45 0.22 7.88 0.00
… … … … …
d=(X1 – X1e)2 Σ: 445.84 9.97

Correlación y Determinación Múltiple Lineal
N  30 Coeficiente Correlación: %aceite-Espesor

X X 2  101.56 N  X 1. X 2   X 1. X 2
r
1
X 1  287.93
N  X 1  ( X 1 ) 2 N  X 2  ( X 2 ) 2
2 2
X 2  9.78
X
2
 4279.64 30 *101.56  287.93 * 9.78
1 r
X 2
2
 3.32 30 * 4279.64  (287.93) 2 30 * 3.32  (9.78) 2
r = 0.5374
Coeficiente de Determinación Múltiple Ajustado
SCE  445.84 SCE / GLRES
R  1
GLRES  N  K  1  26 SCT /( N  1)
SCT  1516.2 445.84 / 26
Raj  1   0.6720
N  1  30  1  29 1516.2 / 29
ANÁLISIS VARIANZA MULTILINEAL

Suma
Cuadrados
Temperatura,
tiempo, SCF 1070.3 3 MCF 356.78 Fc 20.81
espesor
TOTAL SCT 1516.2 29 MCT 52.28 Raj2 0.6720
Índice Ver archivo

Siguiente
Hipótesis Ho: No existe regresión

entre las variables del modelo
 Interpretación: 20.81 es mayor a 2.98

por tanto, se rechaza la Ho; el modelo de
regresión multi exponencial planteado es Ver archivo
significativo para pronóstico al 95%
Índice Siguiente
PRUEBA T STUDENT MULTIL
Coeficientes
Variable Men ii Cii Sbi Tci P: 0.975
Regresión
Espesor b2: 56.587 1E+09 7.40192 11.27 5.02

Tt :
Temperat 2.06
b3: -0.136 33189 0.00018 0.055 -2.47
ura
Tiempo b4: -0.254 22878 0.00012 0.046 -5.55

 Interpretación: Todos los T calculados son

mayores que 2.06; por tanto, se rechaza la
Ho; los coeficientes de regresión del modelo Ver archivo
Índice
son significativos al 95% sobre la dependiente
Siguiente
ANALISIS COMPARATIVO
ANALISIS COMPARARTIVO ENTRE MODELOS
MODELOS Mejor
Criterios Logarítmico Lineal Modelo
R2a 0.9938601 0.672014 Logarítmico
Fc 1565.7346 20.81 Logarítmico
Tb2 espesor 41.98 5.02 Logarítmico
Tb3 temperatura -20.44 -2.47 Logarítmico
Tb4 tiempo -49.58 -5.55 Logarítmico

CONCLUSIONES
 La fracción % de aceite residual en las hojuelas de semilla
de girasol (X1) están en relación directa, de manera multi-
exponencial, al espesor de las hojuelas de semilla (X2),
temperatura de extracción (X3) y tiempo de extracción (X4).
 De acuerdo al coeficiente de determinación, el 99.38% de los
puntos, se ajustan perfectamente al modelo multiexponencial
propuesto.
 De acuerdo a la prueba ANVA, el modelo de regresión multi-
exponencial planteado, es significativo al 95% para proyectar
el % de aceite residual en las hojuelas de semilla de girasol
en base al tiempo, la temperatura y el espesor de la hojuela.
 De acuerdo a la prueba t Student, los coeficientes de
regresión de la temperatura, tiempo y espesor de la hojuela
permiten pronosticar el % de aceite residual en las hojuelas
de manera significativa al 95%.
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”,
Editorial Limusa - México 1994.
 DAMODAR GUJARATI, "Econometría", 4ta
Edición. Editorial Mc Graw Hill. México, 2004.
 DOUGLAS MONTGOMERY “Diseño y Análisis de
Experimentos” - Editorial LIMUSA, 2002 México.
 MURRAY SPIEGEL: “Estadística”. colección
Schaum. Editorial Mc Graw Hill - 1991.
Administración y Economía”. Prentice Hall. 7ma
edición. México, 2004.
Administración y Economía”. Alfa omega Grupo
Editor. 10ma edición. Colombia, 2003.
Índice
CAPITULO III
MEDIDAS DE ASOCIACIÓN
OBJETIVO:
Determinar el mejor modelo de regresión
usando medidas de asociación y
dispersión
Índice Ver 3
Diagrama de dispersión
 Sean los datos de las
cantidades vendidas de un Ventas de un articulo
articulo y sus precios.
 El diagrama de dispersión,
muestra la relación entre las
variables: precios y ventas. 20
 La variable independiente 10
“X”, es el estimador: precio
 La variable dependiente “Y” 2 4

es la que se estima: ventas
Índice Siguiente
VARIACIONES
Dato real:
_  
(Yi  Y )  Total Yi   1   2 X i
:Dato estimado
_ ( Y ) 2
 (Y  Y )  Y  N
2 2  _
(Yi  Y )  Debido a la regresio
_ ( X  Y )
 (Ye  Y )2  2 ( XY  N
)
: Promedio
_ _
 (Y  Y )   (2
Ye  Y ) 2
  (Y Ye ) 2
SCT = SCR + SCE

Siguiente
Índice
Coeficiente de correlación
 Mide el grado de
asociación entre dos
variables.
 Ambas variables
deben ser, al menos
de escala de intervalo
de medición.
Índice Siguiente
Ecuación del coeficiente de correlación
FÓRMULA GENERAL COEFICIENTE CORRELACIÓN: r
 (Yestimada  Ypromedio)
2
r
 (Y  Ypromedio) 2
Variación Explicada
r
Variación Total
FÓRMULA COEFICIENTE CORRELACIÓN PARA MODELOS LINEALES
N  XY   X  Y
r
N  X 2  ( X ) 2 N  Y 2  ( Y ) 2
Índice Siguiente
Error estándar de estimación
 El error estándar de estimación, mide la
variación alrededor de la línea de regresión.
 Está en las mismas unidades que la variable
dependiente.
 Se basa en las desviaciones al cuadrado
respecto de la recta de regresión.
 Valores pequeños, indican que los puntos se
agrupan cerca de la recta.
SY . X 
Y 2
 a( Y )  b( XY )
n2
Índice Siguiente
Correlación positiva perfecta
 Un signo positivo
significa que existe
una relación
directa entre las
variables.
 Un valor r = 1.00
indica una
correlación positiva
perfecta.
Índice Siguiente
Correlación negativa
 Un signo negativo
significa que
existe una
relación inversa
entre las
variables
Índice Siguiente
Correlación nula
 Si la correlación
entre dos
variables es 0,
entonces NO
existe relación
entre las
variables.
Índice Siguiente
Escala coeficiente correlación
 El coeficiente de correlación puede variar desde

-1.00 hasta 1.00
Índice Siguiente
Coeficiente determinación: R2
 R2 es la porción fraccionaria del

cambio en una variable que es
explicada por la otra.
 Varía de 0 a 1.0
 Es el cuadrado del coeficiente de
correlación “r”
Índice Siguiente
Limitaciones coeficiente correlación
Índice Siguiente
Limitaciones coeficiente correlación 2
Índice Siguiente
Análisis de regresión
 Se calcula una variable en base de

otra variable.
 La relación entre variables debe ser
lineal.
 El criterio de mínimos cuadrados se
utiliza para determinar la ecuación de
regresión.
Índice Siguiente
RESIDUALES DEL MODELO
Índice Siguiente
MÉTODO MÍNIMOS CUADRADOS
Índice Siguiente
PRUEBA DE HIPOTESIS
 HIPOTESIS: Enunciado, conjetura acerca
de una población; elaborado con el
propósito de ponerla a prueba.
 Hipótesis Nula Ho: Afirmación acerca del

valor de un parámetro poblacional.
 Hipótesis Alternativa Ha: Afirmación que

se aceptará, si la Hipótesis Nula es falsa.
Índice Siguiente
PRUEBA DE HIPÓTESIS
 Se formula una hipótesis con el solo propósito de
rechazarla.
 Esto es un principio, porque estadísticamente, una
hipótesis NUNCA puede ser aceptada.
 Únicamente podría no ser rechazada en base a
las evidencias que se disponga. Ejemplo:
 Hipótesis Nula Ho: "No existe diferencia entre
tratamientos"
 Hipótesis Alternativa Ha: "Si existe diferencia entre
tratamientos"
Índice Siguiente
TIPOS DE PRUEBA
 Depende de la Hipótesis Alternativa Ha.
 Se denomina Prueba Bilateral o de dos

colas, cuando Ho: B = valor contra Ha ≠
valor.
 Se denomina Prueba Unilateral o de una

cola, cuando Ho: B = valor contra Ha >valor
Índice Siguiente
TIPOS DE ERRORES
 Al tomar la decisión de Aceptar o Rechazar la Ho:
B = valor contra Ha ≠ valor
 en base a los resultados obtenidos de una
muestra aleatoria, seleccionada de una población;
existe 4 posibles alternativas, que determinan si la
decisión elegida es correcta o incorrecta. Luego:
 ERROR TIPO I (α) se comete al Rechazar la Ho

cuando es Verdadera.
 ERROR TIPO II () se comete al Aceptar la Ho

cuando es Falsa
Índice Siguiente
NIVEL DE SIGNIFICACIÓN (NS)
 Es la probabilidad de cometer un Error tipo I
y se denota por α. También se le denomina
nivel de riesgo.
 La probabilidad de la Decisión Correcta de
rechazar Ho cuando es falsa, es 1 - 
Índice Siguiente
FUENTES DE VARIACION
 VARIACION TOTAL:
SCT = ΣY2 – (ΣY)2/n
 VARIACION REGRESION:
SCR = b(ΣXY – ΣX.ΣY/n)
 VARIACION RESIDUAL:
SCE = SCT – SCR
Índice Siguiente
ANALISIS DE VARIANZA DEL
MODELO DE REGRESION
 MODELO DE REGRESION:
X1 = -1.001544 - 1.1002316X2 + 0.254632X3
 DONDE:
 X1:
 X2:
 X3:
Índice Siguiente
VARIACION DEBIDO A LA REGRESION
1.1. Suma de Cuadrados de la Regresión:

SCR  b2 D( X 1 . X 2 )  b3 D( X 1 . X 3 )
SCR  b2 ( X 1 X 2 
 X X
1 2
)  b3 ( X 1 X 3 
 X X
1 3
)
N N
53 * 42 53 * 66
SCR  1.002316 (263  )  0.254632 (384  )  53.16
10 10
1.2. Grados de Libertad:
GLregres = 2 (variables independientes: X2, X3)
1.3. Cuadrado Medio:

SCR 53.16
CMR    26.58
GLregres 2
Índice Siguiente
VARIACION TOTAL
2.1. Suma de Cuadrados Totales
( X 1 ) 2 (53) 2
SCT  ( X 1  )  (339  )  58.10
2
N 10
2.2. Grados de Libertad

GL = N – 1 = 10 – 1 = 9
2.3. Cuadrado Medio

SCT 58.10
CMT    6.46
GLt 9
Índice Siguiente
VARIACION DEBIDO AL RESIDUO
3.1. Suma de Cuadrados del Error

SCE = SCT – SCR
SCE = 58.10 – 53.16 = 4.94
3.2. Grados de Libertad

GLerror = N – GLregres – 1
GLerror = 10 – 2 – 1 = 7
3.3. Cuadrado Medio

SCE 4.94
CMR    0.71
GLerr 7
Índice Siguiente
ANALISIS ANVA
 HIPOTESIS NULA (Ho):
“No existe regresión entre las variables”
 Nivel de confianza: 95%
 Nivel de Significación: 1 – NC = 1 – 0.95 = 0.05
 Ftabla (NC; GLregres; GLerr) = Ft (0.05; 3; 3) = 9.28
 F CALCULADO:
CMR 26.58
Fc    37.64
CME 0.71
 Como Fc es mayor que Ft; se rechaza la

hipótesis nula.
 CONCLUSION: Las variables X2 y X3 en

conjunto son significativas sobre X1 al nivel
del 95% de confianza.
Índice Siguiente
Inferencia de la regresión lineal
 Se basa en las siguientes consideraciones:
 Para un valor de X, los valores de Y se
distribuyen de forma normal respecto de la línea
de regresión.
 La desviación estándar de cada una de las
distribuciones normales es la misma para todos
los valores de X, y se calcula por medio del error
estándar de estimación.
 Las desviaciones respecto de la línea de
regresión son independientes, sin ningún
modelo referente al tamaño o la dirección.
Índice Siguiente
Inferencia de la regresión lineal 2
Índice Siguiente
SUPUESTOS DEL ANÁLISIS DE
VARIANZA
 Homogeneidad de las varianzas con
respecto a la varianza común.
 Las poblaciones tienen distribución Normal.
 Las poblaciones son Independientes.
 Aditividad y linealidad del modelo
Índice Siguiente
Homogeneidad de varianzas
Índice Siguiente
HOMOSCEDASTICIDAD
 Las
perturbaciones ui
de la regresión
poblacional, son
homoscedásticas
es decir todas
tienen la misma
varianza.
Índice Siguiente
HETEROSCEDASTICIDAD
 Las varianzas de ui pueden ser variables por diversas

razones, por ejemplo:
 El tiempo de aprendizaje y los errores cometidos.
 Si mejoran las técnicas productivas, entonces menores
serán los productos defectuosos. Siguiente
Índice
HETEROSCEDASTICIDAD 2
No hay patrón sistemático
entre las 2 variables, por tanto
no hay heteroscedaticidad
en los datos
 Ye valor estimado con la línea de regresión, para

determinar si el valor medio estimado de Y esta
relacionado sistemáticamente con el residual al cuadrado.
Índice Siguiente
HETEROSCEDASTICIDAD 3
 Existe patrones sistemáticos entre las 2 variables. Por

ejemplo, en la (c) es de tipo lineal y en (d) es cuadrático,
por tanto, existe heteroscedaticidad en los datos.
Índice Siguiente
TEST Y CORRECION DE
HETEROSCESDASTICIDAD
 TEST:
 Park
 Glejser
 TECNICAS CORRECCION
 White
Índice Siguiente
MULTICOLINEALIDAD
Índice Siguiente
MULTICOLINEALIDAD 2
Índice Siguiente
Análisis Componentes Principales
 Al eliminarse la
colinealidad, el
sistema queda
representado por
un número menor
de variables, que
además son
“químicamente
puras”.
Índice Siguiente
AUTOCORRELACION
Índice Siguiente
AUTOCORRELACION 2
Índice Siguiente
BIBLIOGRAFÍA
 DAMODAR GUJARATI, "Econometría", 4ta
Edición. Editorial Mc Graw Hill. México, 2004.
Administración y Economía”. Alfaomega Grupo
Índice
CAPITULO IV
SERIES DE TIEMPO
OBJETIVO:
Determinar el índice estacional de una
serie histórica temporal de datos,
para pronosticar acciones a futuro
Índice Ver 4.1

INTRODUCCION A LAS
SERIES DE TIEMPO
 Los sucesos que se dan en la economía, en las
ciencias y tecnologías; generalmente varían de
acuerdo a fuerzas externas que las rodean.
 Son acontecimientos que tienen una tendencia,

son estacionales, cíclicos; y ocasionalmente
presentan sobresaltos, que generan cambios en
las actividades socio económicas, y que afectan
definitivamente a la sociedad en general.
Índice Siguiente
MODELOS SERIES TEMPORALES
 Los modelos de series temporales
pueden ser de tipo aditivo o
multiplicativo:
 Y=T+E+C+I
 Y=T.E.C.I
Índice Siguiente
SERIE HISTORICA TEMPORAL
Y : Valor real * I: irregular
Y = T.C.E.I
T: tendencia
E: estacional
*
C: ciclo
Siguiente
Ver archivo
t
Índice
Tendencia Secular (T) La tendencia puede ser
creciente, decreciente o
constante. Es representado
por una línea recta o curva.
Y = T. C.E.I
Producción anual
Si: T = Y
Y: produc. anual (TM)

30
T = a + b.t 25
20
Y = a.tb
15
10
5 t: años
T = a + b.t + c.t^2 t 0
0 1 2 3 4 5 6 7
Y  a  b.t
c
Donde: T = Y , considerando
constantes o eliminando a las
otras variables: C, E e I
 T: Indica la dirección general que
sigue una serie histórica de datos, El método de los promedios
móviles, reduce la cantidad
en un largo periodo de tiempo. de variaciones cíclicas o
(de cinco años a mas). irregulares, quedando una
tendencia suavizada.
Variaciones Cíclicas (C)
 La economía se desarrolla en
Ciclo ciclos económicos, que duran
prosperidad muchos años (30, 50 o mas).
 Las variaciones cíclicas indican
fluctuaciones; aumentando o
recesión disminuyendo por etapas,
alrededor de la actividad normal.
expansión
 Los ciclos se dan en años;
eliminándo las variaciones
depresión estacionales y los movimientos
irregulares, queda solo la
tendencia.
 Las variaciones cíclicas se
expresan en porcentajes.
 Las etapas cíclicas son:
expansión, prosperidad,
Y  T .C.E.I C  Y /T depresión y recesión.

Variación Estacional (E)
 Son variaciones que duran
menos de un año, y pueden
ser en días, semanas, Índice Estacional
meses, trimestres, etc.
 Son variaciones que se

repiten a intervalos regulares
de tiempo; generalmente por
Y  T .E.C.I
variaciones climáticas, Y
estaciones del año, E
costumbres, etc. T .C.I
 La variación estacional es un
movimiento periódico que se
expresa por números índice.

Productos de Movimiento Estacional
 Por ejemplo en el verano aumenta el consumo de
bebidas gaseosas, cerveza, helados, ropas de baño,
sandalias y en general todas las cosas de verano.
 En el invierno disminuye la demanda de productos de

verano y aumenta la demanda de los productos de
invierno como son casacas, chompas, pantalones,
bebidas a base de alcohol (wisky, ron, pisco, etc.)
 Las costumbres sociales también influyen en la

variación estacional, como son la navidad, año nuevo,
fiestas patrias, día de la madre, inicio del año escolar,
etc.; eventos que incrementan notablemente las
ventas.
Ver archivo Siguiente

Índice
VARIACIONES IRREGULARES (I)
Las variaciones irregulares

se expresan así:
Y = T.E.C.I
 I = Y / (T.E.C)
 Son cambios que se dan en la variable dependiente, son

de corta duración, no son cíclicas ni estacionales.
 A veces estas variaciones son pequeñas o muy grandes;
no son numerosas y son de naturaleza aleatoria.
 Las fuerzas o fenómenos que causan irregularidades o
cambios son: sequías, guerras, inundaciones, terremotos
FUNDAMENTO ELIMINACIÓN V.I.

LÍMITES DE CONTROL EN LA
ELIMNACIÓN DE V. Irregulares
Variaciones irregulares
Variación irregular
Aplicación a Ingeniería de
Proyectos:
Proyección anual y estacional de
la Producción de camperas
Índice Ver 4.2

CASO ESTUDIO
 Una empresa confecciona camperas
(prenda de vestir para protección contra el
frío), por lo que desea proyectar su
producción anual y por periodo estacional.
 Las prendas que no se vendan durante la

temporada de invierno, son almacenadas
durante todo el año, constituyendo un
capital inmovilizado para la empresa.

OBJETIVO:
 Determinar para el próximo

año, la proyección de la
producción anual y por
estaciones, de camperas.

OBTENER DATOS HISTORICOS
TABLA DE CALCULOS
Pasos para
Problema
ESTIMAR VALORES
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Datos históricos de ventas
Nro AÑO ESTACION VENTAS
1 1997: Verano 4
2 Otoño 9
3 29 Invierno 11
4 Primavera 5
5 1998: Verano 6
6 Otoño 8
7 30 Invierno 12
8 Primavera 4
9 1999 Verano …

Diagrama de Dispersión
Ventas estacionales 1997 - 2004
20
18
Y: ventas (mil unid.)
y = 0.1243x + 6.7621
16
R2 = 0.0978
14
12
10
8
6
4
X: estaciones
2
0
V O I P V O I P V O I P V O I P V O I P V O I P V O I P V O I P
Índice Ver archivo

Secuencia de cálculos 1 Ver archivo
1. Promedio Móvil de 4: 4. Índice Estacional Promedio Verano
4  9  11  5 0.7869  0.918  ...  0.5647

pm1   7.25 IEP.ver 
4 7
IEP.ver  0.6919
9  11  5  6
pm2   7.75
4 5.Desv. Stand. Índice Estacional
2. Promedio Móvil centrado
SIE.ver  0.1359
7.25  7.75 6.Límites de Control del Índice Estac.
pmc1   7.50 Limites  Xprom  Desv.Esta.
2
7.75  7.50
pmc2   7.625 7. Límite Inferior I.E. verano:
2 LI .  Xprom  Desv.S tan dar
3. Índice Estacional específico: LI .ver  0.619  0.1359  0.556
11
iee1   1.4667 8. Límite Superior I.E. verano:
7.50
5 LS  Xprom  Desv.S tan dar
iee 2   0.6557
7.625 LS.ver  0.619  0.1359  0.8278
Índice Siguiente
Secuencia de cálculos 2
9. Índice Estacional Básico Verano
0.7869  0.75  0.5263  0.6486  0.6486  05647
IEB.ver 
5
IEB.ver  0.6798
12. Índice Estacional Típico
10. Factor de ajuste del IEB
Estación E
4
F
0.6899  1.0134  1.5614  0.6866 Verano 0.6899
F  1.014915
Otoño 1.0285
11. Índice Estacional Típico Verano Invierno 1.5847
IE  IEB * F Primavera 0.6968
E.ver  0.6798 *1.014915  0.6899

INDICES ESTACIONALES VERANO 1997 - 2004
1.0
0.9
L.S.
0.8
Xprom
0.7
0.6
L.I.
0.5
0.4
0.3
1997 1998 1999 2000 2001 2002 2003 2004 2005
TABLA DE RESULTADOS
Y T TC SI = Y/TC S
P.MOVIL
Nro AÑO ESTACION VENTAS P. MOV. C IEE IE
4
1 1997: Verano 4 0.6899
0.6899
2 Otoño 9 1.0285
3 29 Invierno 11 7.25 7.500 1.4667 1.5847
4 Primavera 5 7.75 7.625 0.6557 0.6968
5 1998: Verano 6 7.50 7.625 0.7869 0.6899
6 Otoño 8 7.75 7.625 1.0492 1.0285
7 30 Invierno 12 7.50 7.625 1.5738 1.5847
8 Primavera 4 7.75 7.750 0.5161 0.6968
9 1999 Verano … … … … …

TENDENCIA ANUAL
N 8 b2: PENDIENTE:
 XY  1347 N  XY   X  Y
b2 
 X 36 N X   X 
2 2
 Y  282
8 *1347  36 * 282
 X  204
2
b2   1.8571
 Y  10104
2 8 * 204  (36) 2
b1: INTERCEPTO:
b1 
Y  b2
X
N N
282 36
b1   1.8571  26.893
8 8
MODELO DE REGRESION: Y  26.893  1.8571( X )
Valores pronosticados Ye
Ye  26.893  1.8571( X )
Ye  26.893  1.8571(1)  29
AÑO X Y anual Ye
1997 1 29 29
1998 2 30 31
1999 3 32 32
2000 4 37 34
2001 5 36 36
2002 6 35 38
2003 7 40 40
Índice
2004 8 43 42
Ver archivo Siguiente
DIAGRAMA DE TENDENCIA
Ventas anuales 1997 - 2004
45
43
Y: ventas (mil. unid.)
41 y = 1.8571x + 26.893
39 2
37
R = 0.886
35
33
31
29
27 X: años
25
0 1 2 3 4 5 6 7 8 9

Coeficientes de Correlación y Determinación
N 8 Coeficiente Correlación:
 XY  1347 N  XY   X  Y
 X 36 r
N  X 2  ( X ) 2 N  Y 2  ( Y ) 2
 Y  282
 X  204
2
8 *1347  36 * 282
r
 Y  10104
2
8 * 204  (36) 2 8 *10104  (282) 2
r = 0.941275
Coeficiente de Determinación:
R 2  (0.941275) 2  0.886

ANÁLISIS DE VARIANZA
Suma
Cuadrados
X: Años SCF 144.86 1 MCF 144.86 Fc 46.62
TOTAL SCT 163.50 7 MCT 23.36 Raj2 0.8670

 INTERPRETACIÓN: 46.62 es mayor a 5.99 por

tanto, se rechaza la Ho; el modelo de regresión
planteado es significativo al 95% de NC.
PRUEBA T STUDENT
Coeficientes Menor
Variable Cii Sbi Tci P: 0.975
Regresión ii
Cte a= 26.893 204 0.607 1.373 19.58

Tt :
2.57
X: Años b= 1.8571 8 0.0238 0.272 6.83
Índice Ver archivo

 Interpretación: 6.83 es mayor a 2.57 por

tanto, se rechaza la Ho, la pendiente del
modelo es significativo al 95% de NC.
CONCLUSIONES
 Usando promedios móviles centrados de 4 periodos, se
eliminan las variaciones cíclicas, estacionales e irregulares
de los datos del estudio.
 La desventaja del método es que se pierden datos al inicio
y final de la serie histórica.
 La aplicación de limites de control con un NC de 68% a los
datos desetacionalizados, se asegura la extracción de las
variaciones irregulares muy grandes y muy pequeñas,
obteniéndose índices estacionales típicos de cada estación
 De acuerdo al coeficiente de determinación, el 88.6% de
los puntos, se ajustan perfectamente al modelo lineal de
tendencia propuesto.
 De acuerdo a la prueba ANVA, el modelo de regresión para
proyectar las ventas anuales es significativo al 95% del
nivel de confianza.
 De acuerdo a la prueba t Student, la pendiente del modelo
de regresión, es significativa al 95% del nivel de confianza.
Índice Siguiente
BIBLIOGRAFÍA
 FRANCIS DIEBOLD: “Elementos de Pronóstico”,
Thomson Editores. México - 1999.
 MOTHES, TORRENS "Estadística Aplicada a la
Ingeniería”. Ediciones Ariel - 1970.
Administración y Economía”. Alfaomega Grupo
Índice
CAPITULO V
DISEÑO DE EXPERIMENTOS
OBJETIVO:
Desarrollar diseños experimentales
Índice Ver 6.1

INTRODUCCIÓN
 CASO: Determinar el efecto sobre la demanda, de
cuatro sabores diferentes de una torta, en base al
Yacón, en los consumidores de la provincia de
Arequipa-2008.
 DIFICULTAD: No se puede consultar a la totalidad de

la población; es costoso, demanda mucho tiempo,
personas y material.
 Pero si se puede “muestrear” a la población y aplicar

"pruebas" de degustación.
 El propósito del diseño experimental, es obtener la

máxima cantidad de información, de manera
experimental y simple como se pueda, referido al
problema de investigación.
Índice Siguiente
 “Un experimento es una serie de pruebas, en el que se
hacen cambios deliberados en las variables de entrada
del sistema, para observar e identificar las razones de
los cambios en la respuesta de salida”. (D. Montgomery
2002).
 Técnica estadística, que planifica, organiza y ejecuta
pasos; para comprobar si son iguales las medias de
dos o más poblaciones, mediante varianzas muestrales
insesgadas.
 “La investigación científica consiste en la búsqueda de
la verdad mediante métodos objetivos, adecuados y
precisos. La experimentación es un método científico,
que consiste en hacer operaciones y prácticas
destinadas a demostrar, comprobar o descubrir
fenómenos o principios básicos” (P. Reyes 1985).
Índice Modelos Siguiente
VENTAJAS Y DESVENTAJAS DEL
 La exactitud de las conclusiones, se conoce
con precisión matemática.
 El número de pruebas, es determinado con
certeza, y a menudo es reducible.
 La comparación de los efectos es mas precisa,
debido a la agrupación de resultados.
 Existe mayor atención a interrelaciones causa-
efecto y a la cuantificación de las fuentes de
variabilidad.
 Mayor énfasis en las alternativas anticipadas y
en la planeación sistemática.
 Ser costoso y demanda tiempo de ejecución.
TRATAMIENTO
 Es el conjunto de condiciones experimentales,
procedimientos, métodos, o estímulos; cuyos
efectos se desea estimar y comparar en una
unidad experimental contra una de control.
 Constituye la variable independiente.
 Ejemplos:
 La cantidad de reactivo aplicable a un proceso
 Una nueva marca de materia prima
 Un nuevo método de trabajo
 Un nuevo equipo de trabajo
CONCEPTOS
 UNIDAD EXPERIMENTAL (UE): Es aquella a la
que se aplica el tratamiento en estudio, en un
experimento.
 UNIDAD DE CONTROL (UC): Es aquella a la que

NO se le aplica el tratamiento. Sirve de testigo
para comparar el resultado del experimento.
 ERROR EXPERIMENTAL: No llegar a resultados

idénticos con dos unidades experimentales
tratadas idénticamente.

PRINCIPIOS BÁSICOS DEL
 ALEATORIZACION: Todas las unidades
experimentales, tienen la misma probabilidad de
recibir un tratamiento, para asegurar asignaciones
imparciales.
 REPETICION: Permite una valoración mas

precisa, del efecto del tratamiento y una mejor
estimación del error experimental.
 CONTROL LOCAL: Permite ciertas restricciones,

en la selección aleatoria, a fin de reducir el error
experimental.
PASOS DISEÑO DE EXPERIMENTOS
 Enunciar claramente el problema

 Reunir la información disponible
 Diseñar el programa de prueba
 Planear y ejecutar el trabajo experimental
 Analizar e interpretar los datos obtenidos
 Preparar el informe
Índice Siguiente
MODELOS DE DISEÑOS
EXPERIMENTALES
 Diseño completamente al azar
 Diseño por bloques al azar
 Diseño cuadrado latino
 Diseño greco latino
 Diseños factoriales
 Los Modelos de experimentos

pueden ser con uno, dos o mas
factores, y pueden ser:
 Sin replicación
 Con replicación
ALEATORIZACIÓN COMPLETA (AC)
BLOQUES
 El objetivo de la AC es
D A C C
eliminar varias fuentes F
de error; por ejemplo I B D B A
la antigüedad, marca, L
D C B D
vida útil de las A
maquinas. S
A B C A
EJEMPLO: Comparar la velocidad de secado, de 4

maquinas de marcas diferentes (A, B, C, D) y asignar
a 4 bloques de 4 fardos de ropa del mismo peso,
elegidas completamente al azar.
EJEMPLO (AC)
 Determinar, si el número promedio de
accidentes producidos en tres maquinas, se
puede considerar iguales al 95% y 99% de
Nivel de Confianza.
 Determinar, si el número diario de productos
defectuosos producidos por tres maquinas,
operadas individualmente por tres
trabajadores expertos en cuatro días, puede
considerarse iguales, al 95% NC. (ver
archivo)
Índice Archivo Ver soluc. Siguiente
BLOQUES ALEATORIOS (BA)
 El objetivo de los BA, es
tener un conjunto I II III IV
completo de tratamientos C A B A
para cada bloque, a fin B B C D
de controlar una fuente
de error o variabilidad A D D C
(diferencia entre bloques: D C A B
l, II, III, IV).
EJEMPLO: Cuatro tratamientos (procesos de
manufactura filas: A, B, C, D); se introducen en
orden aleatorio dentro de cada bloque
(repeticiones, replicaciones, columnas: l, II, III, IV)
Aplicaciones (BA)
 Comparar la calidad de 5 placas metálicas de
diferente marca, en 2 bloques de 5 tornos de
igual marca y año de fabricación.
 Comparar la producción por maquina, de 4

variedades de materia prima, cada una aplicada
a 5 bloques de 4 maquinas.
 Comparar 5 variedades de sorgo, y con 6

repeticiones, conocer el sentido y dirección de
la gradiente de fertilidad del suelo.
CUADRADO LATINO (CL)
 Se aplica, cuando se
desea controlar dos D B C A
fuentes de error al
B D A C
mismo tiempo, tal
como la diferencia C A D B
entre filas y la
diferencia entre A C B D
columnas.
 En tal caso, es deseable que cada

tratamiento, ocurra una vez en cada fila y
una vez en cada columna.
Ejemplos (CL)
 Comparar la producción de 4 operarios
diferentes, utilizando 4 maquinas diferentes,
y determinar si existe diferencia significativa
entre maquinas y entre operarios.
 Comparar la capacidad de extracción de

cobre por lixiviación, por 4 biocatalizadores
diferentes, en 4 grupos de canchas o pads.
Índice Ver soluc. Archivo Siguiente

CUADRADO GRECO LATINO
 Se aplica, cuando se
desea controlar tres Bl A Dd C
fuentes de error o
variabilidad al mismo Ad B Cl D
tiempo, tal como la D Cd B Al
diferencia entre filas,
diferencia entre C Dl A Bd
columnas y diferencia
entre niveles.
 Ental caso, es deseable que cada tratamiento
ocurra una vez en cada fila, una vez en cada
columna y una vez en cada tratamiento.

Ejemplos (CGL)
 Determinar si existe diferencia en
millas recorridas por galón entre las
gasolinas A, B, C y D.
 Diseñar el experimento con 4 conductores
distintos, 4 vehículos distintos y 4
carreteras distintas, al 95% NC.
 Comparar las tensiones de ruptura de los

cables, fabricadas por 4 empresas
diferentes, por 4 operarios diferentes y
usando 4 máquinas diferentes.
DISEÑOS FACTORIALES
 Son arreglos de tratamientos, que permiten aplicar
de una sola vez, una serie de estímulos o
tratamientos, que se considera intervengan en la
respuesta dada, por una unidad experimental.
 Un diseño factorial, es aquel en el que interviene

dos o mas factores, considerando como factor, al
estimulo, representado por mas de dos niveles de
aplicación.

Ejemplo (DF)
 En la producción de galletas, intervienen

como fuentes proteicas, harina de trigo o
harina de soya. Las galletas pueden
presentar dos formas: redonda o cuadrada
y tener dos sabores: lúcuma y fresa.
 Determinar, la mejor combinación de
tratamientos, mediante un diseño factorial
de tres factores.

TÍTULO
“Supresión del desarrollo de microbios en
la carne mediante aplicación de gases”
Ver 6.3 Archivo

Índice
OBTENER DATOS HISTORICOS
TABLA DE CALCULOS Archivo
Pasos para
Problema
ESTIMAR VALORES
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Siguiente
DESCRIPCIÓN DEL PROBLEMA 1
 La vida de anaquel de las carnes almacenadas en
los supermarkets, es el tiempo que un corte
previamente empacado, es sano, nutritivo y
vendible.
 Un paquete normal expuesto al aire tiene una vida

media aproximada de 48 horas, después de la
cual, la carne comienza a deteriorarse por
contaminación de microbios, degradación del
color y encogimiento.
 El empaque al vacío es efectivo para suprimir el

desarrollo de microbios; sin embargo, continúan
siendo un problema los otros factores.
DESCRIPCIÓN DEL PROBLEMA 2
 Estudios sugieren el uso de atmósferas
controladas de gases, como alternativas a los
empaques actuales; que combinan la capacidad
de suprimir el desarrollo de microbios, con la
conservación de las cualidades de la carne,
 mediante la aplicación de gases: a) dióxido de
carbono puro CO2 o b) mezclas de monóxido de
carbono CO, oxigeno O2 y nitrógeno N; en el
empacado para el almacenamiento de la carne.

DEFINICIÓN DEL PROBLEMA
 ¿Cuál es el grado de supresión del

desarrollo de microbios para la
conservación de las cualidades de la carne,
mediante la aplicación de gases de dióxido
de carbono puro CO2, mezclas de
monóxido de carbono CO, oxigeno O2 y
nitrógeno N, en el empacado para el
almacenamiento de carne?
Índice
OBJETIVO GENERAL INVESTIGACIÓN
 Evaluar el grado de supresión del desarrollo

de microbios para la conservación de las
cualidades de la carne, en base a gases de
dióxido de carbono puro CO2, mezclas de
monóxido de carbono CO, oxigeno O2 y
nitrógeno N en el empacado para el
almacenamiento de carne.

OBJETIVOS ESPECÍFICOS
 Identificar detalladamente los factores que
influyen en el grado de supresión del
desarrollo de microbios para la
conservación de las cualidades de la carne.
 Evaluar los factores que influyen en el grado

de supresión del desarrollo de microbios
para la conservación de las cualidades de la
carne.
HIPÓTESIS
 "El grado de supresión del desarrollo de
microbios para la conservación de las
cualidades de la carne, depende de la
aplicación de alguna forma de atmósfera
controlada de gases, como el dióxido de
carbono puro CO2, mezclas de monóxido
de carbono CO, oxigeno O2 y nitrógeno N,
en el empacado para el almacenamiento de
carne"
Índice Archivo
VARIABLES
 VARIABLE DEPENDIENTE: Grado de
supresión del desarrollo de microbios en
la carne.
 VARIABLE INDEPENDIENTE Y SUS

TRATAMIENTOS: Atmósfera controlada
de gases: Dióxido de carbono puro CO2,
mezclas de monóxido de carbono CO,
oxigeno O2 y nitrógeno N

TRATAMIENTOS
 A: Empaque comercial de plástico con aire
del ambiente
 B: Empaque al vacío
 C: Mezcla de gases con 1% CO2, 40% O2 y
59% N
 D: 100% CO2
 FENOMENO A OBSERVAR: Grado de

desarrollo de microbios en la carne.

DISEÑO DEL EXPERIMENTO
 Se usó un diseño totalmente aleatorizado. A
cada conjunto de condiciones de empaque
se le asignó al azar, 3 cortes de carne del
mismo tamaño y peso (75g)
 UNIDAD EXPERIMENTAL: Un corte de

carne.
 TOTAL DE UNIDADES
EXPERIMENTALES: 12 cortes de carne
ALEATORIZACION DEL
TRATAMIENTO
 El diseño totalmente aleatorizado evita la asignación
subjetiva de tratamientos a los cortes de carne.
 Son 4 condiciones de empaque y a cada condición se le
asigna 3 replicas, totalizando 12 muestras. Los pasos para
la aleatorización son los siguientes:
 Paso 1: Numerar del 1 al 12 a las unidades experimentales
(cortes de carne)
 Paso 2: Obtener de una tabla de números aleatorios de
dos dígitos, 12 números que estén entre el 01 y 12.
 Paso 3: Asignar los 3 primeros cortes (6, 11, 10) al
tratamiento A, los siguientes tres cortes (3, 8, 4) al
tratamiento B y así sucesivamente
CONTROL LOCAL
 Los empaques con aire del ambiente sirven
como tratamiento de control porque es
estándar y se puede comparar con los
nuevos empaques.
 Número de Agrupamientos: Un bloque de

3 replicas de almacenamiento con aire del
ambiente en empaque comercial de plástico
 NIVEL DE SIGNIFICANCIA: 0.05

REQUERIMIENTOS PARA EL
EXPERIMENTO
 La empresa de beneficio de ganado vacuno
cuenta con lo siguiente:
 Laboratorio de bromatología
 Recipientes de vidrio inocuos y transparentes para
cultivo de bacterias de medios orgánicos
 Reactivos químicos para las pruebas
 Patrones de comparación de resultados
 Balones de gas con CO2, O2 y N
 Una Cámara frigorífica, una bomba de vacío, y
una empacadora de envases de plástico.
 Cada corte se empacó por separado en las
condiciones asignadas.
PROCESAMIENTO DE
RESULTADOS
 Después de 9 días de almacenamiento a
4ºC en una instalación frigorífica normal, se
midió el número de bacterias sicotrópicas
en la carne. Las bacterias sicotrópicas se
encuentran en la superficie de la carne y se
asocian con la carne deteriorada.
 El crecimiento bacterial se expresa como el
logaritmo del número de bacterias por cm2.
Los resultados se observan en las tablas.
ANALISIS DE VARIANZA
ANALISIS DE VARIANZA NC 0.95
VARIACION SC GL CM Fc Decisión
Tratamiento 32.87 3 10.96 94.58 Rechaza
Error 0.93 8 0.12 Ft
Total 33.80 11 3.07 4.07
Índice Archivo
 INTERPRETACIÓN: 94.58 es mayor a 4.07 por

tanto, se rechaza la Ho; la diferencia entre los
métodos es significativa al 95% de NC.
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”, Editorial
Limusa - México 1994.
 COCHRAN COX “Diseño y Análisis de Experimentos” -
Editorial LIMUSA, edición 1990
 DOUGLAS MONTGOMERY “Diseño y Análisis de
Experimentos” - Editorial LIMUSA, 2002 México.
 PEDRO REYES “Diseño de Experimentos Aplicados” -
Editorial Trillas, 1985 México.
 MURRAY SPIEGEL: “Estadística”. colección Schaum.
Editorial Mc Graw Hill - 1991.
Administración y Economía”. Prentice Hall. 7ma edición.
México, 2004.
Administración y Economía”. Alfaomega Grupo Editor.
10ma edición. Colombia, 2003.
Índice
CAPITULO VII
ANÁLISIS MULTIVARIANTE
OBJETIVO:
Efectuar análisis multivariante de
un conjuntos de datos históricos
Índice Ver 7.1

INTRODUCCIÓN
 “Es el conjunto de técnicas estadísticas, que
analizan simultáneamente mas de dos variables,
en una muestra de observaciones”. (Kendall
1957)
 “El análisis multivariante incluye los métodos

estadísticos que se preocupan por el análisis de
las múltiples medidas que se han hecho sobre
un cierto numero de objetos, formando parte del
mismo, en general, cualquier análisis simultaneo
de mas de dos variables” (Sheth 1968)
Índice Siguiente
MATRIZ DE DATOS
Índice Siguiente
Técnicas Multivariantes
 Análisis Cluster
 Análisis Factorial
 Análisis conjunto
 Análisis de
Correspondencias
Índice Siguiente
ANÁLISIS CLUSTER
 Es una modalidad del
Análisis Multivariante,
que permite clasificar a
los objetos, en un número
pequeño de grupos
relativamente
homogéneos, llamados
conglomerados.
 Los objetos en cada
grupo tienden a ser
similares entre si y
diferentes a los objetos
de otros grupos.
Índice Siguiente
ANÁLISIS CLUSTER 2
Índice Siguiente
ANÁLISIS FACTORIAL
 Es una modalidad del Análisis Multivariado

que permite reducir una serie de variables
a un conjunto menor (factores) que
contienen la mayor parte de la información y
son suficientes para explicar el modelo.
Índice Siguiente
UTILIDAD ANÁLISIS FACTORIAL
Malhotra (1997):
 Segmentación de Mercados: Identifica variables que

agrupe a los clientes por atributos. Por ejemplo, los
compradores de automóviles nuevos pueden
agruparse por la importancia que dan al precio, la
comodidad, el desempeño, el lujo, el servicio
postventa, etc.
 Investigación de Productos: Identifica atributos de

marcas que influyen en la elección del consumidor.
Una pasta dental puede evaluarse por: la protección
contra la caries, la blancura que proporciona a los
dientes, el sabor, el aliento fresco que otorga, su
precio, etc.
Índice Siguiente
ETAPAS ANÁLISIS FACTORIAL
 MATRIZ DE CORRELACIONES.
 EXTRACCIÓN DE FACTORES INICIALES.
 ROTACIÓN DE LOS FACTORES INICIALES.
Índice Aplicación
PASOS PARA REALIZAR UN
ANÁLISIS FACTORIAL 1
 ELABORACIÓN DE LA MATRIZ DE
CORRELACIONES.
 El Test de Esfericidad de Bartlett: Se utiliza para

probar la Hipótesis Nula, que afirma que las
variables no están correlacionadas en la
población.
 Es decir, comprueba si la matriz de correlaciones
es una matriz de identidad. Son válidos valores
elevados del test, con fiabilidad menor a 0.05
 En este caso se rechaza la Hipótesis Nula y se
continúa con el Análisis.
Índice Aplicación Siguiente
 El Índice Kaiser-Meyer-Olkin: Indica qué tan
apropiado es aplicar el Análisis Factorial. Los
valores entre 0.5 y 1 indican que es apropiado
aplicarlo.
 El Gráfico de Sedimentación, representa en el eje
“x” el número de orden de los factores, y en el eje
“y” los valores propios (eigenvalues).
 El Gráfico, muestra cómo van disminuyendo los
valores propios, graficando el hecho de que el
primer factor es el que más varianza explica.

 La “comunalidad”, es la cantidad de varianza que
una variable comparte con las demás variables.
 Los “eigenvalue” (valores propios) pueden
interpretarse como la cantidad de varianza
explicada por cada factor.
 La “carga factorial” es la correlación entre las
variables y los factores.
 EXTRACCIÓN DE LOS FACTORES INICIALES:
Mediante la matriz de correlación (“Componentes
Principales”)
 El procedimiento busca el factor que explique la
mayor cantidad de varianza en la matriz de
correlación.
 Se extrae un segundo factor de la matriz residual
y así sucesivamente, hasta que quede muy poca
varianza que pueda explicarse.
 Los factores así extraídos no se correlacionan
entre ellos; son factores ortogonales.
 ROTACIÓN DE FACTORES INICIALES: Es difícil
interpretar los factores iniciales; por lo tanto, la
extracción inicial se rota para lograr una solución
que facilite la interpretación.
 Los métodos de rotación ortogonales, mantienen
la independencia entre los factores rotados
(métodos varimax, quartimax y equamax). El más
usado es el Varimax.
ANALISIS CONJUNTO
 Determina la importancia relativa que los
consumidores dan a los atributos sobresalientes;
así como las utilidades que dan a los niveles de
atributos. Aplicaciones:
 Determinación de la importancia relativa de los

atributos en el proceso de selección del
consumidor.
 Estimación de la participación en el mercado de

marcas que difieren en niveles de atributos.
 Segmentación del mercado en base en la similitud

de las preferencias para los niveles de atributos.
Índice Siguiente
ANALISIS CONJUNTO
Índice
Análisis de Correspondencias
 Es un caso particular del análisis factorial de
componentes principales, que se diferencia
en lo siguiente:
 Esta orientado al análisis geométrico de la
dependencia entre variables.
 Es apropiado para el tratamiento de
variables cualitativas tipo nominales.
 Analiza las relaciones entre dos conjuntos
de variables: uno de objetos y el otro suele
ser atributos o características
Índice Siguiente
ANALISIS CORRESPONDENCIA
Índice
Segmentación del mercado de
pantalones Jean
Índice Ver 7.2

CASO ESTUDIO
 Una empresa que confecciona de pantalones
Jean, desea averiguar cuáles son las preferencias
más importantes del público que compra sus
pantalones, para segmentar a sus clientes.
 Se diseña una encuesta de siete preguntas y se la
aplica a un grupo de potenciales clientes. Cada
pregunta representa una característica o variable.
 Se pide que valoren de 1 a 7 cada una de las
características.
 A mayor puntuación, mayor preferencia por la
característica. Las siete características son:
Índice Siguiente
CARACTERÍSTICAS O VARIABLES
 V1: BAJO PRECIO

 V2: BUENA CALIDAD
 V3: FACILIDAD PAGO
 V4: JUVENIL
 V5: REBAJAS
 V6: PRENDA DURADERA
 V7: DISEÑO INFORMAL
Índice Siguiente
MATRIZ DE CORRELACIONES
V1 V2 V3 V4 V5 V6 V7
V1 1 -0.004 0.628 0.082 0.675 -0.100 -0.338
V2 -0.004 1 0.151 -0.248 0.048 0.582 -0.251
V3 0.628 0.151 1 -0.182 0.480 0.090 -0.588
V4 0.082 -0.248 -0.182 1 0.272 0.017 0.469
V5 0.675 0.048 0.480 0.272 1 -0.110 -0.082
V6 -0.100 0.582 0.090 0.017 -0.110 1 0.014
V7 -0.338 -0.251 -0.588 0.469 -0.082 0.014 1
Índice
Gráfico de Sedimentación
Scree Plot
3.0
2.5
2.0
1.5
1.0
.5
0.0
1 2 3 4 5 6 7
Component Number
Índice
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared
Loadings
Compone Total % of Cumulati Total % of Cumulati
nt Variance ve % Variance ve %
1 2.485 35.505 35.505 2.485 35.505 35.505
2 1.821 26.013 61.518 1.821 26.013 61.518
3 1.339 19.131 80.649
4 0.508 7.258 87.907
5 0.376 5.373 93.280

6 0.279 3.990 97.270
7 0.191 2.730 100.000
Índice
Rotated Component Matrix
Component
Variable Var 1 2
Bajo precio V1 0.894 -0.109
Buena calidad V2 4.630E-02 0.765
Facilidad pago V3 0.836 0.298
Aspecto juvenil V4 3.817E-04 -0.666
Rebajas V5 0.787 -0.277
Prenda duradera V6 -0.138 0.590
Diseño informal V7 -0.534 -0.575
Índice
Gráfico de dos Factores
Component Plot in Rotated Space
1.0
v2 BUENA CALIDAD
PRENDA DURADERA
v6
.5
FACILIDAD PAGO v3
0.0
BAJO PRECIO
v1
v5
REBAJAS
-.5 v7
v4
DISEÑO INFORMAL JUVENIL
-1.0
-1.0 -.5 0.0 .5 1.0
Component 1
Índice Siguiente
Gráfico de tres Factores
Component Plot in Rotated Space
1.0 juvenil
diseño informal
.5 rebajas
prenda duradera
bajo precio
Component 2 0.0
buena calidad
facilidad pago
-.5
1.0 1.0
.5 .5
0.0 0.0
-.5 -.5
Component 1 Component 3
Índice
Gráfico de cuatro Factores
Índice
CONCLUSIONES
 El Análisis Factorial es una de las técnicas más complejas de la
Investigación de Mercados, que gracias a la informática, puede
ser aplicada actualmente con relativa facilidad.
 Como conclusión teórica, se cita a Namakforoosh (1995)
respecto del Análisis Factorial: Reduce la multiplicidad de
pruebas y medidas hasta lograr una sencillez notable. Indica
qué pruebas y medidas pertenecen al mismo grupo, y cuáles
miden prácticamente lo mismo.
 Por tanto, reduce el número de variables y ayuda a localizar e
identificar las unidades, para aplicar las pruebas.
 Como conclusión empírica; de siete variables iniciales, han
quedado reducidas a tres factores: “economía”, “calidad” y
“juvenil”; produciéndose la pérdida de sólo el 19.13% de la
información original de las 7 variables iniciales.
 Por tanto, puede aplicarse una encuesta de sólo 3 ó 4 items, por
ejemplo: a) Que sea económico; b) Que sea de calidad; c) Que
sea juvenil; opcionalmente d) Que sea informal.
Índice Siguiente
BIBLIOGRAFÍA
 POLO MIRANDA “Estadística Multivarable”. 4ta Edición. Edic.
Universidad Politécnica Catalunya. España 2005.
 HAIR, TATHAN, BLACK "Análisis Multivariante", Editorial Prentice
Hall – 4ta. edición, 2000.
 MALHOTRA NARESH” Investigación de Mercado: Un enfoque
practico” Prentice Hall. México
 ZIKMUND WILLIAM. “ Investigación de Mercado”. Editorial Prentice
Hall. México 1998.
 DAMODAR GUJARATI, "Econometría", 4ta Edición. Editorial Mc
Graw Hill. México, 2004.
 RICHARD LEVIN, RUBIN D. “Estadística para Administración y
Economía”. Prentice Hall. 7ma edición. México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para Administración y
Economía”. Alfaomega Grupo Editor. 10ma edición. Colombia, 2003.
 CATENA A., RAMOS M. Análisis Multivariado, Un manual para
investigadores. Editorial Biblioteca Nueva. 2003 - España.
 DANIEL PEÑA. Análisis de Datos Multivariantes. Editorial McGraw Hill
2002. España.
Índice

Clase02 - Regresion y Correlacion PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase02 - Regresion y Correlacion PDF

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional San Agustín

Facultad Ingeniería de Producción

 El Pronóstico es una alternativa clave, para

 Pronósticos de rendimientos de acciones,

 La variable dependiente “Y” 2 4

 Valor de “a” en base a la pendiente “b”

Índice Modelo Biv

Índice Modelo Biv Siguiente

Índice Modelo Biv Siguiente

n log X . log Y   log X . log Y

representa una serie 10000

lento (aprendizaje) 4000

Índice Archivo Siguiente

Índice Ver archivo Siguiente

ELABORAR DIAGRAMA DISPERS.

Pasos para OBTENER COEFICIENTES DE REGRESION Y EL

Conductivid Temperatur Modelo completo: K = b1 + b2 T

Índice Ver archivo

Ke  0.01014  0.000075 (150)  0.021

6 *123.5  0.245 * 2450

Índice Ver archivo Siguiente

Hipótesis Ho: No existe regresión entre las variables

Temperatura SCF 0.00176 1 MCF 0.00176 Fc 4569.91

Residuo SCE 0.00000 4 MCE 0.00000 Ft(1,4) 7.71

TOTAL SCT 0.00176 5 MCT 0.00035 R2 0.999125

Índice Ver archivo Siguiente

Hipótesis Ho: No existe regresión

 Interpretación: 4569.9 es muy mayor a 7.71

Hipótesis Ho: Los coeficientes poblacionales son cero

Cte b1: 0.01014 1312500 0.701 0.00052 19.5

Índice Ver archivo Siguiente

 Interpretación: 67.6 es mayor a 3.18 por tanto,

Índice Ver archivo Siguiente

P(0.020  Ui  0.023)  0.95

P(Ti  Tt * Ski  Ui  Ti  Tt * Syi )  1  

 Generalmente, son muchas las variables que

 Ejemplo: en un proceso, se quiere investigar como

 X1: % aceite residual en 35

X1: % aceite residual en

Tiempo - % Aceite residual Temperatura - % Aceite residual

X1: % Aceite residual

Índice Ver archivo Siguiente

Matriz de las ecuaciones normales:

Índice Ver archivo Siguiente

 Se obtienen los datos experimentales de la

X4: tiempo extracción, en min.

ELABORAR DIAGRAMA DISPERS.

TABLA DE CALCULOS Ver archivo

Índice Ver archivo Siguiente

Siguiente Ver archivo

172.92 0.0625 576 25 3.2875 315.6 65.8 6 1.3 120

59.29 0.0625 576 100 1.925 184.8 77.0 6 2.5 240

35.28 0.0625 576 225 1.485 142.56 89.1 6 3.8 360

22.37 0.0625 576 400 1.1825 113.52 94.6 6 5.0 480

11.90 0.0625 576 900 0.8625 82.8 103.5 6 7.5 720

4.24 0.0625 576 3025 0.515 49.44 113.3 6 13.8 1320

62.73 0.0625 2704 25 1.98 411.84 39.6 13 1.3 260

23.81 0.0625 2704 100 1.22 253.76 48.8 13 2.5 520

13.40 0.0625 2704 225 0.915 190.32 54.9 13 3.8 780

Siguiente Ver archivo

30 9.78 1056 675 1.112 -2.428 -0.006 -0.003

9.78 3.3234 343.92 220.1 -2.429 7.402 0.0004 5E-16

1056 343.92 42816 23760.0 -0.006 0.0004 0.0002 2E-20

6 123.5  0.245 2450