Está en la página 1de 217

Universidad Nacional San Agustín

Facultad Ingeniería de Producción


y Servicios

Segunda Especialidad
INGENIERÍA DE PROYECTOS

CURSO:
ESTADISTICA Y TOMA DE DECISIONES

TEMA: REGRESION Y
CORRELACION
Ing. Hernán Miguel Marquina Avellaneda
ÍNDICE
 INTRODUCCIÓN
 CAP. I: Regresión Lineal
Otros Modelos básicos de pronóstico
 Caso Estudio: conductividad térmica
 CAP. II: Regresión Multilineal
 Caso Estudio: Extracción de aceite
 CAP. III: Medidas de asociación
 Caso Estudio:
 CAP. IV: Series de Tiempo
 Caso Estudio: Fabricación de camperas
 CAP. V: Regresión Dicotómica
 Caso Estudio: Importaciones Peruanas
 CAP. VI: Diseño de Experimentos
 Caso Estudio: Empaque almacenamiento
 CAP. VII: Análisis Multivariante
 Caso Estudio: Segmentación de clientes Jean
 Proyecto de Investigación
 Plan de Proyección Social
 ANEXOS
INTRODUCCIÓN
 ESTADÍSTICA EN INGENIERÍA: Es la disciplina cuyo
método científico tiene como misión, la búsqueda de
verdades empíricas, sistemáticamente demostrables; y
sustentadas en la:
 TOMA .. (Colecta, acopio, levantamiento, etc.)
 ORGANIZACIÓN .. (Tablas, archivos, etc.)
 REPRESENTACIÓN .. (Histogramas, ojivas, diagramas,
etc.)
 PRESENTACIÓN.. (Informes, resumen, formatos, etc.) y
 ANÁLISIS de los DATOS .. (Inferencia, ANVA, etc.)
 de los PROCESOS PRODUCTIVOS y de SERVICIOS
dentro del campo de la ingeniería,
• con el propósito de obtener resultados objetivos y
confiables, que permitan la Toma de Decisiones de
manera eficiente y eficaz, por los sistemas
organizacionales.
Índice Siguiente
PRONÓSTICO

 El Pronóstico es una alternativa clave, para


tomar decisiones sobre el futuro de un
suceso, en base a hechos del pasado o los
antecedentes del evento.
 A continuación se muestran algunos
campos de aplicación de los Pronósticos:

Siguiente
Índice
PLANEAMIENTO Y CONTROL DE
OPERACIONES
 Administración de inventarios
 Planeamiento de la producción:
¿Qué producir?
 ¿ Cuánto producir?
 ¿ Cuándo producir?
 ¿Dónde producir?

Siguiente
Índice
MARKETING
 Administración del equipo de ventas
 Pronósticos de precios
 Fijación de precios
 Canales de distribución
 Gastos de publicidad
 Ingreso a mercados nuevos
 Pronóstico de ventas

Siguiente
Índice
ECONOMÍA
 Pronóstico del Producto Bruto Interno
 Pronóstico de desempleo por sectores
 Inversiones
 Nivel de precios y las tasas de interés
 Pronósticos sobre política monetaria y fiscal
 Pronóstico de la tasa de inflación
 Pronóstico exportaciones no tradicionales
 Pronóstico sobre ahorro e ingreso personal

Siguiente
Índice
ÁMBITO FINANCIERO

 Pronósticos de rendimientos de acciones,


tasas de interés, tasas de cambio, precios y
valores en general
 Pronósticos de volatilidad de rendimientos
accionarios
 Pronósticos de probabilidad de insolvencia

Siguiente
Índice
Técnica Regresión bivariable

CAPITULO I
MODELOS DE REGRESIÓN BÁSICOS

OBJETIVO:
Modelar un conjunto de datos, mediante
la técnica de regresión bivariable, para
obtener una ecuación de pronóstico

Índice Ver 1
Diagrama de dispersión
 Sean los datos de las
cantidades vendidas de un Ventas de un articulo
articulo y sus precios.

 El diagrama de dispersión,
muestra la relación entre las
variables: precios y ventas. 20

 La variable independiente 10
“X”, es el estimador: precio

 La variable dependiente “Y” 2 4


es la que se estima: ventas

Índice Siguiente
MODELO LINEAL
Ventas
(mill S/.)
Y  a  bX Siguiente
Y  0.03  0.04 X 2
d   (Yei  Yi )  min
0.11 d   (a  bX i  Yi )
P2
2
Pendiente:
0.11  0.07
b  0.04 0.04 b
0.07 P1 2.0  1.0
0.04
b  0.04
1 1
Intercepto: a = 0.03 b  0.04
1.0 2.0
Gastos publicidad
Índice (mil. S/.)
FORMULAS DE LOS COEFICIENTES
Ventas
(mill S/.)
DEL MODELO LINEAL

a
 Y
b
 X
n n

N  XY   X  Y
b
N  X 2   X 
2

Gastos publicidad
(mil. S/.)
Índice Modelo Biv Siguiente
Pendiente de la recta: b
 Indica un cambio en Y para una variación
en X.
 Un valor positivo para “b” indica una
relación directa entre las dos variables, y
un valor negativo, una relación inversa.
 El signo de “b” y el signo de “r”
(coeficiente de correlación), siempre son
iguales.

Siguiente
Índice
Intercepto de la Recta: a
 “a” es el intercepto de la recta con el eje Y

 X  Y   X  XY
2
a
n  X  ( X )
2 2

 Valor de “a” en base a la pendiente “b”

a
 Y
b
 X
n n
Siguiente
Índice
OTROS MODELOS BÁSICOS
DE PRONÓSTICO

Índice
MODELO DE CURVA EXPONENCIAL
 Se presenta cuando los valores de las variables X
e Y graficados en papel aritmético se aproximan a
una línea curva creciente a decreciente,
 pero trasladado los valores X e Y a una gráfica
semilogarítmica, se aproximan a una línea recta,
 es decir que la variable independiente X
evoluciona en forma aritmética y la variable
dependiente Y evoluciona en forma geométrica,
su ecuación es :

Y = a.bx
Índice Modelo Biv Siguiente
CURVA EXPONENCIAL
Y
200
Y = a.bX
log Y  log a  log b. X
180

160

140

120

100

80

60

40

20
X
0
0 1 2 3 4 5 6 7
Índice Modelo Biv
CURVA EXPONENCIAL ESCALA SEMILOGARITMICA

1000
log Y

100

X
10
0 1 2 3 4 5 6 7

Índice Modelo Biv


COEFICIENTES DE LA CURVA
EXPONENCIAL

n  X . log Y   X  log Y
log b 
n  X  ( X )
2 2

log a 
 log Y
 b.
 X
n n

Índice Modelo Biv Siguiente


MODELO DE CURVA GEOMÉTRICA
 La variable independientemente X y la variable
dependiente Y aumentan o disminuyen en
progresión geométrica,
 por tanto los valores X e Y son expresados en
forma logarítmica.
 Un crecimiento geométrico es una curva
 En papel logarítmico o doblemente logarítmico, se
aproximan a una recta
 La expresión exponencial de la ecuación es:

Y  aX b

Índice Modelo Biv Siguiente


CURVA GEOMÉTRICA
Curva Geometrica
9
Y = a.Xb
8
log Yc  log a  log b. log X
7
Y: Demanda

4
X: población
3
2 2.5 3 3.5 4 4.5 5 5.5

n log X . log Y   log X . log Y


b a
 log Y b log X

N  log X   ( log X ) 2
2
n n
Índice Modelo Biv Siguiente
MODELO DE CURVA POBLACIONAL
 Es una variación de la curva exponencial o
semilogarítmica, basada en la fórmula de interés
compuesto.
 Sirve exclusivamente para proyectar la población, pero se
le puede dar otros usos, siempre y cuando se ajusten a las
características de esta curva, que considera dos puntos o
valores de referencia en el tiempo.
 En el caso de poblaciones, tener en cuenta los censos
poblacionales.
 También se le denomina curva del crecimiento, porque se
basa en una tasa de crecimiento (K), cuya ecuación
exponencial es:

Pn = Po (1 + K) n
Índice Siguiente
CURVA POBLACIONAL
Curva Poblacional
200
180 n
160
Pn =Po(1 + K)
P: población

140
120
100
80
60
40
20
n: tiempo
0
0 1 2 3 4 5 6 7
Índice Siguiente
CURVA DE GOMPERTZ
 Modelo bivariante que 12000

representa una serie 10000


de datos que tienen 3
8000
momentos o fases:
 1ra. Fase: crecimiento 6000

lento (aprendizaje) 4000


Yreal
 2da fase: crecimiento 2000
rápido (dominancia) Yestim
 3ra fase: crecimiento 0
0 5 10 15 20 25
constante (tope).

Índice Archivo Siguiente


CURVA DE GOMPERTZ
Y: Curva Gompertz
30000

25000 Yc  a.b Cx

20000

15000
log Yc  log a  log b.c x

10000

5000
X: tiem po
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Siguiente
PROCESO CÁLCULO GOMPERTZ
log Yc  log a  log b.c x

3. Constante c:
1. Tamaño periodo m: D2 D2
C m
 C m  log
n
m  Constante c
D1 D1
3 4. Constante b:
D1 (C  1)
2. Diferencias D1, D2: log b 
D1   2 log Y   1 log Y C m

1
2

5. Constante a:
D2   3 log Y   2 log Y
1 D1  
log a   1 logY  m  
m C 1
Índice Archivo Siguiente
CURVA EXPONENCIAL MODIFICADA
Y Curva exponencial modificada
300

Y = a + b.c X
250

200

150

100

50

X: tiem po
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Índice Archivo
CURVA LOGÍSTICA
2500
1 1
 a  bc x  Y
y a  bc x
2000

1500
Y: PBI

1000

500
X: año
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Siguiente
CURVA PARABÓLICA
70
Yc  a  bX  cX 2
Y

60

50

40

30

20

10
X
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Modelo Biv
CURVA CÚBICA
Y
Tendencia Cúbica
35
30
25 YC  a  bX  cX  dX 2 3

20
15
10
5
X
0
3 3,2 3,4 3,6 3,8 4
Índice Archivo Modelo Cúbico
Aplicación a la Ingeniería:
Conductividad Térmica
Carga de arrabio
al convertidor

Índice Ver 1
OBJETIVO:

 Determinar el modelo de
regresión de la conductividad
térmica del material, en función
de la temperatura.

K = b1 + b2 (T)

Índice Ver archivo Siguiente


OBTENER DATOS EXPERIM.

ELABORAR DIAGRAMA DISPERS.

TABLA DE CALCULOS

Pasos para OBTENER COEFICIENTES DE REGRESION Y EL


resolver el MODELO DE PRONOSTICO

Problema
ESTIMAR VALORES K
CONDUCTIVIDAD TERMICA

OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.

EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Ver archivo Siguiente
Datos Experimentales: T - K

T K K ESTIMADO
ºF Btu/h.ft.ºF
150 0.022
200 0.025
300 0.032
400 0.040
600 0.056
800 0.070
Índice Ver archivo
Diagrama de Dispersión
0.08
0.07
y = 8E-05x + 0.0101
K: Btu/h.ft.ºF

2
0.06 R = 0.9991
0.05
0.04
0.03
0.02
0.01
0.00 T: ºF
0 100 200 300 400 500 600 700 800 900
Índice Ver archivo
Tabla de Cálculos

Conductivid Temperatur Modelo completo: K = b1 + b2 T


K T K^2 T^2 K.T
0.022 150 0.000484 22500 3.3
0.025 200 0.000625 40000 5.0
0.032 300 0.001024 90000 9.6
0.040 400 0.001600 160000 16.0
0.056 600 0.003136 360000 33.6
0.070 800 0.004900 640000 56.0
Σ: 0.245 2450 0.011769 1312500 123.5

Índice Ver archivo


COEFICIENTES MODELO DE REGRESIÓN
Y = b1 + b2.X
b2: PENDIENTE:
N 6
N  T .K   T . K
 TK  123.5 b2 
N  T 2  ( T ) 2
 T  2450
6 *123.5  2450 * 0.245
 K  0.245 b2 
6 *1312500  (2450) 2
 0.000075
 T  1312500
2

b1: INTERCEPTO:

b1 
K  b2
 T
N N
0.245 2450
b1   0.000075  0.01014
6 6
MODELO DE REGRESION: Ke  0.01014  0.000075 (T )
Índice Ver archivo Siguiente
Valores pronosticados Ke
Ke  0.01014  0.000075 (T ) Ver archivo

Ke  0.01014  0.000075 (150)  0.021


T K Ke
ºF Btu/h.ft.ºF Btu/h.ft.ºF
150 0.022 0.021
200 0.025 0.025
300 0.032 0.033
400 0.040 0.040
600 0.056 0.055
800 0.070 0.070
Índice Siguiente
Coeficientes de Correlación y Determinación
N 6
Coeficiente de Correlación
 TK  123.5
 T  2450 N  K .T   K . T
r
 K  0.245 N  K 2  ( K ) 2 N  T 2  ( T ) 2
 T  1312500
2

 K  0.01177
2

6 *123.5  0.245 * 2450


r  0.99955
6 * 0.01177  (0.245) 2
6 *1312500  (2450) 2

Coeficiente de Determinación: R = r2
R 2  (0.99955) 2  0.999125

Índice Ver archivo Siguiente


ANÁLISIS DE VARIANZA

Hipótesis Ho: No existe regresión entre las variables


Nivel de confianza: 95%
Suma
Fuentes GL Cuadrado Medio ESTADISTICO F
Cuadrados

Temperatura SCF 0.00176 1 MCF 0.00176 Fc 4569.91

Residuo SCE 0.00000 4 MCE 0.00000 Ft(1,4) 7.71

TOTAL SCT 0.00176 5 MCT 0.00035 R2 0.999125

Índice Ver archivo Siguiente


INTERPRETACIÓN PRUEBA F

Hipótesis Ho: No existe regresión


entre las variables del modelo

 Interpretación: 4569.9 es muy mayor a 7.71


por tanto, se rechaza la Ho; el modelo de
regresión planteado es significativo al 95%
Índice Ver archivo Siguiente
PRUEBA T STUDENT

Hipótesis Ho: Los coeficientes poblacionales son cero


Nivel de confianza: 95%

Coeficientes Menor
Variable Cii Sbi Tci P: 0.975
Regresión ii

Cte b1: 0.01014 1312500 0.701 0.00052 19.5


Tt :
3.18
Temperat
b2: 0.000075 6.0 0.000 0.000 67.60
ura

Índice Ver archivo Siguiente


INTERPRETACIÓN PRUEBA T

 Interpretación: 67.6 es mayor a 3.18 por tanto,


se rechaza la Ho, el coeficiente de regresión
relativo a la temperatura es significativo al 95%
Índice Ver archivo Siguiente
INTERVALO DE CONFIANZA
PARAMETRO POBLACIONAL “B”
 Superadas las pruebas F y T, entonces el modelo
puede ser usado con fines de predicción.
 Por tanto, se requiere determinar el Intervalo de
Confianza del Parámetro Poblacional B2 a un
nivel de confianza del 95%:
Ke  0.01014  0.000075 (T )
P(bi  Tt * Sbi  Bi  bi  Tt * Sbi)  1  
P(7.5E 5  3.18 *1.1E 6  B2  7.5E 5  3.18 *1.1E 6 )  1  0.05
P(7.16E 5  B2  7.84E 5 )  0.95
Índice Ver archivo Siguiente
INTERVALO DE CONFIANZA
PREDICCIÓN DE K MEDIA y Ki

Índice Ver archivo Siguiente


INTERVALO DE CONFIANZA K media
Error Estándar de la estima:
N 6
T  150 _
1 ( X i  X )2
_ Symi  Syx * 
T  408 N
( X 2 
(  X ) 2

)
 T  2450 N

 T  1312500
2

Sk mi  6 E 4 *
1

(150  408) 2
 0.0383
Tt  3.18
2
6 2450
(1312500  )
6
Intervalo de Confianza para la predicción K media:
P(Ti  Tt * Ski  Ui  Ti  Tt * Ski)  1  
P(150  3.18 * 0.0383  Ui  150  3.18 * 0.0383)  1  0.05

P(0.020  Ui  0.023)  0.95


Índice Ver archivo Siguiente
INTERVALO DE CONFIANZA Ki
Error Estándar de la estima:
N 6
_
T  150 1 ( X i  X )2
Syi  Syx * 1 
( X 2  
_
2
T  408 N ( X )
)
 T  2450 N
 T  1312500
2

4 1 (150  408) 2
Tt  3.18 Ski  6 E * 1  2
 0.0073
6 2450
(1312500  )
6
Intervalo de Confianza para una observación K individual

P(Ti  Tt * Ski  Ui  Ti  Tt * Syi )  1  


P(150  3.18 * 0.0073  Ui  150  3.18 * 0.0073)  1  0.05
P(0.019  Ui  0.024)  0.95
Índice Ver archivo Siguiente
CONCLUSIONES
 La conductividad térmica del material en estudio es
una función directa de la temperatura.
 De acuerdo al coeficiente de determinación, el
99.91% de los puntos, se ajustan perfectamente al
modelo lineal propuesto.
 De acuerdo a la prueba ANVA, el modelo de
regresión para proyectar la conductividad térmica
en base a la temperatura es significativo al 95%
 De acuerdo a la prueba t Student, el coeficiente de
regresión de la temperatura permite pronosticar la
conductividad térmica del material de manera
significativa al 95%.
Índice
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”, Editorial
Limusa - México 1994.
 FRANCIS DIEBOLD: “Elementos de Pronóstico”, Thomson
Editores. México - 1999.
 MOTHES, TORRENS "Estadística Aplicada a la
Ingeniería”. Ediciones Ariel - 1970.
 MURRAY SPIEGEL: “Estadística”. colección Schaum.
Editorial Mc Graw Hill - 1991.
 RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma edición.
México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfaomega Grupo Editor.
10ma edición. Colombia, 2003.

Índice
CAPITULO II
REGRESIÓN MÚLTIPLE

OBJETIVO:
Modelar un conjunto de datos, con mas de
dos variables,
mediante la técnica de regresión múltiple,
para obtener una ecuación de pronóstico.

Índice
INTRODUCCIÓN
 Los procesos industriales, los fenómenos de la
naturaleza, los acontecimientos sociales, entre otros;
rara vez obedecen a modelos bivariables;

 Generalmente, son muchas las variables que


intervienen directa o indirectamente, de manera
dinámica e interactiva sobre un suceso o evento; lo
que hace muy complejo su análisis e interpretación.

 Ejemplo: en un proceso, se quiere investigar como


influye analíticamente, el espesor de las hojuelas de
semilla de girasol, la temperatura de extracción y el
tiempo de extracción; sobre la fracción % de aceite
residual en las hojuelas de semilla de girasol.
Índice Siguiente
FACTORES EXTRACCIÓN ACEITE
Espesor hojuelas - % Aceite residual

 X1: % aceite residual en 35

X1: % aceite residual en


30
hojuelas semilla de girasol 25

hojuela
20
 X2: espesor de las hojuelas 15

 X3: temperatura de 10
5
extracción 0
0.2 0.25 0.3 0.35 0.4 0.45
 X4: tiempo de extracción X2: espesor hojuelas, en mm

Tiempo - % Aceite residual Temperatura - % Aceite residual


35
35 30

X1: % Aceite residual


30
X1: % Aceite resudual

25
25
20
20
15 15
10 10
5
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60 0
X4: tiempo extracción, en min. 20 30 40 50 60
X3: Temperatura ºC
Índice Ver archivo Siguiente
MODELO LINEAL MÚLTIPLE

Índice Ver archivo Siguiente


ECUACIONES NORMALES
MODELO: X 1  b1  b2 X 2  b3 X 3  b4 X 4
Ecuaciones normales del modelo de regresión:
n.b1  b2  X 2  b3  X 3  b4  X 4  X
1

b1  X 2  b2  X 2  b3  X 2 X 3  b4  X 2 X 4 X X
2
2 1

b1  X 3  b2  X 2 X 3  b3  X 3  b4  X 3 X 4 X X
2
3 1

b1  X 4  b2  X 2 X 4  b4  X 3 X 4  b4  X 4 X X
2
4 1

Matriz de las ecuaciones normales:


 n

X 2 X 3 X 4 X 1 

 X 2 X X X X X X X
2
2 2 3 2 4 2 1
 X 3 X X X
2
X X X X 
 
2 3 3 3 4 3 1

 X 4 X X X X X X X
2
2 4 3 4 4 4 1
Índice Ver archivo Siguiente
MODELO CURVO MÚLTIPLE

Índice Ver archivo Siguiente


Aplicación a la Ingeniería:

Extracción de aceite de la
semilla de girasol

Ver 2.2

Índice
Producción de aceite de girasol

Objetivo

Índice Siguiente
CASO ESTUDIO EXPERIMENTAL

 Se obtienen los datos experimentales de la


cinética de extracción del aceite de la semilla
girasol empleando hexano como solvente.
 Las variables independientes son: espesor de
las hojuelas de semilla de girasol (X2),
temperatura de extracción (X3) y tiempo de
extracción (X4).
 La variable dependiente es la fracción de
aceite residual en las hojuelas de semilla de
girasol (X1).
Índice Ver archivo Siguiente
Diagrama de Dispersión X1 – X2
Espesor hojuelas - % Aceite residual

35
X1: % aceite residual en

y = 56.926x - 8.9602
30 2
R = 0.2888
25
hojuela

20
15
10
5
0
0.2 0.25 0.3 0.35 0.4 0.45
X2: espesor hojuelas, en mm
Índice Ver archivo
Diagrama de Dispersión X1- X4
Tiempo - % Aceite residual

35
30 -0.7013
X1: % Aceite resudual

y = 54.036x
25 2
R = 0.5204
20
15
10
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60

X4: tiempo extracción, en min.


Índice Ver archivo
Diagrama de Dispersión X1- X3
Temperatura - % Aceite residual

35
X1: % Aceite residual

y = -0.1397x + 14.517
30 2
25 R = 0.0727
20
15
10
5
0
20 30 40 50 60
X3: Temperatura ºC
Índice Ver archivo
OBJETIVOS:
 Obtener el modelo que mejor represente los datos
experimentales.
 Modelo Nº 1:
X1 = b1 + b2.X2 + b3.X3 + b4.X4
 Modelo Nº 2:
X1 = b1(X2b2)(X3b3)(X4b4)
 Determinar los Indicadores sobre la bondad de
ajuste del modelo matemático elegido.
 Calcular la variación del error de los valores
calculados con los dos modelos.
Índice Ver archivo Siguiente
OBTENER DATOS EXPERIM.

ELABORAR DIAGRAMA DISPERS.

TABLA DE CALCULOS Ver archivo

Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES

OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.

EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Siguiente
Tabla Datos Experimentales
Aceite (%) Espesor (mm) Temperatura (ºC) Tiempo (min)
X1 X2 X3 X4
13.15 0.25 24 5
7.7 0.25 24 10
5.94 0.25 24 15
4.73 0.25 24 20
3.45 0.25 24 30
2.06 0.25 24 55
7.92 0.25 52 5
4.88 0.25 52 10
3.66 0.25 52 15
2.86 0.25 52 20
… … … …

Índice Ver archivo Siguiente


Diagrama Temperatura - Tiempo
y Rendimiento

Siguiente Ver archivo


Índice
Tabla de cálculos Modelo Nº 1
Modelo Nº 1: X1 = b1 + b2.X2 + b3.X3 + b4.X4

(X1)^2 (X2)^2 (X3)^2 (X4)^2 X1X2 X1X3 X1X4 X2X3 X2X4 X3X4

172.92 0.0625 576 25 3.2875 315.6 65.8 6 1.3 120

59.29 0.0625 576 100 1.925 184.8 77.0 6 2.5 240

35.28 0.0625 576 225 1.485 142.56 89.1 6 3.8 360

22.37 0.0625 576 400 1.1825 113.52 94.6 6 5.0 480

11.90 0.0625 576 900 0.8625 82.8 103.5 6 7.5 720

4.24 0.0625 576 3025 0.515 49.44 113.3 6 13.8 1320

62.73 0.0625 2704 25 1.98 411.84 39.6 13 1.3 260

23.81 0.0625 2704 100 1.22 253.76 48.8 13 2.5 520

13.40 0.0625 2704 225 0.915 190.32 54.9 13 3.8 780

… … … … … … … … … …

Siguiente Ver archivo


Índice
COEFICIENTES MODELO LINEAL
MATRIZ “M” DEL DISCRIMINANTE MATRIZ INVERSA DE M

30 9.78 1056 675 1.112 -2.428 -0.006 -0.003

9.78 3.3234 343.92 220.1 -2.429 7.402 0.0004 5E-16

1056 343.92 42816 23760.0 -0.006 0.0004 0.0002 2E-20


675 220.1 23760.0 23375 -0.003 6E-17 2E-20 0.0001

MATRIZ INVERSA M VECTOR TD VECTOR SOLUCION

1.112 -2.428 -0.006 -0.003 287.93 b1 = 1.6619

-2.429 7.402 0.0004 5E-16 101.557 b2 = 56.587


* =
-0.006 0.0004 0.0002 2E-20 9346.32 b3 = -0.1364

-0.003 6E-17 2E-20 0.0001 4400.2 b4 = -0.2538


Ver archivo
MODELO: X1 = 1.6619 + 56.587X2 – 0.1364X3 – 0.2538X4
Índice Siguiente
Tabla de cálculos Modelo Nº 2
Modelo Nº 2: X1 = b1(X2b2)(X3b3)(X4b4)
ln(X1) = ln(b1) + b2.ln(X2) + b3.ln(X3) + b4. ln(X4)
(LX1)^2 (LX2)^2 (LX3)^2 (LX4)^2 LX1LX2 LX1LX3 LX1LX4 LX2LX3 LX2LX4 LX3LX4

6.66 1.9321 10.1124 3 -3.5862 8.2044 4.2 -4.4202 -2.2 5

4.16 1.9321 10.1124 5 -2.8356 6.4872 4.7 -4.4202 -3.2 7

3.17 1.9321 10.1124 7 -2.4742 5.6604 4.8 -4.4202 -3.8 9

2.40 1.9321 10.1124 9 -2.1545 4.929 4.7 -4.4202 -4.2 10

1.54 1.9321 10.1124 12 -1.7236 3.9432 4.2 -4.4202 -4.7 11

0.52 1.9321 10.1124 16 -1.0008 2.2896 2.9 -4.4202 -5.6 13

4.28 1.9321 15.6025 3 -2.8773 8.1765 3.3 -5.4905 -2.2 6

2.53 1.9321 15.6025 5 -2.2101 6.2805 3.7 -5.4905 -3.2 9

1.69 1.9321 15.6025 7 -1.807 5.135 3.5 -5.4905 -3.8 11

1.10 1.9321 15.6025 9 -1.4595 4.1475 3.2 -5.4905 -4.2 12

… … … … … … … … … …

Índice Ver archivo Siguiente


Coeficientes modelo logarítmico
MATRIZ “M” DEL DISCRIMINANTE MATRIZ INVERSA DE M

30.00 -34.28 104.62 85.12 4.1889 0.8094 -0.7953 -0.161

-34.28 40.51 -119.64 -97.27 0.8094 0.7504 0.0138 0.0000

104.62 -119.64 369.15 296.85 -0.7953 0.0138 0.2326 0.0000

85.12 -97.27 296.85 259.13 -0.1611 0.0000 0.0000 0.0568

MATRIZ INVERSA M VECTOR TD VECTOR SOLUCION


4.1889 0.8094 -0.7953 -0.161 59.995 b1 = 8.4969

0.8094 0.7504 0.0138 0.0000 -65.634 b2 = 2.1588


* =
-0.7953 0.0138 0.2326 0.0000 206.534 b3 = -0.5850

-0.1611 0.0000 0.0000 0.0568 157.879 b4 = -0.7013


Ver archivo
MODELO: X1 = 8.4969(X2)2.1588 (X3)-0.5850 (X4)-0.7013
Siguiente
Valores pronosticados X1e
MODELO1: X1 = 1.6619 + 56.587X2 – 0.1364X3 – 0.2538X4

MODELO2: X1 = 8.4969(X2)2.1588 (X3)-0.5850 (X4)-0.7013


X1 Modelo Lineal Modelo Log
Real X1e d^2 X1e d^2
13.15 11.27 3.55 12.38 0.59
7.70 10.00 5.28 7.61 0.01
5.94 8.73 7.77 5.73 0.04
4.73 7.46 7.45 4.68 0.00
3.45 4.92 2.16 3.52 0.01
2.06 -1.42 12.15 2.30 0.06
7.92 7.45 0.22 7.88 0.00
… … … … …
d=(X1 – X1e)2 Σ: 445.84 9.97

Índice Ver archivo Siguiente


Correlación y Determinación Múltiple Lineal

N  30 Coeficiente Correlación: %aceite-Espesor


X X 2  101.56 N  X 1. X 2   X 1. X 2
r
1

X 1  287.93
N  X 1  ( X 1 ) 2 N  X 2  ( X 2 ) 2
2 2

X 2  9.78

X
2
 4279.64 30 *101.56  287.93 * 9.78
1 r
X 2
2
 3.32 30 * 4279.64  (287.93) 2 30 * 3.32  (9.78) 2
r = 0.5374
Coeficiente de Determinación Múltiple Ajustado
SCE  445.84 SCE / GLRES
R  1
GLRES  N  K  1  26 SCT /( N  1)
SCT  1516.2 445.84 / 26
Raj  1   0.6720
N  1  30  1  29 1516.2 / 29
Índice Ver archivo Siguiente
ANÁLISIS VARIANZA MULTILINEAL

Hipótesis Ho: No existe regresión entre las variables


Nivel de confianza: 95%
Suma
Fuentes GL Cuadrado Medio ESTADISTICO F
Cuadrados
Temperatura,
tiempo, SCF 1070.3 3 MCF 356.78 Fc 20.81
espesor

Residuo SCE 445.84 26 MCE 17.15 Ft(3,26) 2.98

TOTAL SCT 1516.2 29 MCT 52.28 Raj2 0.6720

Índice Ver archivo


Siguiente
INTERPRETACIÓN PRUEBA F

Hipótesis Ho: No existe regresión


entre las variables del modelo

 Interpretación: 20.81 es mayor a 2.98


por tanto, se rechaza la Ho; el modelo de
regresión multi exponencial planteado es Ver archivo
significativo para pronóstico al 95%
Índice Siguiente
PRUEBA T STUDENT MULTIL
Hipótesis Ho: Los coeficientes poblacionales son cero
Nivel de confianza: 95%

Coeficientes
Variable Men ii Cii Sbi Tci P: 0.975
Regresión

Espesor b2: 56.587 1E+09 7.40192 11.27 5.02


Tt :
Temperat 2.06
b3: -0.136 33189 0.00018 0.055 -2.47
ura

Tiempo b4: -0.254 22878 0.00012 0.046 -5.55

Índice Ver archivo Siguiente


INTERPRETACIÓN PRUEBA T

 Interpretación: Todos los T calculados son


mayores que 2.06; por tanto, se rechaza la
Ho; los coeficientes de regresión del modelo Ver archivo
Índice
son significativos al 95% sobre la dependiente
Siguiente
ANALISIS COMPARATIVO
ANALISIS COMPARARTIVO ENTRE MODELOS
MODELOS Mejor
Criterios Logarítmico Lineal Modelo
R2a 0.9938601 0.672014 Logarítmico
Fc 1565.7346 20.81 Logarítmico
Tb2 espesor 41.98 5.02 Logarítmico
Tb3 temperatura -20.44 -2.47 Logarítmico
Tb4 tiempo -49.58 -5.55 Logarítmico

Índice Ver archivo Siguiente


CONCLUSIONES
 La fracción % de aceite residual en las hojuelas de semilla
de girasol (X1) están en relación directa, de manera multi-
exponencial, al espesor de las hojuelas de semilla (X2),
temperatura de extracción (X3) y tiempo de extracción (X4).
 De acuerdo al coeficiente de determinación, el 99.38% de los
puntos, se ajustan perfectamente al modelo multiexponencial
propuesto.
 De acuerdo a la prueba ANVA, el modelo de regresión multi-
exponencial planteado, es significativo al 95% para proyectar
el % de aceite residual en las hojuelas de semilla de girasol
en base al tiempo, la temperatura y el espesor de la hojuela.
 De acuerdo a la prueba t Student, los coeficientes de
regresión de la temperatura, tiempo y espesor de la hojuela
permiten pronosticar el % de aceite residual en las hojuelas
de manera significativa al 95%.
Índice Ver archivo Siguiente
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”,
Editorial Limusa - México 1994.
 DAMODAR GUJARATI, "Econometría", 4ta
Edición. Editorial Mc Graw Hill. México, 2004.
 DOUGLAS MONTGOMERY “Diseño y Análisis de
Experimentos” - Editorial LIMUSA, 2002 México.
 MURRAY SPIEGEL: “Estadística”. colección
Schaum. Editorial Mc Graw Hill - 1991.
 RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma
edición. México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfa omega Grupo
Editor. 10ma edición. Colombia, 2003.
Índice
CAPITULO III
MEDIDAS DE ASOCIACIÓN

OBJETIVO:
Determinar el mejor modelo de regresión
usando medidas de asociación y
dispersión

Índice Ver 3
Diagrama de dispersión
 Sean los datos de las
cantidades vendidas de un Ventas de un articulo
articulo y sus precios.

 El diagrama de dispersión,
muestra la relación entre las
variables: precios y ventas. 20

 La variable independiente 10
“X”, es el estimador: precio

 La variable dependiente “Y” 2 4


es la que se estima: ventas

Índice Siguiente
VARIACIONES
Dato real:

_  

(Yi  Y )  Total Yi   1   2 X i
:Dato estimado
_ ( Y ) 2

 (Y  Y )  Y  N
2 2  _
(Yi  Y )  Debido a la regresio
_ ( X  Y )
 (Ye  Y )2  2 ( XY  N
)
: Promedio

_ _

 (Y  Y )   (2
Ye  Y ) 2
  (Y Ye ) 2

SCT = SCR + SCE


Siguiente
Índice
Coeficiente de correlación

 Mide el grado de
asociación entre dos
variables.

 Ambas variables
deben ser, al menos
de escala de intervalo
de medición.

Índice Siguiente
Ecuación del coeficiente de correlación
FÓRMULA GENERAL COEFICIENTE CORRELACIÓN: r

 (Yestimada  Ypromedio)
2

r
 (Y  Ypromedio) 2

Variación Explicada
r
Variación Total

FÓRMULA COEFICIENTE CORRELACIÓN PARA MODELOS LINEALES

N  XY   X  Y
r
N  X 2  ( X ) 2 N  Y 2  ( Y ) 2

Índice Siguiente
Error estándar de estimación
 El error estándar de estimación, mide la
variación alrededor de la línea de regresión.
 Está en las mismas unidades que la variable
dependiente.
 Se basa en las desviaciones al cuadrado
respecto de la recta de regresión.
 Valores pequeños, indican que los puntos se
agrupan cerca de la recta.

SY . X 
Y 2
 a( Y )  b( XY )
n2
Índice Siguiente
Correlación positiva perfecta

 Un signo positivo
significa que existe
una relación
directa entre las
variables.

 Un valor r = 1.00
indica una
correlación positiva
perfecta.

Índice Siguiente
Correlación negativa

 Un signo negativo
significa que
existe una
relación inversa
entre las
variables

Índice Siguiente
Correlación nula

 Si la correlación
entre dos
variables es 0,
entonces NO
existe relación
entre las
variables.

Índice Siguiente
Escala coeficiente correlación

 El coeficiente de correlación puede variar desde


-1.00 hasta 1.00
Índice Siguiente
Coeficiente determinación: R2

 R2 es la porción fraccionaria del


cambio en una variable que es
explicada por la otra.
 Varía de 0 a 1.0
 Es el cuadrado del coeficiente de
correlación “r”

Índice Siguiente
Limitaciones coeficiente correlación

Índice Siguiente
Limitaciones coeficiente correlación 2

Índice Siguiente
Análisis de regresión

 Se calcula una variable en base de


otra variable.
 La relación entre variables debe ser
lineal.
 El criterio de mínimos cuadrados se
utiliza para determinar la ecuación de
regresión.

Índice Siguiente
RESIDUALES DEL MODELO

Índice Siguiente
MÉTODO MÍNIMOS CUADRADOS

Índice Siguiente
PRUEBA DE HIPOTESIS
 HIPOTESIS: Enunciado, conjetura acerca
de una población; elaborado con el
propósito de ponerla a prueba.

 Hipótesis Nula Ho: Afirmación acerca del


valor de un parámetro poblacional.

 Hipótesis Alternativa Ha: Afirmación que


se aceptará, si la Hipótesis Nula es falsa.

Índice Siguiente
PRUEBA DE HIPÓTESIS
 Se formula una hipótesis con el solo propósito de
rechazarla.
 Esto es un principio, porque estadísticamente, una
hipótesis NUNCA puede ser aceptada.
 Únicamente podría no ser rechazada en base a
las evidencias que se disponga. Ejemplo:
 Hipótesis Nula Ho: "No existe diferencia entre
tratamientos"
 Hipótesis Alternativa Ha: "Si existe diferencia entre
tratamientos"

Índice Siguiente
TIPOS DE PRUEBA
 Depende de la Hipótesis Alternativa Ha.

 Se denomina Prueba Bilateral o de dos


colas, cuando Ho: B = valor contra Ha ≠
valor.

 Se denomina Prueba Unilateral o de una


cola, cuando Ho: B = valor contra Ha >valor
Índice Siguiente
TIPOS DE ERRORES
 Al tomar la decisión de Aceptar o Rechazar la Ho:
B = valor contra Ha ≠ valor
 en base a los resultados obtenidos de una
muestra aleatoria, seleccionada de una población;
existe 4 posibles alternativas, que determinan si la
decisión elegida es correcta o incorrecta. Luego:

 ERROR TIPO I (α) se comete al Rechazar la Ho


cuando es Verdadera.

 ERROR TIPO II () se comete al Aceptar la Ho


cuando es Falsa

Índice Siguiente
NIVEL DE SIGNIFICACIÓN (NS)
 Es la probabilidad de cometer un Error tipo I
y se denota por α. También se le denomina
nivel de riesgo.
 La probabilidad de la Decisión Correcta de
rechazar Ho cuando es falsa, es 1 - 

Índice Siguiente
FUENTES DE VARIACION
 VARIACION TOTAL:
SCT = ΣY2 – (ΣY)2/n

 VARIACION REGRESION:
SCR = b(ΣXY – ΣX.ΣY/n)

 VARIACION RESIDUAL:
SCE = SCT – SCR

Índice Siguiente
ANALISIS DE VARIANZA DEL
MODELO DE REGRESION
 MODELO DE REGRESION:

X1 = -1.001544 - 1.1002316X2 + 0.254632X3

 DONDE:
 X1:
 X2:
 X3:

Índice Siguiente
VARIACION DEBIDO A LA REGRESION

1.1. Suma de Cuadrados de la Regresión:


SCR  b2 D( X 1 . X 2 )  b3 D( X 1 . X 3 )

SCR  b2 ( X 1 X 2 
 X X
1 2
)  b3 ( X 1 X 3 
 X X
1 3
)
N N
53 * 42 53 * 66
SCR  1.002316 (263  )  0.254632 (384  )  53.16
10 10
1.2. Grados de Libertad:
GLregres = 2 (variables independientes: X2, X3)

1.3. Cuadrado Medio:


SCR 53.16
CMR    26.58
GLregres 2

Índice Siguiente
VARIACION TOTAL
2.1. Suma de Cuadrados Totales
( X 1 ) 2 (53) 2
SCT  ( X 1  )  (339  )  58.10
2

N 10

2.2. Grados de Libertad


GL = N – 1 = 10 – 1 = 9

2.3. Cuadrado Medio


SCT 58.10
CMT    6.46
GLt 9

Índice Siguiente
VARIACION DEBIDO AL RESIDUO

3.1. Suma de Cuadrados del Error


SCE = SCT – SCR
SCE = 58.10 – 53.16 = 4.94

3.2. Grados de Libertad


GLerror = N – GLregres – 1
GLerror = 10 – 2 – 1 = 7

3.3. Cuadrado Medio


SCE 4.94
CMR    0.71
GLerr 7

Índice Siguiente
ANALISIS ANVA
 HIPOTESIS NULA (Ho):
“No existe regresión entre las variables”
 Nivel de confianza: 95%
 Nivel de Significación: 1 – NC = 1 – 0.95 = 0.05
 Ftabla (NC; GLregres; GLerr) = Ft (0.05; 3; 3) = 9.28
 F CALCULADO:
CMR 26.58
Fc    37.64
CME 0.71

 Como Fc es mayor que Ft; se rechaza la


hipótesis nula.

 CONCLUSION: Las variables X2 y X3 en


conjunto son significativas sobre X1 al nivel
del 95% de confianza.
Índice Siguiente
Inferencia de la regresión lineal
 Se basa en las siguientes consideraciones:
 Para un valor de X, los valores de Y se
distribuyen de forma normal respecto de la línea
de regresión.
 La desviación estándar de cada una de las
distribuciones normales es la misma para todos
los valores de X, y se calcula por medio del error
estándar de estimación.
 Las desviaciones respecto de la línea de
regresión son independientes, sin ningún
modelo referente al tamaño o la dirección.
Índice Siguiente
Inferencia de la regresión lineal 2

Índice Siguiente
SUPUESTOS DEL ANÁLISIS DE
VARIANZA
 Homogeneidad de las varianzas con
respecto a la varianza común.
 Las poblaciones tienen distribución Normal.
 Las poblaciones son Independientes.
 Aditividad y linealidad del modelo

Índice Siguiente
Homogeneidad de varianzas

Índice Siguiente
HOMOSCEDASTICIDAD
 Las
perturbaciones ui
de la regresión
poblacional, son
homoscedásticas
es decir todas
tienen la misma
varianza.

Índice Siguiente
HETEROSCEDASTICIDAD

 Las varianzas de ui pueden ser variables por diversas


razones, por ejemplo:
 El tiempo de aprendizaje y los errores cometidos.
 Si mejoran las técnicas productivas, entonces menores
serán los productos defectuosos. Siguiente
Índice
HETEROSCEDASTICIDAD 2
No hay patrón sistemático
entre las 2 variables, por tanto
no hay heteroscedaticidad
en los datos

 Ye valor estimado con la línea de regresión, para


determinar si el valor medio estimado de Y esta
relacionado sistemáticamente con el residual al cuadrado.
Índice Siguiente
HETEROSCEDASTICIDAD 3

 Existe patrones sistemáticos entre las 2 variables. Por


ejemplo, en la (c) es de tipo lineal y en (d) es cuadrático,
por tanto, existe heteroscedaticidad en los datos.
Índice Siguiente
TEST Y CORRECION DE
HETEROSCESDASTICIDAD
 TEST:
 Park
 Glejser

 TECNICAS CORRECCION
 White

Índice Siguiente
MULTICOLINEALIDAD

Índice Siguiente
MULTICOLINEALIDAD 2

Índice Siguiente
Análisis Componentes Principales

 Al eliminarse la
colinealidad, el
sistema queda
representado por
un número menor
de variables, que
además son
“químicamente
puras”.

Índice Siguiente
AUTOCORRELACION

Índice Siguiente
AUTOCORRELACION 2

Índice Siguiente
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”,
Editorial Limusa - México 1994.
 DAMODAR GUJARATI, "Econometría", 4ta
Edición. Editorial Mc Graw Hill. México, 2004.
 MURRAY SPIEGEL: “Estadística”. colección
Schaum. Editorial Mc Graw Hill - 1991.
 RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma
edición. México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfaomega Grupo
Editor. 10ma edición. Colombia, 2003.
Índice
CAPITULO IV
SERIES DE TIEMPO

OBJETIVO:
Determinar el índice estacional de una
serie histórica temporal de datos,
para pronosticar acciones a futuro

Índice Ver 4.1


INTRODUCCION A LAS
SERIES DE TIEMPO
 Los sucesos que se dan en la economía, en las
ciencias y tecnologías; generalmente varían de
acuerdo a fuerzas externas que las rodean.

 Son acontecimientos que tienen una tendencia,


son estacionales, cíclicos; y ocasionalmente
presentan sobresaltos, que generan cambios en
las actividades socio económicas, y que afectan
definitivamente a la sociedad en general.

Índice Siguiente
MODELOS SERIES TEMPORALES
 Los modelos de series temporales
pueden ser de tipo aditivo o
multiplicativo:

 Y=T+E+C+I

 Y=T.E.C.I

Índice Siguiente
SERIE HISTORICA TEMPORAL
Y : Valor real * I: irregular

Y = T.C.E.I

T: tendencia
E: estacional

*
C: ciclo
Siguiente

Ver archivo
t
Índice
Tendencia Secular (T) La tendencia puede ser
creciente, decreciente o
constante. Es representado
por una línea recta o curva.
Y = T. C.E.I
Producción anual
Si: T = Y

Y: produc. anual (TM)


30
T = a + b.t 25
20
Y = a.tb
15
10
5 t: años
T = a + b.t + c.t^2 t 0
0 1 2 3 4 5 6 7
Y  a  b.t
c

Donde: T = Y , considerando
constantes o eliminando a las
otras variables: C, E e I
 T: Indica la dirección general que
sigue una serie histórica de datos, El método de los promedios
móviles, reduce la cantidad
en un largo periodo de tiempo. de variaciones cíclicas o
(de cinco años a mas). irregulares, quedando una
tendencia suavizada.
Índice Ver archivo Siguiente
Variaciones Cíclicas (C)
 La economía se desarrolla en
Ciclo ciclos económicos, que duran
prosperidad muchos años (30, 50 o mas).
 Las variaciones cíclicas indican
fluctuaciones; aumentando o
recesión disminuyendo por etapas,
alrededor de la actividad normal.
expansión
 Los ciclos se dan en años;
eliminándo las variaciones
depresión estacionales y los movimientos
irregulares, queda solo la
tendencia.
 Las variaciones cíclicas se
expresan en porcentajes.
 Las etapas cíclicas son:
expansión, prosperidad,
Y  T .C.E.I C  Y /T depresión y recesión.

Índice Ver archivo Siguiente


Variación Estacional (E)
 Son variaciones que duran
menos de un año, y pueden
ser en días, semanas, Índice Estacional
meses, trimestres, etc.

 Son variaciones que se


repiten a intervalos regulares
de tiempo; generalmente por
Y  T .E.C.I
variaciones climáticas, Y
estaciones del año, E
costumbres, etc. T .C.I

 La variación estacional es un
movimiento periódico que se
expresa por números índice.

Índice Ver archivo Siguiente


Productos de Movimiento Estacional
 Por ejemplo en el verano aumenta el consumo de
bebidas gaseosas, cerveza, helados, ropas de baño,
sandalias y en general todas las cosas de verano.

 En el invierno disminuye la demanda de productos de


verano y aumenta la demanda de los productos de
invierno como son casacas, chompas, pantalones,
bebidas a base de alcohol (wisky, ron, pisco, etc.)

 Las costumbres sociales también influyen en la


variación estacional, como son la navidad, año nuevo,
fiestas patrias, día de la madre, inicio del año escolar,
etc.; eventos que incrementan notablemente las
ventas.

Ver archivo Siguiente


Índice
VARIACIONES IRREGULARES (I)

Las variaciones irregulares


se expresan así:

Y = T.E.C.I

 I = Y / (T.E.C)

 Son cambios que se dan en la variable dependiente, son


de corta duración, no son cíclicas ni estacionales.
 A veces estas variaciones son pequeñas o muy grandes;
no son numerosas y son de naturaleza aleatoria.
 Las fuerzas o fenómenos que causan irregularidades o
cambios son: sequías, guerras, inundaciones, terremotos
Índice Ver archivo Siguiente
FUNDAMENTO ELIMINACIÓN V.I.

Índice Ver archivo Siguiente


LÍMITES DE CONTROL EN LA
ELIMNACIÓN DE V. Irregulares

Variaciones irregulares

Variación irregular
Índice Ver archivo Siguiente
Aplicación a Ingeniería de
Proyectos:
Proyección anual y estacional de
la Producción de camperas

Índice Ver 4.2


CASO ESTUDIO
 Una empresa confecciona camperas
(prenda de vestir para protección contra el
frío), por lo que desea proyectar su
producción anual y por periodo estacional.

 Las prendas que no se vendan durante la


temporada de invierno, son almacenadas
durante todo el año, constituyendo un
capital inmovilizado para la empresa.

Índice Ver archivo Siguiente


OBJETIVO:

 Determinar para el próximo


año, la proyección de la
producción anual y por
estaciones, de camperas.

Índice Ver archivo Siguiente


OBTENER DATOS HISTORICOS

ELABORAR DIAGRAMA DISPERS.

TABLA DE CALCULOS

Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES

OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.

EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Ver archivo Siguiente
Datos históricos de ventas
Nro AÑO ESTACION VENTAS
1 1997: Verano 4
2 Otoño 9
3 29 Invierno 11
4 Primavera 5
5 1998: Verano 6
6 Otoño 8
7 30 Invierno 12
8 Primavera 4
9 1999 Verano …

Índice Ver archivo Siguiente


Diagrama de Dispersión
Ventas estacionales 1997 - 2004

20
18
Y: ventas (mil unid.)

y = 0.1243x + 6.7621
16
R2 = 0.0978
14
12
10
8
6
4
X: estaciones
2
0
V O I P V O I P V O I P V O I P V O I P V O I P V O I P V O I P

Índice Ver archivo


Secuencia de cálculos 1 Ver archivo

1. Promedio Móvil de 4: 4. Índice Estacional Promedio Verano

4  9  11  5 0.7869  0.918  ...  0.5647


pm1   7.25 IEP.ver 
4 7
IEP.ver  0.6919
9  11  5  6
pm2   7.75
4 5.Desv. Stand. Índice Estacional
2. Promedio Móvil centrado
SIE.ver  0.1359
7.25  7.75 6.Límites de Control del Índice Estac.
pmc1   7.50 Limites  Xprom  Desv.Esta.
2
7.75  7.50
pmc2   7.625 7. Límite Inferior I.E. verano:
2 LI .  Xprom  Desv.S tan dar
3. Índice Estacional específico: LI .ver  0.619  0.1359  0.556
11
iee1   1.4667 8. Límite Superior I.E. verano:
7.50
5 LS  Xprom  Desv.S tan dar
iee 2   0.6557
7.625 LS.ver  0.619  0.1359  0.8278
Índice Siguiente
Secuencia de cálculos 2
9. Índice Estacional Básico Verano
0.7869  0.75  0.5263  0.6486  0.6486  05647
IEB.ver 
5
IEB.ver  0.6798
12. Índice Estacional Típico
10. Factor de ajuste del IEB
Estación E
4
F
0.6899  1.0134  1.5614  0.6866 Verano 0.6899
F  1.014915
Otoño 1.0285
11. Índice Estacional Típico Verano Invierno 1.5847
IE  IEB * F Primavera 0.6968
E.ver  0.6798 *1.014915  0.6899

Índice Ver archivo Siguiente


INDICES ESTACIONALES VERANO 1997 - 2004

1.0

0.9
L.S.
0.8
Xprom
0.7
0.6
L.I.
0.5
0.4
0.3
1997 1998 1999 2000 2001 2002 2003 2004 2005
Índice Ver archivo Siguiente
TABLA DE RESULTADOS

Y T TC SI = Y/TC S
P.MOVIL
Nro AÑO ESTACION VENTAS P. MOV. C IEE IE
4
1 1997: Verano 4 0.6899
0.6899
2 Otoño 9 1.0285
3 29 Invierno 11 7.25 7.500 1.4667 1.5847
4 Primavera 5 7.75 7.625 0.6557 0.6968
5 1998: Verano 6 7.50 7.625 0.7869 0.6899
6 Otoño 8 7.75 7.625 1.0492 1.0285
7 30 Invierno 12 7.50 7.625 1.5738 1.5847
8 Primavera 4 7.75 7.750 0.5161 0.6968
9 1999 Verano … … … … …

Índice Ver archivo Siguiente


TENDENCIA ANUAL
N 8 b2: PENDIENTE:

 XY  1347 N  XY   X  Y
b2 
 X 36 N X   X 
2 2

 Y  282
8 *1347  36 * 282
 X  204
2
b2   1.8571
 Y  10104
2 8 * 204  (36) 2

b1: INTERCEPTO:

b1 
Y  b2
X
N N
282 36
b1   1.8571  26.893
8 8
MODELO DE REGRESION: Y  26.893  1.8571( X )
Índice Ver archivo Siguiente
Valores pronosticados Ye
Ye  26.893  1.8571( X )
Ye  26.893  1.8571(1)  29
AÑO X Y anual Ye
1997 1 29 29
1998 2 30 31
1999 3 32 32
2000 4 37 34
2001 5 36 36
2002 6 35 38
2003 7 40 40

Índice
2004 8 43 42
Ver archivo Siguiente
DIAGRAMA DE TENDENCIA
Ventas anuales 1997 - 2004
45
43
Y: ventas (mil. unid.)

41 y = 1.8571x + 26.893
39 2
37
R = 0.886
35
33
31
29
27 X: años
25
0 1 2 3 4 5 6 7 8 9

Índice Ver archivo Siguiente


Coeficientes de Correlación y Determinación

N 8 Coeficiente Correlación:
 XY  1347 N  XY   X  Y
 X 36 r
N  X 2  ( X ) 2 N  Y 2  ( Y ) 2
 Y  282
 X  204
2
8 *1347  36 * 282
r
 Y  10104
2
8 * 204  (36) 2 8 *10104  (282) 2

r = 0.941275

Coeficiente de Determinación:
R 2  (0.941275) 2  0.886

Índice Ver archivo Siguiente


ANÁLISIS DE VARIANZA
Hipótesis Ho: No existe regresión entre las variables
Nivel de confianza: 95%
Suma
Fuentes GL Cuadrado Medio ESTADISTICO F
Cuadrados

X: Años SCF 144.86 1 MCF 144.86 Fc 46.62

Residuo SCE 18.64 6 MCE 3.11 Ft(1,4) 5.99

TOTAL SCT 163.50 7 MCT 23.36 Raj2 0.8670

Índice Ver archivo Siguiente


INTERPRETACIÓN PRUEBA F

 INTERPRETACIÓN: 46.62 es mayor a 5.99 por


tanto, se rechaza la Ho; el modelo de regresión
planteado es significativo al 95% de NC.
Índice Ver archivo Siguiente
PRUEBA T STUDENT
Hipótesis Ho: Los coeficientes poblacionales son cero
Nivel de confianza: 95%

Coeficientes Menor
Variable Cii Sbi Tci P: 0.975
Regresión ii

Cte a= 26.893 204 0.607 1.373 19.58


Tt :
2.57
X: Años b= 1.8571 8 0.0238 0.272 6.83

Índice Ver archivo


INTERPRETACIÓN PRUEBA T

 Interpretación: 6.83 es mayor a 2.57 por


tanto, se rechaza la Ho, la pendiente del
modelo es significativo al 95% de NC.
Índice Ver archivo Siguiente
CONCLUSIONES
 Usando promedios móviles centrados de 4 periodos, se
eliminan las variaciones cíclicas, estacionales e irregulares
de los datos del estudio.
 La desventaja del método es que se pierden datos al inicio
y final de la serie histórica.
 La aplicación de limites de control con un NC de 68% a los
datos desetacionalizados, se asegura la extracción de las
variaciones irregulares muy grandes y muy pequeñas,
obteniéndose índices estacionales típicos de cada estación
 De acuerdo al coeficiente de determinación, el 88.6% de
los puntos, se ajustan perfectamente al modelo lineal de
tendencia propuesto.
 De acuerdo a la prueba ANVA, el modelo de regresión para
proyectar las ventas anuales es significativo al 95% del
nivel de confianza.
 De acuerdo a la prueba t Student, la pendiente del modelo
de regresión, es significativa al 95% del nivel de confianza.
Índice Siguiente
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”,
Editorial Limusa - México 1994.
 FRANCIS DIEBOLD: “Elementos de Pronóstico”,
Thomson Editores. México - 1999.
 MOTHES, TORRENS "Estadística Aplicada a la
Ingeniería”. Ediciones Ariel - 1970.
 MURRAY SPIEGEL: “Estadística”. colección
Schaum. Editorial Mc Graw Hill - 1991.
 RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma
edición. México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfaomega Grupo
Editor. 10ma edición. Colombia, 2003.
Índice
CAPITULO V
DISEÑO DE EXPERIMENTOS

OBJETIVO:
Desarrollar diseños experimentales

Índice Ver 6.1


INTRODUCCIÓN
 CASO: Determinar el efecto sobre la demanda, de
cuatro sabores diferentes de una torta, en base al
Yacón, en los consumidores de la provincia de
Arequipa-2008.

 DIFICULTAD: No se puede consultar a la totalidad de


la población; es costoso, demanda mucho tiempo,
personas y material.

 Pero si se puede “muestrear” a la población y aplicar


"pruebas" de degustación.

 El propósito del diseño experimental, es obtener la


máxima cantidad de información, de manera
experimental y simple como se pueda, referido al
problema de investigación.
Índice Siguiente
DISEÑO DE EXPERIMENTOS
 “Un experimento es una serie de pruebas, en el que se
hacen cambios deliberados en las variables de entrada
del sistema, para observar e identificar las razones de
los cambios en la respuesta de salida”. (D. Montgomery
2002).
 Técnica estadística, que planifica, organiza y ejecuta
pasos; para comprobar si son iguales las medias de
dos o más poblaciones, mediante varianzas muestrales
insesgadas.
 “La investigación científica consiste en la búsqueda de
la verdad mediante métodos objetivos, adecuados y
precisos. La experimentación es un método científico,
que consiste en hacer operaciones y prácticas
destinadas a demostrar, comprobar o descubrir
fenómenos o principios básicos” (P. Reyes 1985).
Índice Modelos Siguiente
VENTAJAS Y DESVENTAJAS DEL
DISEÑO DE EXPERIMENTOS
 La exactitud de las conclusiones, se conoce
con precisión matemática.
 El número de pruebas, es determinado con
certeza, y a menudo es reducible.
 La comparación de los efectos es mas precisa,
debido a la agrupación de resultados.
 Existe mayor atención a interrelaciones causa-
efecto y a la cuantificación de las fuentes de
variabilidad.
 Mayor énfasis en las alternativas anticipadas y
en la planeación sistemática.
 Ser costoso y demanda tiempo de ejecución.
Índice Modelos Siguiente
TRATAMIENTO
 Es el conjunto de condiciones experimentales,
procedimientos, métodos, o estímulos; cuyos
efectos se desea estimar y comparar en una
unidad experimental contra una de control.

 Constituye la variable independiente.

 Ejemplos:
 La cantidad de reactivo aplicable a un proceso
 Una nueva marca de materia prima
 Un nuevo método de trabajo
 Un nuevo equipo de trabajo
Índice Modelos Siguiente
CONCEPTOS
 UNIDAD EXPERIMENTAL (UE): Es aquella a la
que se aplica el tratamiento en estudio, en un
experimento.

 UNIDAD DE CONTROL (UC): Es aquella a la que


NO se le aplica el tratamiento. Sirve de testigo
para comparar el resultado del experimento.

 ERROR EXPERIMENTAL: No llegar a resultados


idénticos con dos unidades experimentales
tratadas idénticamente.

Índice Modelos Siguiente


PRINCIPIOS BÁSICOS DEL
DISEÑO DE EXPERIMENTOS
 ALEATORIZACION: Todas las unidades
experimentales, tienen la misma probabilidad de
recibir un tratamiento, para asegurar asignaciones
imparciales.

 REPETICION: Permite una valoración mas


precisa, del efecto del tratamiento y una mejor
estimación del error experimental.

 CONTROL LOCAL: Permite ciertas restricciones,


en la selección aleatoria, a fin de reducir el error
experimental.
Índice Modelos Siguiente
PASOS DISEÑO DE EXPERIMENTOS

 Enunciar claramente el problema


 Reunir la información disponible
 Diseñar el programa de prueba
 Planear y ejecutar el trabajo experimental
 Analizar e interpretar los datos obtenidos
 Preparar el informe

Índice Siguiente
MODELOS DE DISEÑOS
EXPERIMENTALES
 Diseño completamente al azar
 Diseño por bloques al azar
 Diseño cuadrado latino
 Diseño greco latino
 Diseños factoriales

 Los Modelos de experimentos


pueden ser con uno, dos o mas
factores, y pueden ser:
 Sin replicación
 Con replicación
Índice Archivo Siguiente
ALEATORIZACIÓN COMPLETA (AC)

BLOQUES
 El objetivo de la AC es
D A C C
eliminar varias fuentes F
de error; por ejemplo I B D B A
la antigüedad, marca, L
D C B D
vida útil de las A
maquinas. S
A B C A

EJEMPLO: Comparar la velocidad de secado, de 4


maquinas de marcas diferentes (A, B, C, D) y asignar
a 4 bloques de 4 fardos de ropa del mismo peso,
elegidas completamente al azar.
Índice Archivo Siguiente
EJEMPLO (AC)
 Determinar, si el número promedio de
accidentes producidos en tres maquinas, se
puede considerar iguales al 95% y 99% de
Nivel de Confianza.
 Determinar, si el número diario de productos
defectuosos producidos por tres maquinas,
operadas individualmente por tres
trabajadores expertos en cuatro días, puede
considerarse iguales, al 95% NC. (ver
archivo)
Índice Archivo Ver soluc. Siguiente
BLOQUES ALEATORIOS (BA)
 El objetivo de los BA, es
tener un conjunto I II III IV
completo de tratamientos C A B A
para cada bloque, a fin B B C D
de controlar una fuente
de error o variabilidad A D D C
(diferencia entre bloques: D C A B
l, II, III, IV).
EJEMPLO: Cuatro tratamientos (procesos de
manufactura filas: A, B, C, D); se introducen en
orden aleatorio dentro de cada bloque
(repeticiones, replicaciones, columnas: l, II, III, IV)
Índice Archivo Siguiente
Aplicaciones (BA)
 Comparar la calidad de 5 placas metálicas de
diferente marca, en 2 bloques de 5 tornos de
igual marca y año de fabricación.

 Comparar la producción por maquina, de 4


variedades de materia prima, cada una aplicada
a 5 bloques de 4 maquinas.

 Comparar 5 variedades de sorgo, y con 6


repeticiones, conocer el sentido y dirección de
la gradiente de fertilidad del suelo.
Índice Archivo Siguiente
CUADRADO LATINO (CL)
 Se aplica, cuando se
desea controlar dos D B C A
fuentes de error al
B D A C
mismo tiempo, tal
como la diferencia C A D B
entre filas y la
diferencia entre A C B D
columnas.

 En tal caso, es deseable que cada


tratamiento, ocurra una vez en cada fila y
una vez en cada columna.
Índice Archivo Siguiente
Ejemplos (CL)
 Comparar la producción de 4 operarios
diferentes, utilizando 4 maquinas diferentes,
y determinar si existe diferencia significativa
entre maquinas y entre operarios.

 Comparar la capacidad de extracción de


cobre por lixiviación, por 4 biocatalizadores
diferentes, en 4 grupos de canchas o pads.

Índice Ver soluc. Archivo Siguiente


CUADRADO GRECO LATINO
 Se aplica, cuando se
desea controlar tres Bl A Dd C
fuentes de error o
variabilidad al mismo Ad B Cl D
tiempo, tal como la D Cd B Al
diferencia entre filas,
diferencia entre C Dl A Bd
columnas y diferencia
entre niveles.
 Ental caso, es deseable que cada tratamiento
ocurra una vez en cada fila, una vez en cada
columna y una vez en cada tratamiento.

Índice Archivo Siguiente


Ejemplos (CGL)
 Determinar si existe diferencia en
millas recorridas por galón entre las
gasolinas A, B, C y D.
 Diseñar el experimento con 4 conductores
distintos, 4 vehículos distintos y 4
carreteras distintas, al 95% NC.

 Comparar las tensiones de ruptura de los


cables, fabricadas por 4 empresas
diferentes, por 4 operarios diferentes y
usando 4 máquinas diferentes.
Índice Archivo Siguiente
DISEÑOS FACTORIALES
 Son arreglos de tratamientos, que permiten aplicar
de una sola vez, una serie de estímulos o
tratamientos, que se considera intervengan en la
respuesta dada, por una unidad experimental.

 Un diseño factorial, es aquel en el que interviene


dos o mas factores, considerando como factor, al
estimulo, representado por mas de dos niveles de
aplicación.

Índice Archivo Siguiente


Ejemplo (DF)

 En la producción de galletas, intervienen


como fuentes proteicas, harina de trigo o
harina de soya. Las galletas pueden
presentar dos formas: redonda o cuadrada
y tener dos sabores: lúcuma y fresa.
 Determinar, la mejor combinación de
tratamientos, mediante un diseño factorial
de tres factores.

Índice Archivo Siguiente


Aplicación a la Ingeniería:

TÍTULO
“Supresión del desarrollo de microbios en
la carne mediante aplicación de gases”

Ver 6.3 Archivo


Índice
OBTENER DATOS HISTORICOS

ELABORAR DIAGRAMA DISPERS.

TABLA DE CALCULOS Archivo

Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES

OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.

EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Siguiente
DESCRIPCIÓN DEL PROBLEMA 1
 La vida de anaquel de las carnes almacenadas en
los supermarkets, es el tiempo que un corte
previamente empacado, es sano, nutritivo y
vendible.

 Un paquete normal expuesto al aire tiene una vida


media aproximada de 48 horas, después de la
cual, la carne comienza a deteriorarse por
contaminación de microbios, degradación del
color y encogimiento.

 El empaque al vacío es efectivo para suprimir el


desarrollo de microbios; sin embargo, continúan
siendo un problema los otros factores.
Índice Archivo Siguiente
DESCRIPCIÓN DEL PROBLEMA 2
 Estudios sugieren el uso de atmósferas
controladas de gases, como alternativas a los
empaques actuales; que combinan la capacidad
de suprimir el desarrollo de microbios, con la
conservación de las cualidades de la carne,
 mediante la aplicación de gases: a) dióxido de
carbono puro CO2 o b) mezclas de monóxido de
carbono CO, oxigeno O2 y nitrógeno N; en el
empacado para el almacenamiento de la carne.

Índice Archivo Siguiente


DEFINICIÓN DEL PROBLEMA

 ¿Cuál es el grado de supresión del


desarrollo de microbios para la
conservación de las cualidades de la carne,
mediante la aplicación de gases de dióxido
de carbono puro CO2, mezclas de
monóxido de carbono CO, oxigeno O2 y
nitrógeno N, en el empacado para el
almacenamiento de carne?

Índice
OBJETIVO GENERAL INVESTIGACIÓN

 Evaluar el grado de supresión del desarrollo


de microbios para la conservación de las
cualidades de la carne, en base a gases de
dióxido de carbono puro CO2, mezclas de
monóxido de carbono CO, oxigeno O2 y
nitrógeno N en el empacado para el
almacenamiento de carne.

Índice Archivo Siguiente


OBJETIVOS ESPECÍFICOS
 Identificar detalladamente los factores que
influyen en el grado de supresión del
desarrollo de microbios para la
conservación de las cualidades de la carne.

 Evaluar los factores que influyen en el grado


de supresión del desarrollo de microbios
para la conservación de las cualidades de la
carne.
Índice Archivo Siguiente
HIPÓTESIS
 "El grado de supresión del desarrollo de
microbios para la conservación de las
cualidades de la carne, depende de la
aplicación de alguna forma de atmósfera
controlada de gases, como el dióxido de
carbono puro CO2, mezclas de monóxido
de carbono CO, oxigeno O2 y nitrógeno N,
en el empacado para el almacenamiento de
carne"
Índice Archivo
VARIABLES
 VARIABLE DEPENDIENTE: Grado de
supresión del desarrollo de microbios en
la carne.

 VARIABLE INDEPENDIENTE Y SUS


TRATAMIENTOS: Atmósfera controlada
de gases: Dióxido de carbono puro CO2,
mezclas de monóxido de carbono CO,
oxigeno O2 y nitrógeno N

Índice Archivo Siguiente


TRATAMIENTOS
 A: Empaque comercial de plástico con aire
del ambiente
 B: Empaque al vacío
 C: Mezcla de gases con 1% CO2, 40% O2 y
59% N
 D: 100% CO2

 FENOMENO A OBSERVAR: Grado de


desarrollo de microbios en la carne.

Índice Archivo Siguiente


DISEÑO DEL EXPERIMENTO
 Se usó un diseño totalmente aleatorizado. A
cada conjunto de condiciones de empaque
se le asignó al azar, 3 cortes de carne del
mismo tamaño y peso (75g)

 UNIDAD EXPERIMENTAL: Un corte de


carne.

 TOTAL DE UNIDADES
EXPERIMENTALES: 12 cortes de carne
Índice Archivo Siguiente
ALEATORIZACION DEL
TRATAMIENTO
 El diseño totalmente aleatorizado evita la asignación
subjetiva de tratamientos a los cortes de carne.
 Son 4 condiciones de empaque y a cada condición se le
asigna 3 replicas, totalizando 12 muestras. Los pasos para
la aleatorización son los siguientes:
 Paso 1: Numerar del 1 al 12 a las unidades experimentales
(cortes de carne)
 Paso 2: Obtener de una tabla de números aleatorios de
dos dígitos, 12 números que estén entre el 01 y 12.
 Paso 3: Asignar los 3 primeros cortes (6, 11, 10) al
tratamiento A, los siguientes tres cortes (3, 8, 4) al
tratamiento B y así sucesivamente
Índice Archivo Siguiente
CONTROL LOCAL
 Los empaques con aire del ambiente sirven
como tratamiento de control porque es
estándar y se puede comparar con los
nuevos empaques.

 Número de Agrupamientos: Un bloque de


3 replicas de almacenamiento con aire del
ambiente en empaque comercial de plástico

 NIVEL DE SIGNIFICANCIA: 0.05


Índice Archivo Siguiente
REQUERIMIENTOS PARA EL
EXPERIMENTO
 La empresa de beneficio de ganado vacuno
cuenta con lo siguiente:
 Laboratorio de bromatología
 Recipientes de vidrio inocuos y transparentes para
cultivo de bacterias de medios orgánicos
 Reactivos químicos para las pruebas
 Patrones de comparación de resultados
 Balones de gas con CO2, O2 y N
 Una Cámara frigorífica, una bomba de vacío, y
una empacadora de envases de plástico.
 Cada corte se empacó por separado en las
condiciones asignadas.
Índice Archivo Siguiente
PROCESAMIENTO DE
RESULTADOS
 Después de 9 días de almacenamiento a
4ºC en una instalación frigorífica normal, se
midió el número de bacterias sicotrópicas
en la carne. Las bacterias sicotrópicas se
encuentran en la superficie de la carne y se
asocian con la carne deteriorada.
 El crecimiento bacterial se expresa como el
logaritmo del número de bacterias por cm2.
Los resultados se observan en las tablas.
Índice Archivo Siguiente
ANALISIS DE VARIANZA

ANALISIS DE VARIANZA NC 0.95

VARIACION SC GL CM Fc Decisión

Tratamiento 32.87 3 10.96 94.58 Rechaza

Error 0.93 8 0.12 Ft

Total 33.80 11 3.07 4.07

Índice Archivo
INTERPRETACIÓN PRUEBA F

 INTERPRETACIÓN: 94.58 es mayor a 4.07 por


tanto, se rechaza la Ho; la diferencia entre los
métodos es significativa al 95% de NC.
Índice Archivo Siguiente
BIBLIOGRAFÍA
 BERNARD OSTLE: “Estadística Aplicada”, Editorial
Limusa - México 1994.
 COCHRAN COX “Diseño y Análisis de Experimentos” -
Editorial LIMUSA, edición 1990
 DOUGLAS MONTGOMERY “Diseño y Análisis de
Experimentos” - Editorial LIMUSA, 2002 México.
 PEDRO REYES “Diseño de Experimentos Aplicados” -
Editorial Trillas, 1985 México.
 MURRAY SPIEGEL: “Estadística”. colección Schaum.
Editorial Mc Graw Hill - 1991.
 RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma edición.
México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfaomega Grupo Editor.
10ma edición. Colombia, 2003.
Índice
CAPITULO VII
ANÁLISIS MULTIVARIANTE

OBJETIVO:
Efectuar análisis multivariante de
un conjuntos de datos históricos

Índice Ver 7.1


INTRODUCCIÓN
 “Es el conjunto de técnicas estadísticas, que
analizan simultáneamente mas de dos variables,
en una muestra de observaciones”. (Kendall
1957)

 “El análisis multivariante incluye los métodos


estadísticos que se preocupan por el análisis de
las múltiples medidas que se han hecho sobre
un cierto numero de objetos, formando parte del
mismo, en general, cualquier análisis simultaneo
de mas de dos variables” (Sheth 1968)
Índice Siguiente
MATRIZ DE DATOS

Índice Siguiente
Técnicas Multivariantes
 Análisis Cluster

 Análisis Factorial

 Análisis conjunto

 Análisis de
Correspondencias
Índice Siguiente
ANÁLISIS CLUSTER
 Es una modalidad del
Análisis Multivariante,
que permite clasificar a
los objetos, en un número
pequeño de grupos
relativamente
homogéneos, llamados
conglomerados.
 Los objetos en cada
grupo tienden a ser
similares entre si y
diferentes a los objetos
de otros grupos.

Índice Siguiente
ANÁLISIS CLUSTER 2

Índice Siguiente
ANÁLISIS FACTORIAL

 Es una modalidad del Análisis Multivariado


que permite reducir una serie de variables
a un conjunto menor (factores) que
contienen la mayor parte de la información y
son suficientes para explicar el modelo.

Índice Siguiente
UTILIDAD ANÁLISIS FACTORIAL
Malhotra (1997):

 Segmentación de Mercados: Identifica variables que


agrupe a los clientes por atributos. Por ejemplo, los
compradores de automóviles nuevos pueden
agruparse por la importancia que dan al precio, la
comodidad, el desempeño, el lujo, el servicio
postventa, etc.

 Investigación de Productos: Identifica atributos de


marcas que influyen en la elección del consumidor.
Una pasta dental puede evaluarse por: la protección
contra la caries, la blancura que proporciona a los
dientes, el sabor, el aliento fresco que otorga, su
precio, etc.
Índice Siguiente
ETAPAS ANÁLISIS FACTORIAL

 MATRIZ DE CORRELACIONES.
 EXTRACCIÓN DE FACTORES INICIALES.
 ROTACIÓN DE LOS FACTORES INICIALES.

Índice Aplicación
PASOS PARA REALIZAR UN
ANÁLISIS FACTORIAL 1
 ELABORACIÓN DE LA MATRIZ DE
CORRELACIONES.

 El Test de Esfericidad de Bartlett: Se utiliza para


probar la Hipótesis Nula, que afirma que las
variables no están correlacionadas en la
población.
 Es decir, comprueba si la matriz de correlaciones
es una matriz de identidad. Son válidos valores
elevados del test, con fiabilidad menor a 0.05
 En este caso se rechaza la Hipótesis Nula y se
continúa con el Análisis.
Índice Aplicación Siguiente
PASOS PARA REALIZAR UN
ANÁLISIS FACTORIAL 2
 El Índice Kaiser-Meyer-Olkin: Indica qué tan
apropiado es aplicar el Análisis Factorial. Los
valores entre 0.5 y 1 indican que es apropiado
aplicarlo.
 El Gráfico de Sedimentación, representa en el eje
“x” el número de orden de los factores, y en el eje
“y” los valores propios (eigenvalues).
 El Gráfico, muestra cómo van disminuyendo los
valores propios, graficando el hecho de que el
primer factor es el que más varianza explica.

Índice Aplicación Siguiente


PASOS PARA REALIZAR UN
ANÁLISIS FACTORIAL 3
 La “comunalidad”, es la cantidad de varianza que
una variable comparte con las demás variables.
 Los “eigenvalue” (valores propios) pueden
interpretarse como la cantidad de varianza
explicada por cada factor.
 La “carga factorial” es la correlación entre las
variables y los factores.
 EXTRACCIÓN DE LOS FACTORES INICIALES:
Mediante la matriz de correlación (“Componentes
Principales”)
 El procedimiento busca el factor que explique la
mayor cantidad de varianza en la matriz de
correlación.
Índice Aplicación Siguiente
PASOS PARA REALIZAR UN
ANÁLISIS FACTORIAL 3
 Se extrae un segundo factor de la matriz residual
y así sucesivamente, hasta que quede muy poca
varianza que pueda explicarse.
 Los factores así extraídos no se correlacionan
entre ellos; son factores ortogonales.
 ROTACIÓN DE FACTORES INICIALES: Es difícil
interpretar los factores iniciales; por lo tanto, la
extracción inicial se rota para lograr una solución
que facilite la interpretación.
 Los métodos de rotación ortogonales, mantienen
la independencia entre los factores rotados
(métodos varimax, quartimax y equamax). El más
usado es el Varimax.
Índice Aplicación Siguiente
ANALISIS CONJUNTO
 Determina la importancia relativa que los
consumidores dan a los atributos sobresalientes;
así como las utilidades que dan a los niveles de
atributos. Aplicaciones:

 Determinación de la importancia relativa de los


atributos en el proceso de selección del
consumidor.

 Estimación de la participación en el mercado de


marcas que difieren en niveles de atributos.

 Segmentación del mercado en base en la similitud


de las preferencias para los niveles de atributos.
Índice Siguiente
ANALISIS CONJUNTO

Índice
Análisis de Correspondencias
 Es un caso particular del análisis factorial de
componentes principales, que se diferencia
en lo siguiente:
 Esta orientado al análisis geométrico de la
dependencia entre variables.
 Es apropiado para el tratamiento de
variables cualitativas tipo nominales.
 Analiza las relaciones entre dos conjuntos
de variables: uno de objetos y el otro suele
ser atributos o características

Índice Siguiente
ANALISIS CORRESPONDENCIA

Índice
Aplicación a la Ingeniería:
Segmentación del mercado de
pantalones Jean

Índice Ver 7.2


CASO ESTUDIO
 Una empresa que confecciona de pantalones
Jean, desea averiguar cuáles son las preferencias
más importantes del público que compra sus
pantalones, para segmentar a sus clientes.
 Se diseña una encuesta de siete preguntas y se la
aplica a un grupo de potenciales clientes. Cada
pregunta representa una característica o variable.
 Se pide que valoren de 1 a 7 cada una de las
características.
 A mayor puntuación, mayor preferencia por la
característica. Las siete características son:
Índice Siguiente
CARACTERÍSTICAS O VARIABLES

 V1: BAJO PRECIO


 V2: BUENA CALIDAD
 V3: FACILIDAD PAGO
 V4: JUVENIL
 V5: REBAJAS
 V6: PRENDA DURADERA
 V7: DISEÑO INFORMAL

Índice Siguiente
MATRIZ DE CORRELACIONES

V1 V2 V3 V4 V5 V6 V7

V1 1 -0.004 0.628 0.082 0.675 -0.100 -0.338

V2 -0.004 1 0.151 -0.248 0.048 0.582 -0.251

V3 0.628 0.151 1 -0.182 0.480 0.090 -0.588

V4 0.082 -0.248 -0.182 1 0.272 0.017 0.469

V5 0.675 0.048 0.480 0.272 1 -0.110 -0.082

V6 -0.100 0.582 0.090 0.017 -0.110 1 0.014

V7 -0.338 -0.251 -0.588 0.469 -0.082 0.014 1

Índice
Gráfico de Sedimentación

Scree Plot
3.0

2.5

2.0

1.5

1.0

.5

0.0
1 2 3 4 5 6 7

Component Number

Índice
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared
Loadings
Compone Total % of Cumulati Total % of Cumulati
nt Variance ve % Variance ve %
1 2.485 35.505 35.505 2.485 35.505 35.505
2 1.821 26.013 61.518 1.821 26.013 61.518
3 1.339 19.131 80.649

4 0.508 7.258 87.907

5 0.376 5.373 93.280


6 0.279 3.990 97.270

7 0.191 2.730 100.000

Índice
Rotated Component Matrix
Component
Variable Var 1 2
Bajo precio V1 0.894 -0.109
Buena calidad V2 4.630E-02 0.765
Facilidad pago V3 0.836 0.298
Aspecto juvenil V4 3.817E-04 -0.666
Rebajas V5 0.787 -0.277
Prenda duradera V6 -0.138 0.590
Diseño informal V7 -0.534 -0.575

Índice
Gráfico de dos Factores
Component Plot in Rotated Space
1.0
v2 BUENA CALIDAD
PRENDA DURADERA
v6

.5
FACILIDAD PAGO v3

0.0
BAJO PRECIO
v1

v5
REBAJAS
-.5 v7
v4
DISEÑO INFORMAL JUVENIL

-1.0
-1.0 -.5 0.0 .5 1.0

Component 1
Índice Siguiente
Gráfico de tres Factores
Component Plot in Rotated Space

1.0 juvenil
diseño informal

.5 rebajas
prenda duradera
bajo precio
Component 2 0.0
buena calidad
facilidad pago

-.5

1.0 1.0
.5 .5
0.0 0.0
-.5 -.5
Component 1 Component 3

Índice
Gráfico de cuatro Factores

Índice
CONCLUSIONES
 El Análisis Factorial es una de las técnicas más complejas de la
Investigación de Mercados, que gracias a la informática, puede
ser aplicada actualmente con relativa facilidad.
 Como conclusión teórica, se cita a Namakforoosh (1995)
respecto del Análisis Factorial: Reduce la multiplicidad de
pruebas y medidas hasta lograr una sencillez notable. Indica
qué pruebas y medidas pertenecen al mismo grupo, y cuáles
miden prácticamente lo mismo.
 Por tanto, reduce el número de variables y ayuda a localizar e
identificar las unidades, para aplicar las pruebas.
 Como conclusión empírica; de siete variables iniciales, han
quedado reducidas a tres factores: “economía”, “calidad” y
“juvenil”; produciéndose la pérdida de sólo el 19.13% de la
información original de las 7 variables iniciales.
 Por tanto, puede aplicarse una encuesta de sólo 3 ó 4 items, por
ejemplo: a) Que sea económico; b) Que sea de calidad; c) Que
sea juvenil; opcionalmente d) Que sea informal.
Índice Siguiente
BIBLIOGRAFÍA
 POLO MIRANDA “Estadística Multivarable”. 4ta Edición. Edic.
Universidad Politécnica Catalunya. España 2005.
 HAIR, TATHAN, BLACK "Análisis Multivariante", Editorial Prentice
Hall – 4ta. edición, 2000.
 MALHOTRA NARESH” Investigación de Mercado: Un enfoque
practico” Prentice Hall. México
 ZIKMUND WILLIAM. “ Investigación de Mercado”. Editorial Prentice
Hall. México 1998.
 DAMODAR GUJARATI, "Econometría", 4ta Edición. Editorial Mc
Graw Hill. México, 2004.
 RICHARD LEVIN, RUBIN D. “Estadística para Administración y
Economía”. Prentice Hall. 7ma edición. México, 2004.
 MASON R, LIND D, MARCHAL. “Estadística para Administración y
Economía”. Alfaomega Grupo Editor. 10ma edición. Colombia, 2003.
 CATENA A., RAMOS M. Análisis Multivariado, Un manual para
investigadores. Editorial Biblioteca Nueva. 2003 - España.
 DANIEL PEÑA. Análisis de Datos Multivariantes. Editorial McGraw Hill
2002. España.
Índice

También podría gustarte