Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Segunda Especialidad
INGENIERÍA DE PROYECTOS
CURSO:
ESTADISTICA Y TOMA DE DECISIONES
TEMA: REGRESION Y
CORRELACION
Ing. Hernán Miguel Marquina Avellaneda
ÍNDICE
INTRODUCCIÓN
CAP. I: Regresión Lineal
Otros Modelos básicos de pronóstico
Caso Estudio: conductividad térmica
CAP. II: Regresión Multilineal
Caso Estudio: Extracción de aceite
CAP. III: Medidas de asociación
Caso Estudio:
CAP. IV: Series de Tiempo
Caso Estudio: Fabricación de camperas
CAP. V: Regresión Dicotómica
Caso Estudio: Importaciones Peruanas
CAP. VI: Diseño de Experimentos
Caso Estudio: Empaque almacenamiento
CAP. VII: Análisis Multivariante
Caso Estudio: Segmentación de clientes Jean
Proyecto de Investigación
Plan de Proyección Social
ANEXOS
INTRODUCCIÓN
ESTADÍSTICA EN INGENIERÍA: Es la disciplina cuyo
método científico tiene como misión, la búsqueda de
verdades empíricas, sistemáticamente demostrables; y
sustentadas en la:
TOMA .. (Colecta, acopio, levantamiento, etc.)
ORGANIZACIÓN .. (Tablas, archivos, etc.)
REPRESENTACIÓN .. (Histogramas, ojivas, diagramas,
etc.)
PRESENTACIÓN.. (Informes, resumen, formatos, etc.) y
ANÁLISIS de los DATOS .. (Inferencia, ANVA, etc.)
de los PROCESOS PRODUCTIVOS y de SERVICIOS
dentro del campo de la ingeniería,
• con el propósito de obtener resultados objetivos y
confiables, que permitan la Toma de Decisiones de
manera eficiente y eficaz, por los sistemas
organizacionales.
Índice Siguiente
PRONÓSTICO
Siguiente
Índice
PLANEAMIENTO Y CONTROL DE
OPERACIONES
Administración de inventarios
Planeamiento de la producción:
¿Qué producir?
¿ Cuánto producir?
¿ Cuándo producir?
¿Dónde producir?
Siguiente
Índice
MARKETING
Administración del equipo de ventas
Pronósticos de precios
Fijación de precios
Canales de distribución
Gastos de publicidad
Ingreso a mercados nuevos
Pronóstico de ventas
Siguiente
Índice
ECONOMÍA
Pronóstico del Producto Bruto Interno
Pronóstico de desempleo por sectores
Inversiones
Nivel de precios y las tasas de interés
Pronósticos sobre política monetaria y fiscal
Pronóstico de la tasa de inflación
Pronóstico exportaciones no tradicionales
Pronóstico sobre ahorro e ingreso personal
Siguiente
Índice
ÁMBITO FINANCIERO
Siguiente
Índice
Técnica Regresión bivariable
CAPITULO I
MODELOS DE REGRESIÓN BÁSICOS
OBJETIVO:
Modelar un conjunto de datos, mediante
la técnica de regresión bivariable, para
obtener una ecuación de pronóstico
Índice Ver 1
Diagrama de dispersión
Sean los datos de las
cantidades vendidas de un Ventas de un articulo
articulo y sus precios.
El diagrama de dispersión,
muestra la relación entre las
variables: precios y ventas. 20
La variable independiente 10
“X”, es el estimador: precio
Índice Siguiente
MODELO LINEAL
Ventas
(mill S/.)
Y a bX Siguiente
Y 0.03 0.04 X 2
d (Yei Yi ) min
0.11 d (a bX i Yi )
P2
2
Pendiente:
0.11 0.07
b 0.04 0.04 b
0.07 P1 2.0 1.0
0.04
b 0.04
1 1
Intercepto: a = 0.03 b 0.04
1.0 2.0
Gastos publicidad
Índice (mil. S/.)
FORMULAS DE LOS COEFICIENTES
Ventas
(mill S/.)
DEL MODELO LINEAL
a
Y
b
X
n n
N XY X Y
b
N X 2 X
2
Gastos publicidad
(mil. S/.)
Índice Modelo Biv Siguiente
Pendiente de la recta: b
Indica un cambio en Y para una variación
en X.
Un valor positivo para “b” indica una
relación directa entre las dos variables, y
un valor negativo, una relación inversa.
El signo de “b” y el signo de “r”
(coeficiente de correlación), siempre son
iguales.
Siguiente
Índice
Intercepto de la Recta: a
“a” es el intercepto de la recta con el eje Y
X Y X XY
2
a
n X ( X )
2 2
a
Y
b
X
n n
Siguiente
Índice
OTROS MODELOS BÁSICOS
DE PRONÓSTICO
Índice
MODELO DE CURVA EXPONENCIAL
Se presenta cuando los valores de las variables X
e Y graficados en papel aritmético se aproximan a
una línea curva creciente a decreciente,
pero trasladado los valores X e Y a una gráfica
semilogarítmica, se aproximan a una línea recta,
es decir que la variable independiente X
evoluciona en forma aritmética y la variable
dependiente Y evoluciona en forma geométrica,
su ecuación es :
Y = a.bx
Índice Modelo Biv Siguiente
CURVA EXPONENCIAL
Y
200
Y = a.bX
log Y log a log b. X
180
160
140
120
100
80
60
40
20
X
0
0 1 2 3 4 5 6 7
Índice Modelo Biv
CURVA EXPONENCIAL ESCALA SEMILOGARITMICA
1000
log Y
100
X
10
0 1 2 3 4 5 6 7
n X . log Y X log Y
log b
n X ( X )
2 2
log a
log Y
b.
X
n n
Y aX b
4
X: población
3
2 2.5 3 3.5 4 4.5 5 5.5
Pn = Po (1 + K) n
Índice Siguiente
CURVA POBLACIONAL
Curva Poblacional
200
180 n
160
Pn =Po(1 + K)
P: población
140
120
100
80
60
40
20
n: tiempo
0
0 1 2 3 4 5 6 7
Índice Siguiente
CURVA DE GOMPERTZ
Modelo bivariante que 12000
25000 Yc a.b Cx
20000
15000
log Yc log a log b.c x
10000
5000
X: tiem po
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Siguiente
PROCESO CÁLCULO GOMPERTZ
log Yc log a log b.c x
3. Constante c:
1. Tamaño periodo m: D2 D2
C m
C m log
n
m Constante c
D1 D1
3 4. Constante b:
D1 (C 1)
2. Diferencias D1, D2: log b
D1 2 log Y 1 log Y C m
1
2
5. Constante a:
D2 3 log Y 2 log Y
1 D1
log a 1 logY m
m C 1
Índice Archivo Siguiente
CURVA EXPONENCIAL MODIFICADA
Y Curva exponencial modificada
300
Y = a + b.c X
250
200
150
100
50
X: tiem po
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Índice Archivo
CURVA LOGÍSTICA
2500
1 1
a bc x Y
y a bc x
2000
1500
Y: PBI
1000
500
X: año
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Siguiente
CURVA PARABÓLICA
70
Yc a bX cX 2
Y
60
50
40
30
20
10
X
0
0 1 2 3 4 5 6 7 8 9
Índice Archivo Modelo Biv
CURVA CÚBICA
Y
Tendencia Cúbica
35
30
25 YC a bX cX dX 2 3
20
15
10
5
X
0
3 3,2 3,4 3,6 3,8 4
Índice Archivo Modelo Cúbico
Aplicación a la Ingeniería:
Conductividad Térmica
Carga de arrabio
al convertidor
Índice Ver 1
OBJETIVO:
Determinar el modelo de
regresión de la conductividad
térmica del material, en función
de la temperatura.
K = b1 + b2 (T)
TABLA DE CALCULOS
Problema
ESTIMAR VALORES K
CONDUCTIVIDAD TERMICA
OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Ver archivo Siguiente
Datos Experimentales: T - K
T K K ESTIMADO
ºF Btu/h.ft.ºF
150 0.022
200 0.025
300 0.032
400 0.040
600 0.056
800 0.070
Índice Ver archivo
Diagrama de Dispersión
0.08
0.07
y = 8E-05x + 0.0101
K: Btu/h.ft.ºF
2
0.06 R = 0.9991
0.05
0.04
0.03
0.02
0.01
0.00 T: ºF
0 100 200 300 400 500 600 700 800 900
Índice Ver archivo
Tabla de Cálculos
b1: INTERCEPTO:
b1
K b2
T
N N
0.245 2450
b1 0.000075 0.01014
6 6
MODELO DE REGRESION: Ke 0.01014 0.000075 (T )
Índice Ver archivo Siguiente
Valores pronosticados Ke
Ke 0.01014 0.000075 (T ) Ver archivo
K 0.01177
2
Coeficiente de Determinación: R = r2
R 2 (0.99955) 2 0.999125
Coeficientes Menor
Variable Cii Sbi Tci P: 0.975
Regresión ii
)
T 2450 N
T 1312500
2
Sk mi 6 E 4 *
1
(150 408) 2
0.0383
Tt 3.18
2
6 2450
(1312500 )
6
Intervalo de Confianza para la predicción K media:
P(Ti Tt * Ski Ui Ti Tt * Ski) 1
P(150 3.18 * 0.0383 Ui 150 3.18 * 0.0383) 1 0.05
4 1 (150 408) 2
Tt 3.18 Ski 6 E * 1 2
0.0073
6 2450
(1312500 )
6
Intervalo de Confianza para una observación K individual
Índice
CAPITULO II
REGRESIÓN MÚLTIPLE
OBJETIVO:
Modelar un conjunto de datos, con mas de
dos variables,
mediante la técnica de regresión múltiple,
para obtener una ecuación de pronóstico.
Índice
INTRODUCCIÓN
Los procesos industriales, los fenómenos de la
naturaleza, los acontecimientos sociales, entre otros;
rara vez obedecen a modelos bivariables;
hojuela
20
X2: espesor de las hojuelas 15
X3: temperatura de 10
5
extracción 0
0.2 0.25 0.3 0.35 0.4 0.45
X4: tiempo de extracción X2: espesor hojuelas, en mm
25
25
20
20
15 15
10 10
5
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60 0
X4: tiempo extracción, en min. 20 30 40 50 60
X3: Temperatura ºC
Índice Ver archivo Siguiente
MODELO LINEAL MÚLTIPLE
b1 X 2 b2 X 2 b3 X 2 X 3 b4 X 2 X 4 X X
2
2 1
b1 X 3 b2 X 2 X 3 b3 X 3 b4 X 3 X 4 X X
2
3 1
b1 X 4 b2 X 2 X 4 b4 X 3 X 4 b4 X 4 X X
2
4 1
X 4 X X X X X X X
2
2 4 3 4 4 4 1
Índice Ver archivo Siguiente
MODELO CURVO MÚLTIPLE
Extracción de aceite de la
semilla de girasol
Ver 2.2
Índice
Producción de aceite de girasol
Objetivo
Índice Siguiente
CASO ESTUDIO EXPERIMENTAL
35
X1: % aceite residual en
y = 56.926x - 8.9602
30 2
R = 0.2888
25
hojuela
20
15
10
5
0
0.2 0.25 0.3 0.35 0.4 0.45
X2: espesor hojuelas, en mm
Índice Ver archivo
Diagrama de Dispersión X1- X4
Tiempo - % Aceite residual
35
30 -0.7013
X1: % Aceite resudual
y = 54.036x
25 2
R = 0.5204
20
15
10
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60
35
X1: % Aceite residual
y = -0.1397x + 14.517
30 2
25 R = 0.0727
20
15
10
5
0
20 30 40 50 60
X3: Temperatura ºC
Índice Ver archivo
OBJETIVOS:
Obtener el modelo que mejor represente los datos
experimentales.
Modelo Nº 1:
X1 = b1 + b2.X2 + b3.X3 + b4.X4
Modelo Nº 2:
X1 = b1(X2b2)(X3b3)(X4b4)
Determinar los Indicadores sobre la bondad de
ajuste del modelo matemático elegido.
Calcular la variación del error de los valores
calculados con los dos modelos.
Índice Ver archivo Siguiente
OBTENER DATOS EXPERIM.
Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES
OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Siguiente
Tabla Datos Experimentales
Aceite (%) Espesor (mm) Temperatura (ºC) Tiempo (min)
X1 X2 X3 X4
13.15 0.25 24 5
7.7 0.25 24 10
5.94 0.25 24 15
4.73 0.25 24 20
3.45 0.25 24 30
2.06 0.25 24 55
7.92 0.25 52 5
4.88 0.25 52 10
3.66 0.25 52 15
2.86 0.25 52 20
… … … …
(X1)^2 (X2)^2 (X3)^2 (X4)^2 X1X2 X1X3 X1X4 X2X3 X2X4 X3X4
… … … … … … … … … …
… … … … … … … … … …
X 1 287.93
N X 1 ( X 1 ) 2 N X 2 ( X 2 ) 2
2 2
X 2 9.78
X
2
4279.64 30 *101.56 287.93 * 9.78
1 r
X 2
2
3.32 30 * 4279.64 (287.93) 2 30 * 3.32 (9.78) 2
r = 0.5374
Coeficiente de Determinación Múltiple Ajustado
SCE 445.84 SCE / GLRES
R 1
GLRES N K 1 26 SCT /( N 1)
SCT 1516.2 445.84 / 26
Raj 1 0.6720
N 1 30 1 29 1516.2 / 29
Índice Ver archivo Siguiente
ANÁLISIS VARIANZA MULTILINEAL
Coeficientes
Variable Men ii Cii Sbi Tci P: 0.975
Regresión
OBJETIVO:
Determinar el mejor modelo de regresión
usando medidas de asociación y
dispersión
Índice Ver 3
Diagrama de dispersión
Sean los datos de las
cantidades vendidas de un Ventas de un articulo
articulo y sus precios.
El diagrama de dispersión,
muestra la relación entre las
variables: precios y ventas. 20
La variable independiente 10
“X”, es el estimador: precio
Índice Siguiente
VARIACIONES
Dato real:
_
(Yi Y ) Total Yi 1 2 X i
:Dato estimado
_ ( Y ) 2
(Y Y ) Y N
2 2 _
(Yi Y ) Debido a la regresio
_ ( X Y )
(Ye Y )2 2 ( XY N
)
: Promedio
_ _
(Y Y ) (2
Ye Y ) 2
(Y Ye ) 2
Mide el grado de
asociación entre dos
variables.
Ambas variables
deben ser, al menos
de escala de intervalo
de medición.
Índice Siguiente
Ecuación del coeficiente de correlación
FÓRMULA GENERAL COEFICIENTE CORRELACIÓN: r
(Yestimada Ypromedio)
2
r
(Y Ypromedio) 2
Variación Explicada
r
Variación Total
N XY X Y
r
N X 2 ( X ) 2 N Y 2 ( Y ) 2
Índice Siguiente
Error estándar de estimación
El error estándar de estimación, mide la
variación alrededor de la línea de regresión.
Está en las mismas unidades que la variable
dependiente.
Se basa en las desviaciones al cuadrado
respecto de la recta de regresión.
Valores pequeños, indican que los puntos se
agrupan cerca de la recta.
SY . X
Y 2
a( Y ) b( XY )
n2
Índice Siguiente
Correlación positiva perfecta
Un signo positivo
significa que existe
una relación
directa entre las
variables.
Un valor r = 1.00
indica una
correlación positiva
perfecta.
Índice Siguiente
Correlación negativa
Un signo negativo
significa que
existe una
relación inversa
entre las
variables
Índice Siguiente
Correlación nula
Si la correlación
entre dos
variables es 0,
entonces NO
existe relación
entre las
variables.
Índice Siguiente
Escala coeficiente correlación
Índice Siguiente
Limitaciones coeficiente correlación
Índice Siguiente
Limitaciones coeficiente correlación 2
Índice Siguiente
Análisis de regresión
Índice Siguiente
RESIDUALES DEL MODELO
Índice Siguiente
MÉTODO MÍNIMOS CUADRADOS
Índice Siguiente
PRUEBA DE HIPOTESIS
HIPOTESIS: Enunciado, conjetura acerca
de una población; elaborado con el
propósito de ponerla a prueba.
Índice Siguiente
PRUEBA DE HIPÓTESIS
Se formula una hipótesis con el solo propósito de
rechazarla.
Esto es un principio, porque estadísticamente, una
hipótesis NUNCA puede ser aceptada.
Únicamente podría no ser rechazada en base a
las evidencias que se disponga. Ejemplo:
Hipótesis Nula Ho: "No existe diferencia entre
tratamientos"
Hipótesis Alternativa Ha: "Si existe diferencia entre
tratamientos"
Índice Siguiente
TIPOS DE PRUEBA
Depende de la Hipótesis Alternativa Ha.
Índice Siguiente
NIVEL DE SIGNIFICACIÓN (NS)
Es la probabilidad de cometer un Error tipo I
y se denota por α. También se le denomina
nivel de riesgo.
La probabilidad de la Decisión Correcta de
rechazar Ho cuando es falsa, es 1 -
Índice Siguiente
FUENTES DE VARIACION
VARIACION TOTAL:
SCT = ΣY2 – (ΣY)2/n
VARIACION REGRESION:
SCR = b(ΣXY – ΣX.ΣY/n)
VARIACION RESIDUAL:
SCE = SCT – SCR
Índice Siguiente
ANALISIS DE VARIANZA DEL
MODELO DE REGRESION
MODELO DE REGRESION:
DONDE:
X1:
X2:
X3:
Índice Siguiente
VARIACION DEBIDO A LA REGRESION
SCR b2 ( X 1 X 2
X X
1 2
) b3 ( X 1 X 3
X X
1 3
)
N N
53 * 42 53 * 66
SCR 1.002316 (263 ) 0.254632 (384 ) 53.16
10 10
1.2. Grados de Libertad:
GLregres = 2 (variables independientes: X2, X3)
Índice Siguiente
VARIACION TOTAL
2.1. Suma de Cuadrados Totales
( X 1 ) 2 (53) 2
SCT ( X 1 ) (339 ) 58.10
2
N 10
Índice Siguiente
VARIACION DEBIDO AL RESIDUO
Índice Siguiente
ANALISIS ANVA
HIPOTESIS NULA (Ho):
“No existe regresión entre las variables”
Nivel de confianza: 95%
Nivel de Significación: 1 – NC = 1 – 0.95 = 0.05
Ftabla (NC; GLregres; GLerr) = Ft (0.05; 3; 3) = 9.28
F CALCULADO:
CMR 26.58
Fc 37.64
CME 0.71
Índice Siguiente
SUPUESTOS DEL ANÁLISIS DE
VARIANZA
Homogeneidad de las varianzas con
respecto a la varianza común.
Las poblaciones tienen distribución Normal.
Las poblaciones son Independientes.
Aditividad y linealidad del modelo
Índice Siguiente
Homogeneidad de varianzas
Índice Siguiente
HOMOSCEDASTICIDAD
Las
perturbaciones ui
de la regresión
poblacional, son
homoscedásticas
es decir todas
tienen la misma
varianza.
Índice Siguiente
HETEROSCEDASTICIDAD
TECNICAS CORRECCION
White
Índice Siguiente
MULTICOLINEALIDAD
Índice Siguiente
MULTICOLINEALIDAD 2
Índice Siguiente
Análisis Componentes Principales
Al eliminarse la
colinealidad, el
sistema queda
representado por
un número menor
de variables, que
además son
“químicamente
puras”.
Índice Siguiente
AUTOCORRELACION
Índice Siguiente
AUTOCORRELACION 2
Índice Siguiente
BIBLIOGRAFÍA
BERNARD OSTLE: “Estadística Aplicada”,
Editorial Limusa - México 1994.
DAMODAR GUJARATI, "Econometría", 4ta
Edición. Editorial Mc Graw Hill. México, 2004.
MURRAY SPIEGEL: “Estadística”. colección
Schaum. Editorial Mc Graw Hill - 1991.
RICHARD LEVIN, RUBIN D. “Estadística para
Administración y Economía”. Prentice Hall. 7ma
edición. México, 2004.
MASON R, LIND D, MARCHAL. “Estadística para
Administración y Economía”. Alfaomega Grupo
Editor. 10ma edición. Colombia, 2003.
Índice
CAPITULO IV
SERIES DE TIEMPO
OBJETIVO:
Determinar el índice estacional de una
serie histórica temporal de datos,
para pronosticar acciones a futuro
Índice Siguiente
MODELOS SERIES TEMPORALES
Los modelos de series temporales
pueden ser de tipo aditivo o
multiplicativo:
Y=T+E+C+I
Y=T.E.C.I
Índice Siguiente
SERIE HISTORICA TEMPORAL
Y : Valor real * I: irregular
Y = T.C.E.I
T: tendencia
E: estacional
*
C: ciclo
Siguiente
Ver archivo
t
Índice
Tendencia Secular (T) La tendencia puede ser
creciente, decreciente o
constante. Es representado
por una línea recta o curva.
Y = T. C.E.I
Producción anual
Si: T = Y
Donde: T = Y , considerando
constantes o eliminando a las
otras variables: C, E e I
T: Indica la dirección general que
sigue una serie histórica de datos, El método de los promedios
móviles, reduce la cantidad
en un largo periodo de tiempo. de variaciones cíclicas o
(de cinco años a mas). irregulares, quedando una
tendencia suavizada.
Índice Ver archivo Siguiente
Variaciones Cíclicas (C)
La economía se desarrolla en
Ciclo ciclos económicos, que duran
prosperidad muchos años (30, 50 o mas).
Las variaciones cíclicas indican
fluctuaciones; aumentando o
recesión disminuyendo por etapas,
alrededor de la actividad normal.
expansión
Los ciclos se dan en años;
eliminándo las variaciones
depresión estacionales y los movimientos
irregulares, queda solo la
tendencia.
Las variaciones cíclicas se
expresan en porcentajes.
Las etapas cíclicas son:
expansión, prosperidad,
Y T .C.E.I C Y /T depresión y recesión.
La variación estacional es un
movimiento periódico que se
expresa por números índice.
Y = T.E.C.I
I = Y / (T.E.C)
Variaciones irregulares
Variación irregular
Índice Ver archivo Siguiente
Aplicación a Ingeniería de
Proyectos:
Proyección anual y estacional de
la Producción de camperas
TABLA DE CALCULOS
Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES
OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Ver archivo Siguiente
Datos históricos de ventas
Nro AÑO ESTACION VENTAS
1 1997: Verano 4
2 Otoño 9
3 29 Invierno 11
4 Primavera 5
5 1998: Verano 6
6 Otoño 8
7 30 Invierno 12
8 Primavera 4
9 1999 Verano …
20
18
Y: ventas (mil unid.)
y = 0.1243x + 6.7621
16
R2 = 0.0978
14
12
10
8
6
4
X: estaciones
2
0
V O I P V O I P V O I P V O I P V O I P V O I P V O I P V O I P
1.0
0.9
L.S.
0.8
Xprom
0.7
0.6
L.I.
0.5
0.4
0.3
1997 1998 1999 2000 2001 2002 2003 2004 2005
Índice Ver archivo Siguiente
TABLA DE RESULTADOS
Y T TC SI = Y/TC S
P.MOVIL
Nro AÑO ESTACION VENTAS P. MOV. C IEE IE
4
1 1997: Verano 4 0.6899
0.6899
2 Otoño 9 1.0285
3 29 Invierno 11 7.25 7.500 1.4667 1.5847
4 Primavera 5 7.75 7.625 0.6557 0.6968
5 1998: Verano 6 7.50 7.625 0.7869 0.6899
6 Otoño 8 7.75 7.625 1.0492 1.0285
7 30 Invierno 12 7.50 7.625 1.5738 1.5847
8 Primavera 4 7.75 7.750 0.5161 0.6968
9 1999 Verano … … … … …
XY 1347 N XY X Y
b2
X 36 N X X
2 2
Y 282
8 *1347 36 * 282
X 204
2
b2 1.8571
Y 10104
2 8 * 204 (36) 2
b1: INTERCEPTO:
b1
Y b2
X
N N
282 36
b1 1.8571 26.893
8 8
MODELO DE REGRESION: Y 26.893 1.8571( X )
Índice Ver archivo Siguiente
Valores pronosticados Ye
Ye 26.893 1.8571( X )
Ye 26.893 1.8571(1) 29
AÑO X Y anual Ye
1997 1 29 29
1998 2 30 31
1999 3 32 32
2000 4 37 34
2001 5 36 36
2002 6 35 38
2003 7 40 40
Índice
2004 8 43 42
Ver archivo Siguiente
DIAGRAMA DE TENDENCIA
Ventas anuales 1997 - 2004
45
43
Y: ventas (mil. unid.)
41 y = 1.8571x + 26.893
39 2
37
R = 0.886
35
33
31
29
27 X: años
25
0 1 2 3 4 5 6 7 8 9
N 8 Coeficiente Correlación:
XY 1347 N XY X Y
X 36 r
N X 2 ( X ) 2 N Y 2 ( Y ) 2
Y 282
X 204
2
8 *1347 36 * 282
r
Y 10104
2
8 * 204 (36) 2 8 *10104 (282) 2
r = 0.941275
Coeficiente de Determinación:
R 2 (0.941275) 2 0.886
Coeficientes Menor
Variable Cii Sbi Tci P: 0.975
Regresión ii
OBJETIVO:
Desarrollar diseños experimentales
Ejemplos:
La cantidad de reactivo aplicable a un proceso
Una nueva marca de materia prima
Un nuevo método de trabajo
Un nuevo equipo de trabajo
Índice Modelos Siguiente
CONCEPTOS
UNIDAD EXPERIMENTAL (UE): Es aquella a la
que se aplica el tratamiento en estudio, en un
experimento.
Índice Siguiente
MODELOS DE DISEÑOS
EXPERIMENTALES
Diseño completamente al azar
Diseño por bloques al azar
Diseño cuadrado latino
Diseño greco latino
Diseños factoriales
BLOQUES
El objetivo de la AC es
D A C C
eliminar varias fuentes F
de error; por ejemplo I B D B A
la antigüedad, marca, L
D C B D
vida útil de las A
maquinas. S
A B C A
TÍTULO
“Supresión del desarrollo de microbios en
la carne mediante aplicación de gases”
Pasos para
resolver el OBTENER COEFICIENTES DE REGRESION Y EL
MODELO DE PRONOSTICO
Problema
ESTIMAR VALORES
OBTENER COEFICIENTES
CORRELACION Y DETERMINAC.
EFECTUAR ANALISIS
VARIANZA Y PRUEBA T
Índice Siguiente
DESCRIPCIÓN DEL PROBLEMA 1
La vida de anaquel de las carnes almacenadas en
los supermarkets, es el tiempo que un corte
previamente empacado, es sano, nutritivo y
vendible.
Índice
OBJETIVO GENERAL INVESTIGACIÓN
TOTAL DE UNIDADES
EXPERIMENTALES: 12 cortes de carne
Índice Archivo Siguiente
ALEATORIZACION DEL
TRATAMIENTO
El diseño totalmente aleatorizado evita la asignación
subjetiva de tratamientos a los cortes de carne.
Son 4 condiciones de empaque y a cada condición se le
asigna 3 replicas, totalizando 12 muestras. Los pasos para
la aleatorización son los siguientes:
Paso 1: Numerar del 1 al 12 a las unidades experimentales
(cortes de carne)
Paso 2: Obtener de una tabla de números aleatorios de
dos dígitos, 12 números que estén entre el 01 y 12.
Paso 3: Asignar los 3 primeros cortes (6, 11, 10) al
tratamiento A, los siguientes tres cortes (3, 8, 4) al
tratamiento B y así sucesivamente
Índice Archivo Siguiente
CONTROL LOCAL
Los empaques con aire del ambiente sirven
como tratamiento de control porque es
estándar y se puede comparar con los
nuevos empaques.
VARIACION SC GL CM Fc Decisión
Índice Archivo
INTERPRETACIÓN PRUEBA F
OBJETIVO:
Efectuar análisis multivariante de
un conjuntos de datos históricos
Índice Siguiente
Técnicas Multivariantes
Análisis Cluster
Análisis Factorial
Análisis conjunto
Análisis de
Correspondencias
Índice Siguiente
ANÁLISIS CLUSTER
Es una modalidad del
Análisis Multivariante,
que permite clasificar a
los objetos, en un número
pequeño de grupos
relativamente
homogéneos, llamados
conglomerados.
Los objetos en cada
grupo tienden a ser
similares entre si y
diferentes a los objetos
de otros grupos.
Índice Siguiente
ANÁLISIS CLUSTER 2
Índice Siguiente
ANÁLISIS FACTORIAL
Índice Siguiente
UTILIDAD ANÁLISIS FACTORIAL
Malhotra (1997):
MATRIZ DE CORRELACIONES.
EXTRACCIÓN DE FACTORES INICIALES.
ROTACIÓN DE LOS FACTORES INICIALES.
Índice Aplicación
PASOS PARA REALIZAR UN
ANÁLISIS FACTORIAL 1
ELABORACIÓN DE LA MATRIZ DE
CORRELACIONES.
Índice
Análisis de Correspondencias
Es un caso particular del análisis factorial de
componentes principales, que se diferencia
en lo siguiente:
Esta orientado al análisis geométrico de la
dependencia entre variables.
Es apropiado para el tratamiento de
variables cualitativas tipo nominales.
Analiza las relaciones entre dos conjuntos
de variables: uno de objetos y el otro suele
ser atributos o características
Índice Siguiente
ANALISIS CORRESPONDENCIA
Índice
Aplicación a la Ingeniería:
Segmentación del mercado de
pantalones Jean
Índice Siguiente
MATRIZ DE CORRELACIONES
V1 V2 V3 V4 V5 V6 V7
Índice
Gráfico de Sedimentación
Scree Plot
3.0
2.5
2.0
1.5
1.0
.5
0.0
1 2 3 4 5 6 7
Component Number
Índice
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared
Loadings
Compone Total % of Cumulati Total % of Cumulati
nt Variance ve % Variance ve %
1 2.485 35.505 35.505 2.485 35.505 35.505
2 1.821 26.013 61.518 1.821 26.013 61.518
3 1.339 19.131 80.649
Índice
Rotated Component Matrix
Component
Variable Var 1 2
Bajo precio V1 0.894 -0.109
Buena calidad V2 4.630E-02 0.765
Facilidad pago V3 0.836 0.298
Aspecto juvenil V4 3.817E-04 -0.666
Rebajas V5 0.787 -0.277
Prenda duradera V6 -0.138 0.590
Diseño informal V7 -0.534 -0.575
Índice
Gráfico de dos Factores
Component Plot in Rotated Space
1.0
v2 BUENA CALIDAD
PRENDA DURADERA
v6
.5
FACILIDAD PAGO v3
0.0
BAJO PRECIO
v1
v5
REBAJAS
-.5 v7
v4
DISEÑO INFORMAL JUVENIL
-1.0
-1.0 -.5 0.0 .5 1.0
Component 1
Índice Siguiente
Gráfico de tres Factores
Component Plot in Rotated Space
1.0 juvenil
diseño informal
.5 rebajas
prenda duradera
bajo precio
Component 2 0.0
buena calidad
facilidad pago
-.5
1.0 1.0
.5 .5
0.0 0.0
-.5 -.5
Component 1 Component 3
Índice
Gráfico de cuatro Factores
Índice
CONCLUSIONES
El Análisis Factorial es una de las técnicas más complejas de la
Investigación de Mercados, que gracias a la informática, puede
ser aplicada actualmente con relativa facilidad.
Como conclusión teórica, se cita a Namakforoosh (1995)
respecto del Análisis Factorial: Reduce la multiplicidad de
pruebas y medidas hasta lograr una sencillez notable. Indica
qué pruebas y medidas pertenecen al mismo grupo, y cuáles
miden prácticamente lo mismo.
Por tanto, reduce el número de variables y ayuda a localizar e
identificar las unidades, para aplicar las pruebas.
Como conclusión empírica; de siete variables iniciales, han
quedado reducidas a tres factores: “economía”, “calidad” y
“juvenil”; produciéndose la pérdida de sólo el 19.13% de la
información original de las 7 variables iniciales.
Por tanto, puede aplicarse una encuesta de sólo 3 ó 4 items, por
ejemplo: a) Que sea económico; b) Que sea de calidad; c) Que
sea juvenil; opcionalmente d) Que sea informal.
Índice Siguiente
BIBLIOGRAFÍA
POLO MIRANDA “Estadística Multivarable”. 4ta Edición. Edic.
Universidad Politécnica Catalunya. España 2005.
HAIR, TATHAN, BLACK "Análisis Multivariante", Editorial Prentice
Hall – 4ta. edición, 2000.
MALHOTRA NARESH” Investigación de Mercado: Un enfoque
practico” Prentice Hall. México
ZIKMUND WILLIAM. “ Investigación de Mercado”. Editorial Prentice
Hall. México 1998.
DAMODAR GUJARATI, "Econometría", 4ta Edición. Editorial Mc
Graw Hill. México, 2004.
RICHARD LEVIN, RUBIN D. “Estadística para Administración y
Economía”. Prentice Hall. 7ma edición. México, 2004.
MASON R, LIND D, MARCHAL. “Estadística para Administración y
Economía”. Alfaomega Grupo Editor. 10ma edición. Colombia, 2003.
CATENA A., RAMOS M. Análisis Multivariado, Un manual para
investigadores. Editorial Biblioteca Nueva. 2003 - España.
DANIEL PEÑA. Análisis de Datos Multivariantes. Editorial McGraw Hill
2002. España.
Índice