Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ÍNDICE
Índice 1
Introducción 2
Aplicación Práctica
Estimación de coeficientes
Aplicación Práctica
Conclusiones
Bibliografía
1
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
INTRODUCCIÓN
2
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
Las suposiciones que se realizan al aplicar las técnicas de regresión lineal son:
• El modelo propuesto es lineal (es decir existe relación entre la variable explicativa y
la variable explicada, y esta relación es lineal). Es decir se asume que:
Para estudiar la validez del modelo es necesario confirmar estas hipótesis mediante el
estudio de los residuos (valores observados - valores predichos): normalidad,
tendencias, etc. Cuando no se cumplen los criterios de aplicación es necesario realizar
transformaciones a las variables, o bien para obtener una relación lineal o bien para
homogeneizar la varianza.
• La independencia de la recta
• La localización de la recta en algún punto. Una ecuación lineal tiene la forma:
3
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
Y´= a + Bx
Donde:
Con esta expresión se hace referencia al proceso matemático que sirve para
ajustar una línea recta a través de un conjunto de datos bivariables asentados en una
gráfica de dispersión. Dicha línea se conoce como línea de regresión simple.
y = βo + x β 1 + ε
Para un valor dado de X, por ejemplo, X1, habrá una diferencia entre el valor Y1
y el correspondiente valor de la curva C. Esta diferencia se denota por D1, que se
conoce como desviación, error o residuo.
4
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
De todas las curvas de aproximación a una serie de datos puntuales la curva que
tiene la propiedad de que: D21 + D22 + . . . + D2N Se conoce como Mejor curva de
ajuste
(XN,YN)
DN
C
(X1,Y1)
D1
(X2,Y2)
D2
X1 X2 XN
Si la SCF es cero, implica que los puntos caen exactamente sobre la línea. Por el
contrario entre más grande es SCF respecto de cero, menor es el ajuste. La recta que
tenga una suma de cuadrados menor para un conjunto de puntos, que cualquier otra
línea recta es la línea recta llamada línea de regresión de los mínimos cuadrados.
(X1, Y1)
(X2, Y2)
...
(XN, YN)
De forma que se minimice el error. Las etapas en que se divide el proceso que
se va a desarrollar son de forma esquemática, las que siguen:
5
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
∑ yi − m∑i =1 xi
n n
Ordenada al origen
a= i =1
n
B=
n∑i =1 xi − (∑i =1 xi )
Pendiente de la recta n n
6
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
DIAGRAMA DE DISPERSIÓN
Gráfico de dispersión
7
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
CORRELACION
Si todos los puntos parecen estar cerca de alguna curva, la correlación se dice
no lineal y una ecuación no lineal es la apropiada para la regresión o estimación. Es
evidente que una correlación no lineal puede ser a veces positiva y a veces negativa.
Si no hay ninguna relación entre las variables, como la figura 1(c), se dice que no
hay correlación entre ellas, es decir, no están correlacionadas.
8
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
Y Y Y
X X X
(a) Correlación lineal positiva (b) Correlación lineal negativa (c) No hay correlación
Figura 1
Medidas de correlación
Una forma de determinar de una manera cualitativa, lo bien que una recta o
curva dada describe la relación entre variables es la observación directa del diagrama
de dispersión. Por ejemplo se ve que para los datos de la fig.-1(a) la recta representada
describe mucho mejor la relación entre “X” y “Y” que la de la fig.-1(b) lo hace para los
suyos, debido al hecho de que hay menos dispersión alrededor de la recta de la fig.1(a).
2
Σ(Y - Y est. )
s Y.X =
N
Y - Y )2
La variación total de Y se define como: Σ(
es decir, la suma de los cuadrados de las desviaciones de los valores de Y de su media Y
lo cual puede escribirse como:
9
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
2 2 2
Σ(Y - Y ) = Σ(Y - Y est. ) + Σ(Y est. - Y )
Coeficiente de correlación
y varía entre -1 y +1, los signos ± se utilizan para la correlación lineal positiva y la
correlación lineal negativa, respectivamente. Nótese que r es una cantidad sin
dimensiones, es decir, no depende de las unidades empleadas. De esta manera un
valor de r igual a +1 implica una relación lineal perfecta con una pendiente positiva,
mientras que un valor de r igual a -1 resulta de una relación lineal perfecta con
pendiente negativa. Se puede decir entonces que las estimaciones muestrales de r
cercanas a la unidad en magnitud implican una buena correlación o una asociación
lineal entre X y Y, mientras que valores cercanos a cero indican poca o ninguna
correlación.
S2Y .X
r = 1-
S 2Y
10
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
11
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
APLICACIÓN PRÁCTICA
Conocimiento Teórico.-
12
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
DIAGRAMA DE DISPERSIÓN
350
y = 0.7447x + 72.842
300
250
Tiempo de secado
200
150
100
50
0
0 50 100 150 200 250 300
Gramaje
Parameter
Estímate Error P-Value
Intercept 72.8425 15.6932 0.0001
Slope 0.744722 0.0862982 0.0000
Análisis de Resultados
Software Statgraphic
14
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
La regresión múltiple comprende tres o más variables. Existe solo una variable
dependiente, pero hay dos o más de tipo independiente. En esta operación se
desarrolla una ecuación la cual se puede utilizar para predecir valore de y, respecto a
valores dados de la diferencia de variables independientes adicionales a través de
incrementar la capacidad predicativa sobre la de la regresión lineal simple.
Aunque hay muchos problemas en los cuales una variable puede predecirse con
bastante exactitud en términos de otra, parece razonable que las predicciones deban
mejorar si adicionalmente se considera información relevante.
Donde:
15
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
∑ X 1i +b1 ∑i =1 X 1i +b2 ∑i =1 X 2i + . . . + bk ∑i =1 X 1 XK = ∑
n n n n n
bo i =1 i =1
XiYi
16
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
CORRELACION MULTIPLE
Esta ecuación se llama ecuación de regresión lineal de X1 sobre X2 y X3; con b1.23,
b12.3, y b13.2 los coeficientes de regresión parcial de acuerdo a la teoría de regresión
múltiple. Como observamos, tenemos una variable dependiente X1 y dos variables
independientes X2 y X3.
17
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
s 21.23
R 1.23 = 1-
s 21
18
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
19
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
APLICACIÓN PRÁCTICA
L IN E A S P O R P U L G A D A
G a n a n c ia d e
L in e a tu r a s L in e a tu r a s L in e a tu r a s L in e a tu ra s
p u n to Y 1
N eg ro X 1 M a g e n ta X 2 C yan X3 Y e llo w X 4
%
75 85 90 95 7 .5
90 89 128 150 25
90 85 89 96 7 .5
165 135 140 150 30
100 95 120 100 25
125 165 185 100 30
128 150 140 110 25
100 125 200 160 30
110 130 210 210 30
115 125 128 130 25
120 190 200 169 30
180 160 190 200 30
250 189 220 200 40
140 200 250 280 42
280 250 200 240 43
300 320 290 260 45
350 290 280 290 49
300 320 350 300 50
320 350 360 320 50
310 350 320 310 50
Conocimiento Teórico.-
La definición de ganancia de punto trata del incremento en los valores tonales del punto
de trama (es decir, la superficie relativa que ocupa en la trama) que experimenta en los
diversos procesos gráficos por los que atraviesa
20
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
Parameter
Estímate Error P-Value
CONSTANT 3.711982 3.06246 0.2433
Negro 0.0510435 0.0341314 0.1555
Magenta -0.0224212 0.0518854 0.6718
Cyan 0.0870096 0.0503742 0.1046
Yellow 0.0343141 0.0404302 0.4094
Análisis de Resultados
La ecuación del modelo establece la relación entre la ganancia de punto y las lineaturas
de trama del PMS.
c) El coeficiente de correlación igual a 0.94403 indica una relación fuerte entre las
variables.
21
Estadística Aplicada
B REGRESIÓN Y CORRELACIÓN LINEAL
CONCLUSIONES
Por otro lado, Al ajustar un modelo de regresión simple o múltiple a una nube de
observaciones es importante disponer de alguna medida que permita medir la bondad
del ajuste. Esto se consigue con los coeficientes de correlación. Si el modelo que se
ajusta es un modelo de regresión lineal, a R se le denomina coeficiente de
correlación y representa el porcentaje de variabilidad de la Y que explica el modelo de
regresión.
BIBLIOGRAFÍA
23
Estadística Aplicada