Está en la página 1de 29

MATERIA:

Diseño de Experimentos II
PROFESOR:
Ing. Yerab Vidaurrazaga López
TEMA:
Análisis de Regresión Lineal
ALUMNOS:
Carlos A. Campos G. Daniel A. Serrano D
Ramón M. Carmona R.
Ñ O L
I S E R I A
D CTO
I F A
U N
ANÁLISIS DE REGRESIÓN LINEAL
DISEÑO UNIFACTORIAL:

Se caracterizan porque estudian el


influjo de una sola variable
independiente sobre una variable
dependiente en dos o más grupos
equivalentes, donde se manipula la
variable independiente y mínimo debe
tener dos valores.

Una variable explicativa cualitativa se llama factor. Los valores


que toma se llaman niveles. En este modelo los niveles son los
distintos tratamientos que aplicamos a las unidades
experimentales

ANÁLISIS DE REGRESIÓN LINEAL


EJEMPLO DE UN DISEÑO UNIFACTORIAL:
En el desarrollo de un nuevo producto alimenticio se desea comparar el
efecto del tipo de envase sobre la vida de anaquel del producto. Para ello
existen tres tipos de envases: Envase A, Envase B, y Envase C. En el
experimento se realizaron 10 replicas en cada tipo de envase y al final se
mide los días de duración del producto. Los datos obtenidos se muestran en
la tabla

En el ejemplo, podemos ver que:


LA VARIABLE DE RESPUESTA: Días de duración del producto alimenticio.
EL FACTOR CONTROLADO: Tipo de envase (se tienen tres variantes).
LOS NIVELES DEL FACTOR: 3 Tipos de envase

ANÁLISIS DE REGRESIÓN LINEAL


MODELO MATEMÁTICO O MODELO ESTADISTICO:

 El modelo matemático del diseño unifactorial se expresa así,

Yij=

Donde Yij es días de duración;

media global o media general;

= efecto del factor o efecto del tipo de envase;

error aleatorio.

ANÁLISIS DE REGRESIÓN LINEAL


HIPOTESIS DEL EXPERIMENTO:

El planteamiento estadístico corresponde al contrastar las


siguientes Hipótesis:

Hipótesis Nula:

H0: No influye el tipo de envase en la duración de un


producto alimenticio.

Hipótesis Alternativa:

Ha: El tipo de envase influye en la duración de un producto


alimenticio

ANÁLISIS DE REGRESIÓN LINEAL


ANALISIS ESTADISTICO DEL DISEÑO DE UN SOLO
FACTOR (ANOVA):

El Análisis de Varianza
(ANOVA) es una técnica
estadística muy poderosa para
el estudio del efecto de uno o
más factores sobre la media
de una variable (y la varianza
de la variable).

La Idea básica es descomponer la variabilidad total observada


de los datos en dos partes; una debido a las diferencias de los
tratamientos y otra debido a un error aleatorio.

ANÁLISIS DE REGRESIÓN LINEAL


DESCOMPOSICIÓN DE LA SUMA TOTAL DE CUADRADOS
(DESCOMPOSICIÓN DE LA VARIABILIDAD):
La variabilidad total de los datos se obtiene mediante la Suma de
Cuadrados Totales (SC TOTALES), el cual a su vez se descompone en
dos elementos:
1. La Suma de Cuadrados de Tratamientos (SC TRATAMIENTOS),
2. La Suma de Cuadrados del Error (SC error).
Considerando los datos del ejemplo,

Suma de Cuadrados Total (SCTOTAL): mide la variabilidad total en


los datos, y matemáticamente se obtiene así,
Donde el 38.53 es el promedio general de los treinta datos.
2 2 2
(23-38.53) +(34-38.53) + ...... +(34-38.53) = 2409.5
Los Grados de libertad totales, se obtienen restándole uno al total
de los datos (30-1=29).

ANÁLISIS DE REGRESIÓN LINEAL


Suma de Cuadrados de Tratamientos (SC TRATAMIENTOS): mide la
variabilidad en los datos asociada a los tratamientos, que en este
caso seria asociada a cada tipo de envase, su cálculo se efectúa de la
siguiente manera:
10x (31-38.53) 2+ 10x (41.3-38.53)2+ 10x (43.3-38.53) 2 = 871.3
Donde el 10 representa el numero de replicas por tratamiento (o tipo de
envase)
 31 es el promedio del envase A.
 41.3 es el promedio del envase B.
 43.3 es el promedio del envase C.
 38.53 es el promedio general de los 30 datos.

Los grados de libertad son el numero de tratamientos menos uno, es decir


cada tipo de envase es un tratamiento por consiguiente son 3 le restamos
uno y obtenemos dos grados de libertad (3-1= 2).

ANÁLISIS DE REGRESIÓN LINEAL


Suma de Cuadrados Del Error (SC ERROR): mide la variabilidad que
no es debida a las diferencias entre tipo de envase o tratamientos es
la variabilidad interna en los tratamientos o envases, en esta
variabilidad se incluye la variabilidad de errores de medición, de
experimentador o cualquier fuente externa al experimento. Los
cálculos se efectúan de la siguiente manera:
2 2 2 2 2
(23-31) +….+(36-31) +(35-41.3) +…+(52-41.3) +(50-43.3) + ... + (34-
2
43.3) = 1538.2

El calculo de sus grados de libertad son el total de datos menos el


numero de tratamientos, en este caso, es (30-3) = 27.

Finamente, notemos que SC TOTAL= SC TRATAMIENTO + SC


RESIDUAL, es decir
2409.5 = 871.3 + 1538.2

ANÁLISIS DE REGRESIÓN LINEAL


CUADRADOS MEDIOS:

Una vez obtenidos las sumas de cuadrados se procede a obtener los


cuadrados medios, el primero es el Cuadrado Medio de los Tratamientos
(CM TRATAMIENTOS), el cual se obtiene dividiendo la SCTRATAMIENTOS
entre sus grados de libertad, como se muestra a continuación:

CM tratamientos= SC tratamientos = 871.3 = 435.65


a–1 2
Donde a es el numero de tratamientos o envases.
El segundo es el Cuadrado Medio del Error (CMerror), que se obtiene
dividiendo la suma de cuadrados del error entre sus grados de libertad, su
cálculo se efectúa así:
CM error= SC error = 1538.2 = 56.97
n–a 27
Donde N es el total de datos y a es el numero de tratamientos.

ANÁLISIS DE REGRESIÓN LINEAL


OBTENCIÓN DE LA F CALCULADA O DE LA FO:

La F-calculada o la F0, se obtiene al dividir el cuadrado medio del


tratamiento entre el cuadrado medio del error, como se muestra a
continuación,
Fo= CMtratamiento = 435.65 = 7.96
CM error 56.97

ANÁLISIS DE REGRESIÓN LINEAL


OBTENCIÓN DE LA F CALCULADA O DE LA FO:

En las tablas de la distribución F de Fisher (apéndice) podemos ver


que para un ∝=0.05
  con 2 grados de libertad en el numerador y
27 grados de libertad en el denominador se tiene que el valor de la
F(tablas) es 3.35.

COMPARACIÓN DE LA FO CON LA F (TABLAS):


Si el valor de la Fo es mayor que el valor de la F(tablas) entonces se
rechaza la hipótesis nula, en los resultados se puede ver que
Fo=7.647>F(tablas)=3.35, se concluye que si hay diferencias en los
tipos de envase.

En otras palabras el tipo de envase si influye en la duración de un


producto alimenticio. Todos los resultados anteriores se pueden ver
en la siguiente tabla, llamada Tabla de Análisis de Varianza.

ANÁLISIS DE REGRESIÓN LINEAL


OBTENCIÓN DE LA F CALCULADA O DE LA FO:

En las tablas de la distribución F de Fisher (apéndice) podemos ver


que para un ∝=0.05
  con 2 grados de libertad en el numerador y
27 grados de libertad en el denominador se tiene que el valor de la
F(tablas) es 3.35.

COMPARACIÓN DE LA FO CON LA F (TABLAS):


Si el valor de la Fo es mayor que el valor de la F(tablas) entonces se
rechaza la hipótesis nula, en los resultados se puede ver que
Fo=7.647>F(tablas)=3.35, entonces podemos concluir que si
existen diferencias en los tipos de envase.

En otras palabras el tipo de envase si influye en la duración de un


producto alimenticio. Todos los resultados anteriores se pueden ver
en la siguiente tabla, llamada Tabla de Análisis de Varianza.

ANÁLISIS DE REGRESIÓN LINEAL


TABLA DE ANALISIS DE VARIANZA (ANOVA):

FUENTE SUMA DE G.L. CUADRADO RAZÓN- F VALOR-P


CUADRADOS MEDIO

Efectos P(F= 7.65)


Principales

A- Envase 871.267 2 435.633 7.65 0.0023

Residuos 1538.2 27 56.9704

Total 2409.47 29
(Corregido)

ANÁLISIS DE REGRESIÓN LINEAL


ZA
I A N
A R
OV
C
ANÁLISIS DE REGRESIÓN LINEAL
¿QUÉ ES COVARIANZA?:
Una medida del grado en que dos variables aleatorias se
mueven en la misma dirección o en direcciones opuestas la
una respecto a la otra.
Una covarianza positiva es
cuando, dos variables aleatorias
generalmente se mueven en la
misma dirección.

Si tienden a moverse en
direcciones opuestas, se dirá
que tienen una covarianza
negativa.

ANÁLISIS DE REGRESIÓN LINEAL


USOS DE ANÁLISIS DE COVARIANZA:

Los usos más importantes del análisis de la covarianza son:


1. Para controlar el error y aumentar la precisión.

2. Ajustar medias de tratamientos de la variable


dependiente a las diferencias en conjuntos de valores de
variables independientes correspondientes.

3. Interpretación de la naturaleza de los efectos de los


tratamientos.

4. Dividir una covarianza total o suma de productos


cruzados en componentes.

ANÁLISIS DE REGRESIÓN LINEAL


EJEMPLO DE COVARIANZA:

MEDICINA: Hipertensión en
pacientes obesos
En un Centro de Salud hacen el seguimiento de la tensión
arterial a sus pacientes y los resultados constatan que aquellos
que tienen sobrepeso, tienen una presión arterial superior a la
media.

Vamos a ver los datos y a calcular la covarianza de este


estudio. Para simplificar los cálculos, tomaremos una muestra
de 10 pacientes.

ANÁLISIS DE REGRESIÓN LINEAL


DATOS:
X= Peso (kg) 72 76 78 81 89 95 108 115 120 130

Y= Presión sistólica 115 121 125 130 141 150 165 170 177 178
(mm Hg)

En este caso tenemos que el número de datos totales es


N= 10

Para calcular la covarianza necesitamos:


 Las medias marginales de X y Y.
 El producto de cada Xi y Yi.

Para poder realizar los cálculos con mayor comodidad,


utilizaremos la siguientes tabla:

ANÁLISIS DE REGRESIÓN LINEAL


Peso (kg) Presión (mm Hg) Peso * Presión
72 115 8280
76 121 9196
78 125 9750
81 130 10530
89 141 12549
95 150 14250
108 165 17820
115 170 19550
120 177 21240
130 178 23140
964 1472 146305

Aquí, multiplicamos
Sumaremos toda la_ Sumaremos toda la_
entre columnas y
columna para sacar X columna para sacar Y
sumamos el total

ANÁLISIS DE REGRESIÓN LINEAL


Peso (kg) Presión Peso *
(mm/Hg) Presión  Media del peso:
72 115 8280
_
76 121 9196   X
= 964 = 96.4
78 125 9750
N 10
81 130 10530
89 141 12549
95 150 14250  Media de la presión:
108 165 17820 _
115 170 19550   Y
= 1472 = 147.2
120 177 21240 N 10
130 178 23140
964 1472 146305

COVARIANZA:   XY - x y_ _= 146305 - 96.4 * 147.5=


N 10
= 14630.5 – 14190.08= 440.42

ANÁLISIS DE REGRESIÓN LINEAL


La Covarianza es positiva, luego la correlación es directa
como podemos comprobar en el siguiente gráfico
Peso Presión Peso * Peso^2 Presión^
(kg)
Xi
(mm/Hg
Yi
Presión 2
 Desviación típica del peso:
72 115 8280 5184 13225 ______________
2
  96740
________ - (96.4) = 19.52
76 121 9196 5776 14641
78 125 9750 6084 15625
10
81 130 10530 6561 16900
89 141 12549 7921 19881
 Desviación típica de la presión:
______________
2
95 150 14250 9025 22500   ________ - (147.2) =22.87
108 165 17820 11664 27225 10
115 170 19550 13225 28900
120 177 21240 14400 31329  Coeficiente de correlación lineal:
130 178 23140 16900 31684 r = _________
440.42 = 0.9865
964 1472 146305 96740 221910 19.52 * 22.87

ANÁLISIS DE REGRESIÓN LINEAL


La Covarianza es positiva, luego la correlación es directa
como podemos comprobar en el siguiente gráfico

ANÁLISIS DE REGRESIÓN LINEAL


ES
I O N
AC
L IC L A
A P E
D SI Ó N
R E L
E G A
R IN E
L
ANÁLISIS DE REGRESIÓN LINEAL
El modelo de regresión lineal es aplicado en un gran número
de campos, desde el ámbito científico hasta el ámbito social,
pasando por aplicaciones industriales ya que en multitud de
situaciones se encuentran comportamientos lineales. Estos
son algunos ejemplos aplicados a diversos campos:.
Química
La concentración de un elemento es uno de
los parámetros de mayor importancia en los
procesos químicos aplicados en la industria.

Para ello se elabora una recta de calibración


que se obtiene a partir de la correlación
entre la absorbancia de un patrón y la
concentración de la sustancia a controlar.

APLICACIONES DE LA REGRESIÓN LINEAL


Mecánica
En esta rama se utiliza la Regresión Lineal
entre otros para ajustar la recta de Paris ,
una ecuación que sirve para estudiar
elementos sometidos a fatiga en función del
número de ciclos a los que se somete un
material.
Electricidad
Se puede obtener el valor de una resistencia
en un circuito y su error mediante un ajuste
de regresión lineal de pares de datos
experimentales de voltaje e intensidad
obtenidos mediante un voltímetro y un
amperímetro.

APLICACIONES DE LA REGRESIÓN LINEAL


Sensores
Calibración de un sensor de temperatura
(termopar). Se calibra el sensor y
simultáneamente se mide la variación de
temperaturas en un líquido para representar
los datos obtenidos posteriormente
mediante Regresión Lineal.

Construcción
Mediante técnicas de regresión lineal se
caracterizarán diversas cualidades del
concreto. A partir del módulo de elasticidad
es posible predecir la resistencia a la
comprensión de una determinada
composición de un concreto.

APLICACIONES DE LA REGRESIÓN LINEAL


i a s
ra c
¡G r su !
o
P ción
te n
A
ANÁLISIS DE REGRESIÓN LINEAL

También podría gustarte