Está en la página 1de 3

En esta unidad se tratará el modelo de regresión lineal simple y se ilustrará con el

siguiente ejemplo:
Ejemplo 1. En una curva de calibración, la densidad óptica varía dependiendo de
la concentración de biomasa, como se muestra en la tabla 1.

Tabla 1. Análisis de regresión lineal para la densidad óptica


como una función de la concentración de biomasa.

Concentración (x) Densidad óptica (%Trasmitancia) (y)


1 4
2 9
4 18
5 20
8 35
10 41
12 47
15 60

Para el análisis de una situación de relación entre dos variables se debe:


1. Identificar la variable independendiente y la variable dependiente: En este caso
la variable dependiente es la densidad óptica (y) y la variable independiente es
concentración (x).
2. Determinar si existe una relación de dependencia razonable. En la situación
presentada puede observarse que en la realidad estas dos características
(concentración de biomasa y densidad óptica) presentan una relación lógica. Se ha
encontrado que la densidad óptica depende de la concentración de biomasa.
Para determinar de manera inicial la relación lineal entre las dos variables se debe
elaborar un diagrama de dispersión, como el que aparece en la figura 4.
Figura 4. Gráfico de dispersión para los valores observados y pronosticados.

De acuerdo al gráfico de dispersión se puede asumir que existe una relación lineal
y se requiere la línea recta que mejor se ajuste a los datos experimentales.
3. Determinar el modelo estadístico :Como la densidad óptica parece aumentar a
medida que aumenta la concentración entonces se debe sugerir un modelo lineal
dado por:

y i = β o + β 1x i + ε ij i = 1, 2, ..., 8

Donde y i es el valor observado en este caso la densidad óptica para un valor de


concentración x, β o corresponde al intercepto de y con la línea de regresión y β 1
representa el valor medio de densidad óptica para un valor determinado de
concentración llamada pendiente de la línea de regresión o coeficiente de regresión,
x es el valor de la concentración, que se asume, es medida sin error.y ε ij es la
variable aleatoria error.
Para poder utilizar este modelo , se asume que las variables error ε ij cumplen los
suguientes supuestos:
( i ) Normales con media cero
( ii ) Independientes
( iii ) Con igual varianza σ 2.
Estos supuesto deben validarse.

4. Determinar la ecuación de regresión o modelo ajustado: El modelo predicho


o ecuación de regresión ajustada es una expresión como la siguiente

ŷ i = β̂ o + β̂ 1x i

Para obtenerla usted debe encontrar los valores estimados de los parámetros: β̂ o y
β̂ 1. Éstos se obtienen aplicando el método de mínimos cuadrados.
El método de mímos cuadrado trata de buscar cual es la recta que más se acerca a
los puntos; es decir busca la recta que haga que la distancia entre el valor real y i y
el valor obtenido por la recta ajustada ŷ i sea la más pequeña y así, la suma de todas
estas distancias simbolizadas como:
n

∑( y − ŷ ) 2
Suma de cuadrados del error = SCE = i i
i=1
Sea la más pequeña. Como la mejor recta está determinada por β̂ o y β̂ 1 entonces
matemáticamente, se desea escoger los valores para β̂ o y β̂ 1 que minimicen la suma
de cuadrados del error.(si desea ver el procedimiento ver apendice teórico al final).
Para el ejemplo los valores estimados son:
β̂ o = 1.1931, corresponde al punto de intersección en el eje y o punto en el que la
recta corta al eje y y se interpreta como la respuesta mínima que se espera tener
para la variable y, es decir el mínimo valor de densidad óptica.
β̂ 1 = 3.9378, corresponde a la pendiente de la recta o coeficiente de regresión.
Como puede observarse en la gráfica la recta tuvo una inclinación ascendente de
izquierda a derecha, lo que es consistente con el valor obtenido de β̂ 1 que fué
positivo, por esto se concluye que tiene pendiente POSITIVA y puede decirse que
existe una relación lineal positiva entre la densidad óptica y la concentración (lo
cual se había detectado gráficamente). El valor de la pendiente significa que a
medida que aumente en una unidad la concentración de biomasa, la densidad óptica
promedio incrementará en 3.9378 unidades.
Al reemplazar en la ecuación de regresión los valores de los parámetros estimados
se tiene:

ŷ i = 1.1931 + 3.9378x i

5. Determinar si la ecuación de regresión es buena


Existen vaias maneras para determinar si se debe utilizar la ecuación de regresión
para predecir un valor o estimar unvalor medio para una valor dado x, entre esta
tenemos:
Métodos descriptivos como el coeficiente de correlación muestral, el coeficiente de
determinación.
Métodos objetivos com la prueba del coeficiente de regresión o prueba sobre la
pendiente ( o su equivalente la prueba del coeficiente de correlación) y la prueba de
falta de ajuste.

ENLACES
Applet de Regresión

También podría gustarte