Está en la página 1de 30

CLASIFICACIÓN DE LAS VARIABLES

Las variables se clasifican según:

1. Su Naturaleza

2. Su Escala de Medida

3. Su Número Y = Variable
Dependiente o
Respuesta
4. Su Relación entre ellas
X 1, … X k = Variables
Independientes
El objetivo de muchas investigaciones científicas es comprender y explicar
las relaciones entre variables.

Frecuentemente, se requiere conocer como y en que medida una variable


de respuesta (Y) se relaciona con una o un grupo de variables
independientes ( X1, X2, …, X k).
EL ANÁLISIS DE REGRESIÓN es una técnica
estadística para el modelamiento y la investigación
de la relación entre dos o más variables.
La palabra “Regresión” fue usada por primera vez por
Francis Galton ( 1822 – 1911) en sus estudios biológico de
la Herencia, refiriéndose a la “ley de la regresión universal

“Cada peculiaridad en un hombre es


compartida por sus descendientes,
pero en media, en un grado menor.”
Francis Galton
•Primo de Darwin
•Estadístico y aventurero
•Fundador (con otros) de
la estadística moderna
para explicar las teorías
de Darwin.
REGRESIÓN : El análisis de regresión es útil –
para averiguar la forma probable de las
relaciones entre las variables, y el objetivo final,
cuando se emplea este método de análisis, es
predecir o estimar el valor de una variable que
corresponde al valor dado de otra variable.

CORRELACIÓN: El análisis de correlación se refiere a la


intensidad de la relación entre variables. Cuando se calculan las
mediciones de correlación a partir de un conjunto de datos, el
interés recae en el grado de correlación entre las variable,
calculado con el coeficiente de correlación.
ANALISIS DE REGRESION

Simple *
Lineal
Cuando la relación entre las
variables es de tipo lineal Múltiple **

Regresión

Simple *

No Lineal
Cuando la relación entre las
variables es de tipo nolineal Múltiple **
Analizaremos como más de una sola variable explicativa
podría utilizarse para predecir el valor de la variable
dependiente. Se considera cuanto más poderoso podría
volverse el modelo si se utilizaran más variables
explicativas
El modelo de regresión simple con una variable
independiente se expresa como:

El Modelo de
Regresión Simple
^
εi = Yi – Yi recibe el nombre de residuo.

Se estima el modelo utilizando los datos muestrales así:

El Modelo de Regresión
Simple Estimado
El modelo de regresión múltiple con k variable
independientes se expresa como:

El Modelo de
Regresión Múltiple

^
εi = Yi – Yi recibe el nombre de residuo.

Se estima el modelo utilizando los datos muestrales así:

El Modelo de Regresión
Múltiple Estimado
COEFICIENTE DE CORRELACIÓN Y
COEFICIENTE DE DETERMINACIÓN

Ahora que tenemos una comprensión general de la naturaleza de


la relación entre las variables, es conveniente medir la fuerza de ésta
relación.

La medida de la fuerza viene dada por el Coeficiente de


Correlación.(R )

La medida del poder explicativo o ajuste del Modelo viene dada


por el Coeficiente de Determinación. (R 2)
COEFICIENTE DE CORRELACIÓN Y
COEFICIENTE DE DETERMINACIÓN
 R = +/- 1, Existe perfecta correlación positiva o negativa
 R + / - 1, Existe fuerte correlación positiva o negativa
 R + / - 0.8, Existe meritoria correlación positiva o negativa
 R + / - 0.5, Existe moderada correlación positiva o negativa
 R 0, Existe pobre o debil correlación positiva o negativa
 R = 0, No existe correlación entre las variables

i
CASO Nº 1

Uno de los problemas más desafiantes en el campo del control de la


contaminación del agua, lo presenta la industria del curtido de pieles. Los
desechos de las curtiembres son químicamente complejos. Se caracterizan por
los altos valores de demanda bioquímica de oxígeno, sólidos volátiles y otros.
Considérense los siguientes datos que se obtuvieron de 33 muestras de
desechos químicamente tratados en un estudio. Donde las variables son el
porcentaje de sólidos totales y el porcentaje de la demanda química de oxígeno
para las 33 muestras.
DATOS DEL CASO Nº 1

% Demanda % Demanda
Nº % de Sólidos química de Nº % de Sólidos química de
oxígeno oxígeno
1 3 5 18 36 34
2 7 11 19 37 36
3 11 21 20 38 38
4 15 16 21 39 37
5 18 16 22 39 36
6 27 28 23 39 45
7 29 27 24 40 39
8 30 25 25 41 41
9 30 35 26 41 41
10 31 30 27 42 40
11 31 40 28 42 44
12 32 32 29 43 37
13 33 34 30 44 44
14 33 32 31 45 46
15 34 34 32 46 46
16 36 37 33 47 49
17 36 38 34 50 51
PREGUNTAS DEL CASO Nº 1

a) Construya el modelo de regresiòn lineal simple para estimar el valor


del % de Demanda química de oxígeno a partir del % de Sólidos.

b) Utilizando el modelo pronostique el porcentaje de Demanda química


de oxígeno cuando el % de Sólidos es 35.

c) Interprete el grado de influencia o Contribuciòn de cada variable al


modelo.

d) Calcule e interprete R y R 2
CASO Nº1: REGRESION LINEAL SIMPLE
UTILIZANDO HOJA DE CALCULO

I. FASE OPERATIVA DEL CASO Nº 1


I. FASE OPERATIVA DEL CASO Nº 1
II. FASE RESULTADOS DEL CASO Nº 1
II. FASE RESULTADOS DEL CASO Nº 1
CASO Nº 2: REGRESION LINEAL SIMPLE

El procesamiento de carbon sin tratar implica el "lavado", en


donde se elimina la ceniza de carbòn( no organico, material
incombustible). Una revista proporciona los datos relacionados
con los porcentajes de ceniza y el volùmen de una partìcula de
carbòn. Se midieron los porcentajes promedio de ceniza para seis
volùmenes de partìculas de carbòn. Los datos son los siguientes:

Porcentaje de a) Construya el modelo de regresiòn lineal simple para


Volumen ( cm 3 )
ceniza estimar el valor del porcentaje de ceniza a partir del
0.01 3.32 volùmen de la partìcula
0.06 4.05
b) Utilizando el modelo pronostique el porcentaje de
0.58 5.69
ceniza para partìculas con un volùmen de 50 cm 3
2.24 7.06
15.55 8.17 c) Interprete el grado de influencia del modelo.
276.02 9.36 Contribuciòn de cada variable al modelo.
d ) Calcule e interprete R y R 2
CASO Nº 2: REGRESION LINEAL SIMPLE
II. FASE RESULTADOS
CASO Nº 3
El rendimiento de una reacción química (Y) depende de la
Concentración del reactivo ( X1) y de la temperatura de
operación.( X2) . Los datos obtenidos son los siguientes:
Y 81 89 83 91 79 87 84 90
X1 1 1 2 2 1 1 2 2
X2 150 180 150 180 150 180 150 180

a) Ajuste un modelo de regresión lineal múltiple a los datos.


b) Utilice la prueba t para evaluar la contribución al modelo de cada variable de
Regresión. Si se emplea α = 0.05 , Qué conclusiones se puede obtener?
c) Pruebe la significancia de la Regresión utilizando α = 0.05; ¿ Cuál es el valor P de
esta prueba?
d) Calcule e interprete R y R 2
e) Prediga el Rendimiento de la reacción química cuando la la Concentración del
reactivo X1 = 1 y la temperatura de operación X2 = 170
II. FASE RESULTADOS
III. FASE ANALITICA

a) La ecuación de regresión lineal múltiple del Rendimiento de una


Reacción Química es:

39.750 + 3.000 X1 + 0.250 X2


III. FASE ANALITICA
b) Interpretando coeficientes de Regresión y su significancia.

bo = 39.750, es el rendimiento de una reacción química


independientemente de la Concentración del reactivo ( X1) y de la
temperatura de operación.( X2)

b1 = 3.000, representa el incremento promedio del rendimiento de


una reacción química por cada variación unitaria de la Concentración
del reactivo (X1). Cuando la temperatura de operación (X2)
permanece constante. Individualmente tiene influencia significativa
sobre el rendimiento ( p = 0.01)

b2 = 0.250 , representa el incremento promedio del rendimiento de


una reacción química por cada variación unitaria de Temperatura de
operación ( X2). Cuando la Concentración del reactivo (X1)
permanece constante. Individualmente tiene influencia altamente
significativa sobre el rendimiento ( p = 0.000)
III. FASE ANALITICA

c) Pruebe la significancia de la Regresión utilizando α = 0.05; ¿ Cuál


es el valor P de esta prueba? Interpretando el cuadro ANVA

d) Calcule e interprete R y R 2

R = 0.980, nos indica que existe elevada correlación entre las variables
R2 % = 0.960 nos indica que el 96.0 % de la variabilidad de la reacción
química es como consecuencia de la variabilidad de la Concentración
del reactivo ( X1) y la temperatura de operación.( X2)
III. FASE ANALITICA

e) Prediga el Rendimiento de la reacción química cuando la


Concentración del reactivo X1 = 1 y la temperatura de operación
X2 = 170

39.75 + 3 * X1 + 0.25 * X2

39.75 + 3 * 1 + 0.25 * 170

85.25
CASO Nº 4
Se piensa que la potencia consumida por una planta química está relacionada
con la temperatura ambiente promedio ( X1), el número de días al mes ( X2), la
pureza producto del producto ( X3), y las toneladas del producto producidas (X4).
Los datos correspondientes al año pasado son:

Y 240 236 290 274 301 316 300 296 267 276 288 261
X1 25 31 45 60 65 72 80 84 75 60 50 38
X2 24 21 24 25 25 26 25 25 24 25 25 23
X3 91 90 88 87 91 94 87 86 88 91 90 89
X4 100 95 110 88 34 99 97 96 110 105 100 98

a) Ajuste un modelo de regresión lineal múltiple a los datos.


b) Prediga el consumo de de potencia para un mes en el que X1 = 75 º F, X2 = 24 dias, X3 = 90% y
X4 = 98 toneladas.
c) Pruebe la significancia de la Regresión utilizando α = 0.01; ¿ Cuál es el valor P de esta prueba?
d) Utilice la prueba t para evaluar la contribución al modelo de cada variable de Regresión. Si se
emplea α = 0.01 , Qué conclusiones se puede obtener?
e) Calcule e interprete R y R 2
FASE RESULTADOS

También podría gustarte