Está en la página 1de 14

Actividad 1.

Mapa Mental

Resumir mediante un mapa mental las medidas estadísticas Bivariantes de regresión y

correlación.

El análisis de Covariables
El análisis de regresión es o variables Se usan como predictores o
regresión es
una herramienta de independien son variables de confusión
construir una
frecuente uso estadístico te que interesa controlar
función que
que permite investigar las
permita estimar el
relaciones entre diferentes
valor futuro de la
variables cuantitativas Atributos sobre los
variable de Variables
dependiente, el análisis de cuales se quieren medir
estudio. Permite
regresión es un proceso o dependien cambios o hacer
calcular un
modelo que analiza el te predicciones
promedio
vínculo entre una variable
condicional
dependiente y una o varias
variables independientes

Directa: Se da cuando al
Indica si existe relación entre aumentar una de las variables
dos eventos (Variables) sobre la otra aumenta, la recta es una
su naturaleza y su fuerza recta creciente.
MEDIDAS
ESTADÍSTICAS Inversa: Se da cuando al aumentar
BIVARIANTES DE una de las variables la otra disminuye,
REGRESIÓN Y la recta es decreciente
CORRELACIÓN
Tipos de
Nula: Se da cuando no hay dependencia
Correlac
entre las variables , se puede decir que
ión
las variables son incorreladas y la forma
La correlación se de puntos tiene una forma redondeada
refiere a que
exista un vínculo
entre varios Coeficiente de Correlación: Es medida por
eventos. Una de lo que se denomina coeficiente de
las herramientas correlación (r). Su valor numérico varía de
que nos permite 1.0 a -1.0 e indica la fuerza de relación. En
interferir si existe general, r>0 indica una relación positiva y
dicho vínculo es r<0 indica una relación negativa, mientras
que r=0 indica que no hay relación Fuerte: Cuanto más
justamente el cerca estén los puntos
análisis de de la recta
correlación

Débil: Cuanto más separados


estén los puntos de la recta
Grados de
Correlación
Nulo: No existe ningún
tipo de patrón entre
ellas.
Actividad 2. Definición de Conceptos.

Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:

❖ Diagrama de dispersión.

❖ Correlación lineal simple.

❖ Coeficiente de determinación R2

❖ Correlación positiva y correlación negativa

❖ ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

2.1. Diagrama de Dispersión: Los Diagramas de Dispersión o Gráficos de Correlación permiten

estudiar la relación entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlación

entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y

(Correlación positiva) o si cada vez que aumenta el valor de X disminuye en igual proporción el

valor de Y (Correlación negativa).

En un gráfico de correlación representamos cada par X, Y como un punto donde se cortan las

coordenadas de X e Y:

2.2. Correlación Lineal Simple: En estadística, la regresión lineal simple es un modelo de

regresión lineal con una única variable explicativa. Es decir, se trata de puntos de muestra de dos

dimensiones con una variable independiente y una variable dependiente (convencionalmente, la x

y Y coordenadas en un sistema cartesiano de coordenadas) y encuentra una función lineal (una

línea recta no vertical) que, con la mayor precisión posible, predice los valores de la variable
dependiente como una función de la variable independiente. El adjetivo simple se refiere al hecho

de que la variable de resultado está relacionada con un solo predictor.

Es común hacer la estipulación adicional de que se debe usar el método de mínimos cuadrados

ordinarios (MCO): la precisión de cada valor predicho se mide por su cuadrado residual

(distancia vertical entre el punto del conjunto de datos y la línea ajustada), y el objetivo es hacer

que la suma de estas desviaciones al cuadrado sea lo más pequeña posible. Otros métodos de

regresión que pueden usarse en lugar de mínimos cuadrados ordinarios incluyen las desviaciones

mínimas absolutas (minimizando la suma de valores absolutos de los residuos) y el estimador de

Theil-Sen (que elige una línea cuya pendiente es la mediana de las pendientes determinadas por

pares de puntos de muestra). Regresión de Deming (mínimos cuadrados totales) también

encuentra una línea que se ajusta a un conjunto de puntos muestrales bidimensionales, pero (a

diferencia de los mínimos cuadrados ordinarios, las desviaciones mínimas absolutas y la

regresión de la pendiente media) no es realmente una instancia de regresión lineal simple, porque

no separa las coordenadas en una variable dependiente e independiente y podría devolver una

línea vertical como su ajuste.

2.3. Coeficiente de determinación R2: El coeficiente de determinación es la proporción de la

varianza total de la variable explicada por la regresión. El coeficiente de determinación, también

llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender

explicar.

Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto

más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos
intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo

y, por tanto, menos fiable será.

2.4. Correlación positiva y correlación negativa

2.4.1. Correlación Positiva: se habla de una correlación positiva cuando la relación entre una

variable y otra es lineal y directa, de manera que un cambio en una variable predice el cambio en

la otra variable. En ese caso, la correlación es positiva perfecta, es decir, ambas variables varían

al mismo tiempo. Este tipo de correlación es directamente proporcional. Hay una correlación

positiva cuando las dos variables se correlacionan en sentido directo, por lo que, a valores altos

de una variable le corresponden valores altos a la otra variable e igualmente con los valores bajos.

2.4.2. Correlación Negativa: Se habla de una correlación negativa cuando la relación entre una

variable y otra es opuesta o inversa, es decir, cuando una variable cambia, la otra se modifica

hacia lo contrario. Entonces, cuando una posee valores altos la otra posee valores bajos y

mientras este valor esté más cerca de -1 más evidente será esta covariación.

2.5. ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

En estadística, el coeficiente de correlación es una medida lineal entre dos variables aleatorias

cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la

escala de medida de las variables.


De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un

índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando

ambas sean cuantitativas y continuas.

Actividad 3. Ejercicio práctico.

3.2. 2. Biomasa-Pureza. El rendimiento del producto de un proceso químico está relacionado

con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la

pureza (Y) del acetato de octilo producido y el porcentaje de biomasa (x) que está presente en el

condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:

Tabla 1. Temperatura Media vs casos de enfermedad respiratoria

X Y

(g.de Biomasa (Pureza

vegetal) Acetato Octilo)

0,99 90,01

1,02 89,05

1,15 91,43

1,29 93,74

1,46 96,73

1,36 94,45

0,87 87,59

1,23 91,77

1,55 99,42
1,4 93,65

1,19 93,54

1,15 92,52

0,98 90,56

1,01 89,54

1,11 89,85

1,2 90,39

1,26 93,25

1,32 93,41

1,43 94,98

0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las

variables.

Gráfico1. Diagrama de Dispersión, Biomasa vs pureza acetato

g.de Biomasa vegetal - Pureza Acetato


Octilo
105

100

95

90

85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
En primer lugar, podemos observar que entre mayor G. de Biomasa Vegetal hay la pureza de

Acetato Octilo, es decir, parece haber una correlación positiva entre G. de Biomasa Vegetal y

pureza de Acetato Octilo. Pero una menor g. de Biomasa Vegetal media puede presentar menos

pureza de acetato Octilo y viceversa. Esto es así porque no hay una correlación total absoluta

entre las variables mencionadas Para cada g. de Biomasa vegetal hay casos de pureza de acetato.

Sin embargo, podemos afirmar que existe cierto grado de correlación entre las variables

mencionsdas

b. Encuentre el coeficiente de determinación y correlación.

Coeficiente de determinación R2

( )

∑ ❑e
2

1− ❑



❑(Y − y)
2

Para hallar el valor de y calculada, se reemplaza los valores de a y b en la fórmula y=a+bx

donde

❑ ❑

❑ ( ∑ ❑ x)( ∑ ❑ y )


❑ xy − ❑
n

a=¿ b= ❑
2
❑ (∑ ❑ x )


2
❑x − ❑
n

; a= 74,28331424, b= 14,94747973

Para hallar los valores de e= “y” observada –“ y” calculada


Los valores del denominador se hallan tomando “y” observada – promedio de “y” elevado

al cuadrado

Tabla 2. Valores calculados para hallar coeficiente de determinación R2

Y Observada X Y calculada e e cuadrado Denominador

90,01 0,99 89,0813192 0,928680825 0,86244807 4,62465025

89,05 1,02 89,5297436 -0,479743567 0,23015389 9,67521025

91,43 1,15 91,4729159 -0,042915932 0,00184178 0,53363025

93,74 1,29 93,5655631 0,174436905 0,03042823 2,49482025

96,73 1,46 96,1066346 0,623365351 0,38858436 20,8803303

94,45 1,36 94,6118867 -0,161886676 0,0262073 5,24181025

87,59 0,87 87,2876216 0,302378393 0,09143269 20,8894703

91,77 1,23 92,6687143 -0,898714311 0,80768741 0,15249025

99,42 1,55 97,4519078 1,968092175 3,87338681 52,7003403

93,65 1,4 95,2097859 -1,559785865 2,43293195 2,21861025

93,54 1,19 92,0708151 1,469184878 2,15850421 1,90302025

92,52 1,15 91,4729159 1,047084068 1,09638504 0,12924025

90,56 0,98 88,9318444 1,628155622 2,65089073 2,56160025

89,54 1,01 89,3802688 0,15973123 0,02551407 6,86702025

89,85 1,11 90,8750167 -1,025016743 1,05065932 5,33841025

90,39 1,2 92,2202899 -1,830289919 3,34996119 3,13467025

93,25 1,26 93,1171387 0,132861297 0,01765212 1,18701025

93,41 1,32 94,0139875 -0,603987487 0,36480088 1,56125025


94,98 1,43 95,6582103 -0,678210257 0,45996915 7,94958025

87,33 0,95 88,48342 -1,153419986 1,33037766 23,3337303

1843,21 23,92 1843,21 0 21,2498169 173,376895

R2= 1-(21,2498169/173,376895)

R2= 0,877435705

Correlación lineal

❑ ❑ ❑
N ∑ ❑ xy −∑ ❑ x ∑ ❑ y
r= ❑ ❑ ❑

√{ ( )} { ( )}
❑ ❑ 2 ❑ ❑ 2
N ∑ ❑ x 2− ∑❑ x × N ∑ ❑ y 2− ∑❑y
❑ ❑ ❑ ❑

Tabla 3. Valores calculados para hallar la correlación lineal

Número

de pares X X*X Y Y*Y XY

de datos

1 0,99 0,9801 90,01 8101,8001 89,1099

2 1,02 1,0404 89,05 7929,9025 90,831

3 1,15 1,3225 91,43 8359,4449 105,1445

4 1,29 1,6641 93,74 8787,1876 120,9246

5 1,46 2,1316 96,73 9356,6929 141,2258


6 1,36 1,8496 94,45 8920,8025 128,452

7 0,87 0,7569 87,59 7672,0081 76,2033

8 1,23 1,5129 91,77 8421,7329 112,8771

9 1,55 2,4025 99,42 9884,3364 154,101

10 1,4 1,96 93,65 8770,3225 131,11

11 1,19 1,4161 93,54 8749,7316 111,3126

12 1,15 1,3225 92,52 8559,9504 106,398

13 0,98 0,9604 90,56 8201,1136 88,7488

14 1,01 1,0201 89,54 8017,4116 90,4354

15 1,11 1,2321 89,85 8073,0225 99,7335

16 1,2 1,44 90,39 8170,3521 108,468

17 1,26 1,5876 93,25 8695,5625 117,495

18 1,32 1,7424 93,41 8725,4281 123,3012

19 1,43 2,0449 94,98 9021,2004 135,8214

20 0,95 0,9025 87,33 7626,5289 82,9635

170044,53
Suma 23,92 29,2892 1843,21 2214,6566
2

Reemplazando valores, adquirimos r= -41148,33213

c. Determine el modelo matemático que permite predecir el efecto de una variable

sobre la otra. ¿Es confiable?


El modelo matemático es y= a+bx
❑ ❑

❑ ( ∑ ❑ x)( ∑ ❑ y )


❑ xy − ❑
n

a=¿ b= ❑
2
❑ (∑ ❑ x )


2
❑x − ❑
n

De la ecuación y= a+bx obtenemos los siguientes datos:

Tabla 4. Datos para graficar la ecuación lineal.

X Y

89,081319
0,99
2

89,529743
1,02
6

91,472915
1,15
9

93,565563
1,29
1

96,106634
1,46
6

94,611886
1,36
7

87,287621
0,87
6
92,668714
1,23
3

97,451907
1,55
8

95,209785
1,4
9

92,070815
1,19
1

91,472915
1,15
9

88,931844
0,98
4

89,380268
1,01
8

90,875016
1,11
7

92,220289

1,2 9

93,117138

1,26 7

94,013987

1,32 5

95,658210

1,43 3

0,95 88,48342
Graficando la ecuación lineal:

Gráfica 2. Gráfica lineal Biomasa vs Pureza

g.de Biomasa vegetal - Pureza Ace-


tato Octilo
100

98

96

94

92

90

88

86

84

82
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6

Con el cálculo anterior de r2= 0,877435705 la recta es confiable porque está cerca del 1,

d. Determine el grado de relación de las dos variables.

El grado de relación entre las dos variables es positiva con un coeficiente de relación alta puesto

que r= 0,936715381

También podría gustarte