Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mapa Mental
correlación.
El análisis de Covariables
El análisis de regresión es o variables Se usan como predictores o
regresión es
una herramienta de independien son variables de confusión
construir una
frecuente uso estadístico te que interesa controlar
función que
que permite investigar las
permita estimar el
relaciones entre diferentes
valor futuro de la
variables cuantitativas Atributos sobre los
variable de Variables
dependiente, el análisis de cuales se quieren medir
estudio. Permite
regresión es un proceso o dependien cambios o hacer
calcular un
modelo que analiza el te predicciones
promedio
vínculo entre una variable
condicional
dependiente y una o varias
variables independientes
Directa: Se da cuando al
Indica si existe relación entre aumentar una de las variables
dos eventos (Variables) sobre la otra aumenta, la recta es una
su naturaleza y su fuerza recta creciente.
MEDIDAS
ESTADÍSTICAS Inversa: Se da cuando al aumentar
BIVARIANTES DE una de las variables la otra disminuye,
REGRESIÓN Y la recta es decreciente
CORRELACIÓN
Tipos de
Nula: Se da cuando no hay dependencia
Correlac
entre las variables , se puede decir que
ión
las variables son incorreladas y la forma
La correlación se de puntos tiene una forma redondeada
refiere a que
exista un vínculo
entre varios Coeficiente de Correlación: Es medida por
eventos. Una de lo que se denomina coeficiente de
las herramientas correlación (r). Su valor numérico varía de
que nos permite 1.0 a -1.0 e indica la fuerza de relación. En
interferir si existe general, r>0 indica una relación positiva y
dicho vínculo es r<0 indica una relación negativa, mientras
que r=0 indica que no hay relación Fuerte: Cuanto más
justamente el cerca estén los puntos
análisis de de la recta
correlación
❖ Diagrama de dispersión.
❖ Coeficiente de determinación R2
estudiar la relación entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlación
entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y
(Correlación positiva) o si cada vez que aumenta el valor de X disminuye en igual proporción el
En un gráfico de correlación representamos cada par X, Y como un punto donde se cortan las
coordenadas de X e Y:
regresión lineal con una única variable explicativa. Es decir, se trata de puntos de muestra de dos
línea recta no vertical) que, con la mayor precisión posible, predice los valores de la variable
dependiente como una función de la variable independiente. El adjetivo simple se refiere al hecho
Es común hacer la estipulación adicional de que se debe usar el método de mínimos cuadrados
ordinarios (MCO): la precisión de cada valor predicho se mide por su cuadrado residual
(distancia vertical entre el punto del conjunto de datos y la línea ajustada), y el objetivo es hacer
que la suma de estas desviaciones al cuadrado sea lo más pequeña posible. Otros métodos de
regresión que pueden usarse en lugar de mínimos cuadrados ordinarios incluyen las desviaciones
Theil-Sen (que elige una línea cuya pendiente es la mediana de las pendientes determinadas por
encuentra una línea que se ajusta a un conjunto de puntos muestrales bidimensionales, pero (a
regresión de la pendiente media) no es realmente una instancia de regresión lineal simple, porque
no separa las coordenadas en una variable dependiente e independiente y podría devolver una
llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender
explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto
más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos
intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo
2.4.1. Correlación Positiva: se habla de una correlación positiva cuando la relación entre una
variable y otra es lineal y directa, de manera que un cambio en una variable predice el cambio en
la otra variable. En ese caso, la correlación es positiva perfecta, es decir, ambas variables varían
al mismo tiempo. Este tipo de correlación es directamente proporcional. Hay una correlación
positiva cuando las dos variables se correlacionan en sentido directo, por lo que, a valores altos
de una variable le corresponden valores altos a la otra variable e igualmente con los valores bajos.
2.4.2. Correlación Negativa: Se habla de una correlación negativa cuando la relación entre una
variable y otra es opuesta o inversa, es decir, cuando una variable cambia, la otra se modifica
hacia lo contrario. Entonces, cuando una posee valores altos la otra posee valores bajos y
mientras este valor esté más cerca de -1 más evidente será esta covariación.
En estadística, el coeficiente de correlación es una medida lineal entre dos variables aleatorias
índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando
con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la
pureza (Y) del acetato de octilo producido y el porcentaje de biomasa (x) que está presente en el
X Y
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
variables.
100
95
90
85
80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
En primer lugar, podemos observar que entre mayor G. de Biomasa Vegetal hay la pureza de
Acetato Octilo, es decir, parece haber una correlación positiva entre G. de Biomasa Vegetal y
pureza de Acetato Octilo. Pero una menor g. de Biomasa Vegetal media puede presentar menos
pureza de acetato Octilo y viceversa. Esto es así porque no hay una correlación total absoluta
entre las variables mencionadas Para cada g. de Biomasa vegetal hay casos de pureza de acetato.
Sin embargo, podemos afirmar que existe cierto grado de correlación entre las variables
mencionsdas
Coeficiente de determinación R2
( )
❑
∑ ❑e
2
1− ❑
❑
∑
❑
❑(Y − y)
2
donde
❑ ❑
❑ ( ∑ ❑ x)( ∑ ❑ y )
∑
❑
❑ xy − ❑
n
❑
a=¿ b= ❑
2
❑ (∑ ❑ x )
∑
❑
2
❑x − ❑
n
; a= 74,28331424, b= 14,94747973
al cuadrado
R2= 1-(21,2498169/173,376895)
R2= 0,877435705
Correlación lineal
❑ ❑ ❑
N ∑ ❑ xy −∑ ❑ x ∑ ❑ y
r= ❑ ❑ ❑
√{ ( )} { ( )}
❑ ❑ 2 ❑ ❑ 2
N ∑ ❑ x 2− ∑❑ x × N ∑ ❑ y 2− ∑❑y
❑ ❑ ❑ ❑
Número
de datos
170044,53
Suma 23,92 29,2892 1843,21 2214,6566
2
❑ ( ∑ ❑ x)( ∑ ❑ y )
∑
❑
❑ xy − ❑
n
❑
a=¿ b= ❑
2
❑ (∑ ❑ x )
∑
❑
2
❑x − ❑
n
X Y
89,081319
0,99
2
89,529743
1,02
6
91,472915
1,15
9
93,565563
1,29
1
96,106634
1,46
6
94,611886
1,36
7
87,287621
0,87
6
92,668714
1,23
3
97,451907
1,55
8
95,209785
1,4
9
92,070815
1,19
1
91,472915
1,15
9
88,931844
0,98
4
89,380268
1,01
8
90,875016
1,11
7
92,220289
1,2 9
93,117138
1,26 7
94,013987
1,32 5
95,658210
1,43 3
0,95 88,48342
Graficando la ecuación lineal:
98
96
94
92
90
88
86
84
82
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
Con el cálculo anterior de r2= 0,877435705 la recta es confiable porque está cerca del 1,
El grado de relación entre las dos variables es positiva con un coeficiente de relación alta puesto
que r= 0,936715381