Está en la página 1de 3

Tema 09 – correlaciones y regresiones

La correlación es una medida de la relación entre dos variables. Puede ser positiva,
negativa o cero. Una correlación positiva indica que a medida que una variable aumenta,
la otra variable también aumenta
La correlación se mide en una escala -1 a 1, donde -1 indica una correlación
perfectamente negativa, 1 indica una correlación perfectamente positiva y 0 indica
ausencia de correlación
Coeficiente de correlación lineal
- Es una medica de la relación lineal entre dos variables. Es un numero entre -1 y 1,
donde -1 indica una relación perfectamente negativa.
- 1 indica una relación perfectamente y 0 indica ausencia de relación lineal entre las dos
variables cuantitativas y se puede calcular fácilmente a partir de los datos de una muestra.
- mide el grado de intensidad de esta posible relación entre las variables
Coeficiente de correlación para datos NO agrupados
- Es una medida de la relación entre dos variables cuantitativas que se basa en los datos
individuales de una muestra, en lugar de datos agrupados en intervalos.
- Un valor cercano a 1 indica una alta correlación positiva, un valor cercano a -1 indica
una alta correlación negativa, y un valor cercano a 0 indica ausencia de correlación
En otras palabras
- si “r” > 0, la correlación lineal es positiva. La correlación es tanto más fuerte cuanto más
se aproxima a 1.
- si “r” < 0, la correlación lineal es negativa. La correlación negativa es tanto más fuerte
cuanto más fuerte más se aproxima a -1.
Coeficiente de correlación para datos agrupados
- se utiliza cuando los datos están organizados en grupos o categorías.
- un ejemplo común es cuando se tienen datos agrupados en una tabla de frecuencia
- el resultado esta entre -1 y 1 que indica el grado de relación lineal entre las dos variables
- un valor cercano a 1 indica una alta correlación positiva
- un valor cercano a -1 indica una alta correlación negativa
- un valor cercano a 0 indica ausencia de correlación
En la tabla de frecuencias de dos variables, cada recuadro de esta tabla se llama una
celda y corresponde a un par de intervalos, y el numero indicado en cada celda se llama
frecuencia de celda
Para elaborar la tabla se recomienda
- Agrupar las variables x y y en un igual número de intervalos
-Los intervalos de la variable x se ubican en la parte superior de manera horizontal (fila) y
en orden ascendente
- Los intervalos de la variable y se ubican en la parte izquierda de manera vertical
(columna) y en orden descendente
Interpretación
- el numero 5 es la frecuencia de la celda correspondiente al par de intervalos 86-90 en
coeficiente intelectual y 19-26 en calificación obtenida en la prueba de conocimiento
- el numero 8 en la fila de fx es el total marginal o frecuencia del intervalo 76-880 en
coeficiente intelectual
- el numero 50 es total de frecuencias marginales y representa al numero total de
estudiantes
Para obtener el número -8 de los intervalos 76-80 en x y 43-50 en y, se obtiene
multiplicando 2. (-2). (2) = -8.
- para obtener el numero 6 de los intervalos 96-100 en x y 51-58 en y se obtiene
multiplicando 1.2.3. =6
- los números de la última columna (24, -2, 7, 0, 5 y 12) se obtienen sumando los números
de las esquinas en cada fila, así, por ejemplo, para obtener el numero 24 se suma 6 + 18
=24
- los números de la ultima fila (0. 5. 0. 2, 12 y 27) se obtienen sumando los números de
las esquinas en cada columna, así, por ejemplo, para obtener el numero 27 se suma 18
+6+3 =27
Análisis de regresión
- es una técnica estadística utilizada para entender como una variable dependiente esta
relacionada con una o más variables independientes
- en un análisis de regresión se busca encontrar un modelo matemático que describa la
relación entre las variables, en términos de una función lineal o no lineal, con el objetivo
de poder hacer predicciones sobre el valor de la variable dependientes dado uno o varios
valores de las variables independientes
- ayuda a entender como el valor típico de la variable dependientes cambia cuando
cualquiera de las variables independientes es modificado, se mantengan las otras
variables independientes fijas
- es ampliamente utilizado para la predicción y previsión, donde su uso tiene
superposición sustancial en el campo de aprendizaje automático
- se utiliza también para comprender que cuales de las variables independientes están
relacionadas con la variable dependientes, y explorar las formas de estas relaciones
Modelos de regresión
- existen diferentes tipos de modelos de regresión, algunos de los más comunes son:
- regresión lineal simple: se utiliza cunado la relación entre la variable dependientes y la
variable independiente es lineal. Es el modelo más sencillo y se basa en la ecuación de la
recta
- regresión lineal múltiple: se utiliza cunado hay más de una variable independiente.
Permite analizar como varias variables independientes contribuyen a predecir la variable
dependiente
- regresión logística: se utiliza cuando la variable dependiente es categórica (binaria o de
más de dos categorías) y se quiere predecir la probabilidad de pertenecer a una
determinada categoría

También podría gustarte