Está en la página 1de 5

1. ¿Cuál es el propósito del análisis de regresión y correlación?

En análisis de regresión es una herramienta de frecuente uso en Estadística que permite


estudiar y valorar las relaciones entre diferentes variables cuantitativas tenidas en cuenta
mediante la construcción de una ecuación.
El esquema básico de análisis de regresión plantea un proceso o modelo en el cual se analiza
la relación entre una variable dependiente (porque es influida por el resto) y una o varias
variables independientes o fijas (las que influyen en el objeto de estudio). Gracias procesos
de regresión estadística es posible entender el modo en que la dependiente es afectada por
cambios en los valores de las independientes.
Las principales aplicaciones de este elemento estadístico son la predicción o previsión de
hechos a partir de unos datos determinados, teniendo en cuenta el grado de influencia (en
Estadística se conoce a esto como correlación lineal) de las diferentes variables en los
mismos a raíz de la experiencia que aporta esta información.

Desde un punto de vista más teórico, la regresión permite estimar su esperanza condicional
(el valor promedio que adopta dadas el resto de variables). Alternativamente otro objetivo
es construir una función de regresión para poder estimarla mediante distribuciones de
probabilidad.

2. ¿Por qué se requiere la regresión lineal múltiple? ¿En qué casos se presenta?
La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable
dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes
llamadas predictores (X1, X2, X3…).
Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable
dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se
debe que analizar con cautela para no malinterpretar causa-efecto).
Los modelos lineales múltiples siguen la siguiente ecuación:
Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei
β0: es la ordenada en el origen, el valor de la variable dependiente Y cuando todos los
predictores son cero.
βi: es el efecto promedio que tiene el incremento en una unidad de la variable predictora Xi
sobre la variable dependiente Y, manteniéndose constantes el resto de variables. Se conocen
como coeficientes parciales de regresión.
ei: es el residuo o error, la diferencia entre el valor observado y el estimado por el modelo.
Es importante tener en cuenta que la magnitud de cada coeficiente parcial de regresión
depende de las unidades en las que se mida la variable predictora a la que corresponde, por
lo que su magnitud no está asociada con la importancia de cada predictor. Para poder
determinar qué impacto tienen en el modelo cada una de las variables, se emplean los
coeficientes parciales estandarizados, que se obtienen al estandarizar (sustraer la media y
dividir entre la desviación estándar) las variables predictoras previo ajuste del modelo.

3. ¿Qué tipos de correlación existe, cite un ejemplo para cada uno de los casos?

Correlación positiva: ocurre cuando una variable aumenta y la otra también. Por ejemplo, la
altura de una persona y el tamaño de su pie; mientras aumenta la altura, el pie también.

Correlación negativa: es cuando una variable aumenta y la otra disminuye. El tiempo de


estudio y el tiempo que pasas jugando videojuegos, tienen una correlación negativa, ya que
cuando tu tiempo de estudio aumenta, no te queda tanto tiempo para jugar videojuegos.

Sin correlación: no hay una relación aparente entre las variables. Los puntos en tus
videojuegos y tu talla de zapato no parecen tener ninguna correlación; mientras una aumenta,
la otra no tiene ningún efecto.

4. ¿Qué es coeficiente de correlación y cuál es su interpretación?


El Coeficiente de Correlación es una medida de la correspondencia o relación lineal entre
dos variables cuantitativas aleatorias. En palabras más simples se puede definir como un
índice utilizado para medir el grado de relación que tienen dos variables, ambas cuantitativas.
Teniendo dos variables, la correlación facilita que se hagan estimaciones del valor de una de
ellas, con conocimiento del valor de la otra variable. Este coeficiente es una medida que
indica la situación relativa de los sucesos respecto a las dos variables, es decir, representa la
expresión numérica que indica el grado de correspondencia o relación que existe entre las 2
variables. Estos números varían entre límites de +1 y -1.
Su dimensión indica el nivel de asociación entre las variables.

Cuando es menor a cero (r < 0) Se dice que hay correlación negativa: Las variables se
correlacionan en un sentido inverso.
A valores altos en una de las variables, le suelen corresponder valores bajos en la otra variable
y viceversa. Cuánto el valor esté más próximo a -1 dicho coeficiente de correlación más
evidente será la covariación extrema.
Si r= -1 se habla de correlación negativa perfecta, la cual supone una determinación absoluta
entre ambas variables, en sentido directo coexiste una relación lineal perfecta de pendiente
negativa.

Cuando es mayor a cero (r > 0) Se dice que hay correlación positiva: Ambas variables se
correlacionan en un sentido directo.
A valores altos en una de las variables, le corresponden valores altos en la otra variable e
igualmente en una situación inversa sucede con los valores bajos. Cuánto más próximo a +1
se encuentre el coeficiente de correlación más evidente será la covariación.

Si r = 1 Se habla de correlación positiva perfecta, la cual supone una determinación absoluta


entre las variables, en sentido directo coexiste una relación lineal perfecta de pendiente
positiva).

Cuando es igual a cero (r = 0) Se dice que las variables están incorrectamente relacionadas,
no puede es posible establecer algún sentido de covariación.
No existe relación lineal, pero esto no implica necesariamente que las variables sean
independientes, pudiendo existir relaciones no lineales entre las variables.

Cuando las dos variables son independientes se dice que no están correlacionadas, aunque el
resultado de reciprocidad no es necesariamente cierto.
5. ¿Qué es coeficiente de determinación y cuál es su interpretación?
La bondad de la predicción depende de la relación entre las variables. Si dos variables no
covarían, no podremos hacer predicciones válidas, y si la intensidad de la covariación es
moderada, las predicciones no serán demasiado buenas. En consecuencia, hay que disponer
de alguna medida de la capacidad de la ecuación de Regresión para obtener predicciones
buenas (en el sentido de que sean lo menos erróneas posible).
Esta medida es el Coeficiente de Determinación, que es el cuadrado del coeficiente de
correlación de Pearson, y da la proporción de variación de la variable Y que es explicada por
la variable X (variable predictora o explicativa). Si la proporción es igual a 0, significa que
la variable predictora no tiene NULA capacidad predictiva de la variable a predecir (Y).
Cuanto mayor sea la proporción, mejor será la predicción. Si llegara a ser igual a 1 la variable
predictora explicaría TODA la variación de Y, y las predicciones NO tendrían error.
Los modelos estadísticos tienen como finalidad probar o explicar alguna variable aleatoria,
esto se realiza a través de otras variables aleatorias que son conocidas como factores. Ya que
se puede predecir una variable considerada aleatoria a través de su medida y que para este
caso la varianza será el mismo error cuadrático medio, el máximo error cuadrático medio que
se puede aceptar es la varianza.
El resultado puede variar entre 0 y 1, esto significa que mientras más cerca esté del uno estará
más ajustada a la variable que intentas probar, mientras que en el caso contrario, es decir,
cuanto más se acerca a 0 menos fiable será ya que estará menos ajustado el modelo.
BIBLIOGRAFÍA
OpenIntro Statistics: Third Edition, David M Diez, Christopher D Barr, Mine Çetinkaya-
Rundel An Introduction to Statistical Learning: with Applications in R (Springer Texts in
Statistics) Linear Models with R, Julian J.Faraway

Lic. Rosa María Martínez Ortega. Calle E entre 7ma. y Paseo. Edificio 15059. Apto 3.
Altahabana. Boyeros. Ciudad de La Habana, Lic. Leonel C. Tuya Pendás. Avenida 83
núm.11414 entre 114 y 116. Marianao. Ciudad de La Habana. Tomado
de:http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1729-519X2009000200017

También podría gustarte