Está en la página 1de 10

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD DE FALCÓN
FACULTAD DE CIENCIAS SOCIALES
CARRERA: Procesos Gerenciales
CÁTEDRA: Estadística II
DOCENTE: PROF. Manuel Duarte

MODELO DE REGRESIÓN Y CORRELACIÓN SIMPLE

Autor:

Mujica Maira C.I: 15.982.774

Punto Fijo, abril 2023.


MODELO DE REGRESIÓN Y CORRELACIÓN SIMPLE
Introducción

La correlación lineal y la regresión lineal simple, siempre serán técnicas estadísticas


que analizan y estudian la relación lineal que existen entre dos variables. Pero antes de
entrar en detalles es importante resaltar algunas discrepancias

• La correlación cuantifica relacionadas están (2) dos variables, cuando la


regresión lineal radica en formar una ecuación (modelo) que se basa en la
relación existente entre ambas variables, y que permita indicar el valor de una
partiendo de la otra.

• El cómputo de la correspondencia entre dos variables depende del orden o


asignación de cada variable X, Y, y mide únicamente la relación entre ambas
sin considerar dependencias. En el caso de la regresión lineal, el modelo varía
según qué variable se considere dependiente de la otra (lo cual no implica
causa-efecto).

• A nivel experimental, la correlación se suele emplear cuando ninguna de las


variables se ha controlado, simplemente se han medido ambas y se desea saber
si están relacionadas. En el caso de estudios de regresión lineal, es más común
que una de las variables se controle (tiempo, concentración de reactivo,
temperatura…) y se mida la otra.

• Por norma general, los estudios de correlación lineal preceden a la generación


de modelos de regresión lineal. Primero se analiza si ambas variables están
correlacionadas y, en caso de estarlo, se procede a generar el modelo de
regresión.
1. REGRESIÓN Y CORRELACIÓN LINEAL. CONCEPTOS BÁSICOS EN EL
ANÁLISIS DE LA REGRESIÓN.

¿Qué es la regresión lineal?


El estudio de la regresión lineal se usa para anunciar el valor de una variable como el
valor de otra. La variable que se quiere predecir se designa variable dependiente. La
variable la cual se está utilizando para presagiar el valor de la otra variable se designa
variable independiente.
Es importante saber que es variable: esta es el símbolo que simboliza un elemento no
detallado de un conjunto dado

¿Qué es regresión y correlación?

La correlación mide como están relacionadas estás dos variables, entre tanto que la
regresión lineal radica en generar una ecuación (guía) que, se basa en la relación
existente entre ambas variables, la cual permita anteceder el valor de una a partir de la
otra.
Para entender la relación lineal que hay entre dos variables perennes se hace necesario
poner de parámetros que consientan cuantificar dicha correlación. Uno de ellos es la
covarianza, que muestra el grado de variación ligada de dos variables aleatorias.

Covarianza muestral: Cov = (X,Y) =

Coeficiente de correlación

Es aquel que provee de una medida de dos variables aleatorias están asociadas en una
«muestra». Es igualmente una medida del ímpetu de la relación lineal entre X y Y.

Correlación Simple. La precisión de la predicción depende de qué tan cercana sea la


relación entre X e Y, por esta razón se le llama correlación o relación entre las dos
variables. Es un modelo matemático que examina la relación de dependencia entre dos
variables cuantitativas, intenta comprobar que dicha relación es lineal y proporciona
los coeficientes (a y b) que se utilizan para construir la ecuación de la recta predicha.
Ambos métodos se basan en la media y la varianza de las variables medidas y tienen
importantes condiciones operativas que incluyen la independencia de los valores
observados de las variables independientes, la normalidad e independencia de
los residuos y la homogeneidad de las variables independientes. Varianza
variable, alternativas no paramétricas con correlaciones si no se cumplen.

La correlación simple puede presentarse de dos formas:

Correlación Positiva y la negativa:

La positiva es cuando r está entre 0 y +1. Los valores de X y Y tienden a moverse en la


misma dirección.

Y la negativa; es cuando r está entre -1 y 0. Entonces los valores de X y Y tienden a


moverse en dirección opuesta; cuando uno aumenta el otro tiende a disminuir y
viceversa.

Regresión lineal. Se refiere a una relación que puede representarse gráficamente


mediante una línea recta que describe la dependencia entre dos variables, la que puede
ser positiva o negativa.

Propósito de la Regresión Lineal: Estimar la relación entre dos variables es hacer una
predicción o predicción cuantitativa. Esta regresión se puede utilizar en una variedad
de situaciones. Se utilizan cuando dos variables miden aproximadamente lo mismo,
pero una de las variables es relativamente costosa o, por el contrario, poco
interesante de usar, y la otra no es muy interesante (Sokal & Rohlf, 2006). El análisis de
regresión solo indica que puede haber una relación matemática (si la hay). Si la variable
tiene una "causa", es decir. provoca un cambio en el valor de otra variable, no puede
existir ni regresión ni correlación, por lo que el modelo debe utilizarse sólo si ya se ha
establecido causalidad o correlación a priori en las variables estudiadas. regresión entre
dos variables
Este tipo ocurre cuando dos o más variables independientes afectan a la variable
dependiente. Ejemplo: Y = f (x, w, z). Por ejemplo: podría ser una regresión de varios
tipos:
Una empresa de desarrollo de software planea correlacionar sus ventas con la
cantidad de pedidos que recibe para el tipo de software que desarrolla
(sistemas, capacitación y automatización comercial) para dar servicio a 10
proyectos este año. La correlación cuantifica qué tan relacionadas están dos variables,
mientras que la regresión lineal implica generar una ecuación (modelo) que predice el
valor de una variable a partir de la otra en función de la relación entre las dos variables.

2. PREDICCIÓN Y EVALUACIÓN DE LAS VARIABLES. REGRESIÓN Y


ESTIMACIÓN MEDIANTE LA LÍNEA DE REGRESIÓN.
¿Qué son los predictores?
Variable independiente: o la variable predictora, es decir, la variable que forma la
base de la estimación. Regresión simple: solo hay una variable independiente y una
variable dependiente. Regresión múltiple: involucra dos o más variables independientes
y una variable dependiente.
Tipo de predictor y tipo de variable
El método de validación elegido depende del tipo de predicción, el tipo de variable que
se predice y el contexto en el que se utilizarán los resultados de la validación.
Primero se detectará el tipo del predictor, luego el tipo de la variable. tipo de previsión
Hay dos tipos de predicciones:
predicción de clasificación. Consisten en declaraciones que indican que cierto
evento (o valor de una variable) sucederá o no; las predicciones son declaraciones
incondicionales. Por ejemplo, "lloverá esta noche" o "mañana la temperatura
subirá a 25°C".

Predicciones probabilistas. Consisten en afirmaciones sobre la probabilidad de que


ocurra un evento. Por ejemplo, "esta noche hay un 80% de probabilidad de que llueva"
o "hay un 10% de probabilidad de que la temperatura suba más de 3°C sobre la normal".
Nótese que esos dos tipos de predicciones están relacionados: las predicciones
categóricas son de hecho predicciones probabilistas en las que las únicas probabilidades
que se utilizan son 0 y 1.
Tipos de variables
Así como existen dos tipos de predicciones, también se utilizan dos tipos de
variables:
Variables escalables. Son variables que toman un valor en una escala continua o
discreta (por ejemplo, la temperatura o la velocidad del viento). Normalmente una
escala que en principio parece continua en realidad es discreta, porque las variables sólo
pueden especificarse con una exactitud determinada (por ejemplo, las temperaturas
predichas generalmente sólo se expresan aproximándolas al grado más próximo).
Algunas veces, las variables escalables se denominan "variables ordinales" o "variables
de tipo magnitud". Nótese que un rasgo esencial de esas variables es que están escaladas
de tal forma que la distancia numérica entre valores o entre estados tiene algún
significado.
Variables no expandibles. Estas son variables que simplemente definen eventos que
pueden ocurrir o no (como el tipo de precipitación: lluvia, nieve o aguanieve). Las
variables que no son escalables a veces se denominan "variables nominales" o
"variables categóricas". A veces, las variables que se pueden escalar (p. ej., estado del
cielo: nublado, parcialmente nublado o despejado/claro) se consideran no escalables a
efectos de validación.

La ecuación lineal de regresión:


- Variable dependiente e independiente (fijas ó aleatorias):
• Fijas (modelo I de regresión) .
• Aleatorias (modelo II; más complejo)
- Objetivo predictivo (básico en ciencia)
- Ecuación de regresión (mínimos cuadrados):
• Valor de intersección (a)
• Pendiente (b)
- Aplicación a un ejemplo:
• Gráfico dispersión
• Estimación de recta predictiva
- Los residuos:
• El valor predicho de y por la ecuación (y’)
• Porción de y expo
- La relación con el coeficiente de correlación:
• La r 2 (porcentaje de variación explicado)

método de mínimos cuadrados. La fórmula a utilizar. Encuentre la especificación de la


línea de ajuste o regresión.
Utiliza el método de mínimos cuadrados para ajustar una línea a una serie de
datos representados como puntos en un plano. Supongamos que tenemos datos para
las siguientes variables x, y

X1 X2 ……. Xn
Y1 Y2 ……. Yn

Esto puede ocurrir en estudios experimentales donde se estudia la variación de una


cierta cantidad x en función de otra cantidad y.
El método de los mínimos cuadrados nos da un criterio por el cual podemos obtener la
mejor recta que representa un punto dado. Para todos los puntos (xi, yi), donde i = 1...,n,
nos gustaría que Yi = mxi b.
Pero como yi 6 = mxi b, generalmente se requiere la suma al cuadrado de las diferencias
(desviaciones), yi − (mxi b)

3. ANÁLISIS DE CORRELACIÓN: COEFICIENTE DE CORRELACIÓN Y DE


DETERMINACIÓN.

¿Qué es el coeficiente de correlación?

El coeficiente de correlación es una medida especial que cuantifica la fuerza de la


relación lineal entre dos variables en un análisis de correlación. En informes
relacionados, esta relación se denota por r. ¿Cómo usar el coeficiente de correlación?
Para dos variables, la fórmula compara la distancia entre cada punto de datos con la
media de la variable y utiliza esta comparación para indicar qué tan bien se ajusta la
relación entre las variables a una línea imaginaria trazada entre los datos. Esto es lo que
queremos decir cuando decimos que la correlación prueba una relación lineal. ¿Qué
limitaciones se deben considerar? La correlación se aplica solo a dos variables dadas y
no proporciona información sobre las relaciones fuera de los datos bivariados. Esta
prueba no puede detectar valores atípicos en los datos (lo que distorsiona los resultados)
y no puede determinar correctamente la relación de la curva.

¿Qué significan los valores del coeficiente de correlación?

El coeficiente de correlación r es un valor sin unidades entre -1 y 1. El valor p indica la


significación estadística. Por lo tanto, la correlación suele expresarse mediante dos
cifras clave: r = y p =
• Cuanto más cerca esté r de cero, más débil será la relación lineal. • Un valor de
r positivo indica una correlación positiva, donde los valores de dos variables
tienden a aumentar juntos.
• Un valor de r negativo indica una correlación negativa, donde el valor de una
variable tiende a aumentar mientras que el valor de la otra variable tiende a
disminuir.
• Los valores de 1 y -1 representan correlaciones "perfectas" positivas y
negativas, respectivamente. Dos variables perfectamente correlacionadas
cambian juntas a una tasa fija. Decimos que tienen una relación lineal; cuando se
representan en un diagrama de dispersión, todos los puntos de datos se pueden
conectar mediante la misma línea recta

4. EJEMPLOS PRÁCTICOS DE REGRESIÓN LINEAL


EJEMPLO DE LA VIDA REAL DE REGRESIÓN LINEAL.

N#° 1 EJEMPLO.
Las empresas suelen utilizar la regresión lineal para comprender la relación entre el
gasto en publicidad y los ingresos

Por ejemplo, podrían ajustarse a un modelo de regresión lineal simple utilizando el


gasto en publicidad como variable de predicción y los ingresos como variable de
respuesta. El modelo de regresión tomaría la siguiente forma:

ingresos = β 0 + β 1 (gasto publicitario)


El coeficiente β 0 representaría los ingresos totales esperados cuando la inversión
publicitaria es cero.
El coeficiente β 1 representaría el cambio promedio en los ingresos totales cuando la
inversión publicitaria aumenta en una unidad (por ejemplo, un dólar).
Si β 1 es negativo, significaría que una mayor inversión publicitaria se asocia con menos
ingresos.
Si β 1 está cerca de cero, significaría que la inversión publicitaria tiene poco efecto
sobre los ingresos.
Y si β 1 es positivo, significaría que una mayor inversión publicitaria se asocia con más
ingresos.
Dependiendo del valor de β 1, una empresa puede decidir disminuir o aumentar su gasto
publicitario.
N#° 2 EJEMPLO
Los investigadores médicos suelen utilizar la regresión lineal para comprender la
relación entre la dosis del fármaco y la presión arterial de los pacientes.

Por ejemplo, los investigadores pueden administrar varias dosis de un determinado


medicamento a los pacientes y observar cómo responde su presión arterial. Pueden
ajustarse a un modelo de regresión lineal simple utilizando la dosis como variable
predictiva y la presión arterial como variable de respuesta. El modelo de regresión
tomaría la siguiente forma:

presión arterial = β 0 + β 1 (dosis)


El coeficiente β 0 representaría la presión arterial esperada cuando la dosis es cero.
El coeficiente β 1 representaría el cambio promedio en la presión arterial cuando la dosis
se incrementa en una unidad.
Si β 1 es negativo, significaría que un aumento de la dosis se asocia con una
disminución de la presión arterial.
Si β 1 está cerca de cero, significaría que un aumento en la dosis se asocia con ningún
cambio en la presión arterial.
Si β 1 es positivo, significaría que un aumento de la dosis se asocia con un aumento de
la presión arterial.
Dependiendo del valor de β 1 , los investigadores pueden decidir cambiar la dosis
administrada a un paciente.
REFERENCIAS BIBLIOGRÁFICAS

LIBROS
Siegel, S., Castellan, N.J.1988. Nonparametric Statistics. McGraw Hill, New York.
http://www.cas.buffalo.edu/classes/psy/segal/2072001/regression/regression.html
(Pagina Web donde se explica el análisis de regresión) UNIVERSIDAD DE VIGO
Siegel, S., Castellan, N.J.1988. Nonparametric Statistics. McGraw Hill, New York

WEB
https://statologos.com/regresion-lineal-ejemplos-de-la-vida-real/
https://www3.uji.es/~mateu/t2-alumnos.pdf
https://www.cienciadedatos.net/documentos/26_ejemplo_regresion_lineal_simple_multi
ple_polinomial_interaccion_entre_predictores.html

También podría gustarte