Está en la página 1de 13

Instituto Tecnológico de Ciudad Madero

Investigación
REGRESIÓN Y CORRELACIÓN

Estadística Inferencial I

Carrera: Ingeniería Industrial


Alumna: Rosales Rojas Ariadna Azeneth
Numero de control: 21070890
Docente: Malibrán Gabriela

Cd Madero, Tamaulipas a 1 de diciembre de 2022

1
INDICE
Portada........................................................................................... 1
Índice ............................................................................................. 2
Regresión y correlación ................................................................. 3
Regresión ...................................................................................... 3
Correlación .................................................................................... 5
Ejemplos de respectivos casos ..................................................... 6
Caso lineal ..................................................................................... 6
Caso 2d grado ............................................................................... 8
Caso exponencial .......................................................................... 10
Caso potencial ............................................................................... 11
Bibliografía

2
REGRESIÓN Y CORRELACIÓN
La regresión y la correlación son dos técnicas estrechamente relacionadas y
comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis
de los datos muestrales para saber qué es y cómo se relacionan entre si dos o más
variables en una población. El análisis de correlación produce un número que
resume el grado de la correlación entre dos variables; y el análisis de regresión da
lugar a una ecuación matemática que describe dicha relación.
Los datos necesarios para análisis de regresión y correlación provienen de
observaciones de variables relacionadas.

REGRESIÓN:
El análisis de regresión es una herramienta de frecuente uso en estadística. La cual
permite investigar las relaciones entre diferentes variables cuantitativas. Esto,
mediante la formulación de ecuaciones matemáticas.
Visto de otro modo, dicho análisis es un proceso o modelo que analiza el vínculo
entre una variable dependiente y una o varias variables independientes. Así, a partir
de dicho estudio, se halla una relación matemática.
Gracias a los procesos de regresión, es posible entender el modo en que la variable
dependiente es afectada por cambios en los demás factores.
El proceso de realizar una regresión permite determinar con confianza cuáles son
los factores más importantes, cuáles se pueden ignorar y cómo influyen entre sí.
Dichos factores se denominan variables las cuales se clasifican en:

• Variable(s) dependiente(s): Es el factor más importante, el cual se está


tratando de entender o predecir.
• Variable(s) independiente(s): Es el factor que tú crees que puede impactar
en tu variable dependiente.

APLICACIONES DEL ANÁLISIS DE REGRESIÓN


Una de las principales aplicaciones del análisis de regresión es la proyección con
diferentes escenarios. Esto, teniendo en cuenta el grado de influencia (en
estadística se conoce a esto como correlación) sobre la variable dependiente.
Es decir, el objetivo del análisis es construir una función que permita estimar el valor
futuro de la variable de estudio.
3
Desde otro punto de vista, la regresión permite calcular una esperanza (promedio)
condicional. Para ese fin, se toman como dados los valores de las variables
independientes.
Cabe precisar que cuando se tiene en cuenta solo una variable independiente
hablamos de regresión lineal simple. En cambio, si se incluyen más factores, se
trataría de una regresión lineal múltiple.
El análisis de regresión tiene aplicaciones para la vida cotidiana. Esto, desde el
estudio de accidentes de tráfico en una determinada zona geográfica hasta
comprobar si un plan de estudios es recomendable según la tasa de abandono
escolar, por ejemplo.

TIPOS DE REGRESIÓN LINEAL


• Regresión lineal simple
La regresión lineal simple se basa en estudiar los cambios en una variable, no
aleatoria, afectan a una variable aleatoria, en el caso de existir una relación
funcional entre ambas variables que puede ser establecida por una expresión lineal,
es decir, su representación gráfica es una línea recta. Es decir, se esta en presencia
de una regresión lineal simple cuando una variable independiente ejerce influencia
sobre otra variable dependiente.
Ejemplo: Y = f(x)
• Regresión lineal múltiple
La regresión lineal permite trabajar con una variable a nivel de intervalo o razón, así
también se puede comprender la relación de dos o más variables y permitirá
relacionar mediante ecuaciones, una variable en relación a otras variables
llamándose Regresión múltiple. O sea, la regresión lineal múltiple es cuando dos o
más variables independientes influyen sobre una variable dependiente.
Ejemplo: Y = f(x, w, z).
• Regresión no lineal
El ajuste de un modelo de regresión no lineal es similar al del modelo lineal y
también puede realizarse mediante la técnica de mínimos cuadrados.
No obstante, en determinados casos un ajuste no lineal puede convertirse en un
ajuste lineal mediante una sencilla transformación de alguna de las variables del
modelo.

4
CORRELACIÓN:
La correlación, también conocida como coeficiente de correlación lineal (de
Pearson), es una medida de regresión que pretende cuantificar el grado de variación
conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el
grado de intensidad y el sentido de la relación entre dos variables.

Siendo:
Cov (x;y): la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».

¿CÓMO SE MIDE LA CORRELACIÓN?


El coeficiente de correlación de la muestra, r, cuantifica la intensidad de la relación.
Las correlaciones también se someten a pruebas para establecer su significancia
estadística.

VALORES QUE PUEDE TOMAR LA CORRELACIÓN


ρ = -1 Correlación perfecta negativa

ρ=0 No existe correlación

ρ = +1 Correlación perfecta positiva

Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube,
y además con la misma intensidad (+1).

En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y además
con la misma intensidad, entonces estamos hablando de correlación negativa (-1).

5
¿CUÁLES SON ALGUNAS LIMITACIONES DEL ANÁLISIS DE
CORRELACIÓN?

La correlación no puede medir la presencia o el efecto de otras variables aparte de


las dos que se están explorando. Es importante saber que la correlación no nos
informa sobre causas y efectos. Además, la correlación no puede describir con
precisión las relaciones curvilíneas.

TIPOS DE CORRELACIÓN

Atendiendo el numero de variables estudiadas, la correlación puede ser:


• Correlación simple
Cuando se estudia el grado de asociación o dependencia entre dos variables.
• Correlación múltiple
Cuando se estudia el grado de asociación que puede existir entre tres o más
variables, una de ella dependiente y el resto independiente.
• Correlación parcial
En el caso de correlación múltiple es la cuantificación del grado de asociación neta
entre dos variables, y una vez eliminada estadísticamente la influencia de las otras
variables independientes.

MODELOS DE REGRESIÓN SIMPLE


Dependiendo de la forma de función de regresión, existen muchos tipos de
regresión simple.

Lineal 𝑦 = 𝑎 + 𝑏𝑥

2do grado (cuadrática) 𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥 2

Exponencial 𝑦 = 𝑎𝑏 𝑥

Potencial 𝑦 = 𝑎 ⋅ 𝑥𝑏

EJEMPLOS DE RESPECTIVOS CASOS


CASO LINEAL

Los modelos de regresión lineales hacen referencia a aquellos modelos en que la


función adopta la forma de una suma de términos, cada uno conformado por el
producto de un parámetro y una variable independiente

EJEMPLO

6
El dueño de una fábrica quiere estudiar la relación entre la edad de sus empleados
y su rendimiento. Para eso mide la cantidad de productos elaborados por hora por
cada empleado. A continuación, se presenta una muestra aleatoria de 12
empleados.

Productos
Edad y X2 xy yc
elaborados x
8 35 64 280 39.9
6 37 36 222 32.76
3 40 9 120 22.05
4 39 16 156 25.62
5 45 25 225 29.19
10 25 100 250 47.04
7 32 49 224 36.33
7 41 49 287 36.33
5 39 25 195 29.19
55 333 373 1959

ECUACIONES NORMALES

a = ∑X2∑y - ∑X∑Xy ∑y = n a + b ∑X
n ∑X2 – (∑X)2

b = n ∑Xy - ∑y∑x ∑Xy = a∑X + b ∑X2


n ∑X2 – (∑X)2

Se sustituye en las ecuaciones en la cual obtendremos resultados de a y b directos

a = 373(333) – 55(1959) = 11.34


12(373) – (55)2

b = 12(1959) – 55(333) = 3.57


12(373) – (55)2

333 = 12(11.34) + 3.57(55)

1959 = 11.34(55) + 3.57(373)

Por lo tanto, se sustituye a y b en la ecuación:

Yc = a + bx

Utilizando todos los valores de x sucesivamente para obtener yc.

7
CASO DE 2do GRADO

Es ando las variables X e Y se relacionan según una línea curva, se habla de


regresión no lineal o curvilínea. Es una función de segundo grado la que se ajusta
lo suficiente a la situación real dada.

La expresión general de un polinomio de segundo grado es: Y =a+bX+cX2 donde


a, b y c son los parámetros.

El problema consiste, por tanto, en determinar dichos parámetros para una


distribución dada. Se seguirá para ello, un razonamiento y la utilización de las
ecuaciones normales de Gauss.

EJEMPLO:

Calcule la ecuación de la regresión para la siguiente información. Los datos


pertenecen a la cantidad de una sustancia que pertenece a un sistema quimico en
reacción después de x minutos

x y xy x2 x3 x4 x2y yc
1 34 34 1 1 1 34 34.13
1.2 32 38.4 1.44 1.728 2.0736 46.08 30.794
1.5 26 39 2.25 3.375 5.0625 58.5 26.31
2 18 36 4 8 16 72 20.22
2.5 18 45 6.25 15.625 39.0625 112.5 15.86
2.7 12 32.4 7.29 19.683 53.1441 87.48 14.600
3 14 42 9 27 81 126 13.23
3.2 12 38.4 10.24 32.768 104.8576 122.88 12.662
3.5 15 52.5 12.25 42.875 150.0625 183.75 12.33
4 13 52 16 64 256 208 13.16
4.5 18 81 20.25 91.125 410.0625 364.5 15.72
5 16 80 25 125 625 400 20.01
5.2 22 114.4 27.04 140.608 731.1616 594.88 22.210
5.5 26 143 30.25 166.375 915.0625 786.5 26.03
6 35 210 36 216 1296 1260 33.78
50.8 311 1038.1 208.26 955.162 4685.5494 4457.07

ECUACIONES NORMALES

∑y = n a + b ∑x + c∑x2

∑xy = a ∑x + b ∑x2 + c ∑x3

∑x2y = a ∑x2 + b ∑x3 + c ∑x4

8
Se sustituye en las ecuaciones normales

Ecuación 1: 311 = 15a + 50.8b + 208.26c


Ecuación 2: 1038.1 = 50.8a + 208.26b + 955.162c
Ecuación 3: 4457.07 = 208.26a + 955.162b + 4685.5494c

Se multiplica la ecuación 1 por -50.8 y la ecuación 2 por 15 para eliminar a

-15798.8 = -762a - 2580.64b – 10579.608c

15571.5 = 762a + 3123.90b + 14327.430c

-227.3 = 543.26b + 3747.822c

Se multiplica la ecuación 1 por -208.26 y la ecuación 3 por 15 para eliminar a

-64768.86 = -3123.9a – 10579.608b – 43372.2276c

66856.05 = 3123.9a + 14327.4b + 70283.25c

-2087.19 = 3747.822b + 26911.0224c

Ambos resultados de juntan para obtener valor de b y c

-227.3 = 543.26b + 3747.822c

-2087.19 = 3747.822b + 26911.0224c

1985766.779 = 573512.28c

Despejando c se obtiene: c = 1985766.779 = 3.46


573512.28c

Sustituyendo en la ecuación primera se puede obtener valor de b

227.3 = 543.26b + 3747.822(3.46) b = -24.29

Y para obtener valor de b se sustituye en la ecuación 1

Ecuación 1: 311 = 15a + 50.8(-24.29) + 208.26(3.46) a = 54.96

y para sacar valor de yc se sustituyen los valores de a, b y c en la ecuación:

yc = a + bx + cx2

9
CASO EXPONENCIAL

El caso exponencial se utiliza sobre todo cuando se desea calcular tasas de


crecimiento. Esto implica tomar en cuenta la variable tiempo como variable
independiente; sin embargo, puede considerarse cualquier otra variable y ajustar la
función sin hacer referencias a tasas de crecimiento.

EJEMPLO

La siguiente información corresponde al número de palabras Y que en un grupo de


secretarias, escogido al azar, puede escribir (en maquina eléctrica) de acuerdo con
el número de meses X de entrenamiento:

Xi (núm de meses) 1 2 3 4 5 6 7 8
Yi (núm de palabras) 15 18 25 30 35 45 53 70

ECUACIONES NORMALES

logYi = n log a + log b ∑Xi

∑X*logYi = log a ∑Xi + logb∑Xi2

Xi Yi logYi XlogYi X2 Yc
1 15 1.1760913 1.17609 1 15.23
2 18 1.2552725 2.510545 4 19.12
3 25 1.3979400 4.193820 9 24.07
4 30 1.4771213 5.908485 16 30.26
5 35 1.5440680 7.720340 25 38.03
6 65 1.8129134 10.8774804 36 47.81
7 53 1.7242759 12.069931 49 60.10
8 70 1.8450980 14.760784 64 75.54
36 291 12.2327804 59.2174772 204

Se sustituye en las ecuaciones normales:

Ecuación 1: 12.2327804 = 8 log a + 36 log b


Ecuación 2: 59.2174772=36 log a + 204 log b

Se multiplica la ecuación 1 por -9 y la ecuación 2 por 2

-110.0950236 = -72 log a – 324 log b

118.4349544 = 72 log a + 408 log b

8.3399308 = + 84 log b

10
log b = 8.3399308 = 0.099
84

log b = 0.099 ∴ b = 1.257 (antilogaritmo)

Sustituimos este valor en la ecuación 1

12.23277804 = 8 log a + 36(0.099)

12.23277804 = 8 log a + 3.564

log a = 8.67
8

log a = 1.0836 ∴ a = 12.12 (antilogaritmo)

Sustituyendo log a y log b en


log Yi = log a + log b
tenemos:
log Yc = 1.0836 + 0.099 X
que es la ecuación de regresión perdida, la cual expresada en forma original, Yc=
abx , quedaría:
Yc = 12.12(1.257) x
En la tabla aparecen los valores de Yc que se obtuvieron de dichas ecuaciones,
cambiando el valor X sucesivamente.

CASO POTENCIAL
EJEMPLO
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el
volumen (variable independiente) e Y es la presión de una masa dada de gas
(variable resultante).
X 1 2 3 4 5 6
y 7 30 90 170 290 450

ECUACIONES NORMALES

11
x y log X log Y log X* log Y (log X)2
1 7 0,0000 0,8451 0,0000 0,0000
2 30 0,3010 1,4771 0,4447 0,0906
3 90 0,4771 1,9542 0,9324 0,2276
4 170 0,6021 2,2304 1,3429 0,3625
5 290 0,6990 2,4624 1,7211 0,4886
6 450 0,7782 2,6532 2,0646 0,6055
7 650 0,8451 2,8129 2,3772 0,7142
28 3,7024 14,4354 8,8829 2,4890

Al resolver el sistema se obtiene: log a = 0,819; ß = 2,351

Reemplazando valores en la ecuación predictora expresada en logaritmos se tiene:

Para calcular la ecuación predictora, primero se calcula el valor de a de la siguiente


manera:

Reemplazando en la ecuación predictora se obtiene:

Para estimar la presión de la masa de gas de volumen 9 se reemplaza el valor X =


9 en la ecuación predictora

BIBLIOGRAFIA
https://sites.google.com/site/estadisticadescriptivaenedu/home/unidad-1/6---regre

12
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html
https://economipedia.com/definiciones/analisis-de-regresion.html
https://www.jmp.com/es_mx/statistics-knowledge-portal/what-is-correlation.html
https://www.questionpro.com/blog/es/analisis-de-regresion/
https://www.ecured.cu/Regresi%C3%B3n_lineal
https://aprendeconalf.es/docencia/estadistica/manual/regresion/

13

También podría gustarte