Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad IV
Introducción a la Regresión y Correlación
En la práctica a menudo se desea estudiar más de una variable aislada. Por lo general, se
quiere determinar como una variable está relacionada con otras variables; lo que los
estadísticos denominan regresión.
La regresión como una técnica estadística, una de ellas la regresión lineal simple, analiza
la relación de dos o más variables continuas, cuando analiza las dos variables a esta se le
conoce como variables bivariantes que pueden corresponder a variables cualitativas, la
regresión nos permite el cambio en una de las variables llamadas respuesta y que
corresponde a otra conocida como variable explicativa, la regresión es una técnica
utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede
suceder.
Siendo así la regresión una técnica estadística, por lo tanto para interpretar situaciones
reales, pero a veces se manipula de mala manera por lo que es necesario realizar una
selección adecuada de las variables que van a construir las formulas matemáticas, que
representen a la regresión, por eso hay que tomar en cuenta variables que tiene relación,
de lo contraria se estaría matematizando un galimatías.
𝑌 = 𝑎 + 𝑏𝑥
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑑 = 𝑌 − 𝑌 ?
que se cancelen entre sí, pueden hacer que el total (Σd) sea engañosamente cercano a
cero. Para evitar este problema, primero podría tomarse el valor absoluto de cada
desviación y luego minimizar su suma:
𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑎𝑟 Σ 𝑑 = Σ 𝑌 − 𝑌
Lo anterior se denomina criterio de los mínimos cuadrados, mediante el cual se elige una
única recta de mínimos cuadrados.
𝒀 = 𝒂 + 𝒃𝒙
Σ 𝑋 − 𝑋 (𝑌 − 𝑌 )
𝑏=
Σ(𝑋 − 𝑋 )2
Sean:
𝑥 = 𝑋−𝑋
𝑦 = (𝑌 − 𝑌)
Σ𝑥𝑦
𝑏=
Σ𝑥 2
Una vez que se ha calculado b, entonces se puede hallar ordenada al origen a a partir de
otra fórmula sencilla:
𝑎 = 𝑌 − 𝑏𝑋
X Y
Fertilizante (kg/Ha) Producción (Ton/Ha)
100 40
200 50
300 50
400 70
500 65
600 65
700 80
𝚺𝐱𝐲 16 500
𝒃= = = 0.059
𝚺𝐱 𝟐 280 00
Luego se utiliza esta pendiente b (junto con 𝑋 y 𝑌 calculadas en las dos primeras
columnas de la tabla 2) para calcular la ordenada al origen a a partir de la fórmula:
𝒀 = 𝒂 + 𝒃𝒙 = 36.4 + 0.059𝑋
La idea es convertir una curva exponencial a una recta por medio de logaritmos, ya sea
naturales o de cualquier otra base, como sigue. Empiece con la función exponencial
y = A·xr
Esto expresa log y como una función lineal de x, de forma ecuación de la recta y = a + bx
con:
Pendiente = b =r
Intersección = a = Log10 A
Por lo tanto, si calculamos la recta de mejor ajuste usando Log10 y como una función de x,
entonces la pendiente y la intersección en y serían dados como más arriba, y después
podemos obtener los coeficientes r y A por
r =b
A = 10a
* Datos son redondeados. Fuente: Informes de compañía/The New York Times, Enero 27, 1998, p. D1.
Solución. Pues necesitamos modelar Log10 R como una función lineal de t, primero
construimos una tabla con x = t y y = Log10 R, y entonces calculamos la recta de
regresión, y = a + bx.
Posteriormente se resuelve con los resultados anteriores como si de una regresión lineal
simple se tratara para encontrar la ecuación de la recta de mejor ajuste. Así, la recta de
regresión que obtenemos es:
y = 0.427+ 0.139 x
y = A·xr
R = A·tr
entonces:
a = log10 A = 0.427
b = r = 0.139
r = 0.139
𝐥𝐨𝐠 𝟏𝟎 𝑨 = 𝟎. 𝟒𝟐𝟕
𝟏𝟎(𝐥𝐨𝐠𝟏𝟎 𝑨) = 𝟏𝟎(𝟎.𝟒𝟐𝟕)
𝑨 = 𝟐. 𝟔𝟕𝟕
R = 2.6770·t0.139
Supongamos que tenemos una muestra de N personas, a cada persona se le asignan dos
números, uno mide su estatura y otro mide su peso. El conjunto de valores X = {x 1, x2,
...,xN} representa las diferentes estaturas y el conjunto Y = {y 1, y2, ...,yN} representa los
diferentes pesos. De esta forma podemos crear el conjunto de pares ordenados P = {(x 1 ,
y1), (x2 , y2), ...,(xN , yN)} donde el par ordenado (xi , yi) representa el peso y la estatura de
la persona número i. Para este conjunto podemos investigar la correlación que existe
entre estatura y peso.
En este artículo estudiaremos la correlación lineal. Esta correlación ocurre cuando dos
variables X,Y tiende a seguir un patrón lineal. Por ejemplo podemos investigar la relación
lineal que existe entre peso y estatura, promedio del CETEC-Jojutla y puntuación en el
examen de ingreso (examen de conocimientos), ingreso mensual y gastos mensuales,
coeficiente intelectual y promedio universitario, edad e ingreso mensual entre otras.
Se dice que existe una relación o correlación positiva entre dos variables X y Y, si al
aumentar los valores de X aumentan los valores de Y, o cuando al disminuir los valores
de X disminuyen los valores de Y. Por ejemplo:
P = {(2,1), (3,2), (3,3), (4,2), (4,3), (4,4), (5,4), (5,5), (6,3), (6,4), (6,5)}.
Se dice que existe una relación o correlación negativa entre dos variables X y Y, si al
aumentar los valores de X disminuyen los valores de Y, o cuando al disminuir los valores
de X aumentan los valores de Y. Por ejemplo para el conjunto de pares ordenados.
P = {(4,5), (5,3), (5,4), (5,5), (6,4), (6,4), (7,1), (7,2), (7,3), (8,1), (8,2)}.
Por el contrario mientras menor es el diámetro de la elipse que encierra los puntos de un
diagrama de dispersión mayor es la relación de las variables que contiene. Cuando esto
ocurre decimos que la correlación es fuerte. La figura 6 muestra una correlación
positiva fuerte.
La correlación lineal perfecta ocurre cuando todos los puntos del diagrama de dispersión
están exactamente sobre una recta inclinada, como se muestra en la figura 8.
Si los datos forman una recta horizontal o vertical, no hay correlación ya que una
variable no afecta la otra como se muestra en las figuras 9 y 10.
Los diagramas de dispersión no siempre se presentan en alguna de las formas que vimos
anteriormente. Algunas veces sugieren relaciones que no son lineales, como se muestra
en la figura 11.
En este diagrama hay un patrón definido, sin embargo las dos variables no están
relacionadas linealmente, esto implica que no hay correlación lineal.
Bibliografía:
Introducción a la estadística; T. H. Wonnacott, R. J. Wonnacott; 2ª Ed.; Limusa
Wiley; 2004.
Estadística aplicada a los negocios y la economía; Lind, Marchal, Wathen; 13ª Ed.;
Mc Graw Hill; 2008.