Análisis de la regresión y correlación entre variables

República Bolivariana de Venezuela
Ministerio del poder popular para la educación
Universidad Nacional Experimental de Los Llanos Occidentales ´Ézequiel Zamora´´
Barinas estado Barinas
CONFRONTACION DE VARIABLES
MEDIANTE LA REGRESION Y
CORRELACION
Alumnos:
Docente:
 María Gómez
 Ilene Malthiesen
C.I.: 26815225
 Stephany Velázquez
C.I.: 27421210
 Helianis Blanco
C.I.: 27076461
Barinas, junio 2021

INTRODUCCIÓN
Muchas veces las decisiones se basan en la relación entre dos o más variables.
Ejemplos:
• Dosis de fertilizantes aplicadas y rendimiento del cultivo.
• La relación entre la radiación que reciben los sensores con la que se predicen los
rendimientos por parcelas con los rendimientos reales observados en dichas parcelas.
• Relación entre tamaño de un lote de producción y horas – hombres utilizadas para

realizarlo.
•El peso de un adolescente, con su estatura.
• Los gastos, con el ingreso disponible en un mes.
• Estatura de los niños, con su edad.
• Demanda de algún artículo, con los gastos de propaganda
• Cantidad de cigarrillo al día y la frecuencia cardiaca.
Distinguiremos entre relaciones funcionales y relaciones estadísticas.

Números índices
Un número índice puede definirse como una medida estadística que nos permite
valorar la variación relativa de una magnitud simple o compleja a lo largo del tiempo o
del espacio. Lo más habitual es que se estudie la evolución de la magnitud a lo largo del
tiempo, con lo que hay que establecer un período inicial o base sobre el que se va
comparando la evolución de la magnitud o variable estadística.
 Usos
Existen un gran número de fenómenos socioeconómicos cuyo significado y estudio

alcanza distintos niveles de complejidad. Ejemplos de estos fenómenos pueden
encontrarse en el análisis de factores como el nivel de inflación, el nivel de desarrollo,
etc. Estos constituyen el instrumental analítico más adecuado para estudiar la evolución
de una serie de magnitudes económicas a través de las cuales podemos dar respuesta a
cuestiones tales como si la coyuntura económica es positiva o negativa, si el nivel de
inflación es adecuado o no o si nuestro ritmo de crecimiento económico permite o no
permite crear empleo. Los números índices, utilizados también con frecuencia en
Economía, Demografía, Salud y diferentes campos de la estadística aplicada.
 Construccion de números índices simples y agregados
Para explicar la construcción de un índice simple tenemos el siguiente ejemplo:

Como se ve en el cuadro, se pueden construir a partir de los mismos datos diferentes
índices, basados en distintos años base. El índice I se obtiene al tomar como año base
1994. El índice se calcula dividiendo el precio del petróleo de cada año por el precio del
año base, este cociente se multiplica por 100. Siendo entonces en el año 1999 el precio
del petróleo 112,56% del correspondiente a 1994. Mediante cualquiera de estos índices
(I y II) los valores absolutos de la variable se transforman en valores relativos y así
pueden compararse fácilmente las variaciones de los precios.
Según la Encuesta Permanente de Hogares el número de ocupados urbanos en octubre

de 1998 fue de 11.713 miles de trabajadores, siendo 11.485 miles en octubre de 2001
por lo que decimos que el índice de empleo de octubre 2001 con base en octubre de
1998, fue:
Reflejando un descenso del empleo de 1,0 – 0,9805= 0,015, o, en porcentaje, de un

1,5% entre ambos años. Siendo este un ejemplo de un índice simple de cantidades.
 Construcción de Índices Agregados

• Los índices agregados no ponderados o no pesados significan que todos los valores
considerados son de igual importancia. Agregado significa que agregamos o sumamos
todos los valores. La principal ventaja de este índice es su simplicidad.
• Para construir un índice de precios agregados sin ponderar, primero debemos obtener
la suma de los diversos precios para cada uno de los periodos que se consideran y luego
dividirla por la suma de los precios del periodo base.
• Sea Σ p0 la suma de los precios del periodo base y sea Σpn la suma de los precios del
periodo dado; el cociente de las dos sumas multiplicado por 100 arroja el índice P
expresado en porcentaje; esto es:
 Cambio de periodo base
Cuando se utilizan números índices es frecuente que una vez trascurrido cierto tiempo
desde la elección del periodo base, el dato correspondiente a dicho período pierda su
carácter representativo, de manera que resulta conveniente fijar un nuevo período de
referencia más próximo al actual. Para efectuar un cambio de base simplemente se
divide cada valor de la serie de números índices entre el que toma en el que se va a
considerar como nuevo período de referencia. El periodo base debe ser elegido entre los
períodos que tengan un comportamiento lo más normal posible.
Por ejemplo, en el siguiente cuadro se muestra que se ha obtenido los índices en base
1995 para los turistas que llegaron a España por carretera en el periodo comprendido
entre 1995 y 2003. Dado el tiempo transcurrido entre el periodo de referencia y el
actual, puede ser aconsejable realizar un cambio de base de 1995 a 2000. Para obtener
los índices en base 2000 a partir de los que están en base 1995, se divide cada uno de los
valores de la serie en base 1995 entre 118,06 que es el valor que en dicha serie
corresponde al nuevo periodo de referencia, de manera que en el año 1995, el índice en
base 2000 es 84,70 (= 100,00 / 119,06), en el año 1996 es 87,72 (= 103,68 / 118,06),
etcétera.
Números índices, en base entre 1995 y 2000:

Formulas
a) Regresión
b) Correlación
Variables que intervienen enVariable respuesta

un estudio
(´Éfecto´´)
Variable explicativa
(´Ćausa´´)
Variable dependiente
Se representa en el eje Y
Variable independiente
Se representa en el eje X
Diagrama de dispersión
También conocido como gráfico de dispersión o gráfico de correlación consiste en la

representación gráfica de dos variables para un conjunto de datos. En otras palabras,
analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o
qué tan independientes son una de la otra.
Relación lineal entre dos variables
Es aquella que puede representarse con mejor exactitud mediante una línea recta. No
toda relación entre dos variables es lineal. Algunas se representan con mejor exactitud
usando una curva. En este caso, se dice que la relación entre las variables es curvilínea.
Una relación entre dos variables puede ser:
 Positiva
 Negativa
 Relación lineal positiva
Una relación positiva entre las variables X y Y indica que existe una relación directa
entre ellas, es decir, los valores menores de X están asociados con los valores menores
de Y y los valores mayores de X están asociados con los valores mayores de Y.
Existe una relación positiva entre las variables X y Y si al aumentar los valores de X
los valores de Y tienden a aumentar. Una relación lineal positiva está representada
gráficamente por una línea recta de pendiente positiva
 Relación lineal negativa
Una relación negativa entre las variables X y Y indica que existe una relación
inversa entre ellas, es decir, los valores menores de X están asociados con los
valores mayores de Y y los valores mayores de X están asociados con los valores
menores de Y. Si existe una relación negativa entre las variables X y Y, entonces al
aumentar los valores de X los valores de Y tienden a disminuir y viceversa.
Una relación lineal negativa queda representada gráficamente por una línea recta
de pendiente negativa.
 Relación lineal perfecta
Es aquella en la que existe una relación positiva o negativa para la cual todos los
puntos caen sobre una recta.
 Relación lineal imperfecta
Una relación lineal imperfecta es aquella en la cual existe una relación positiva o
negativa, pero no todos los puntos caen sobre la recta.
Análisis de correlación lineal simple
Si entre dos variables cuantitativas existe una relación lineal, el análisis de

correlación lineal simple se usa para determinar la dirección y la magnitud de dicha
relación.
La dirección de la relación se refiere a si ésta es positiva o negativa.
La magnitud de la relación o grado de relación entre las variables se refiere a la

fuerza de la relación que existe entre las variables. Se trata de expresar
cuantitativamente el grado de relación que existe entre las variables en estudio.
 Coeficiente de Correlación: expresa de manera cuantitativa el grado y la

dirección de la relación entre dos variables.
•Coeficiente de correlación r de Pearson (rxy): se usa cuando los datos están medidos en
una escala de intervalo o de razón.
•Coeficiente de correlación rho de Spearman (rs): se utiliza cuando una o ambas

variables están medidas en la escala ordinal, en la escala de intervalo o la de razón.
Características del coeficiente de correlación

El signo del coeficiente indica si la relación entre las variables es positiva o negativa:
si el coeficiente es positivo, entonces la relación es positiva. En caso contrario, la
relación es negativa.
El valor numérico del coeficiente de correlación varía entre –1 y +1 y éste describe la
magnitud de la relación entre las variables.
 Si r = -1 entonces existe una relación lineal perfecta negativa entre las
variables.
 Si r = 0 entonces no existe relación entre las variables.
 Si r = +1 entonces existe una relación lineal perfecta positiva entre las
variables.
Las relaciones imperfectas, positivas o negativas, tienen coeficientes de correlación

que varían entre –1 y +1. Relaciones:
 Si r = 0 - Nula
 Si r > 0 y r < ± 0,10 - Casi Nula
 Si r >= ± 0,10 y r < ± 0,20 - Muy baja
 Si r >= ± 0,20 y r < ± 0,40 - Baja
 Si r >= ± 0,40 y r < ± 0,60 - Media
 Si r >= ± 0,60 y r < ± 0,80 - Alta
 Si r >= ± 0,80 y r < ± 1,00 - Muy alta
 Si r = ± 1 – Perfecta
Al calcular el coeficiente de correlación deben tomarse en cuenta dos aspectos: la

forma de la relación y la escala de medición.
 La forma de la relación: para interpretar correctamente el valor del coeficiente

de correlación de Pearson o de Spearman es necesario que la relación entre las
variables sea lineal. Por ello, previo al cálculo de un coeficiente de correlación
lineal, es necesario elaborar un diagrama de dispersión para determinar si existe
o no una relación lineal entre las variables.
 La escala de medición: si las variables están medidas en la escala de intervalo o

razón se calcula de r de Pearson. Si una o ambas variables están medidas como
mínimo en la escala ordinal se puede calcular el coeficiente de correlación de
Spearman.
Análisis de regresión lineal simple
El análisis de regresión lineal simple tiene por objetivos:
1. Describir la relación lineal existente entre dos variables cuantitativas mediante la

ecuación de la recta que mejor se ajusta a los datos
2. Usar esta ecuación para realizar una predicción de los valores de una variable
usando la información aportada por la otra.
En el análisis de regresión lineal es simple cuando intervienen sólo dos variables:

Una de ellas es llamada variable independiente y es denotada por la letra X. La otra
variable es llamada variable dependiente, denotada por la letra Y.
Los valores de la variable dependiente son los que deseamos predecir, usando para
ello la información aportada por la variable independiente (X). Si en el análisis de
regresión intervienen más de dos variables (una dependiente y las demás
independientes), éste es llamado análisis de regresión lineal múltiple.
En el caso de una relación lineal, el objetivo es obtener la ecuación de la recta que

mejor se ajuste a los datos (que mejor represente la relación entre las variables). Esta
ecuación es llamada ecuación de regresión lineal simple:
Yí= A+B.Xi
Donde:
Yí= valor estimado de Y para el valor de Xi
A= constante de regresión lineal
B= coeficiente de regresión lineal
Interpretación del coeficiente de regresión lineal
•Si B > 0 entonces la relación lineal es positiva y el valor absoluto de B representa el

número de unidades que tiende a aumentar la variable Y por cada unidad que aumenta
la variable X.
• Si B < 0 entonces la relación lineal es negativa y el valor absoluto de B representa el

número de unidades que tiende a disminuir la variable Y por cada unidad que aumenta
la variable X.
• Si B = 0 entonces la ecuación de regresión lineal no es el modelo más adecuado para

describir la relación entre las variables involucradas. En este caso, la media aritmética
es la mejor predicción de la variable dependiente para cualquier valor de la variable
independiente.
Interpretación de la constante de regresión lineal
La constante de regresión indica el valor correspondiente a la variable dependiente

cuando la variable independiente asume un valor igual a cero. Se debe tener cuidado al
interpretar la constante de regresión de la ecuación pues en ocasiones ésta no tiene
sentido.
Consideraciones al utilizar la regresión lineal para la predicción
•Linealidad: Para usar de una manera eficiente el análisis de regresión con la finalidad
de predecir, se exige que la relación entre las variables sea lineal.
•Si se va a utilizar los datos de un grupo de sujetos para hacer predicciones sobre otro
grupo de sujetos, es importante que el grupo de cálculo básico sea representativo del
grupo de predicción.
•La ecuación de la recta de predicción se utiliza de manera adecuada, sólo para el

rango de la variable en la cual se basa.
Aplicación
Los datos siguientes muestran las cantidades consumidas de complemento nutricional

(en Kg.) y el aumento de peso de niños con signos de desnutrición.
Presente la información en un diagrama de dispersión
 Procedimiento:
1er Paso: Reúna pares de datos (X,Y), cuya relación desea estudiar y organice la
información en una tabla.
2do Paso: Encuentre los valores mínimos y máximos para X e Y. Elija las escalas
que se usarán en los ejes horizontal y vertical, de manera que ambas longitudes sean
aproximadamente iguales, facilitando la lectura del diagrama.
3er Paso: Registre los datos en el gráfico. Cuando se obtengan los mismos valores en
diferentes observaciones, muestre estos puntos haciendo círculos concéntricos (o), o
registre el segundo punto muy cerca del primero.
4to Paso: Agregue toda la información que puede ser de utilidad para entender el
diagrama, tal como: título del diagrama, período de tiempo, número de pares de datos,
nombre de la variable y unidades de cada eje, entre otros.

Análisis de la regresión y correlación entre variables

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis de la regresión y correlación entre variables

Cargado por

Copyright:

Formatos disponibles

República Bolivariana de Venezuela

Ministerio del poder popular para la educación

Universidad Nacional Experimental de Los Llanos Occidentales ´´Ezequiel Zamora´´

Barinas estado Barinas

Barinas, junio 2021

• Dosis de fertilizantes aplicadas y rendimiento del cultivo.

• Relación entre tamaño de un lote de producción y horas – hombres utilizadas para

•El peso de un adolescente, con su estatura.

• Los gastos, con el ingreso disponible en un mes.

• Estatura de los niños, con su edad.

• Demanda de algún artículo, con los gastos de propaganda

• Cantidad de cigarrillo al día y la frecuencia cardiaca.

Distinguiremos entre relaciones funcionales y relaciones estadísticas.

Existen un gran número de fenómenos socioeconómicos cuyo significado y estudio

 Construccion de números índices simples y agregados

Para explicar la construcción de un índice simple tenemos el siguiente ejemplo:

Según la Encuesta Permanente de Hogares el número de ocupados urbanos en octubre

Reflejando un descenso del empleo de 1,0 – 0,9805= 0,015, o, en porcentaje, de un

 Construcción de Índices Agregados

 Cambio de periodo base

Números índices, en base entre 1995 y 2000:

Variables que intervienen enVariable respuesta

También conocido como gráfico de dispersión o gráfico de correlación consiste en la

Relación lineal entre dos variables

 Relación lineal positiva

 Relación lineal negativa

 Relación lineal imperfecta

Análisis de correlación lineal simple

Si entre dos variables cuantitativas existe una relación lineal, el análisis de

La magnitud de la relación o grado de relación entre las variables se refiere a la

 Coeficiente de Correlación: expresa de manera cuantitativa el grado y la

•Coeficiente de correlación rho de Spearman (rs): se utiliza cuando una o ambas

Características del coeficiente de correlación

Las relaciones imperfectas, positivas o negativas, tienen coeficientes de correlación

Al calcular el coeficiente de correlación deben tomarse en cuenta dos aspectos: la

 La forma de la relación: para interpretar correctamente el valor del coeficiente

 La escala de medición: si las variables están medidas en la escala de intervalo o

El análisis de regresión lineal simple tiene por objetivos:

1. Describir la relación lineal existente entre dos variables cuantitativas mediante la

En el análisis de regresión lineal es simple cuando intervienen sólo dos variables:

En el caso de una relación lineal, el objetivo es obtener la ecuación de la recta que

Interpretación del coeficiente de regresión lineal

•Si B > 0 entonces la relación lineal es positiva y el valor absoluto de B representa el

• Si B < 0 entonces la relación lineal es negativa y el valor absoluto de B representa el

• Si B = 0 entonces la ecuación de regresión lineal no es el modelo más adecuado para

Interpretación de la constante de regresión lineal

La constante de regresión indica el valor correspondiente a la variable dependiente

Consideraciones al utilizar la regresión lineal para la predicción

•La ecuación de la recta de predicción se utiliza de manera adecuada, sólo para el

Los datos siguientes muestran las cantidades consumidas de complemento nutricional

Presente la información en un diagrama de dispersión

También podría gustarte