Está en la página 1de 17

C

CARRERA
INGENIERÌA AMBIENTAL

ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

Docente: Cecilia Parra Ferié


PhD. Doctora en Ciencias Técnicas

cparra@espam.edu.ec
Análisis de correlación y regresión
• Relación entre variables. Tipos de relaciones entre
variables.
• Diagramas de dispersión
• Análisis correlacional. Uso de paquetes estadísticos
para el análisis e interpretación
Generalmente se toman Para hacer estos pronósticos, se basan en la
decisiones basadas en relación (intuitiva y calculada) entre lo que
predicciones ya se sabe y lo que se debe estimar.
de sucesos futuros.

Si los responsables de la toma de decisiones pueden


determinar cómo lo conocido se relaciona con el evento
futuro, pueden ayudar considerablemente al proceso de
toma de decisiones.

Ése es el objetivo de esta temática: cómo determinar la relación entre


variables.
Los análisis de regresión y correlación nos
mostrarán cómo determinar tanto la naturaleza
como la fuerza de una relación entre dos
variables, que son cuantitativas.
TIPOS DE RELACIONES ENTRE VARIABLES

Los análisis de regresión y de correlación se basan en la


relación, o asociación, entre dos o más variables.

La variable independiente ---- X


La variable dependiente ----- Y
Relaciones directas e inversas entre la variable independiente X y la variable
dependiente Y

Al incrementarse la variable independiente, la La variable dependiente disminuye al aumentar la


variable dependiente también lo hace. variable independiente.
Ejemplo: Las ventas de una empresa se Ejemplo: El incremento del precio de los productos
incrementan al aumentar el presupuesto de hace que disminuya la demanda de los mismos.
publicidad.
DIAGRAMAS DE DISPERSION

El primer paso para determinar si existe una relación


entre dos variables es examinar la gráfica de los
datos observados (o conocidos).
Esta gráfica, o dibujo, se llama diagrama de
dispersión.
Trazo, o “ajuste”, de una línea recta
a través del diagrama de dispersión

La línea recta
representa la relación
entre X y Y “ajustada”

Diagrama de dispersión de las calificaciones de


Cuando vemos todos estos puntos juntos, podemos visualizar
estudiantes en exámenes de admisión graficadas contra el
la relación que existe entre las dos variables. Como resultado,
promedio general acumulado
podemos trazar, o “ajustar” una línea recta a través del
diagrama de dispersión para representar la relación.

La relación descrita por los puntos está definida por una línea recta. Por tanto, podemos decir que
es una relación lineal.
La relación entre las variables X y Y también puede tomar la forma de una
curva. Los especialistas en estadística la llaman relación curvilínea

La dirección de la curva puede indicar si la


relación curvilínea es directa o inversa. La
curva describe una relación inversa porque Y
disminuye al aumentar X.

Relación curvilínea entre el tiempo de construcción de una nuevo avión y el número de unidades
producidas.
Se ilustra la relación curvilínea de este fenómeno de “curva de aprendizaje”.
Resumiendo, los tipos de
relaciones que podemos
encontrar entre la
variable dependiente (Y)
y la independiente (X),
son:
Ejemplo:

a) Si deseamos estudiar la relación entre la


Contaminación atmosférica y la emisión de CO2

Cómo clasificaríamos estas variables???????

b) En el caso de las variables cambio climático y la


deforestación.

Cómo las clasificaríamos ???????


Análisis correlacional. Uso de paquetes
estadísticos para el análisis e interpretación
El coeficiente de correlación de Pearson, pensado para variables cuantitativas
(escala mínima de intervalo), es un índice que mide el grado de covariación
entre distintas variables relacionadas linealmente.
Esto significa que puede haber variables fuertemente relacionadas, pero no
de forma lineal, en cuyo caso no puede aplicarse la correlación de Pearson.

Por ejemplo, la relación entre el estrés y el rendimiento tiene forma


parabólica; igualmente, si relacionamos población y tiempo la relación será
de forma exponencial. En estos casos (y en otros muchos) no es conveniente
utilizar la correlación de Pearson.
El coeficiente de correlación de Pearson es un índice de fácil
ejecución e, igualmente, de fácil interpretación.
Sus valores absolutos oscilan entre 0 y 1.
El valor del índice de correlación varía en el intervalo [-1,1], indicando el signo el sentido
de la relación:
 Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total
entre las dos variables denominada relación directa: cuando una de ellas aumenta, la
otra también lo hace en proporción constante.
 Si 0 < r < 1, existe una correlación positiva.
 Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todavía relaciones no lineales entre las
dos variables.
 Si -1 < r < 0, existe una correlación negativa.
 Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia
total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la
otra disminuye en proporción constante.
Ejemplo Tengamos las siguientes puntuaciones en las variables X e Y :

X: 105 116 103 124 137 126 112 129 118 105
Y: 4 8 2 7 9 9 3 10 7 6

También podría gustarte