Está en la página 1de 6

Tema-7-Resumen.

pdf

Martacm_01

Analisis de Datos en Psicologia I

2º Grado en Psicología

Facultad de Educación, Psicología y Ciencias del Deporte


Universidad de Huelva

Reservados todos los derechos.


No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Marta Castillo Molero

Tema 7: Análisis descriptivo bivariable: Análisis de la relación entre dos

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
variables cuantitativas.
¿Cómo analizar la relación entre dos variables cuantitativas?

La estrategia de comparación de medias no es la más adecuada: tendríamos un


número elevado de medias a comparar, y en muchos casos las medias se obtendrían a
partir de muy pocos datos.

1. Diagrama de dispersión.

Eje de abscisas (X): Variable predictora. Eje de ordenadas (Y): Variable criterio. Cada

Reservados todos los derechos.


punto representa un caso y su posición depende de los valores tomados por ese caso
en ambas variables.

Interpretación:

La interpretación de un diagrama de dispersión se basa en la comparación entre la


representación de los datos y una función que permita predecir los valores de la
variable criterio a partir los valores de la variable predictora.

Función lineal: Y = A + BX

Su representación gráfica es una línea recta. Las técnicas de análisis de este tema sólo
son adecuadas para este tipo de relaciones.

 Funciones lineales directas (tendencia creciente; pendiente positiva).


 Funciones lineales inversas (tendencia decreciente; pendiente negativa)

Intensidad de la relación: Cuanto mayor sea el ajuste de los puntos a una línea recta
(relaciones lineales) mayor será la intensidad de la relación, de forma más precisa se
podrán predecir los valores de una variable a partir de los valores de la otra.

2. Estadísticos de asociación entre dos variables cuantitativas.

2.1. Covarianza.

Es el promedio de los productos de las puntuaciones diferenciales.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009380
Marta Castillo Molero

Interpretación:

Sxy = 0  Relación lineal nula

Sxy > 0  Relación lineal directa

Sxy < 0  Relación lineal inversa

Si dividimos el diagrama de dispersión en 4 zonas en función de los valores de las

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
medias, todos los productos de puntuaciones diferenciales correspondientes a los
casos que se encuentran en las zonas superior derecha e inferior izquierda son
positivos, mientras que los productos de puntuaciones diferenciales correspondientes
a los casos que se encuentran en las zonas superior izquierda e inferior derecha son
negativos.

La covarianza no es un buen indicador de la intensidad de la relación. Su valor depende


de las unidades de medida de las variables.

2.2. Coeficiente de correlación de Pearson.

Reservados todos los derechos.


El coeficiente de correlación de Pearson es el promedio de los productos de las
puntuaciones típicas.

Interpretación:

rxy = 0  Relación lineal nula

rxy > 0  Relación lineal directa

rxy < 0  Relación lineal inversa

Fórmula más utilizada:

Propiedades del coeficiente de correlación:

1. Un valor bajo del coeficiente de correlación no implica ausencia de relación, sólo


implica ausencia de relación lineal.

2. Un valor elevado del coeficiente de correlación no implica una relación causal.

3. Es invariante ante cualquier transformación lineal de las variables.

Respuesta Coca-Cola Zero Azúcar. Demasiado bueno para explicarlo con palabras
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009380
Marta Castillo Molero

3. Regresión lineal simple.

Las técnicas de regresión son técnicas de predicción.

Hasta ahora hemos visto como determinar si dos variables cuantitativas estaban
relacionadas y cuál era la intensidad de esa relación. Las técnicas de regresión
permiten determinar la función matemática más adecuada para predecir los valores de
una o más variables predictoras.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3.1. Regresión lineal simple.

Nos ceñiremos únicamente en las técnicas para estudiar relaciones lineales, de manera
que la función matemática buscada será la ecuación de una línea recta.

Y’ = A + BX

Nos ceñiremos al caso de una sola variable predictora. Por tanto no abordaremos las
técnicas de regresión múltiple.

Mínimos cuadrados: El criterio para la elección de la ecuación de regresión que mejor

Reservados todos los derechos.


se ajusta a los datos es elegir aquella que minimiza los errores al cuadrado

Y’ = A + BX

Y = Y’ + error

Siendo el error igual a la diferencia entre las puntuaciones observadas y las


puntuaciones predichas  error = Y – Y’

En principio podría pensarse que la suma de los errores podría ser un buen indicador
de la cantidad de error cometido al usar la recta de regresión para predecir las
puntuaciones. Sin embargo, debido a que unos errores serán positivos y otros
negativos, la suma tiende a ser 0. Por ello para evaluar la cantidad de error cometido
con la recta de regresión se usa la suma de los errores al cuadrado (Suma Cuadrática
de los Errores - SCe-).

3.2. Evaluación del modelo.

El hecho de que una ecuación de regresión sea la que mejor ajuste a unos datos no
implica que el ajuste sea bueno. ¿Cómo se evalúa el ajuste de la ecuación de regresión
a los datos?

Al igual que en el análisis de la varianza, en el modelo de regresión se comparan dos


predicciones:

Equilibrio en tu día a día con el nuevo portátil Prestige 15. Entra ya y llévatelo
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009380
Marta Castillo Molero

1. Predecir Y a partir de la media. La cantidad de error cometido con esta predicción

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
se evalúa mediante la SCT.

2. Predecir Y a partir de la recta de regresión. La cantidad de error cometido con esta


predicción se evalúa mediante la SCe.

La diferencia entre SCT y la SCe será una medida de la ganancia predictiva que se
consigue con la ecuación de regresión, y se denomina Suma Cuadrática de las
predicciones (SCY’).

Reservados todos los derechos.


Evaluación del modelo

Al igual que en el análisis de la varianza, el indicador de la capacidad predictiva del


modelo usado en regresión es la proporción de la variabilidad total atribuible a la
variable predictora. En regresión este indicador recibe el nombre de coeficiente de
determinación, y además puede demostrarse que es igual al cuadrado del coeficiente
de correlación (r2).

Los criterios usados para evaluar el tamaño de este indicador.

Interpretación del coeficiente de determinación (r2)

Es recomendable interpretar el coeficiente de determinación en el contexto específico


de las variables analizadas. Así, no tendrá la misma importancia una r2 = 0,7 si estamos
analizando la relación entre peso y altura que si estamos analizando la relación entre
ansiedad y notas. En cualquier caso, las recomendaciones de Cohen (1988) pueden
tener cierta utilidad en el contexto de las relaciones entre variables psicológicas.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-5009380

También podría gustarte