Está en la página 1de 49

Unidad Académica de

Estudios Generales

Estadística Básica

Profesores: Equipo docente de Estadística


Unidad IV
Semana 13

Pruebas para estudios correlacionales


¿Qué variables se relacionan con el índice tabáquico?
V1 V2

Saturación de oxígeno
LOGRO DE LA SESIÓN

Al finalizar la sesión, el estudiante determina la relación


de variables cuantitativas y cualitativas aplicando las
pruebas estadísticas de correlación de Pearson, Rho de
Spearman y Chi Cuadrado según cumplimiento de
supuestos, haciendo uso de SPSS.
Semana 13: Pruebas para estudios correlacionales

1. Correlación de Pearson
2. Correlación Rho de Spearman
3. Chi Cuadrado
4. Conclusiones

ASU: HCD300 - Bioestatistics. Unit 2: Homework 4 Lecture: Correlation (2.2)


CORRELACIÓN
Busca determinar si dos variables cuantitativas están relacionadas linealmente y en
qué medida los cambios de una variable pueden explicarse por los cambios que
ocurren en la otra. Esta correlación, parten de observaciones en las variables X e Y, se
valora si los puntos tienen una tendencia lineal y cual es su orientación, se mide con
el coeficiente de correlación de Pearson.

Pregunta de Investigación

¿Cuál es la relación entre la variable 1 y la variable 2?

NO implica causalidad, solo asociación


CORRELACIÓN

Grado de correlación entre dos variables (no causalidad)


V1 V2

Dirección Infidelidad

Fuerza

Significación Satisfacción
de la relación
CORRELACIÓN
Dirección: Gráfico de dispersión se observa la tendencia y relación si es positiva o negativa.

18 25 6
16
Var. Dependiente (Y)

Var. Dependiente (Y)

Var. Dependiente (Y)


20 5
14
12 4
10 15
3
8
10
6 2
4
5 1
2
0 0 0
0 5 10 15 0 10 20 30 0 5 10 15 20
Var. Independiente (X) Var. Independiente (X) Var. Independiente (X)

Relación positiva Relación negativa No hay relación lineal


Correlación

¿Cumple los supuestos de


normalidad?
SI NO

Prueba Prueba no
paramétrica paramétrica

Correlación de Correlación Rho de


Pearson Spearman
Relación entre dos variables cuantitativas
con distribución normal

A: Correlación de
1. Gráfico de dispersión
Pearson 2. Correlación de Pearson
3. Hipótesis estadísticas
4. P-valor
COEFICIENTE DE CORRELACIÓN LINEAL

La correlación lineal se mide con el estadístico denominado coeficiente de correlación


de Pearson y nos indica la fuerza de correlación, su fórmula es:

nXYXY
R
nX2 (X)2 nY2 (Y)2

(( ) ; donde -1 ≤ ≤ +1
R=

Si r < 0  Existe correlación negativa entre las variables


Si r > 0  Existe correlación positiva entre las variables
Si r = 0  No existe correlación lineal entre las variables (Variables no correlacionadas)
Interpretación del coeficiente de correlación R de Pearson

El Coeficiente de Correlación R de Pearson mide la fuerza y dirección de relación entre dos variables
cuantitativas en una escala que varía entre -1 a +1. Cuanto mas se aleja del 0 el valor del coeficiente
muestra una relación mas fuerte. El signo de R nos indica si la relación es positiva o negativa.

Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación
negativa negativa negativa negativa negativa positiva positiva positiva positiva positiva
Muy alta Alta Moderada Baja Muy baja Muy baja Baja Moderada Alta Muy alta

-1 -0.8 -0.6 -0.4 -0.2 0 +0.2 +0.4 +0.6 +0.8 +1

NEGATIVA POSITIVA

Hernández, Fernández & Baptista, 2016, 304-305


Coeficiente de Correlación R de Pearson
130
330 120
110
280
100
230 90
80
180 70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100
100
90
90
80
80
70
70
60
60
50
50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Coeficiente de Correlación R de Pearson
80
90
80 70
70 60
60 50
50 40
40
30
30
20
20
r=-0,5 10 r = -0,7
10
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

80
80

70
70
60 60
50 50
40 40
30 30
20
20
10 r= -0,95 10 r=-0,999
0
0
140 150 160 170 180 190 200
140 150 160 170 180 190 200
Prueba de correlación
1. Formulación de hipótesis estadísticas

Ho: No existe correlación entre la variable X e Y ( r = 0)


H1: Si existe correlación entre la variable X e Y ( r ǂ 0)
2. Nivel de significancia: α = 0,05

3. Estadístico de prueba: Correlación de Pearson

4. P – valor : se obtiene con SPSS o cualquier otro software estadístico

5. Decisión: si P-valor < 0.05 se rechaza Ho

6. Conclusión: con la hipótesis no rechazada


Resultados de la prueba de correlación de Pearson
Significación y P-valor

Interpretación de resultados
Como R =0.513 las variables peso y talla muestran una correlación moderada positiva.
Con una confianza de 95% y P-valor =0.000 menor a 0.05 se concluye que si existe una
correlación significativa entre talla y peso.
Ejemplo 1
El estudio tiene como objetivo determinar la relación que existe entre el número de respiraciones
por minuto y el nivel de saturación de oxígeno en pacientes con Covid 19. Los datos corresponden
a las mediciones que se hicieron antes de recibir asistencia médica en el hospital del Dos de Mayo
en el año 2020. Probar si existe correlación entre las variables con una significancia de 0,05.
Nivel de saturación Respiraciones por
de oxígeno minuto

1 85 40
2 86 38
3 87 35
4 88 34
5 88 35
6 89 29
7 89 30
8 89 32
9 90 26
10 90 25
11 90 27
Solución:
Variables:
X: Nivel de saturación de oxígeno
Y: Respiraciones por minuto
GRÁFICO DE DISPERSIÓN

En el gráfico de dispersión se observa una tendencia lineal con relación inversa entre la
respiraciones por minuto y el nivel de saturación de oxígeno.
Solución:
Regla de decisión: Usando un nivel de confianza de 95%. Si el nivel de significancia (p-valor) es menor que 0.05, se
rechaza la hipótesis nula.

1. PRUEBA DE NORMALIDAD

Formulación de la hipótesis
Ho: La distribución de las variables saturación de oxígeno y respiraciones por minuto no es diferente a una distribución normal
H1: La distribución de las variables saturación de oxígeno y respiraciones por minuto es diferente a una distribución normal

Estadístico de prueba: Shapiro Wilk

Decisión: P-valor = 0,152 y P-valor=0.759 para las variables saturación oxígeno y respiraciones por minuto son mayores a 0,05
entonces no se rechaza la hipótesis nula.
Conclusión: Con una confianza de 95% se obtuvo un P-valor=0,152 y P-valor=0,459 son mayores a 0,05. Se concluye que
los datos de las variables saturación de oxígeno y respiraciones por minuto tiene una distribución normal, por
consiguiente se utilizará la prueba paramétrica Correlación de Pearson.
Correlación de Pearson con SPSS
Analizar, Correlaciones , Bivariadas, luego ingresar ambas variables

Ingresa
Saturación de Oxígeno
Respiraciones por m
Solución:
2. PRUEBA DE CORRELACIÓN DE PEARSON
Formulación de la hipótesis

Ho: No existe correlación entre el nivel de saturación de oxígeno y el número de respiraciones por minuto
H1: Si existe correlación entre el nivel de saturación de oxígeno y el número de respiraciones por minuto

Estadístico de prueba: Correlación de Pearson

R = -0,960

Decisión: P-valor = 0,000 < 0,05 se rechaza Ho y se acepta H1

Conclusión: Según resultados de la prueba de correlación de Pearson con un P-valor= 0,000. Se concluye que si
existe correlación significativa entre el nivel de saturación de oxígeno y el número de respiraciones por
minuto, además es una correlación negativa muy alta (R= -0,960 ).
Resultados de correlación de Pearson con SPSS
Resultados
Ejemplo 1 aplicativo de ASU
Ingresos Años de Ingresos Años de
El estudio tiene como objetivo determinar la anuales educación anuales educación
N° N°
relación que existe entre el número de años de 1 36577 11 11 64543 12
educación y el ingreso anual. Los datos 2 54365 12 12 43433 14
corresponden a una encuesta realizada a 20 3 33542 10 13 34644 12
trabajadores que se encuentra en el archivo: 4 65654 12 14 33213 10
5 45765 11 15 55654 15
S13 ASU 02-4Data_examples_additional_correlations.xlsx. 6 24354 7 16 76545 14
43233 12 21324 11
Probar si existe correlación entre las variables con 7 17
8 44321 13 18 17645 12
una significancia de 0,05. 23216 9 23432 11
9 19
10 43454 12 20 44543 15

Tomado de: Arizona State University (Enero, 2023). HCD300: Bioestatistics. Estadística para los negocios.
https://canvas.asu.edu/courses/49003/modules 5.
Relación entre dos variables cuantitativas
sin distribución normal

B: Correlación Rho de
Spearman 1. Gráfico de dispersión
2. Correlación Rho de Spearman
3. Hipótesis estadísticas
4. P-valor
Correlación Rho de Spearman

Rho de Spearman es una prueba estadística no paramétrica, que


busca examinar la dirección y magnitud de la asociación de
variables aleatorias cuantitativas sin distribución normal y variables
cualitativas con medición ordinal.

Valores de correlación entre: -1, 0, +1


Correlación Rho de Spearman

El coeficiente de correlación de Spearman también denominado correlación de


rangos o jerarquías, mide la fuerza de correlación. Charles Edward Spearman (1904)
la fórmula es:

6 d 2 : −1 ≤ ≤ +1
 1
n ( n 2  1)
 : Coeficiente de correlación de
Interpretación Rs: Spearman
Si  < 0  Existe correlación negativa d: Es la diferencia entre los
correspondientes datos de
Si  > 0  Existe correlación positiva
ordenados según rangos
Si  = 0  No existe correlación
n: Tamaño de datos
Interpretación del coeficiente de correlación Rho de Spearman
El Coeficiente de Correlación Rho de Spearman mide la fuerza y dirección de relación entre dos variables
medidas en al menos escala ordinal que varía entre -1 a +1. Cuanto mas se aleja del 0 el valor del
coeficiente muestra una relación mas fuerte. El signo de  nos indica si la relación es positiva o negativa.

Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación
negativa negativa negativa negativa negativa positiva positiva positiva positiva positiva
Muy alta Alta Moderada Baja Muy baja Muy baja Baja Moderada Alta Muy alta

-1 -0.8 -0.6 -0.4 -0.2 0 +0.2 +0.4 +0.6 +0.8 +1

NEGATIVA POSITIVA

Hernández, Fernández & Baptista, 2016, 304-305


Prueba de Correlación Rho de Spearman
1. Formulación de hipótesis estadísticas

Ho: No existe correlación entre la variable X e Y ( = 0)


H1: Si existe correlación entre la variable X e Y ( ǂ 0)
2. Nivel de significancia: α = 0,05

3. Estadístico de prueba: Correlación Rho de Spearman

4. P – valor : se obtiene con software estadístico SPSS

5. Decisión: si P-valor ≤ α = 0.05 se rechaza Ho y se acepta H1

6. Conclusión: con la hipótesis no rechazada


Ejemplo 2

Un analista está interesado en conocer la


influencia del Clima organizacional en el
estrés de las enfermeras de una clínica.
Para saberlo, administró dos escalas, una
que mide Clima Organizacional y otra que
mide estrés a un grupo de 10 enfermeras.
El analista se plantea que ambas variables
están relacionadas.

Clima laboral 61 41 55 42 50 55 62 57 60 59 90
Estrés 42 60 50 55 58 60 48 60 52 72 40
Relación de clima laboral y estrés en enfermeras
Problema Objetivo Hipótesis
¿Cuál es la relación entre el clima laboral Determinar la relación entre el clima H1: Existe relación significativa entre el
y el estrés en las enfermeras de una laboral y el estrés en las enfermeras de clima laboral y el estrés en las enfermeras
clínica privada? una clínica privada de una clínica privada

Solución: GRÁFICO DE DISPERSIÓN

Variables:
X: Clima laboral
Y: Estrés

En el gráfico de dispersión se observa una


relación inversa entre clima laboral y estrés.
Solución:
Regla de decisión: Usando un nivel de confianza de 95%. Si el nivel de significancia (p-valor) es menor que 0.05,
se rechaza la hipótesis nula.

1. PRUEBA DE NORMALIDAD
Formulación de la hipótesis
Ho: La distribución de las variables clima laboral y estrés no es diferente a una distribución normal
H1: La distribución de las variables clima laboral y estrés es diferente a una distribución normal

Estadístico de prueba: Shapiro Wilk

Decisión: P-valor = 0,032 para clima laboral menor a 0.05 se rechaza Ho, P-valor=0.758 para el estrés es mayor a 0,05
entonces no se rechaza la hipótesis nula.
Conclusión: Con una confianza de 95% se obtuvo un P-valor=0,032 y P-valor=0,758. Se concluye que los datos de las
variables clima laboral y estrés no tienen una distribución normal, por consiguiente se utilizará la prueba no
paramétrica Correlación Rho de Spearman.
Correlación Rho de Spearman con SPSS
Analizar, Correlaciones , Bivariadas, luego ingresar ambas variables
Solución:
2. PRUEBA DE CORRELACIÓN RHO DE SPEARMAN
Formulación de la hipótesis

Ho: No existe correlación entre el clima laboral y estrés


H1: Si existe correlación entre el clima laboral y estrés

Estadístico de prueba: Correlación Rho de Spearman

Rho = -0,602

Decisión: P-valor = 0,050 se rechaza Ho y se acepta H1

Conclusión: Según resultados de la prueba de correlación Rho de Spearman con un P-valor= 0,050. Se concluye que
si existe correlación significativa entre el clima laboral y estrés, además es una correlación negativa
moderada (Rho= -0,602).
Ejemplo 3

Se realizó un estudio con el objetivo de X Y X Y


4 1 9 4
determinar si las habilidades sociales se 1
4 2
14
9 5
2 15
relacionan con la extraversión. Para ello se 3 5 1 16 10 5
tiene las puntuaciones en un test de 4 5 2 17 10 6
extraversión (puntuaciones de 0 a 20) y las 5 5 3 18 11 5
6 3 11 6
puntuaciones del test en habilidades 6 19

7 6 4 20 12 5
sociales (puntuaciones de 0 a 10) que fue 8 7 3 21 12 6
aplicado a una muestra 26 adolescentes que 9 7 4 22 13 5
estaban cursando quinto de secundaria de 10 7 5 23 13 6
8 3 14 5
un colegio estatal. 11 24

12 8 4 25 15 6
13 8 5 26 16 5
Ejemplo 2 aplicativo de ASU
Horas de Examen Horas de Examen
estudio de grado estudio de grado
El estudio tiene como objetivo determinar la relación N° N°
que existe entre el número de horas de estudio y los 1 0 75 14 7 96
5 95 8 93
puntajes del examen de grado. Los datos 2 15
8 99 6 96
corresponden a una encuesta realizada a 26 3 16
4 6 100 17 1 74
graduados que se encuentra en el archivo: 5 75 2 78
5 18
S13 ASU 02-4Data_examples_additional_correlations.xlsx. 6 3 83 19 3 80
7 4 98 20 7 97
Probar si existe correlación entre las variables con una 8 8 100 21 8 97
significancia de 0,05. 9 6 94 22 6 95
10 2 78 23 9 98
11 5 94 24 5 94
12 4 91 25 4 92
13 3 88 26 7 96

Tomado de: Arizona State University (Enero, 2023). HCD300: Bioestatistics. Estadística para los negocios.
https://canvas.asu.edu/courses/49003/modules 5.
Relación entre dos variables cualitativas

C: Chi Cuadrado 1. Tabla de contingencia


2. Hipótesis estadísticas
3. Chi cuadrado
Chi Cuadrado
El estadístico Chi cuadrado (χ2) determina la asociación y/o dependencia
entre dos variables cualitativas, que consiste en comparar frecuencias
observados con frecuencias esperadas en una tabla de contingencia.

La distribución de datos es asimétrica positiva y permite realizar las


pruebas de:

1. Prueba Chi cuadrado de independencia


2. Prueba Chi cuadrado de homogeneidad de grupos
Los datos recolectados se en frecuencias observadas y se organizan en una
tabla de contingencia.

Variable 1 Variable 2 Total


1 2 fi.

1 f11 f12 f1.

2 f21 f22 f2.

Total f.1 f.2 Total (n)


f.j
El estadístico Chi cuadrado se define como:

  f  eij 
k l
2
ij
i 1 j 1
2 
eij

Donde:
fij : son las frecuencias observadas de la muestra
eij : son las frecuencias esperadas , se obtiene:

eij 
 f i .  f . j 
n

k: número de categorías de la variable en fila


l: número de categorías de la variable en columna
Chi cuadrado de independencia
Las hipótesis son:

Ho: La variable X no está relacionada con Y


(son independientes)

H1: Las variable X está relacionada con Y (no


son independientes)
Prueba Chi cuadrado de independencia
1. Formulación de hipótesis estadísticas
Ho: La variable X es independiente de Y (No existe relación)
H1: La variable X es dependiente de Y (Existe relación)
2. Nivel de significancia: α =0,05

3. Estadístico de prueba: Chi cuadrado de independencia

4. P–valor : Probabilidad que se obtiene con SPSS o cualquier otro software


estadístico

5. Decisión: si P-valor ≤ 0.05 se rechaza Ho


6. Conclusión: con la hipótesis no rechazada
Ejemplo 4:
El centro de salud de una comunidad en su preocupación por la salud de las personas, realizó un
estudio para determinar si el estado nutricional antropométrico está asociado al nivel de actividad
física, en personas adultas que fueron atendidos en el primer trimestre del año, los datos son:

Actividad física
Estado nutricional Total
Alta Moderada Ninguna
Normal 52 65 25 142
Sobrepeso 18 32 67 117
Obesidad 11 18 53 82
Total 81 115 145 341

Con un nivel de significación del 5% ¿Cuál es la relación entre el nivel de actividad física y el
estado nutricional antropométrico en personas adultas?
Proceso Chi cuadrado con SPSS
Analizar, estadísticos descriptivos, tablas cruzadas, luego ingresar variables
Proceso Chi cuadrado con SPSS
Resultados

En la tabla de contingencia
se observa mayor
presencia de personas con
sobrepeso

P-valor = 0.000 menor a 0.05


se rechaza Ho
Ejemplo 5

Se investiga si el hábito de fumar está asociado al consumo de alcohol, el estudio


se realizó a un grupo de 50 personas y los datos se encuentra en la siguiente tabla.

Tabla 3. Consumo de alcohol según el hábito de fumar

Consumo de alcohol
Hábito de Total
Si No
fumar
n % n % n %
Si 14 9 23
No 8 19 27
Total 22 28 50
CONCLUSIONES
1. El coeficiente de correlación de Pearson determina la
correlación lineal entre variables cuantitativas son
distribución normal.
2. La correlación de las variables está en el intervalo [-1;1]
3. El coeficiente de correlación Rho de Spearman determina
la relación lineal entre variables cuantitativas cuando no
cumple el supuesto de normalidad.
4. La relación de variables cualitativas se determina con Chi
cuadrado
TRABAJO EN SALA

Resolver en equipos
colaborativos el TE7 de la
semana 13.
REFERENCIAS BIBLIOGRÁFICAS
1. Webster, A. (2006). Estadística aplicada a los Negocios y la Economía. (3° ed.)
Colombia: McGraw Hill.
2. Veliz, O. (2014). Estadística para administración y los negocios. (2ª ed.).
México D.F: Pearson.
3. Pardo, A., y San Martín, R. (2010). Análisis de datos en ciencias sociales y de la
salud II. Madrid: Síntesis.
4. Véliz Capuñay, Carlos, 2011, México. Estadística para la administración y los
negocios, Primera Edición, 2011, Prentice Hall. Pearson.
5. David R. Anderson, Dennis J. Sweeney, Thomas A. Williams (2012)Estadística
para negocios y economía, 11a. ed.

También podría gustarte