Está en la página 1de 20

16/05/2017

Correlación es una técnica estadística utilizada
para determinar el grado en el que dos variables
están relacionadas.

1

16/05/2017

Diagrama de dispersión de
puntos
• Dos variables cuantitativas
• Una variable es llamada independiente (X)
y la otra dependiente (Y)
• Los puntos no se unen
• No es tabla de frecuencias
Y
* *
*
X

Peso. 67 69 85 83 74 81 97 92 114 85
SBP(m mHg)
TAS (mm HG) (kg)
TAS 120 125 140 160 130 180 150 140 200 130
(mmHg)

220
200
180
160
140
120
100
80 wtPeso
(kg)(Kg)
60 70 80 90 100 110 120

2

16/05/2017 TAS (mm SBP(m mHg)HG) 220 200 180 160 140 120 100 80 Peso (Kg) Wt (kg) 60 70 80 90 100 110 120 Diagrama de puntos dispersos de peso y tensión arterial sistólica El modelo de los datos es indicativo del tipo de relación entre las dos variables:  Relación positiva ó Directa  Relación negativa ó Indirecta ó Inversa  No hay relación 3 .

16/05/2017 18 16 14 12 Height in CM 10 8 6 4 2 0 0 10 20 30 40 50 60 70 80 90 Age in Weeks Confiabilidad Edad del Auto 4 .

 Coeficientede Correlación r de pearson. 16/05/2017 Peso (libras) Tasa de pulso (latidos/minuto) Estadístico que muestra el grado de relación entre las dos variables. Coeficiente de correlación Tau-b de Kendall 5 .  Coeficiente de correlación de Rankings de Spearman (rs).

16/05/2017  También llamado correlación r de Pearson  Mide la naturaleza y fuerza entre dos variables cuantitativas.  Si el signo es positivo. significa una relación inversa o indirecta (significando que el incremento en una variable está asociado con una disminución de la otra variable).75 1 indirecta Directa Correlación correlación perfecta perfecta sin relación 6 .25 0 0. significa que la relación es directa (un incremento en una variable está asociado con el incremento de la otra variable. fuerte intermedio débil débil intermedio fuerte -1 -0.  El valor de r está entre ( -1) y ( +1)  El valor de r denota la fuerza de la asociación como se ilustra en el siguiente diagrama.75 -0. una disminución de una variable está asociado con la disminución de la otra variable).  El signo de r denota la naturaleza de la asociación  Mientras que el valor de r denota la fuerza de asociación.25 0.  Si el signo es negativo.

75 ≤ r < 1 = fuerte correlación.75 = intermedia correlación.25 ≤ r < 0. 16/05/2017 Si r = cero significa que no hay asociación o correlación entre las dos variables. ¿Cómo clacular el coeficiente de correlación simple (r)?  xy   x y r n  ( x) 2   ( y) 2   x  2 . Si 0 < r < 0.  y  2   n  n     7 . Si 0.25 = débil correlación. Si r = 1 = perfecta correlación. Si 0.

para encontrar la relación entre edad y peso. Nº Edad Peso (Kg) serial (años) 1 7 12 2 6 8 3 8 12 4 5 10 5 6 11 6 9 13 Las dos variables son de tipo cuantitativo.  y  2   n  n     8 . Se requiere encontrar la correlación entre edad y peso. calcule el coeficiente de correlación simple. una variable (edad) es llamada independiente y la otra (peso) es llamada dependiente y con notación de variable Y. usando la siguiente fórmula:  xy   x y r n  ( x) 2   ( y) 2   x  2 . datos de su edad en años y peso en kilogramos fue registrada como se muestra en la siguiente tabla. 16/05/2017 Una muestra de 6 niños fue seleccionada.

742  r = 0. 16/05/2017 Edad Peso Nº (años) (Kg) xy X2 Y2 Serial (x) (y) 1 7 12 84 49 144 2 6 8 48 36 64 3 8 12 96 64 144 4 5 10 50 25 100 5 6 11 66 36 121 6 9 13 117 81 169 Total ∑x= ∑y= ∑xy= ∑x2= ∑y2= 41 66 461 291 742 41 66 461 r 6  (41)   2 (66)2     6   6  291 .759 Fuerte correlación directa 9 .

94 6(230)  32 6(204)  32  2 2 (356)(200) r = . 16/05/2017 Ansiedad Puntaje X2 Y2 XY (X) de prueba (Y) 10 2 100 4 20 8 3 64 9 24 2 9 4 81 18 1 7 1 49 7 5 6 25 36 30 6 5 36 25 30 ∑X = 32 ∑Y = 32 ∑X2 = 230 ∑Y2 = 204 ∑XY=129 (6)(129)  (32)(32) 774  1024 r   .0.94 Fuerte correlación indirecta 10 .

11 . Una variable es cuantitativa y la otra es cualitativa ordinal. Ambas variables son cualitativas ordinales. Este procedimiento usa los dos rankings que puede asignarse a los valores de la muestra en X y en Y. 1. 4. Calcule el valor de di para cada par de observaciones restando el ranking de yi del ranking de xi. 3. Ranquee los valores de X de primero a n donde n es el número de pares de valores de X y Y en la muestra. Ranquee el valor de Y de primero a n. 2. Eleve al cuadrado cada di y ∑di2 lo cual es la suma de valores al cuadrado. Coeficiente de correlación de rankings de Spearman puede calcularse en los siguientes casos: Ambas variables son cuantitativas. 16/05/2017 No es una prueba no paramétrica de correlación.

Números Nivel de educación Ingreso de la (X) (Y) muestra A Preparatoria 25 B Primaria 10 C Universidad 8 D Secundaria 10 E Secundaria 15 F Analfabeta 50 G Universidad 60 12 . Aplique la siguiente fórmula: 6 (di)2 rs  1  n(n 2  1) El valor de rs denota la magnitud y naturaleza de la asociación dando la misma interpretación el r simple. se obtuvieron los siguientes datos. 16/05/2017 5. Encuentre la relación entre ellos y comente. En un estudio de la relación entre el nivel de educación e ingreso.

5 0.25 D Secundaria 10 4.5 4 0.02 7(48) Comentario: Hay una correlación débil indirecta entre el nivel de educación y el ingreso.5 5.5 30.5 0. 16/05/2017 Ranking Ranking di di2 (X) (Y) X Y A Preparatoria 25 3 3 0 0 B Primaria 10 6 5.5 1 0.25 C Universidad 8 1.5 -1 1 E Secundaria 15 4.25 ∑ di2=57 6  57 rs  1   0.5 0.5 7 -5. 13 .25 F Analfabeta 50 7 2 5 25 G Universidad 60 1.5 0.

menores a cualquier otra línea. Nos dice cuanto es el valor de cambio de y en función del cambio en los valores de x. El proceso de predecir la variable Y usando la variable X.  Calcule la línea que de “el mejor trazo” para un grupo de datos. Regresión minimiza los residuales SBP(mm Hg) TAS(mmHg) 220 200 180 160 140 120 100 Peso 80 Kg Wt (kg) 60 70 80 90 100 110 120 14 . 16/05/2017 Regresión: técnica enfocada a la predicción de algunas variables conociendo a otras.  La línea de regresión hace la suma de cuadrados de los residuales.

16/05/2017 Usando el método de los cuadrados mínimos (un procedimiento que minimiza las desviaciones verticales de puntos trazados alrededor de la línea recta) somos capaces de construir el mejor trazado de la línea recta en la gráfica de puntos dispersos y luego formular la ecuación de regresión en la forma de: Y  a  bX a  y  bx  x y  xy  n bb1  (  x) 2 x  n 2 SBP(mmHg) TAS (mmHg) 220  La ecuación de regresión describe la 200 línea de regresión 180 matemáticamente 160 ◦ Intersección 140 ◦ Pendiente 120 100 80 WtPeso (kg) 60 70 80 90 100 110 120 (Kg) 15 .

16/05/2017 Y ŷ  a  bX Y = bX + a Change b= Cambio b = Slope Change in X in Y pendiente en Y a = Y-intercept Cambio X en X a = intersección 16 .

16/05/2017  Regresión lineal ion Linear Regress  Calificación final en el curso= 59. mostrados en la siguiente tabla.95 + 3.17 * study el curso R2=0. Encuentre la ecuación de regresión y que se predice del peso cuando la edad es 8.95 + 3.5 años.17*(número de horas de estudio por semana) En una muestra de 6 personas fue seleccionada el valor de su edad (variable x) y su peso.0 0 Number Número deof hours horas spenten empleadas studying estudio Calificación final predicha en clase = 59.0 0 Final grade in course = 59.0 0    2 .0 0 4 .0 0 Calificación  7 0.95 + 3.88 course   finalinen    Final grade 8 0. Número serial Edad (x) Peso (y) 1 7 12 2 6 8 3 8 12 4 5 10 5 6 11 6 9 13 17 .0 0 6 .88 R-Square = 0.0 0 1 0.0 0 8 .17 * horas de estudio  9 0.

83) 18 .92 (41) 2 291  6 Ecuación de regresión ŷ (x)  11  0.83 y  11 6 6 41  66 461  b 6  0. 16/05/2017 Número Edad Peso (y) xy X2 Y2 serial (x) 1 7 12 84 49 144 2 6 8 48 36 64 3 8 12 96 64 144 4 5 10 50 25 100 5 6 11 66 36 121 6 9 13 117 81 169 Total 41 66 461 291 742 41 66 x  6.9(x  6.

2 Peso (en 12 Weight 11. 16/05/2017 ŷ (x)  4.675  0.58Kg 12.5 8 8.92x ŷ (8. y luego extendiendo la línea a la derecha y a la izquierda.5)  4.5  11.4 12.5)  4.6 11.675  0.675  0.92 * 7.8 11.5  12. 19 .4 7 7.92 * 8.50Kg ŷ (7.5 9 Age (in(en Edad years) años) Creamos una línea de regresión trazando dos valores estimados para y contra su componente de x.6 (in Kg) 12.

16/05/2017 20 .