Está en la página 1de 26

ANALISIS SIMPLE DE CORRELACIÓN

Comprender e interpretar los terminos


variable dependiente y
1
variable indenpendiente x

Calcular e interpretar el coeficiente de


2 correlación y el coeficiente de
determinación.
#
1
Analisis de correlación
Grupo de tecnicas para medir la
2
asociación entre dos variables
3
Diagrama de dispersión 4
Gráfica que permite visualizar la traza de
los datos

Coeficiente de correlación
Media de fuerza de la relación lineal entre dos variables
entre dos variables
Coeficiente de determinación
Proporción de la variación total en la variable dependiente
que se explica, o contabiliza, por la variación en la variable
dependiente

Caracteriticas
El coeficiene dedel coeficiente
correlación demuestra
de la correlacción
se identifica por
la letra minúscula r
Muestra la dirección y fuerza de la relación
entre dos variables en escala de intervalo o en escala de
razón
Varia de -1 hasta +1, inclusive
Un valor cercano a 0 indica que hay poca asociación

Un valor cercano a 1 indica que una asociación directa Positiva

Un valor cercano a -1 indica que una asociación inversa Negativa

entre dos variables


te de determinación
n de la variación total en la variable dependiente
plica, o contabiliza, por la variación en la variable

CONCEPTUALIZACIÓN CON EXCEL

Analisis Data
Formula insertada
Diagrama de dispersión es la gráfica que se aplica para
visualizar la mejor línea de tendencia. Al emplear la recta
para la regresión como método matemático donominado
mínimos cuadradros, se elimina los juicios subjetivos.
Este método proporciona lo que conmunmente se Principios de mínimos cuadrados: Determina una
conoce como recta del "mejor ajuste". ecuación de regresión al minimizar la suma de los
cuadrados de las distancias verticales entre los valores
reales de Y y los valores pronosticados de Y .

a: es la intersección Y
b: es la pendiente de la recta r: es el coeficienete de correlación
Sy: desviación estándar de Y
Sx: desviación estándar de X

a=
: es la media de Y
: es la media de X
ción
Copier Sales of America vende copiadoras a empresas de todos los tamaños en Estados Unidos y Canadá.
la señora Marcy Bancer al puesto de gerente nacional de ventas. A la siguiente junta de ventas asistirán los
de todo el país. Ella desea destacar la importancia de hacer una última llamada de ventas adicional cada día
información sobre la relación entre el número de llamadas de ventas y el número de copiadoras vendidas. P
muestra aleatoria de 10 representantes y determina el número de llamadas que hicieron el mes pasado y el
que vendieron. La información muestral se reporta en la tabla

¿Qué observaciones cabe hacer respecto de la relación entre el número de llamadas de ventas y el número
Elabore un diagrama de dispersión para representar la información.
Con base en la información de la tabla, la señora Bancer sospecha que hay una relación entre el número de
hechas en un mes y el número de copiadoras vendidas.

Llamadas Vendidas (y)


Ventas
(x) (y) Estimada

Tom Keller 20 30
Jeff Hall 40 60
Brian Virost 20 40
Greg Fish 30 60
Susan Welch 10 30
Carlos Ramírez 10 40
Rich Niles 20 40
Mike Kiel 20 50
Mark Reynolds 20 30
Soni Jones 30 70
50
dos Unidos y Canadá. Hace poco ascendieron a
de ventas asistirán los representantes de ventas
ntas adicional cada día, y decide reunir
opiadoras vendidas. Por ello, selecciona una
on el mes pasado y el número de copiadoras

de ventas y el número de copiadoras vendidas?

ión entre el número de llamadas de venta


INDIDCACIONES
Con la aplicación de excel desarrolle:

0) Detalle la Asignación se contempla como evaluación de la instalación de la herram


equipo computacional que se utiliza, indicaciones en el blog:

https://estadisticaparaelmanejodeexcel.blogspot.com

Sección : Cargar o importar datos

1) Aplicación de la opción "Analisis de Datos" , para cada problema (1 al 5) describa co


una breve evaluación, apoyada con el analisis de estadistica descriptivo . (5 pts C/U = 25 pt

2) Construya grafica de dispersión para cada problemas del 1 al 5 segun la caracteristi


de la variable en estudio,importante que la grafica tenga:
Titulo (recordar que debe contestar el que, como, cuando y donde),
Identique los nombres de los ejes y etiquetas. (5 pts C/U = 25 pts)

3) Cada problema del 1 al 5 debe llevar la ecuación de la recta, coeficientes de correla


determinación acompañado de la interpretación de dichos resultados. Con la teoria y
coeficiente de correlación y determinación presente su interpretación
. (6 pts C/U = 30
pts)
la instalación de la herramienta excel en el
PROBLEMAS
Detalles a Evaluar
1
1.Aplicación de Formulas individuales 5

2. Aplicación de Analisis de Datos 2


Interpretación 3

oblema (1 al 5) describa con sus palabras 3. Construcción de gráfica con todo 5


descriptivo . (5 pts C/U = 25 pts)
4.Consturcción de la ecuación 2
Interpretación 4
1 al 5 segun la caracteristica

y donde),
pts)

cta, coeficientes de correlación y


sultados. Con la teoria y el resultado del
retación
PROBLEMAS
Total
2 3 4 5
5 5 5 0 20

2 2 2 2 10
3 3 3 3 15

5 5 5 5 25

2 2 2 2 10
4 4 4 4 20

100
Control X Y Agragar
Personas Altura Peso diagrama de dispersión (‘scatterplot’). Pertenece: Angel Saavedra 8-969-533 a: es la intersección Y
Pedro 175 80 b: es la pendiente de la recta
Carmen 180 82
Yessica 162 57
Silva 157 63 Ecuación de la gráfica
Danna 180 78 Altura vs peso Y= -102.71 1.0054 x
Jostin 173 65 90
Keyla 171 66 X Y
Y Estimada
X
Y Estimada
Patricia 168 67 80 Altura Peso Altura
Raul 165 62 70
f(x) = 1.00538047655649 x − 102.712528823982
R² = 0.71508301432077
175 80 73.2 175
María 165 58 180 82 78.3 180
60 162 57 60.2 162
Insertar formula
50
157 63 55.1 157
Coeficiente de correlación 0.85 40
180 78 78.3 180
173 65 71.2 173
30
Resultados con analisis de datos 171 66 69.2 171
20
Altura Peso 168 67 66.2 168
10
Altura 1 165 62 63.2 165
Peso 0.85 1 0
155 160 165 170 175 180 185
165 58 63.2 165
200 98.4
R2 0.7151

0.85

Coeficiente de Correlación Mide la asosicación entre dos variables


Coeficiente de Determinación Proporción de variación
Mininimos cuadrados Recta de estimación
La frecuencia cardíaca, o pulso, es el número de veces que su corazón late por minuto. La frecuencia cardíaca normal
varía de una persona a otra.
La frecuencia respiraoria es la cantidad de respiraciones por minuto. Generalmente, se mide al estar en reposo. Simplemente
implica contar la cantidad de respiraciones durante un minuto contando la cantidad de veces que el tórax se eleva. Es posible
que la frecuencia respiratoria aumente cuando hace ejercicio, tiene fiebre, está enfermo o tiene otras afecciones médicas.
Cuando controle la respiración, también es importante prestar atención a si tiene dificultad para respirar.
Valide si la frecuencia respiratoria es la variable independiente, ¿Quién ejerce primero en el cuerpo; el corazón o los pulmones?

Frecuencia
Frecuencia
Respiratoria
(FR=x)
Cardiaca (FC=y) Frecuencia Cardiaca(FC) vs Frecuencia Respira-
60 120
toria(FR)
60 125 180

Frecuencia Cardiaca(FC)
60 130 160
f(x) = 4.34377330350485 x − 137.460850111857
61 120 140 R² = 0.932810303886294
62 135 120
62 130 100
80
63 140
60
65 140
40
70 170 20
70 165 0
58 60 62 64 66 68 70 72

Frecuencia Respiratoria(FR)
Coeficiente de correlación 0.97

Frecuencia Frecuencia
Respiratoria Cardiaca
(FR=x) (FC=y)
Interpretación: la frecuencia respiratoria tiene valores mas comunes y
Frecuencia Respiratoria
cercanos, a diferencia de la frecuencia cardiaca que variaron sus valores,
(FR=x) 1
algunos cuerpos la FR es la misma pero la FC era diferente.

Frecuencia Cardiaca (FC=y) 0.97 1

R2 0.9328
Raíz cuadrada 0.97
íaca normal Variable Independiente
Frecuencia Respiratoria
poso. Simplemente
e eleva. Es posible Variable Dependiente
ciones médicas. Frecuencia Cardiaca

azón o los pulmones? Ecuación de la Gráfica


Y= -137.46 4.3438 x

Frecuencia
Frecuencia
Respiratoria Y Estimada
uencia Respira- (FR=x)
Cardiaca (FC=y)

60 120 123.17
60 125 123.17
0850111857 60 130 123.17
61 120 127.51
62 135 131.86
62 130 131.86
63 140 136.20
65 140 144.89
70 170 166.61
70 165 166.61
68 70 72

FR)

valores mas comunes y


que variaron sus valores,
a FC era diferente.
En un estudio llevado a cabo en Italia, 10 pacientes con hipertrigliceridemiase sometieron a una dieta baja en grasas y alta en
carbohidratos. Antes de comenzar la dieta, se analizaron los niveles de colesterol y triglicéridos en cada paciente.

Los triglicéridos son un tipo de grasa, conocido como el más común de grasa en su cuerpo.  El colesterol es una sustancia cerosa y
parecida a la grasa que se encuentra en todas las células de su cuerpo.
Evalue que variable es la independiente, siendo el colesterol en el cuerpo una sustancia parecida a la grasa y siendo los trigliceridos un
tipo de grasa.

Nivel de Nivel de
Pacientes Colesterol triglicéridos
(mmol/l) (mmol/l) Nivel de Colesterol (mmol/l) vs Nivel de
1 5.12 2.3 Triglicéridos(mmol/l)
2 6.18 2.54
3 6.77 2.95 12

Nivel de Colesterol(mmol/l)
4 6.65 3.77 10
5 6.36 4.18
8 f(x) = 0.265976690499653 x + 5.16134373583755
6 5.9 5.31 R² = 0.422050765430501
7 5.48 5.53 6
8 6.02 8.83 4
9 10.34 9.48
10 8.51 14.2 2

0
Coeficiente de correlación 0.65 0 2 4 6 8 10 12 14 16
Nivel de Triglicéridos(mmol/l)
Analisis de Datos

Nivel de Colesterol
Nivel
(mmol/l)
de triglicéridos (mmol/l)
Nivel de
Colesterol
(mmol/l) 1
Nivel de
triglicéridos
(mmol/l) 0.65 1

R2 0.4221
Raíz
cuadrada 0.65
n

erosa y a: es la intersección Y
b: es la pendiente de la recta
iceridos un

ECUACIÓN Y= 5.1613 0.266 X


Nivel de Nivel de
triglicéridos Colesterol
(mmol/l) (mmol/l) Y(estimada)
2.3 5.12 5.77
2.54 6.18 5.84
2.95 6.77 5.95
3.77 6.65 6.16
4.18 6.36 6.27
5.31 5.9 6.57
5.53 5.48 6.63
8.83 6.02 7.51
9.48 10.34 7.68
14.2 8.51 8.94

La variable independiente es el nivel de colesterol ya que esta no depende de


nadie y la dependiente es el trigliceridos es solo un tipo de grasa.
Sbp Duración Tiempo
170 640 105 Treinta y cinco pacientes con cardiopatía isquémica – una obstrucción delflujo sanguíneo al corazón –
128 670 118 participaron en una serie de pruebas diseñadas para evaluar la percepción del dolor. En una parte del
150 560 130 estudio, los pacientes practicaban ejercicio hasta experimentar angina o dolor en el pecho. Se registró el
tiempo hasta el inicio de la angina y la duración delataque.
148 510 150
160 212 178 Tiempo de registro del inicio de la angina (dolor de pecho), en minutos
154 260 180 Duración de los efectos, en minutos
175 228 192 Sbp, flujo sanguíneo al corazón
140 335 200
140 460 200 ¿Tiene relación el tiempo con el Sbp o el tiempo con la duración?
120 440 201
172 210 240
178 359 245
122 438 252
158 270 270
132 781 277
130 802 278
175 360 300
140 1775 300
Duración vs Tie
150 524 322 2000
180 441 330 1800
160 1084 345 Coeficiente de Correlación -0.07

Duración de los efectos


1600
122 505 360 1400
170 75 375 1200
150 823 386 Análisis de datos 1000
168 780 440 800
134 1065 480 Tiempo Duración 600
400 f(x) = − 0.08867232305
160 1080 540 Tiempo 1 R² = 0.0054347770053
200
154 308 562 Duración -0.0737209401 1
0
125 860 570 0 200 400 600
140 60 578 R2 0.0054 Variable independiente
Tiem
154 765 720 Raíz Tiempo de registro
120 396 729 cuadrada 0.07 Variable dependiente
162 328 780 Duración de los efectos
140 540 1200
178 130 1430
Tiempo Duración
Y(Estimada)
elflujo sanguíneo al corazón – 105 640 571.04
n del dolor. En una parte del 118 670 569.88
dolor en el pecho. Se registró el 130 560 568.82
150 510 567.05
178 212 564.56
180 260 564.38
192 228 563.32
200 335 562.61
200 460 562.61
201 440 562.52
240 210 559.06
245 359 558.62
252 438 558.00
270 270 556.40
277 781 555.78
278 802 555.69
300 360 553.74
Duración vs Tiempo 300 1775 553.74
2000 322 524 551.79
1800 330 441 551.08
345 1084 549.75
Duración de los efectos

1600
1400 360 505 548.42
1200 375 75 547.09
1000 386 823 546.11
800 440 780 541.32
600 480 1065 537.77
400 f(x) = − 0.0886723230518533 x + 580.346618479229
R² = 0.00543477700539741 540 1080 532.45
200
562 308 530.50
0
0 200 400 600 800 1000 1200 1400 1600 570 860 529.79
Tiempo de Registro
578 60 529.08
720 765 516.49
729 396 515.69
780 328 511.16
1200 540 473.91
1430 130 453.51
Ecuación Y 580.35 -0.0887 X

Si tiene relación pero observando las gráficas se logra ver comportamientos diferentes de la
duración de los efectos y el flujo sanguíneo al corazón
Tiempo Sbp Y(estimada)
105 170 149.13
118
130
128
150
149.18
149.23
Flujo sanguíneo al Corazón vs
150 148 149.31 Tiempo de Registro
178 160 149.41
200

Flujo Sanguíneo al Corazón


180 154 149.42
192 175 149.47
150
200 140 149.50 f(x) = 0.00385064747923548 x + 148.720954549927
200 140 149.50 100
R² = 0.00361611909037918
201 120 149.50
240 172 149.66 50
245 178 149.68
252 122 149.70 0
0 200 400 600 800 1000 1200 1400 1600
270 158 149.77
277 132 149.80 Tiempo de Registro
278 130 149.80
300 175 149.89
300 140 149.89 Coeficiente de Correlación 0.06
322 150 149.98
330 180 150.01 Análisis de Datos
345 160 150.07
360 122 150.12 Tiempo Sbp
375 170 150.18 Tiempo 1
386 150 150.23 Sbp 0.06 1
440 168 150.44
480 134 150.59
540 160 150.83 ECUACIÓN Y 148.72 0.0039
562 154 150.91
570 125 150.94 Variable independiente Tiempo de registros
578 140 150.97
720 154 151.53 Variable dependiente Flujo sanguíneo al corazón
729 120 151.56
780 162 151.76
1200 140 153.40
1430 178 154.30
azón vs
o

4549927

1200 1400 1600

Tiempo de registros

jo sanguíneo al corazón
Presión (mm
Sal (gr)
de Hg) Se dice que el consumo excesivo de sal afecta a un mecanismo de
No.
seguridad en el cerebro, que impide que la presión arterial se eleve.
xi yi La sal en exceso desregula este mecanismo, liberando una gran
1 2 99 cantidad de una hormona antidiurética, la vasopresina, que causa el
2 2 98 aumento de la presión arterial.
3 3.5 110
4 4 110 Se realiza evaluación a 12 personas, se podra establecer que tiene
5 4.3 112 relación y establecer la propoción de la misma
6 5 120
7 3 99
8 2 100
9 3.5 112
10 3.2 105
11 2.8 108
12 3.8 110
Presión(mm de Hg) vs Sal(gr)
140
Coeficiente de Correlación 120
0.91 f(x) = 6.48503833154727 x + 85.7862501030418
Presión(mm de Hg)
100 R² = 0.835398666354714
Análisis de Datos 80
60
Sal Presión
40
Sal 1
Presión 0.91 1 20
0
1.5 2 2.5 3 3.5 4 4.5 5 5.5
R2 0.8354 Sal(gr)
Raíz 0.91
Presión (mm de
No. Sal (gr)
Hg)
Y(Estimada)
1 2 99 98.76
2 2 98 98.76
3 3.5 110 108.48
4 4 110 111.73
5 4.3 112 113.67
6 5 120 118.21
7 3 99 105.24
8 2 100 98.76
9 3.5 112 108.48
10 3.2 105 106.54
11 2.8 108 103.94
12 3.8 110 110.43

Y 85.786 6.485 x

Variable Independiente Sal(gr)


Variable Depediente Presión

La gráfica se utiliza para evaluar visualmente la relación lineal


lo cual nos da como resultado una relación estable entre la
presión y sal.
Horas Calificacion
No. En realidad no existe un claro consenso acerca de
xi yi
las horas que se deben dedicar al estudio al día. Algunos expertos
1 20 6.5
aseguran que en promedio un estudiante debería dedicar entre 4 y
2 16 6 6 horas de estudio diarias; sin embargo, otros consideran que no importa
3 34 8.5 el tiempo dedicado sino la calidad.
4 23 7 Por lo cual evalue si existe relación entre horas de estudio y calificación
5 27 9
6 32 9.5
7 18 7.5
8 22 8

Calificación vs Horas
coeficiente de correlación 0.8
10
Análisis de Datos 9 f(x) = 0.156462585034014 x + 3.99489795918367
Horas Calificación 8 R² = 0.685455134434726
7
Horas 1

Calificación
6
Calificación 0.82792218 1
5
4
R2 0.6855 3
2
Raíz cuadrada 0.8 1
0
15 20 25 30 35
Horas
Horas Calificacion
No.
xi yi Y(Estimada)
1 20 6.5 7.12
2 16 6 6.50
3 34 8.5 9.32
4 23 7 7.59
5 27 9 8.22
6 32 9.5 9.00
7 18 7.5 6.81
8 22 8 7.44

Ecuación 3.9949 0.1565 x


n vs Horas

3.99489795918367

si existe una relación entre ambas variables

Variable independiente
Horas
Variable dependiente
Calificación

25 30 35
Horas

También podría gustarte