Está en la página 1de 8

Actividad 7.

Correlación y Regresión

Guiomar de Jesús Suarez Polo


CC. 36.547.674

Titular del Curso: Juan Salamanca

Nombre del Curso: Estadística

Programa: LPI
1) Un equipo se encargó de analizar las causas de los frecuentes errores en las facturas diligenciadas
por una clínica. El número de datos variaban según el tipo de factura. Un miembro del equipo propuso
concentrarse en simplificar las facturas más complicadas, seguramente causa de la mayoría de errores.
El equipo decidió investigar en primer lugar la teoría, aparentemente obvia, según la cual el número
de errores en una factura dependía de la cantidad de datos a incluir en la misma. Los datos recogidos
fueron:
Número de Número de Número de Número de Número de Número de
datos en la errores en la datos en la errores en la datos en la errores en la
lectura lectura lectura lectura lectura lectura
8 3 15 7 15 1
15 2 26 1 22 6
15 5 20 5 24 6
12 4 10 2 19 9
10 7 10 3 12 8
25 2 9 5 27 6
20 3 13 3 24 12
17 9 20 9 10 1
18 3 23 10 12 2
23 4 20 12
27 1 13 12
8 0 24 8
18 6 13 9
20 1 13 0
18 0 23 0

¿El diagrama de dispersión confirma la teoría “de la existencia de la relación entre el número
de datos a incluir en la factura y la cantidad de errores en la misma?

R) No, ya que como nos podemos dar de cuenta en el gráfico, no hay una coherencia u orden
dentro de los errores en las facturas dependiendo de la cantidad de datos.
Un ejemplo se puede obtener, si se toma una muestra aleatoria de los datos de la anterior
tabla

Datos Errores Diferencia


8 3 5
15 2 13
15 5 10
12 4 8

La diferencia de datos es muy grande y dispareja para tener un dato cercano a la teoría
planteada
2) Teniendo en cuenta los datos arrojados anteriormente, se tomó la decisión de hacer una
estratificación de los datos por empleada (una tenía mucha más experiencia que la otra)
mostró que efectivamente no existía la correlación buscada, pero si una clara diferencia entre
el número de errores entre las dos.

a) ¿Qué puede concluir después de realizar los respectivos diagramas de dispersión?


R) El número de datos en la factura, deja de presentar un número de error con una
frecuencia similar

b) ¿Qué estrategia utilizaría para minimizar los errores en las facturas?


R) Se realiza un estudio más detallado en donde los datos arrojan un error más bajo,
y allí se detallaría mejor las causas que los originan.

3) La tabla siguiente presenta el mejoramiento (en la velocidad de la lectura) de ocho


estudiantes que cursan un programa de lectura de velocidad y el número de semanas que
siguieron el programa:

Número Mejoramiento de la
de lectura (Palabras por
semanas minuto).

x y

3 86

5 118

2 49

8 193

6 164

9 232

3 73

4 109
a. Ilustre los ocho puntos de los datos para verificar si es razonable que la relación
entre el mejoramiento de lectura promedio y el tiempo es lineal.

Variacion en la velocidad de la lectura


250

200

150

100

50

0
X Y

nemero de semanas mejoramiento de la lectura (palabras por minuto) Columna1

b. Encuentre la ecuación de la línea de mínimos cuadrados que nos permitirá pronosticar


el mejoramiento de velocidad a partir del número de semanas que un estudiante ha seguido
el programa.

Y (Mejoramiento de la lectura. X (Número de semanas) X2 XY


Palabras por minuto)
86 3 9 258
118 5 25 590
49 2 4 98
193 8 64 1544
164 6 36 984
232 9 81 2088
73 3 9 219
109 4 16 436
TOTALES 1024 40 244 6217
Y= mx+b

m= ∑xy-∑x∑y/n
n∑x2 –(∑x)2
n

40x1024
6217 - 8
m= = 6217-5120 = 1097 = 24,93
244 – (40)2 244-200 44
8

b= y – mx= ∑(y/n) - m∑x/n= (1024/8) – 24,93 (40/8) = 128 – 124,65= 3,35

Y= mx+b= 3,35+24,93= 28,28

c. Use los resultados de la parte (b) para pronosticar el mejoramiento de velocidad de


un estudiante después de que ha conseguido el programa durante siete semanas.

R) Y= mx+b= 3,35+24,93(7) = 3,35+174,51= 177,86

4) Una socióloga que estudia la relación entre el tamaño de la familia y las cuentas por
alimentos seleccionó al azar a seis clientas de un supermercado. A cada clienta seleccionada
se le preguntaba cuántos hijos menores de 18 años de edad vivían con ella y también el
número de cuartos de leche que en promedio se consumía por semana en su hogar. Estos son
los datos resultantes de esta encuesta:

Número de hijos menores Consumo semanal de


de 18 años leche(cuartos)

2 14

2 20

2 9

2 25

2 16

2 14

a. La socióloga quería encontrar la línea de mínimos cuadros que le permitiera pronosticar el


consumo de leche con base en el número de hijos. ¿Qué problemas de cálculo enfrentará?
R) / no podrá encontrar una relación entre las variables ya que en la variable x solo se
trabajará en base a un intervalo, es decir, no encontraremos una líneas, solo se trabajara
en base a un intervalo, es decir, no encontraremos una línea de tendencia ni tampoco una
ecuación de mínimos cuadrados de tendencia ni tampoco una ecuación de mínimos
cuadrados.

5) Un estudio de la relación entre los [Q’s de los esposos y sus esposas dio la ecuación
de mínimos cuadrados y = 48- 0.5 x donde x es el [Q del esposo e y es el [Qde la esposa.
Considerando que esta ecuación se basa en los siguientes datos:

x Y

90 90

114 102

102

a) y = 94
6) Los siguientes son los números de minutos que 12 mecánicos requirieron para
ensamblar una máquina en la mañana, x, y en la tarde, y:

x y

12 14

11 11

9 14

13 11

10 12

11 15

12 12

14 13
10 16

9 10

11 10

12 14

a) Calculo r.

∑(xi-x) (yi-y)
r= = (7,10-15) (7,10-15) / √ (7,10-15)2 (7,10-15)2
√ ∑(xi-x)2 ∑(yi-y)2

r=1

7) Si calculamos r para cada uno de los siguientes conjuntos de datos, ¿debería sorprendernos
obtener r=1 y r= -1? Explique sus respuestas.
a. x Y
6 9
14 11

b. x y
12 5
8 15

Si calculamos r para cada conjunto obtendremos “0” como respuesta.


A) Señale en cada caso si esperaría una correlación positiva, una correlación negativa o
ninguna correlación:
a. Las edades de sus esposos y sus esposas;
ninguna correlación
b. la cantidad de hule de las llantas y el número de millas que han recorrido;
correlación positiva
c. el número de horas que los golfistas practican y sus calificaciones:
correlación positiva
d. la medida del calzado y del [Q;
correlación positiva
e. el peso de la carga de los camiones y su consumo de gasolina.
correlación positiva

8) Indique en cada caso si esperaría una correlación positiva, una correlación negativa o
ninguna correlación:
a. La medida de la concentración de polen en el aire y la venta de medicamentos
antialérgicos; Correlación negativa
b. el ingreso y la educación; Correlación positiva
c. el número de días soleados en agosto en Detroit y la concurrencia al zoológico de
Detroit; Ninguna correlación
d. el talle de la camisa y el sentido del humor; Ninguna correlación
e. el número de personas vacunadas contra la gripe y el número de personas que
contraen esa enfermedad; Correlación negativa

También podría gustarte