Está en la página 1de 9

ACTIVIDAD 8

1. Un equipo se encargo de analizar la causa de los frecuentes errores en las facturas diligenciadas por
una clínica. El numero de datos variaban según el tipo de factura. Un miembro del equipo propuso
concentrarse en simplificar las facturas mas complicadas, seguramente causa de la mayoría de errores .
El equipo decidió investigar en primer lugar la teoría, aparentemente obvia, según la cual el numero de
errores en una factura dependía de la cantidad de datos a incluir en la misma. Los datos recogidos
fueron.
x y xy X² Y²
8 3 24 64 9
15 2 30 225 4
15 5 75 225 25
12 4 48 144 16
10 7 70 100 49
25 2 50 625 4
20 3 60 400 9
17 9 153 289 81
18 3 54 324 9
23 4 92 529 16
27 1 27 729 1
8 0 0 64 0
18 6 108 324 36
20 1 20 400 1
18 0 0 324 0
15 7 105 225 49
26 1 26 676 1
20 5 100 400 25
10 2 20 100 4
10 3 30 100 9
9 5 45 81 25
13 3 39 169 9
20 9 180 400 81
23 10 230 529 100
20 12 240 400 144
13 12 156 169 144
24 8 192 576 64
13 9 117 169 81
13 0 0 169 0
23 0 0 529 0
15 1 15 225 1
22 6 132 484 36
24 6 144 576 36
19 9 171 361 81
12 8 96 144 64
27 6 162 729 36
24 12 288 576 144
10 1 10 100 1
12 2 24 144 4
17 4 68 289 16
688 191 3401 13086 1415

¿El diagrama de dispersión confirma la teoría “de la existencia de la relación entre el numero de datos a
incluir en la factura y la cantidad de errores en la misma?.

Respuesta:
Datos recogidos
14
12
numero de errores
10
8
Columna B
6 Lineal (Columna B)
4
2
0
5 10 15 20 25 30
numero de datos
f(x) = 0,09x + 3,18

n(∑ xy)−(∑ x )(∑ y)


r=
√n(∑ x )−(∑ x ) ∗ √n(∑ y )−(∑ y )
2 2 2 2

4632
r=
√50096∗ √20119
4632
r=
31747,14

r=0,14

Según lo mostrado en la tabla el coeficiente de correlación es muy bajo, dado que se encuentra entre 0
y 0,20 ,gracias a esto podemos concluir que el diagrama de dispersión no confirma la teoría.

2.

Teniendo en cuenta los datos arrojados anteriormente , se tomo la decisión de hacer una estratificación
de los datos por empleada (una tenia mucho mas experiencia que la otra ) mostró que efectivamente no
existía la correlación buscada pero si una clara diferencia entre el numero de errores de las dos.

a. ¿que puede concluir después de realizar los respectivos diagramas de dispersión?

b. ¿Qué estrategia utilizaría para minimizar los errores en la factura?


X Y X₂ Y₂
15 2 8 3
25 2 15 5
20 3 12 4
18 3 10 7
23 4 17 9
27 1 18 6
8 0 15 7
20 1 20 5
18 0 9 5
2 1 20 9
10 2 23 10
10 3 20 12
13 3 13 12
13 0 24 8
23 0 13 9
15 1 22 6
10 1 24 6
12 2 19 9
17 4 12 8
299 33 27 6
24 12
365 158

Respuesta :

Facturas rellenadas por carmen


4,5
4
numero de errores wen la factura

3,5
3
2,5
2 Columna C
1,5
1
0,5
0
0 5 10 15 20 25 30
Numero de datos en la factura
Facturas rellenadas por maria
Numero de los errores en la factura 14
12
10
8
6 Columna F

4
2
0
5 10 15 20 25 30
Numero de datos en la factura

a. Podemos concluir que la empleada Maria tiene menos dispersión , en otras palabras están mas
relacionados los errores con los datos de la factura.

b. Como lo muestran las tablas y el gráfico de dispersión, para disminuir los errores hay que facturar
menos datos.

3.

La tabla siguiente el mejoramiento (en la velocidad de la lectura) de ocho estudiantes que cursan un
programa de lectura de velocidad y el numero de semanas que siguieron el programa:

x y xy X² Y²
3 86 258 9 7396
5 118 590 25 13924
2 49 98 4 2401
8 193 1544 64 37249
6 164 984 36 26896
9 232 2088 81 53824
3 73 219 9 5329
4 109 436 16 11881
40 1024 6217 244 158900

a. Ilustre los ocho puntos de los datos para verificar si es razonable que la relación entre el
mejoramiento de lectura promedio y el tiempo lineal.

b. Encuentre la ecuación de la linea de mínimos cuadrados que nos permitirá pronosticar el


mejoramiento de velocidad a partir del número de semanas que un estudiante ha seguido el programa.

c. Use los resultados de la parte (b) para pronosticar el mejoramiento de velocidad de un estudiante
después de que ha conseguido el programa durante siete semanas.

Respuesta:

a.
Me jo ra m ie n to d e la le ctu ra (p a la b ra s p o r m

Velocidad de lectura
250
200 f(x) = 24,93x + 3,34
150
y
100 Lineal (y)
50
0
1 2 3 4 5 6 7 8 9 10
Numero de s em anas

b.

n (∑ xy)−∑ x ∑ y ∑ y−a(∑ x )
a= b=
n(∑ x2 )−(∑ x)
2
n

8 (6217)−(40)(1024) 1024−24,9318181818 (40)


a= b=
8 (244)−(40)2 8

49736−40960 1024−997,2727273
a= b=
1952−1600 8

8776 26,7272727
a= b=
352 8

a=24,9318181818 b=3,3409090

ecuacion de la linea de minimos cuadrados f ( x )=24,9318181818 x +3,3409090

c.

f (7)=24,9318181818(7)+3,3409090

f (7)=177,86

El mejoramiento en 7 semanas de un estudiante es de 177,86 palabras por minutos.


4.

una sociología que estudia la relación entre el tamaño de la familia y las cuentas por alimentos
selecciono al azar a seis clientas de un supermercado. A cada clienta seleccionada se le preguntaba
cuantos hijos menores de 18 años de edad vivían con ella y también el numero de cuartos de leche que
en promedio se consumía por semana en su hogar. Estos son los datos resultantes de esta encuesta:

x y xy X² Y²
2 14 28 4 196
2 20 40 4 400
2 9 18 4 81
2 25 50 4 625
2 16 32 4 256
2 14 28 4 196

Respuesta:

30
f(x) = - 2,57E+15x + 5,15E+15
25
Consum o semanal de leche

20

15
Columna C
10 Lineal (Columna C)
Lineal (Columna C)
5

0
1,5 2 2,5 3 3,5 4
Numero de hijos menores de 18 años

a. La socióloga encontró el problema de no poder encontrar el valor del consumo por cada numero de
hijos menores de 18 años puesto que el valor del coeficiente (a) es infinito, ademas la recta es vertical .

5. Un estudio de la relación entre los IQ's de los esposos y sus esposas dio la ecuación de mínimo
cuadrado y= 48-0,5x donde x es el IQ del esposo y (y) es el de la esposa. Considerando de esta
ecuación se basa en los siguientes datos.
Respuesta:

f ( x)=−0,5 x+ 48
f (102)=−0,5(102)+48

f (102)=−3

El valor del IQ de la mujer y relacionada con el del hombre x es de -3.

6.
Los siguientes son números de los minutos que 12 mecánicos requirieron para ensamblar una maquina
en la mañana, x,y en la tarde, y.

x y xy X² Y²
12 14 168 144 196
11 11 121 121 121
9 14 126 81 196
13 11 143 169 121
10 12 120 100 144
11 15 165 121 225
12 12 144 144 144
14 13 182 196 169
10 16 160 100 256
9 10 90 81 100
11 10 110 121 100
12 14 168 144 196
134 152 1697 1522 1968

a. calcular r

Respuesta :

n(∑ xy)−(∑ x )(∑ y)


r=
√n(∑ x )−(∑ x ) ∗ √n(∑ y )−(∑ y )
2 2 2 2

12(1697)−(134)(152)
r=
√ 12(1522)−(134) ∗ √ 12(1968)−(152)
2 2

20364−20368
r=
√18264−17956∗ √23616−23104
−4
r=
√(308)∗ √(512)
−4
r=
√157696
−4
r=
397,1095567

r=−0.010072787

7. Si calculamos r para uno de los siguientes conjuntos de datos, ¿debería sorprendernos obtener r=1 y
r=-1 Explique su respuesta.

a. x y xy X² Y²
12 5 60 144 25
8 15 120 64 225
20 20 180 208 250

n(∑ xy)−(∑ x )(∑ y)


r=
√n(∑ x )−(∑ x ) ∗ √n(∑ y )−(∑ y )
2 2 2 2

2( 180)−(20)(20)
r=
√ 2(208)−(20) ∗ √ 2(250)−(20)
2 2

−40
r=
√( 416−400)∗ √(500−400)

r= −40
4∗ 10

r=−1

Si debería sorprendernos obtener 1 ya que el calculo del coeficiente de variación es -1

b.

x y xy X² Y²
6 9 54 36 81
4 11 44 16 121
10 20 98 52 202
n(∑ xy)−(∑ x )(∑ y)
r=
√n(∑ x )−(∑ x ) ∗ √n(∑ y )−(∑ y )
2 2 2 2

2(98)−(10)(20)
r=
√ 2(52)−(10) ∗ √2( 202)−(20)
2 2

−4
r=
√( 4)∗ √( 4)
−4
r=
4
r=−1

No debería sorprendernos obtener -1 ya que el calculo del coeficiente de variación es efectivamente -1


como lo muestra el calculo anterior.

7.
Respuestas:

a: no hay correlación
b: no hay correlación
c: correlación positiva
d: no hay correlación
e: correlación negativa

8.

Respuestas :

a: no hay correlación
b: correlación positiva
c: no hay correlación
d: no hay correlación
e: correlación negativa

También podría gustarte