Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Correlación y Regresión
Programa: LPI
1) Un equipo se encargó de analizar las causas de los frecuentes errores en las facturas diligenciadas
por una clínica. El número de datos variaban según el tipo de factura. Un miembro del equipo propuso
concentrarse en simplificar las facturas más complicadas, seguramente causa de la mayoría de errores.
El equipo decidió investigar en primer lugar la teoría, aparentemente obvia, según la cual el número
de errores en una factura dependía de la cantidad de datos a incluir en la misma. Los datos recogidos
fueron:
Número de Número de Número de Número de Número de Número de
datos en la errores en la datos en la errores en la datos en la errores en la
lectura lectura lectura lectura lectura lectura
8 3 15 7 15 1
15 2 26 1 22 6
15 5 20 5 24 6
12 4 10 2 19 9
10 7 10 3 12 8
25 2 9 5 27 6
20 3 13 3 24 12
17 9 20 9 10 1
18 3 23 10 12 2
23 4 20 12
27 1 13 12
8 0 24 8
18 6 13 9
20 1 13 0
18 0 23 0
¿El diagrama de dispersión confirma la teoría “de la existencia de la relación entre el número
de datos a incluir en la factura y la cantidad de errores en la misma?
R) No, ya que como nos podemos dar de cuenta en el gráfico, no hay una coherencia u orden
dentro de los errores en las facturas dependiendo de la cantidad de datos.
Un ejemplo se puede obtener, si se toma una muestra aleatoria de los datos de la anterior
tabla
La diferencia de datos es muy grande y dispareja para tener un dato cercano a la teoría
planteada
2) Teniendo en cuenta los datos arrojados anteriormente, se tomó la decisión de hacer una
estratificación de los datos por empleada (una tenía mucha más experiencia que la otra)
mostró que efectivamente no existía la correlación buscada, pero si una clara diferencia entre
el número de errores entre las dos.
Número Mejoramiento de la
de lectura (Palabras por
semanas minuto).
x y
3 86
5 118
2 49
8 193
6 164
9 232
3 73
4 109
a. Ilustre los ocho puntos de los datos para verificar si es razonable que la relación
entre el mejoramiento de lectura promedio y el tiempo es lineal.
200
150
100
50
0
X Y
m= ∑xy-∑x∑y/n
n∑x2 –(∑x)2
n
40x1024
6217 - 8
m= = 6217-5120 = 1097 = 24,93
244 – (40)2 244-200 44
8
4) Una socióloga que estudia la relación entre el tamaño de la familia y las cuentas por
alimentos seleccionó al azar a seis clientas de un supermercado. A cada clienta seleccionada
se le preguntaba cuántos hijos menores de 18 años de edad vivían con ella y también el
número de cuartos de leche que en promedio se consumía por semana en su hogar. Estos son
los datos resultantes de esta encuesta:
2 14
2 20
2 9
2 25
2 16
2 14
5) Un estudio de la relación entre los [Q’s de los esposos y sus esposas dio la ecuación
de mínimos cuadrados y = 48- 0.5 x donde x es el [Q del esposo e y es el [Qde la esposa.
Considerando que esta ecuación se basa en los siguientes datos:
x Y
90 90
114 102
102
a) y = 94
6) Los siguientes son los números de minutos que 12 mecánicos requirieron para
ensamblar una máquina en la mañana, x, y en la tarde, y:
x y
12 14
11 11
9 14
13 11
10 12
11 15
12 12
14 13
10 16
9 10
11 10
12 14
a) Calculo r.
∑(xi-x) (yi-y)
r= = (7,10-15) (7,10-15) / √ (7,10-15)2 (7,10-15)2
√ ∑(xi-x)2 ∑(yi-y)2
r=1
7) Si calculamos r para cada uno de los siguientes conjuntos de datos, ¿debería sorprendernos
obtener r=1 y r= -1? Explique sus respuestas.
a. x Y
6 9
14 11
b. x y
12 5
8 15
8) Indique en cada caso si esperaría una correlación positiva, una correlación negativa o
ninguna correlación:
a. La medida de la concentración de polen en el aire y la venta de medicamentos
antialérgicos; Correlación negativa
b. el ingreso y la educación; Correlación positiva
c. el número de días soleados en agosto en Detroit y la concurrencia al zoológico de
Detroit; Ninguna correlación
d. el talle de la camisa y el sentido del humor; Ninguna correlación
e. el número de personas vacunadas contra la gripe y el número de personas que
contraen esa enfermedad; Correlación negativa