Está en la página 1de 5

Instrucciones: Identificar el tipo de problema y aplicar los conocimientos

previos, contestando los problemas y realizando el programa en Python para


comprobar ambos resultados, debiendo entregar en electrónico el desarrollo
del problema y el código desarrollado para la solución de los problemas.

1.- Las notas de 12 alumnos de una clase en Matemáticas y Física son las
siguientes:
Matemáticas Física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10
Calcular el diagrama de dispersión.

2.- . La tabla siguiente recoge las puntuaciones de 11 sujetos (N=11) en dos


variables X e Y.

X Y
10 8.04
8 6.95
13 7.58
9 8.81
11 8.33
14 9.963
6 7.24
4 4.26
12 10.84
7 4.82
5 5.68

a.- Construir el diagrama de dispersión de Y en función de X. En base al diagrama


construido,
a.1. ¿Cómo están relacionada X e Y?
a.2. ¿Qué signo tienen la covarianza y la correlación?
b.- Calcular la covarianza utilizando la expresión:
N

∑ (X
i =1
i − X )(Yi − Y )
SPC
S xy = =
N−1 N−1

c.- Calcular el coeficiente de correlación de Pearson utilizando la expresión


N

S xy ∑ (X
i =1
i − X )(Yi − Y )
rxy = =
Sx Sy N N

∑ (X − X) ∑ (Y − Y )
2 2
i i
i =1 i =1

3.- En un estudio de la Seguridad e Higiene en el Trabajo se contrastó la incidencia


del tabaquismo en la gravedad de los accidentes laborales. Considerando una
gradación de Muy fumador hasta No fumador como media del tabaquismo, y una
gradación de Muy grave a Leve en el tipo de accidente. Se extrajo una muestra de
525 individuos que habían sufrido un accidente laboral. Los resultados se presentan
en la siguiente tabla de contingencia (tabla de doble entrada):
Muy Grave Grave Lesiones Leves
Leves
Muy fumador 20 10 10 30
Fumador 30 40 20 50
Fumador 10 60 80 60
esporádico
No fumador 5 20 30 50
Se pide:
1. Representar los datos anteriores gráficamente
2. Calcular las distribuciones marginales para cada una de las variables de estudio.
3. Construir una tabla de distribución de frecuencias porcentuales donde aparezcan
las distribuciones de la variable de tipo de Lesión condicionada a cada una de las
variables del Fumador.
4. Estudiar si las variables están asociadas o no por medio de una medida
descriptiva. Realizar un análisis gráfico y comentar los resultados.
4. En un estudio sobre el sexismo en el trabajo se contrastaron las variables sexo y
nivel de ingresos. Los resultados obtenidos sobre una muestra de 528 individuos se
presentan en una tabla de doble entrada:
Alto Medio Bajo Bajo
Hombre 50 135 78
Mujer 20 147 98
Se pide:
a) Representar gráficamente las variables en estudio
b) Calcular una media descriptiva del nivel de asociación entre ambas variables.
Realizar un análisis gráfico y analizar los resultados.

5.- De una determinada empresa se conocen los siguientes datos, referidos al


volumen de ventas (en millones de pesetas) y al gasto en publicidad ( en miles de
pesetas) de los últimos 6 años:
Volumen de Ventas (mil Gastos de publicidad (miles
Ptas) ptas)
10 16
15 32
20 48
22 56
30 64
32 80
Calcular:
a) ¿Existe relación lineal entre las ventas de la empresa y sus gastos en
publicidad? Razona la respuesta.
b) Obtener las rectas de regresión mínimo cuadrático.
c) ¿Qué volumen de ventas de la empresa se podría esperar en un año que se
gaste de publicidad 60000 pesetas? ¿Y para un gasto en publicidad de 200000
pesetas?
d) Si lo único que interesase fuese la evolución del volumen de ventas en términos
de gastos en publicidad, sin tener en cuenta la cantidad concreta de cada una
de ellas, ¿existiría correlación ordinal entre ambas variables?

6.- Cinco niños de 2,3,5,7 y 8 años de edad pesan, respectivamente, 14,20,32,42 y


44 kilos.
1) Hallar la ecuación de la recta de regresión de la edad sobe el peso
2) ¿Cuál sería el peso aproximado de un niño de seis años?
7. Un centro comercial sabe en función de la distancia, en kilómetros, a la que se
sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran en la
tabla:

No de Clientes Distancia
(X) (Y)
8 15
7 19
6 25
4 23
2 31
1 40

Calcular:
1) Calcular el coeficiente de correlación lineal
2) Si el centro comercial se sitúa a 2Km, ¿Cuántos clientes puede esperar?
3) Si desea recibir a 5 clientes, ¿a que distancia del núcleo de población debe
situarse?

8. El número de turistas (en millones) entrados en España mensualmente durante


los
años 2001 y 2002 se expone en la siguiente estadística.

a) Calcular en qué año hubo mayor dispersión de turistas por mes.


b) Calcular la matriz de covarianzas.
c) Calcular el coeficiente de correlación lineal entre los dos años e interpretarlo.

9.- Se ha tomado un grupo de parejas (con hijos) y se les ha preguntado a qué


edad
tuvieron su primer hijo. La información se recoge en la tabla adjunta (x = edad del
padre, y = edad de la madre).
a) Estimar mediante la recta de regresión, la edad del padre, si la madre tuvo una
edad de 25 años.
b) Estimar mediante la recta de regresión la edad de la madre si el padre tuvo una
edad de 25 años.
c) Calcular e interpretar el coeficiente de correlación lineal (r) y el coeficiente de
determinación (R2).
d) Representar el polígono de frecuencias absoluta y el polígono de frecuencias
absolutas acumuladas de la distribución marginal de los padres.
e) Calcular la mediana y el percentil 90 de la distribución marginal de las madres.
f) Qué media es más representativa. Justificar la respuesta.

10.- De una variable estadística bidimensional se conocen los siguientes datos:


Σx =140; Σy = 90; N =12; σx = 3.5; σy = 2.2 y el coeficiente de correlación lineal r =
0.9. Calcular:
A) La recta de regresión de y sobre x.
B) La recta de regresión de x sobre y.
C) El valor de x para un valor de y=7.
D) El punto de intersección de las rectas de regresión.
E) Varianza residual.
F) Varianza explicada.
G) Coeficiente de determinación.
H) Matriz de covarianzas.

También podría gustarte