Está en la página 1de 4

Estad stica I Licenciatura en Matem aticas, Curso 2012-13 Relaci on de ejercicios propuestos

1. Realizar un an alisis descriptivo de los datos brit anicos de ingresos familiares contenidos en el chero Datos-ingresos.txt. En concreto, calcular los estad sticos de tendencia central, las medidas de dispersi on y representar un diagrama de cajas y un estimador kernel de la funci on de densidad. Comentar los resultados. 2. Demostrar que
n n

(xi x )2 = m n
i=1 aR i=1

(xi a)2 .

Qu e signica esto en relaci on con la interpretaci on intuitiva de la media muestral? 3. Representar, en un mismo gr aco, los diagramas de cajas correspondientes a la variable Largo del chero tortugas.txt para el conjunto de datos global, para los ejemplares hembra y para los ejemplares macho. Es decir, el gr aco debe incluir tres diagramas de cajas, de izquierda a derecha: el primero debe corresponder a la variable global (sin distinci on de sexos), el segundo al subconjunto de los datos correspondiente a las hembras y el tercero al correspondiente a los machos. Emplear colores distintos para los tres diagramas. 4. Los datos del chero Datos-kevlar.txt corresponden al tiempo hasta el fallo (en horas) de 101 barras de un material utilizado en los transbordadores espaciales, llamado Kevlar49/epoxy, sometidas a un cierto nivel de esfuerzo. Los datos han sido tomados de Barlow et al. (1984). (a) Calcula las principales medidas descriptivas num ericas de estos datos. (b) Representa un diagrama de cajas. (c) Representa un histograma con un n umero de clases apropiado.

(d) Estudia la presencia de datos at picos en la muestra. Si hay datos at picos, supr melos y repite todos los apartados anteriores. Compara los resultados obtenidos. 5. Determina razonadamente si las siguientes armaciones son verdaderas o falsas: (a) Si a nadimos 7 a todos los datos de un conjunto, el primer cuartil aumenta en 7 unidades y el rango intercuart lico no cambia. (b) Si todos los datos de un conjunto se multiplican por -2, la desviaci on t pica se dobla. (c) Si todos los datos de un conjunto se multiplican por 2, la varianza se dobla. (d) Si cambiamos el signo de todos los datos de un conjunto, el coeciente de asimetr a tambi en cambia de signo. (e) Al multiplicar por tres todos los datos de un conjunto, el coeciente de asimetr a no var a. (f) Si el coeciente de correlaci on entre dos variables vale -0.8, los valores por debajo del promedio de una variable est an asociados con valores por debajo del promedio de la otra. (g) Si para todo i, se cumple yi < xi , el coeciente de correlaci on entre x e y es negativo. (h) Al restar una unidad a cada dato de un conjunto, la desviaci on t pica siempre disminuye. (i) Si a un conjunto de datos con media x se le a nade un nuevo dato que coincide con x , la media no cambia y la desviaci on t pica disminuye. 6. (a) Calcula el diagrama de dispersi on de las dos variables correspondientes al peso y a la circunferencia de abdomen que aparecen en el chero Datos-bodyfat.txt. Calcula la recta de regresi on y el coeciente de correlaci on. Comenta los resultados. (b) An alogas preguntas para las dos variables del chero Datos-geyser.txt. 7. Para tres conjuntos de datos se han representado los correspondientes histogramas y diagramas de cajas. Relaciona cada histograma con el diagrama de cajas que le corresponde:

0.5 0.4 0.3

0.5 0.4 0.3

1.5

1 0.2 0.1 0 5 0.5 0.2 0.1 0 5

0 1

10

1 0.8 0.6

3 2 1

10 8 6

0 0.4 1 0.2 0 2 3 2 0 4

8. Se presenta a continuaci on el diagrama de dispersi on correspondiente a dos variables:


10 8

2 2.5

1.5

0.5

0.5

1.5

2.5

Contesta a las siguientes preguntas: (a) Existe relaci on entre las variables? (b) Hay alg un dato at pico? (c) De los tres valores siguientes: 0.01, 0.83 y -0.73, cu al crees que podr a corresponder al coeciente de correlaci on entre x e y ? 9. Un estudio sobre el efecto de la temperatura en el rendimiento de un proceso qu mico proporciona los siguientes resultados:

Temperatura (x) Rendimiento (y)

-5 1

-4 5

-3 4

-2 7

-1 10

0 8

1 9

2 13

3 14

4 13

5 18

(a) Representa el diagrama de dispersi on de los datos anteriores y calcula el coeciente de correlaci on entre las dos variables. Se puede admitir que existe una relaci on lineal aproximada entre ambas, es decir, yi a + bxi ? (b) Calcula el t ermino independiente y la pendiente de la recta de m nimos cuadrados. (c) Qu e rendimiento predecir as para un nuevo proceso realizado a temperatura x = 3.5? 10. En cada uno de los dos siguientes conjuntos de datos, se ha sustituido un n umero por x. Si es posible, calcula x de forma que el coeciente de correlaci on valga 1. Si no es posible, explica la raz on. Datos A: (1, 1), (2, 3), (2, 3), (4, x). Datos B: (1, 1), (2, 3), (3, 4), (4, x).