Está en la página 1de 4

Tema 3 Estadı́stica Descriptiva Ejercicios

1º. Completa los datos que faltan en la siguiente tabla estadı́stica, donde ni , Ni y fi representan
respectivamente las frecuencias absolutas, acumuladas y relativas:
Xi ni fi Ni
1 4
2 6 0.12
3 15
4 6 0.12
5 31
6 9 0.18
7 4
8

2º. Demuestra las siguientes afirmaciones:

(a) La suma de las desviaciones de los valores de una variable respecto a su media aritmética es
0.
(b) Si X es una variable estadı́stica de media aritmética x y c es una constante, entonces la media
aritmética de la variable X + c es x + c.
(c) Si X es una variable estadı́stica de media aritmética x y c es una constante, entonces la media
aritmética de la variable cX es cx.
(d) La varianza de una variable X es 0 si y sólo si X toma un único valor.
(e) Si X es una variable estadı́stica de varianza s2x y c es una constante, entonces la varianza de
la variable X + c es s2x .
(f) Si X es una variable estadı́stica de varianza s2x y c es una constante, entonces la varianza de
la variable cX es c2 s2x .

3º. Calcula las medias aritmética y geométrica de la siguiente lista de datos:

23 24 27 29 29 30 33 33 34 38 45 60 60 88 126 221 256

¿Cuál de las dos medidas anteriores te parece más razonable como resumen de la distribución?

4º. Las cantidades de cadmio (en ppm) encontradas en 50 ejemplares de rocas del tipo A y en 60
ejemplares del tipo B se expresan en las siguientes tablas:

Cadmio(ppm) N ◦ ejemplares A Cadmio(ppm) N ◦ ejemplares B


20 5 20 1
22 8 22 17
24 12 24 18
26 15 26 19
28 7 28 5
30 3

A la vista de estos datos, razona cuál de los dos tipos de datos presenta una estructura más
homogénea en cuanto a la cantidad de cadmio se refiere.
5º. En un aula de 30 estudiantes se ha contabilizado el número de faltas a lo largo de un trimestre.
Los resultados se muestran en el siguientes diagrama de barras:

nº de estudiantes

12

0 3 4 6 10
faltas

(a) Calcula el número medio de faltas durante dicho trimestre.


(b) Calcula la mediana y la moda de la distribución anterior, indicando su significado.
(c) Calcula la desviación tı́pica de la distribución anterior.

6º. Se han realizado 100 mediciones sobre la concentración de cierta sustancia en el aire de una región
determinada y, posteriormente, se han agrupado los datos en intervalos.
Los resultados se representan en el histograma siguiente:

2
1.6

0.4

150 165 170 175 180 190 210

(a) Halla la correspondiente tabla de frecuencias.


(b) Calcula la media aritmética y la desviación tı́pica.
(c) Calcula la mediana y la moda.
(d) Calcula los cuartiles y el recorrido semiintercuartı́lico.
7º. La distribución que sigue representa el diámetro en cm. de 40 ejemplares de un tipo de sedimentos:

Diámetro N◦ de ejemplares
[2.85, 3.05) 4
[3.05, 3.25) 8
[3.25, 3.45) 9
[3.45, 3.65) 8
[3.65, 3.85) 7
[3.85, 4.05] 4

(a) Representa los datos anteriores mediante un histograma y construye el polı́gono de frecuencias
acumuladas absolutas.
(b) Calcula la media aritmética, la mediana y la moda de dicha distribución.
(c) Calcula el recorrido, la desviación media y la desviación tı́pica e indica si la media aritmética
obtenida en el apartado anterior es o no representativa.
(d) Se decide someter a una determinada radiación al 25 % del total de ejemplares con mayor
diámetro. ¿Cuál es el valor del diámetro mı́nimo que tendrán los ejemplares que reciban tal
radiación?
(e) Simetrı́a y curtosis de la distribución estadı́stica.
(f) Al estudiar los diámetros de otra muestra de 100 ejemplares, se obtiene que la media aritmética
y la varianza de esta nueva distribución valen 5.16 y 0.012 respectivamente. ¿Cuál de las dos
distribuciones es más homogénea en relación al diámetro de los ejemplares?

8º. Dado el siguiente conjunto de datos:


139 171 134 155 144 153 179 139 149 154
137 140 142 168 152 149 148 155 168 144
131 144 137 156 153 149 169 158 147 150
152 140 161 153 179 146 152 140 145 152
151 145 157 156 160 170 165 158 158 161
se pide:

(a) Agrúpalos en cinco intervalos de la misma amplitud.


(b) Halla la media aritmética y la desviación tı́pica.
(c) Halla la mediana y el recorrido semiintercuartı́lico.
(d) Halla la moda.

9º. Se quiere realizar un análisis rápido de la concentración de una sustancia en una disolución me-
diante las lecturas dadas por un colorı́metro. Para ello, se determinaron cuidadosamente 6 con-
centraciones Y (en mgr/cm3 ) de la sustancia en otras tantas disoluciones, anotándose las lecturas
X correspondientes en el colorı́metro, obteniendo ası́ la siguiente tabla:

X 90 170 275 330 390 410


Y 42 48 61 69 80 89

(a) Determina las rectas de regresión de Y sobre X y de X sobre Y .


(b) Calcula el coeficiente de correlación. Interpretación.
(c) Estima la concentración de la sustancia cuando la lectura del colorı́metro es 270.
10º. Un cientı́fico trata de relacionar la antigüedad X (en millones de años) de cierto tipo de fósiles
con la cantidad de una sustancia Y (en partes por millón) que existe en ellos. Con una muestra
de cinco fósiles cuya datación ha realizado por otro método obtiene la siguiente tabla:
X 1 2 2.5 3 4
Y 15 20 40 50 70

(a) Calcula el coeficiente de correlación entre ambas variables e interprétalo.


(b) Si la cantidad de sustancia de un fósil es de 30 partes por millón, ¿qué antigüedad estimamos
que tiene?
(c) Si otro fósil tiene 3 millones de años ¿cuál es la cantidad de la sustancia que se espera en él?

11º. Demuestra las siguientes afirmaciones:

(a) Si (X, Y ) es una variable bidimensional con covarianza sxy y c y d son constantes, entonces la
covarianza de (X + c, Y + d) es sxy .
(b) Si (X, Y ) es una variable bidimensional con covarianza sxy y c y d son constantes, entonces la
covarianza de (cX, dY ) es cdsxy .

12º. La tabla que se proporciona representa la información obtenida sobre la longitud X y la anchura
Y en mm. de 60 ejemplares de cierto tipo de rocas:

Y [1.55, 1.65) [1.65, 1.75) [1.75, 1.85]


X
[5.0, 5.5) 2 1 0
[5.5, 6.0) 2 2 1
[6.0, 6.5) 1 3 2
[6.5, 7.0) 1 10 8
[7.0, 7.5) 4 5 5
[7.5, 8.0] 2 3 8

Se pide:

(a) Distribuciones marginales de X e Y .


(b) Distribución de X condicionada a que la anchura Y varı́e en [1.65, 1.75).
(c) Rectas de regresión y coeficiente de correlación.
(d) Mediana, moda y cuartiles de Y .

13º. Se consideran los datos estadı́sticos


X 0 1 2 3 4
Y 8 7 4 1 0

(a) Representa la nube de puntos.


(b) Sin realizar cálculos numéricos, determina cuál de las ecuaciones

y = −2.2x + 8.4; y = −4.3 + 3.6x; x = 3.4y + 7.2

corresponde a la recta de regresión de Y sobre X.


(c) Sin realizar cálculos numéricos, determina cuál de los valores

−0.98; 0.97; −1.8

corresponde al coeficiente de correlación lineal entre X e Y .

También podría gustarte