Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccion Al Analisis de Datos
Introduccion Al Analisis de Datos
INTRODUCCIÓN AL ANÁLISIS DE DATOS
1) Se desea distribuir en 7 clases de igual amplitud la data de vida útil, medida en meses, de 5000
baterías para automóviles. Para ello se dispone de la siguiente información acerca de esa
distribución:
i) La mediana de la vida útil de las baterías de de 20 meses.
ii) El 20 % de los datos se concentra en las tres primeras clases.
iii) El 22% de los datos se concentra en la quinta clase.
iv) La mitad de los datos está en las tres últimas clases.
v) El número total de datos en las clases dos y tres es igual al número de
datos en la clase seis.
vi) En la clase siete hay 600 datos.
vii) f7 = 2f2
viii) El primer cuartil es 15 meses y 25 días.
Nota: Considere que un mes tiene 30 días.
A) Consiga la distribución de frecuencias de la vida útil de las 5000 baterías.
De la información suministrada se pueden escribir lo siguiente (n = 5000, c = 7)
i) 20.
ii) 0,20.
iii) 0,22.
iv) 2500.
v) .
vi) 600.
vii) 2 .
viii) 15,833.
4 1,2,3
1
5000 1000
15 4 5 15,8333 ó
1500
20
3
5000 3600
25 4 5 25,9375
800
El diagrama será
Q1 = 15,833 Q2 = 20 Q3 = 25,9375
10 15 20 25 30
x x
2) Una máquina produce tornillos cuya longitud nominal es de 10 cm de largo. Se considera que
un tornillo está en especificaciones si su longitud difiere menos de 2 mm de la longitud
nominal. Las longitudes de la producción de una hora, 1500 tornillos, se han distribuido en 7
clases de igual amplitud, con las características siguientes:
i) En las clases uno y siete hay igual cantidad de tornillos.
ii) El total de tornillos por encima de la clase cinco excede al total
de la clase dos por cinco.
iii) En las dos primeras clases hay un total de 180 tornillos.
iv) Hasta la clase seis hay 1450 tornillos acumulados.
v) El 37% de los tornillos cae en la cuarta clase.
vi) El percentil 27,33, igual a 9,95 cm, coincide con el límite superior
de la clase tres.
vii) La longitud promedio de los 1500 tornillos es de 10,033 cm.
De los datos se tiene que n = 1500; c = 7; clases de igual amplitud
i) f1 = f7
ii) f6 + f7 = f2 + 5
iii) F2 = f1 + f2 = 180
iv) F6 = 1450
v) h4 = 0,37
vi) P , = 9,95 cm, H3 = 0,2733 , F3 = 1500*0,2733 = 410
vii) 10,033 cm
A) Hallar la distribución de frecuencias de las longitudes de estos tornillos.
De la información iv) se tiene que
1500 1500 1450 50 50
De la información iii) se tiene que
180 180 50 130
De la información ii) se tiene que
5 130 5 50 85
De la información v) se tiene que
0,37 1500 0,37 1500 555
De la información vi) se tiene que
410 410 180 230
Ya que la suma de los fi debe ser igual a n, se tiene, finalmente,
1500 1500 1100 400
Ya disponemos de todos los valores del vector f y por lo tanto también se dispone de todos los
valores de los vectores F, h y H.
Para conocer los límites de los intervalos, sea a el límite inferior de la clase 1 y sea d el ancho de
clases. Entonces todos los límites de clases se pueden expresar en términos de a y de d.
De la información vii) se tiene
1 2 1 533
10,033 .1
1500 2 150
De la información vi) se tiene
3 9,95 . 2
Resolviendo el sistema de las ecuaciones 1 y 2 se tiene 9,50; 0,15.
En definitiva la distribución de frecuencias será
Clases LIi LSi MCi fi Fi hi Hi
1 9,50 9,65 9,575 50 50 0,0333 0,0333
2 9,65 9,80 9,725 130 180 0,0867 0,1200
3 9,80 9,95 9,875 230 410 0,1533 0,2733
4 9,95 10,10 10,025 555 965 0,37 0,6433
5 10,10 10,25 10,175 400 1365 0,2667 0,91
6 10,25 10,40 10,325 85 1450 0,0567 0,9667
7 10,40 10,55 10,475 50 1500 0,0333 1
1500 1
B) ¿Qué porcentaje de tornillos está en especificaciones?
Para conseguir el porcentaje de tornillos que está en especificaciones hay que conocer a qué
percentiles corresponden los valores 9,80 y 10,2 que se corresponden con los límites de ese
intervalo. Es decir, hay que conocer el valor de j tal que Pj es igual a cada uno de los valores
indicados anteriormente. De la fórmula del percentil, despejando j, se tiene (para 10,2 la clase a
considerar es la clase cinco y para 9,8 la clase a considerar es la clase dos)
100
82,11%
1500 ∆
100
12%
1500 ∆
En consecuencia, el porcentaje solicitado es la diferencia, 70,11%. ¡Que mal está la máquina!
3) Se dispone de 200 datos del punto de congelación de diversas sustancias, agrupadas en 5 clases
de igual amplitud. De la distribución de frecuencias se tiene la información siguiente:
i) La mediana de los datos es (‐25 °C).
ii) El 15% de los datos supera los (‐ 155/17 °C = ‐9,11675 °C).
iii) La frecuencia absoluta de la segunda clase es cuatro veces la frecuencia absoluta de la
clase uno.
iv) La tercera clase contiene el 25% de los datos.
v) La frecuencia absoluta acumulada de la segunda clase es 100.
vi) Hasta la cuarta clase están acumulados el 92% de los datos.
A) Determinar la tabla de frecuencias.
De analizar la información suministrada se concluye que la distribución de frecuencias tiene la
estructura siguiente
Límite Límite Centro de
clases Inferior i Superior i la clase i fi Fi hi Hi
1
2 100
3 0,25
4 0,92
5 200 1
De la información v) se deduce que la mediana es el límite superior de la clase dos, por tanto,
LS2 = ‐25 °C, o bien,
2 25 1
De la información vi) se puede decir que
0,92 200 0,92 184
Entonces,
200 184 16
De la información iv) se puede escribir,
0,25 200 0,25 50
De la información iii) y v) se puede escribir,
100 4 5
Solo queda por conocer f4 y para ello hay que recordar que la suma de todos los fi es 200,
entonces,
200 20 80 50 16 34
Para completar la tabla es necesario conocer otra ecuación en términos de a y d, para ello, de la
información ii), se puede escribir
155
,
17 ,
Luego,
Eliminar el 15% de los datos es eliminar los 30 datos inferiores, es decir, se elimina toda la clase
1 (20 datos) y 10 datos de la clase 2 (quedaran 70 datos en la nueva clase 2; ver nuevo límite
inferior). Las clases resultantes son
Límite Límite Centro de
clases Inferior i Superior i la clase i fi Fi
1
2 ‐33,75 ‐25 ‐29,375 70 70
3 ‐25 ‐15 ‐20 50 120
4 ‐15 ‐5 ‐10 34 154
5 ‐5 5 0 16 170
1 1
% 29,375 70 20 50 10 34 0 16 19,978
170 170
El promedio solicitado es ‐19,978 °C.