Está en la página 1de 9

Lazcano Juárez Angel Eduardo 5CV21

Escuela Superior de Ingeniería Mecánica y Eléctrica


Probabilidad y Estadística
Prof. Fernando Salazar Posadas
Tema: Estadística descriptiva
Tarea No. 2
Entrega: noviembre 18 de 2020

1. Los siguientes, son datos sobre clasificaciones de octanaje del motor para diferentes
mezclas de gasolina
88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3
95.6 93.3 94.7 91.1 91.0 94.2 87.8 89.9
88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.8
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1
89.2 88.3 85.3 87.9 88.6 90.9 89.0 96.1
93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7
91.8 91.6 90.4 91.1 92.6 89.8 90.6 91.1
90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7

a) Construir un histograma de frecuencia relativa de todos los datos usando 10 clases.

Primero ordenaremos los datos de menor a mayor:

83.4, 84.3, 85.3, 86.7, 86.7, 87.4, 87.5, 87.6, 87.7, 87.8, 87.9, 88.2, 88.3, 88.3, 88.3, 88.5, 88.5,
88.6, 88.6, 88.7, 88.9, 89.0, 89.2, 89.3, 89.3, 89.6, 89.7, 89.8, 89.8, 89.9, 89.9, 90.0, 90.1, 90.1,
90.3, 90.3, 90.4, 90.4, 90.4, 90.5, 90.6, 90.7, 90.8, 90.9, 91.0, 91.0, 91.0, 91.1, 91.1, 91.1, 91.2,
91.2, 91.5, 91.6, 91.6, 91.8, 91.8, 92.2, 92.2, 92.2, 92.3, 92.6, 92.7, 92.7, 92.7, 93.0, 93.2, 93.3,
93.3, 93.4, 93.7, 94.2, 94.2, 94.4, 94.7, 95.6, 96.1, 98.8, 100.3.

Una vez ordenados los 79 datos, y teniendo en cuenta que el histograma se realizará con 10 clases.
Obtenemos la distribución de clases:
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
∆𝑥 =
# 𝑐𝑙𝑎𝑠𝑒𝑠
100.3 − 83.4
∆𝑥 = ≈ 1.88 ∴ ∆𝑥 = 2
10

1
Lazcano Juárez Angel Eduardo 5CV21
Obtenemos la frecuencia y la frecuencia relativa:

Frecuencia
Clase Frecuencia
relativa

82.0 – 83.9 1 0.013

84.0 – 85.9 2 0.025

86.0 – 87.9 8 0.101

88.0 – 89.9 20 0.253

90.0 – 91.9 26 0.329

92.0 – 93.9 14 0.177

94.0 – 95.9 5 0.063

96.0 – 97.9 1 0.013

98.0 – 99.9 1 0.013

100.0 – 101.9 1 0.013

Obtenemos la gráfica con respecto de la tabla anterior.

Clasificación de octanaje del motor para diferentes mezclas de gasolina


30

25

20
Frecuencia

15

10

0
82.0 - 83.9 84.0 - 85.9 86.0 - 87.9 88.0 - 89.9 90.0 - 91.9 92.9 - 93.9 94.0 - 95.9 96.0 - 97.9 98.0 - 99.9 100.0 -
101.9
Clases

2
Lazcano Juárez Angel Eduardo 5CV21

Clasificación de octanaje del motor para diferentes mezclas de gasolina


0.35

0.3
Frecuencia Relativa

0.25

0.2

0.15

0.1

0.05

0
82.0 - 83.9 84.0 - 85.9 86.0 - 87.9 88.0 - 89.9 90.0 - 91.9 92.9 - 93.9 94.0 - 95.9 96.0 - 97.9 98.0 - 99.9 100.0 -
101.9
Clases

̃), moda, varianza (𝝈𝟐 ) y desviación estándar (𝝈).


̅), mediana (𝒙
b) Determinar la media (𝒙

1 1
Para la media: 𝑥̅ = 79
∙ ∑79
𝑖=1 𝑥𝑖 = 79 ∙ 7076.3 = 89.57 ∴ 𝑥̅ = 89.57

Para la mediana: 𝑥̃ = 𝑥79+1 = 𝑥40 . El número ubicado en x40 es: 90.5


2

Para la moda: Los números que ocurren con mayor frecuencia son: 88.3, 90.4, 90.9, 91.1, 92.2,
92.7. Estos números se repiten 3 veces cada uno.
1
Para la varianza: 𝜎 2 = ∙ ∑79
𝑖=1(𝑥𝑖 − 𝑥̅ ) = 7.87
79−1
Para la desviación estándar:𝜎 ≡ √𝜎 2 ∴ 𝜎 = √7.87 = 2.805

3
Lazcano Juárez Angel Eduardo 5CV21
c) Construir el diagrama de árbol de este conjunto de datos.

83 4
84 3
85 3
86 7 7
87 4 5 6 7 8 9
88 2 3 3 3 5 5 6 6 7 9
89 0 2 3 3 6 7 8 8 9 9
90 0 1 1 3 3 4 4 4 5 6 7 8 9
91 0 0 0 1 1 1 2 2 5 6 6 8 8
92 2 2 2 3 6 7 7
93 0 2 3 3 4 7
94 4 7
95 6
96 1
97
98 8
99
100 3

d) Construir el diagrama de cajas usando como extremos el percentil 10 y percentil 90.

79∙10 1 87.6+87.7
Calculando el percentil 10: 𝑝(10) = 100
+2 = 8.4 ∴ 10𝑝 = 2
= 87.65
79∙90 1 93.7+94.2
Calculando el percentil 90: 𝑝(90) = 100
+2 = 71.6 ∴ 90𝑝 = 2
= 93.95
79∙25 1 88.7+88.9
Calculando el cuartil 1: 𝑝(25) = 100
+2 = 20.25 ∴ 25𝑝 = 2
= 88.8
79∙50 1 90.4+90.5
Calculando el cuartil 2 o mediana: 𝑝(50) = 100
+2 = 40 ∴ 50𝑝 = 2
= 90.45
79∙75 1 92.2+92.2
Calculando el cuartil 3: 𝑝(75) = 100
+2 = 59.75 ∴ 75𝑝 = 2
= 92.2

82.0 101.9
10p = 87.65 Q1 = 88.8 𝑥̃ = 90.45 Q3 = 92.2 90p = 93.95

e) ¿El análisis de datos revela alguna característica interesante?

Nos demuestra que tenemos un tipo de diagrama unimodal simétrica

4
Lazcano Juárez Angel Eduardo 5CV21
2. Considere los siguientes datos de quejas de salud, inflamación de articulaciones (IA),
fatiga (F), dolor de espalda (DE), debilidad muscular (DM), tos (T), irritación de nariz (IN),
otra (O) obtenidas por un laboratorio farmacéutico
O IN T O O O
O F O IN F O
IA IA F DE O O
O IA O IN O DE
IA F F DE IA DM
O IA IN T IA T
F O IN F IA DE
O IA DE IA O F
F O DE DM O DM
O IN O O DE DM

a) Obtener las frecuencias relativas de las diferentes categorías y presentar un histograma.

DE, DE, DE, DE, DE, DE, DE, DM, DM, DM, DM, F, F, F, F, F, F, F, F, F, IA, IA, IA, IA, IA, IA, IA, IA, IA, IA
IN, IN, IN, IN, IN, IN, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, O, T, T, T

Frecuencia
Clases Frecuencia
Relativa

DE 7 0.117

DM 4 0.083

F 9 0.15

IA 10 0.167

IN 6 0.1

O 21 0.35

T 3 0.05

Quejas de la salud
0.4

0.35

0.3
Frecuencia Relativa

0.25

0.2

0.15

0.1

0.05

0 5
DE DM F IA IN O T
Clases
Lazcano Juárez Angel Eduardo 5CV21
̃), moda, varianza (𝝈𝟐 ) y desviación estándar (𝝈).
̅), mediana (𝒙
b) Determinar la media (𝒙

Para los casos de la media 𝑥̅ , la varianza 𝜎 2 y la desviación estándar 𝜎. No podríamos realizar los
cálculos, ya que los datos no son numéricos.

Para la moda: Otra queja de salud.

Para la mediana 𝑥̃, los datos que están al centro son IA e IN. Pero no se puede obtener un valor
numérico que se situé en medio de los dos.

Sí modificamos el orden de las diferentes clases presentadas en el histograma ¿se modifica las
medidas de tendencia central?

Si, todos los valores cambiarían.

3. Una transformación de valores de datos mediante alguna función matemática, como


√𝒙 o 1/x. A menudo puede producir un conjunto de números que tiene propiedades
estadísticas "más agradables" que los datos originales. En particular, puede ser posible
encontrar una función para la cual el histograma de los valores de las transformaciones
sea más simétrico (o, mejor aún, más parecido a una curva en forma de campana) que los
datos originales. Como ejemplo, el artículo "Análisis cinematográfico de lapso de tiempo
de las interacciones de fibroblas de Berilio" (Environ. Research, 1983: 34-48) informó los
resultados de experimentos diseñados para estudiar el comportamiento de ciertas células
individuales que habían sido expuestas al berilio. Una característica importante de una
célula tan individual es su tiempo de interdivisión (IDT). Los IDT se determinaron para un
gran número de células, tanto en condiciones expuestas (tratamiento) como no expuestas
(control). Los autores de este artículo utilizaron una transformación logarítmica, es decir,
Valor transformado =log (valor original). Considere los siguientes datos representativos
de IDT:
IDT log10 (IDT) IDT log10 (IDT) IDT log10 (IDT)
28.1 1.45 60.1 1.78 21.00 1.32
31.2 1.49 23.7 1.37 22.30 1.35
13.7 1.14 18.6 1.27 15.50 1.19
46.0 1.66 21.4 1.33 36.30 1.56
25.8 1.41 26.6 1.42 19.10 1.28
16.8 1.23 26.2 1.42 38.40 1.58
34.8 1.54 32.0 1.51 72.80 1.86
62.3 1.79 43.5 1.64 48.90 1.69
28.0 1.45 17.4 1.24 21.40 1.33
17.9 1.25 38.8 1.59 20.70 1.32
19.5 1.29 30.6 1.49 57.30 1.76
21.1 1.32 55.6 1.75 40.90 1.61
31.9 1.50 25.5 1.41
28.9 1.36 52.1 1.72

6
Lazcano Juárez Angel Eduardo 5CV21
a) Usar intervalos de clase [10,20), [20,30), . . ., [70,80) y construya el histograma con los
datos originales.

IDE
16

14

12

10
Frecuencia

0
[10,20] [20,30] [30,40] [40,50] [50,60] [60,70] [70,80]
Clases

b) Usar intervalos de clase [1.1,1.2), [1.2,1.3), . . . y construya el histograma con los datos
transformados.

Log10 (IDE)
10
9
8
7
Frecuencia

6
5
4
3
2
1
0
[1.1,1.2] [1.2,1.3] [1.3,1.4] [1.4,1.5] [1.5,1.6] [1.6,1.7] [1.7,1.8] [1.8,1.9]
Clases

c) ¿Cuál es el efecto en la transformación?

Se puede apreciar que el primer histograma tiene una forma asimétrica positiva, pero, cuando
usamos los valores del Log10, observamos que el histograma se comporta como bimodal.

7
Lazcano Juárez Angel Eduardo 5CV21
4. Las primeras cuatro desviaciones de la media en la muestra de 𝒏 = 𝟓 tiempos de
reacción fueron 0.3, 0.9, 1.0, 1.3.
a) ¿Cuál es la quinta desviación de la media?

Considerando que ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ ) = 0, podemos realizar la suma de las desviaciones, el total negativo
deberá ser la quinta desviación de la media.

𝑥5 − 𝑥̅ = −(0.3 + 0.9 + 1.0 + 1.3) = −3.5 ∴ 𝑥5 − 𝑥̅ = −3.5


b) Proponer una muestra de datos, para la cual estas son las cinco desviaciones de la media.

Primero calculamos la media entonces, si: 𝑥5 − 𝑥̅ = −3.5 ∴ 𝑥̅ = 𝑥5 + 3.5, proponiendo un primer


valor como: 5.0, 𝑥̅ = 5.0 + 3.5 = 8.5. Derivado de este valor de la media, realizamos las
operaciones: 𝑥𝑖 − 8.5, donde, obtenemos la siguiente muestra de datos: 5.0, 8.8, 9.4, 9.5 y 9.8.

5. Considere la siguiente información sobre la resistencia a la tracción máxima (lb/in) para


una muestra de 𝒏 = 𝟒 alambres de cobre de circonio duro (de "Métodos de
caracterización para alambre de cobre fino", Wire J. Intl., Agosto de 1997: 74-80).
̅=76,831
𝒙 𝝈 =180 Valor mínimo 𝒙𝒊 =76,683 Valor máximo 𝒙𝒊 =77,048
Determine los valores de las dos observaciones de muestra del medio, planteando y
resolviendo el sistema de ecuaciones adecuado.

1 1 𝑛𝑥̅ 2
Sabiendo que: 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 , y que: 𝜎 = √ ∑𝑛𝑖=1 𝑥𝑖2 − , podemos deducir que:
𝑛 𝑛−1 𝑛−1

Para obtener el valor de 𝑥2 , realizamos las siguientes operaciones:


1
𝑥̅ = (𝑥 + 𝑥2 + 𝑥3 + 𝑥4 ) ∴ 𝑥2 + 𝑥3 = 4(𝑥̅ ) − (𝑥1 + 𝑥4 )
4 1
𝑥2 + 𝑥3 = 153593 ∴ 𝑥2 = −𝑥3 + 153593 − −−→ (1)
Ahora analizaremos el valor de 𝑥2 , con la ecuación de la varianza para obtener el resultado
de 𝑥3 .

2
1 2 2 2 2
4𝑥̅ 2
180 = (𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ) −
3 3
1 2
1802 = (𝑥 + 𝑥22 + 𝑥32 + 𝑥42 − 4𝑥̅ 2 )
3 1
3(1802 ) = 𝑥12 + 𝑥22 + 𝑥32 + 𝑥42 − 4𝑥̅ 2
3(1802 ) − (𝑥12 + 𝑥42 ) + 4𝑥̅ 2 = 𝑥22 + 𝑥32
Sustituyendo los valores obtenemos:

𝑥22 + 𝑥32 = 11795430651

8
Lazcano Juárez Angel Eduardo 5CV21
Sustituimos 𝑥2 :

(−𝑥3 + 153593)2 + 𝑥32 = 11795430651

2𝑥32 − 307186𝑥3 + 1535932 − 11795430651 = 0

2𝑥32 − 307186𝑥3 + 11795378998 = 0

Aplicamos la formula general para ecuaciones de segundo grado:

−(−307186) ± √(−307186)2 − 4(2)(11795378998)


𝑥3 =
2(2)

𝑥3 = 76910.13

Sustituimos 𝑥3 en la ecuación (1):

𝑥2 = −76910.13 + 153593

𝑥2 = 76682.87

También podría gustarte