Está en la página 1de 25

EXAMEN FINAL PROBABILIDAD Y ESTADÍSTICA.

Nombre: Dayra Alejandra Jiménez Rojas


Código: 20191573146

Para el primer conjunto de datos se tiene que:


1. Calcular la media, cuartiles y desviación estándar como datos no agrupados.

a. La media aritmética se obtiene utilizando la fórmula:


n
x
x=∑ ❑ i
i=1 n

La suma de todos los datos de n es





❑ x i=4507,98

Y de la siguiente manera:
4507,98
x=
90
x=50,08 ∎
b. Para los cuartiles se tienen las siguientes fórmulas.
n+1 W +1 w+1
Q 2=W = , Q1= , Q3=n+1−
2 2 2

Para el cálculo del cuartil 2 (que es lo mismo que la mediana), se tiene que
n=90, es decir, un valor par, es por esta razón que se debe calcular el w:
n+1
w=
2
90+1
w=
2
w=45.5∎
Es decir, en lo datos se buscan los que se encuentran en la posición 45 y 46,
lo cuales son:
Posici ó n 45=49,24
Posici ó n 46=49,29
Y se promedian estos valores:
49,24 +49,29
Q 2=
2
Q2=49,265∎
Para el cuartil 1, se tiene el valor de w, para la siguiente fórmula:
45.5+1
=23.25
2
Sabiendo este valor, se busca en los datos la posición 23 y 24, los cuales son:
Posici ó n 23=22,14
Posici ó n 24=22,56
La fórmula para calcular el cuartil es la siguiente:
Q1=22,14 + ( 22,56−22,14 )∗0.25

Q1=22,245 ∎

Por último, para el cuartil 3, se calcula de la siguiente manera:


n+1−30.75
90+1−23.25
¿ 67.75
Sabiendo este valor, se busca en los datos la posición 67 y 68, los cuales son:
Posici ó n 67=80,21
Posici ó n 68=81,43
La fórmula para calcular el cuartil es la siguiente:
Q3=80,21+ ( 81,43−80,21 )∗0.75

Q3=81,125∎

c. Para la desviación estándar se tiene que:


m

∑ (X i−x )2
S2= i=1
n−1
Recordando que x=50,08 , queda de la siguiente manera:
n

∑ ( x i−50,08 ) 2
S2= i=1
89
2
S =940,095
S= √ 940,095=30,661 ∎

2. Tabla de frecuencia en intervalos como datos agrupados usando la regla de


Sturges y tomando la amplitud con dos decimales.
Para comenzar con el análisis de los datos agrupados, se realiza la tabla de
frecuencia. Para lograrlo se debe tomar en cuenta el rango, números de intervalos y
la amplitud.
El rango se determina de la siguiente manera:
R=X m á x −X m í n

R=93,76−1,55
R=92,21∎
El número de intervalos se calcula empleando la fórmula:
m=1+3.3 log log (n)
m=1+3.3 log log ( 90 )
m=7,44 ∎
Por último, se calcula la amplitud del intervalo:
R
a=
m
93.76−1,55
a=
1+3,3 log log (90)
a=12,37 ∎

Se obtiene entonces la siguiente tabla de frecuencia:

Intervalo fi hi Fi Hi
1,55 – 13,92 15 15/90 15 15/90
13,92 – 26,29 11 11/90 26 26/90
26,29 – 38,66 12 12/90 38 38/90
38,66 – 51,03 9 9/90 47 47/90
51,03 – 63,4 9 9/90 56 56/90
63,4 – 75,77 5 5/90 61 61/90
75,77 – 88,14 16 16/90 77 77/90
88.14 – 100,51 13 13/90 90 90/90=1

Figura 1. Tabla de frecuencia para datos agrupados para el primer conjunto de datos

3. Cálculo de media aritmética, cuartiles y varianza como datos agrupados.

a. Para el cálculo de la media aritmética, es importante tener la marca de clase


del intervalo. Este valor se obtiene de la siguiente fórmula:
xm á x + x m í n
x i=
2
Figura 2. Tabla de frecuencia con la marca de clase

Intervalo fi xi
1,55 – 13,92 15 7,735
13,92 – 26,29 11 20,105
26,29 – 38,66 12 32,475
38,66 – 51,03 9 44,845
51,03 – 63,4 9 57,215
63,4 – 75,77 5 69,585
75,77 – 88,14 16 81,955
88.14 – 100,51 13 94,325

Teniendo la marca de clase, este valor se multiplica con la frecuencia

Intervalo fi xi f i xi
1,55 – 13,92 15 7,735 116,025
13,92 – 26,29 11 20,105 221,155
26,29 – 38,66 12 32,475 389,7
38,66 – 51,03 9 44,845 403,605
51,03 – 63,4 9 57,215 514,935
63,4 – 75,77 5 69,585 347,925
75,77 – 88,14 16 81,955 1311,28
88.14 – 100,51 13 94,325 1226,225

Figura 3. Tabla de frecuencia con el producto de la marca de clase y la frecuencia absoluta

Por último, para el cálculo de la media aritmética se suma f i x i y se divide


por el número de datos.
n
xf
x=∑ i i
i=1 n

x=50,342 ∎
b. Para el cálculo de la varianza, se usa la siguiente fórmula:
n
( x ¿¿ i−x )2 f i
S =∑ ❑
2
¿
i =1 n−1

Utilizando la marca de clase anteriormente calculada, se resta con la media


aritmética ( x=50,342).

Intervalo fi xi x i−x

1,55 – 13,92 15 7,735 -42,607


13,92 – 26,29 11 20,105 -30,237
26,29 – 38,66 12 32,475 -17,867
38,66 – 51,03 9 44,845 -5,497
51,03 – 63,4 9 57,215 6,873
63,4 – 75,77 5 69,585 19,243
75,77 – 88,14 16 81,955 31,613
88.14 – 100,51 13 94.325 43,983
Figura 4. Diferencia entre la marca de clase y la media aritmética

Este último valor se eleva al cuadrado y se multiplica por la frecuencia.


x i−x 2
(x ¿¿ i−x) f i ¿

-42,607 27231,34
-30,237 10057,55
-17,867 3831,08
-5,497 272,03
6,873 425,04
19,243 1851,31
31,613 15989.32
43,983 25147,66

Por último, estos valores se suman y se dividen entre n−1=89


2
S =952.869∎
S= √ 952.869=30.869 ∎
4. Gráficas de histograma, polígono de frecuencia y ojiva para los datos agrupados.

a. Histograma.
b. Polígono de frecuencia.

c. Ojiva.

5. Cálculo de los percentiles 23%, 38% y 78% con datos no agrupados y agrupados.
a. Para datos no agrupados se tiene que:
k =23 %
w=k ∙ n
w=23 % ∙ 90
w=20.7
Se busca en los datos, en la posición 20 y 21, los cuales son:
Posici ó n 20=21.31
Posici ó n 21=21,43
Se utiliza la misma fórmula para calcular los cuartiles, entonces:
P1=x n + ( x n+1− xn )∗0.7

Entonces:
P1=21,31+ ( 21,43−21,31 )∗0.7
P1=21,394

Para el segundo percentil no agrupado, nuevamente se escoge un valor:


k =38 %
Y se usa la siguiente tabla para el cálculo del percentil:
w=k ∙ n
w=38 % ∙ 90
w=34.2
Se busca en los datos, en la posición 34 y 35, los cuales son:
Posici ó n 34=35,79
Posici ó n 35=36,55
Entonces:
P1=35,79+ ( 36,55−35,79 )∗0.2

P2=35,942

Para el tercer percentil no agrupado, nuevamente se escoge un valor:


k =78 %
Y se usa la siguiente fórmula para el cálculo del percentil:
w=k ∙ n
w=78 % ∙ 90
w=70,2
Se busca en los datos, en la posición 70 y 71, los cuales son:
Posici ó n 70=82 ,73
Posici ó n 71=84,21
Entonces:
P1=82,73+ ( 84,21−82,73 )∗0.2

P3=83,026

b. Para datos agrupados se tiene que:


k =23 %
Y se usa la siguiente fórmula a para el cálculo del percentil:
w=k ∙ n
w=23 % ∙ 90
w=20.7
Se usa la misma fórmula para el cálculo de cuartiles agrupados:
w−F i−1
P j=Li+ ∙a
fi

Entonces:
20,7−15
P1=13,92+ ∙12.37
11
P1=20,33

Para el segundo percentil de datos agrupados, nuevamente se escoge un valor:


k =38 %
Primero:
w=k ∙ n
w=38 % ∙ 90
w=34,2

Entonces:
34,2−26
P2=26,29+ ∙12,37
12
P2=34,74

Para el tercer percentil de datos agrupados, nuevamente se escoge un valor:


k =78 %
Primero:
w=k ∙ n
w=78 % ∙ 90
w=70.2
Entonces:
70,2−61
P3=75,77+ ∙12,37
16
P3=82,88

6. Calcular cuatro intervalos de confianza


a. Para los datos desagrupados se tiene que:
μ=50,08
σ =940,095
n=90
Entonces, se supone un valor de confianza, en este caso, 95%, se calcula de la
siguiente manera:
0,95=1−α ⟹ α =0.05
Z 0.05
=Z 0.025=−1.96
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
√ σ
n
Entonces:
50,08 ±(−1.96)∙
√ 940,095
90
[43,7453 , 56.4146]

Ahora para un segundo cálculo, se supone un valor de confianza, en este caso,


87%, se calcula de la siguiente manera:
0,87=1−α ⟹ α=0.13
Z 0.13
=Z 0.065=−1.51
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
√ σ
n
Entonces:
50,08 ±(−1.51)∙
√ 940,095
90

[45,199 , 54,9602]
b. Para los datos agrupados se tiene que:
μ=50,342
σ =952,859
n=90
Entonces, se supone un valor de confianza, en este caso, 50%, se calcula de la
siguiente manera:
0,50=1−α ⟹ α =0.50
Z 0.50
=Z 0.25=−0.67
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
√ σ
n
Entonces:
50,342 ±(−0.67)∙
√ 952,859
90

[48.161,52,522]

Ahora para un segundo cálculo, se supone un valor de confianza, en este caso,


85%, se calcula de la siguiente manera:
0,85=1−α ⟹ α =0.15
Z 0.13
=Z 0.075=−1.44
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
√ σ
n
Entonces:
50,342 ±(−1.44)∙
√ 952,869
90

[45,786 , 54,897]

7. Calcular la recta de mínimos cuadrados y coeficiente de correlación de los datos.


Se construye a la recta de mínimos cuadrados teniendo en cuenta los siguientes
parámetros:
a. Recta de mínimos cuadrados.
X =Cantidad de datos=90
Y =Valor de cada dato
Se usan las siguientes fórmulas:
❑ ❑ ❑
n ∙ ∑ ❑ x ∙ y −∑ ❑ x ∙ ∑ ❑ y
❑ ❑ ❑
m=
(∑❑ ❑ x )
❑ ❑ 2
n ∙ ∑ ❑ x 2−

❑ ❑ ❑ ❑


❑ x 2 ∑ ❑ y−∑ ❑ x ∙ ∑ ❑ x ∙ y
❑ ❑ ❑
b=
(∑❑ ❑ x)
❑ ❑ 2
n ∙ ∑ ❑ x 2−

En donde se tiene que:


n=90



❑ x=4095




❑ y =4507,98




2
❑ x =247065




❑ x ∙ y=207191,22

Reemplazando los valores, entonces:


m=0.0342
b=48,532
b. Para el coeficiente de correlación se tiene que:

∑ ❑(x−x )( y− y )
r= ❑

√∑ √∑
❑ ❑
2
❑ ( x−x ) ❑ ( y− y )2
❑ ❑

En donde se tiene que:





2
❑ ( x−x ) =60742,5




2
❑ ( y− y ) =83668,46




❑( x−x)( y − y)=2078,13

Entonces:
r =0,02915

r 2=0,0008497

Ahora, para el segundo conjunto de datos se tiene que:


1. Calcular la media, cuartiles y desviación estándar como datos no agrupados.

a. La media aritmética se obtiene utilizando la fórmula:


n
x
x=∑ ❑ i
i=1 n

La suma de todos los datos de n es





❑ x i=9461,54

Y de la siguiente manera:
9461,54
x=
90
x=105,12 ∎
b. Para los cuartiles se tienen las siguientes fórmulas.
n+1 W +1 w+1
Q 2=W = , Q1= , Q3=n+1−
2 2 2

Para el cálculo del cuartil 2 (que es lo mismo que la mediana), se tiene que
n=90 , es decir, un valor par, es por esta razón que se debe calcular el w:
n+1
w=
2
90+1
w=
2
w=45.5∎
Es decir, en lo datos se buscan los que se encuentran en la posición 45 y 46,
lo cuales son:
Posici ó n 45=110,17
Posici ó n 46=110,2
Y se promedian estos valores:
110,17+110,2
Q 2=
2
Q 2=110,185 ∎

Para el cuartil 1, se tiene el valor de w, para la siguiente fórmula:


45.5+1
=23.25
2
Sabiendo este valor, se busca en los datos la posición 23 y 24, los cuales son:
Posici ó n 23=69,13
Posici ó n 24=69,26
La fórmula para calcular el cuartil es la siguiente:
Q1=69,13+ (69,26−69,13 )∗0.25
Q1=69,162 ∎

Por último, para el cuartil 3, se calcula de la siguiente manera:


n+1−23.25
90+1−23.25
¿ 67.75
Sabiendo este valor, se busca en los datos la posición 67 y 68, los cuales son:
Posici ó n 67=138,94
Posici ó n 68=139,01
La fórmula para calcular el cuartil es la siguiente:
Q3=138,94 + ( 139,01−138,94 )∗0.75
Q3=138,992

c. Para la desviación estándar se tiene que:


m

∑ ❑( X i−x)2
2 i=1
S=
n−1
Recordando que x=105,12, queda de la siguiente manera:
n

∑ ❑ ( x i−105,12 )2
2 i=1
S=
89

S2=1985,255
S= √1985,255=44,556 ∎

2. Tabla de frecuencia en intervalos como datos agrupados usando la regla de


Sturges y tomando la amplitud con dos decimales.

Para comenzar con el análisis de los datos agrupados, se realiza la tabla de


frecuencia. Para lograrlo se debe tomar en cuenta el rango, números de intervalos y
la amplitud.
El rango se determina de la siguiente manera:
R=X m á x −X m í n

R=188,01−26,64
R=161,37∎
El número de intervalos se calcula empleando la fórmula:
m=1+3.3 log log (n)
m=1+3.3 log log ( 90 )
m=7,44 ∎
Por último, se calcula la amplitud del intervalo:
R
a=
m
188,01−26,64
a=
1+3,3 log log (90)
a=21,66 ∎

Se obtiene entonces la siguiente tabla de frecuencia:

Intervalo fi hi Fi Hi

26,64 – 48,3 16 16/90 16 16/90

48,3 – 69,96 8 8/90 24 24/90

69,96 – 91,62 5 5/90 29 29/90

91,62 – 113,28 18 18/90 47 47/90

113,28 – 134,94 19 19/90 66 66/90

134,94 – 156,6 12 12/90 78 78/90

156,6 – 178,26 10 10/90 88 88/90

178,26 – 199,92 2 2/90 90 90/90=1


Figura 1. Tabla de frecuencia para datos agrupados para el primer conjunto de datos

3. Cálculo de media aritmética, cuartiles y varianza como datos agrupados.

a. Para el cálculo de la media aritmética, es importante tener la marca de clase


del intervalo. Este valor se obtiene de la siguiente fórmula:
xm á x + x m í n
x i=
2

Intervalo fi xi

26,64 – 48,3 16 37,47

48,3 – 69,96 8 59,13

69,96 – 91,62 5 80,79


91,62 – 113,28 18 102,45

113,28 – 134,94 19 124,11

134,94 – 156,6 12 145,77

156,6 – 178,26 10 167,43

178,26 – 199,92 2 189,09


Figura 2. Tabla de frecuencia con la marca de clase

Teniendo la marca de clase, este valor se multiplica con la frecuencia

Intervalo fi xi f i xi

26,64 – 48,3 16 37,47 599,52

48,3 – 69,96 8 59,13 473,04

69,96 – 91,62 5 80,79 403,95

91,62 – 113,28 18 102,45 1844,1

113,28 – 134,94 19 124,11 2358,09

134,94 – 156,6 12 145,77 1749,24

156,6 – 178,26 10 167,43 1674,3

178,26 – 199,92 2 189,09 378,18

Figura 3. Tabla de frecuencia con el producto de la marca de clase y la frecuencia absoluta

Por último, para el cálculo de la media aritmética se suma f i x i y se divide


por el número de datos.
n
xi f i
x=∑ ❑
i=1 n

x=105,338 ∎
b. Para el cálculo de la varianza, se usa la siguiente formula:
n
( x ¿¿ i−x )2 f i
S2 = ∑ ❑ ¿
i =1 n−1

Utilizando la marca de clase anteriormente calculada, se resta con la media


aritmética ( x=105,338 ).
Intervalo fi xi x i−x

26,64 – 48,3 16 37,47 -67,868


48,3 – 69,96 8 59,13 -46,208
69,96 – 91,62 5 80,79 -24,548
91,62 – 113,28 18 102,45 -2,888
113,28 – 134,94 19 124,11 18,77
134,94 – 156,6 12 145,77 40,432
156,6 – 178,26 10 167,43 62,092
178,26 – 199,92 2 164,09 83,752
Figura 4. Diferencia entre la marca de clase y la media aritmética

Este último valor se eleva al cuadrado y se multiplica por la frecuencia.


-85,544 2
(x ¿¿ i−x) f i ¿

-63,884 73697,0468
-42,224 17081,4341
-20,564 3013,021
1,096 150,12
22,756 6695,37
44,416 19616,96
41,076 38554,1646
-85,544 14028,795

Por último, estos valores se suman y se dividen entre n−1=89


2
S =1941,99 ∎
S= √1941,99=44,068 ∎
4. Gráficas de histograma, polígono de frecuencia y ojiva para los datos agrupados.

a. Histograma.
b. Polígono de frecuencia.

c. Ojiva.
5. Cálculo de los percentiles 23%, 38% y 78% con datos no agrupados y agrupados.
a. Para datos no agrupados se tiene que:
k =23 %
w=k ∙ n
w=23 % ∙ 90
w=20.7
Se busca en los datos, en la posición 20 y 21, los cuales son:
Posici ó n 20=61,95
Posici ó n 21=66,58
Se utiliza la misma fórmula para calcular los cuartiles, entonces:
P1=x n + ( x n+1− xn )∗0.7

Entonces:
P1=61,95+ ( 66,58−61,95 )∗0.7

P1=65,191

Para el segundo percentil no agrupado, nuevamente se escoge un valor:


k =38 %
Y se usa la siguiente tabla para el cálculo del percentil:
w=k ∙ n
w=38 % ∙ 90
w=34.2
Se busca en los datos, en la posición 34 y 35, los cuales son:
Posici ó n 34=96,88
Po s ici ó n 35=97,61
Entonces:
P1=96,88+ ( 97,61−96,88 )∗0.2

P2=97,026

Para el tercer percentil no agrupado, nuevamente se escoge un valor:


k =78 %
Y se usa la siguiente fórmula para el cálculo del percentil:
w=k ∙ n
w=78 % ∙ 90
w=70,2
Se busca en los datos, en la posición 70 y 71, los cuales son:
Posici ó n 70=142,94
Posici ó n 71=143,1
Entonces:
P1=142,94+ ( 143,1−142,94 )∗0.2

P3=142,972

b. Para datos agrupados se tiene que:


k =23 %
Y se usa la siguiente fórmula a para el cálculo del percentil:
w=k ∙ n
w=23 % ∙ 90
w=20.7
Se usa la misma fórmula para el cálculo de cuartiles agrupados:
w−F i−1
P j=Li+ ∙a
fi

Entonces:
20,7−16
P1=48,3+ ∙21.66
8
P1=61,025

Para el segundo percentil de datos agrupados, nuevamente se escoge un valor:


k =38 %
Primero:
w=k ∙ n
w=38 % ∙ 90
w=34,2

Entonces:
34,2−29
P2=91,62+ ∙21,66
18
P2=97,877

Para el tercer percentil de datos agrupados, nuevamente se escoge un valor:


k =78 %
Primero:
w=k ∙ n
w=78 % ∙ 90
w=70.2
Entonces:
70,2−66
P3=134,94 + ∙ 21,66
12
P3=142,521

6. Calcular cuatro intervalos de confianza


a. Para los datos desagrupados se tiene que:
μ=105,12
2
σ =1985,255
n=90
Entonces, se supone un valor de confianza, en este caso, 95%, se calcula de la
siguiente manera:
0,95=1−α ⟹ α =0.05
Z 0.05
=Z 0.025=−1.96
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
√ σ
n
Entonces:
105,12 ±(−1.96)∙
√ 1985,255
90
[95,914 , 114,325]

Ahora para un segundo cálculo, se supone un valor de confianza, en este caso,


87%, se calcula de la siguiente manera:
0,87=1−α ⟹ α=0.13
Z 0.13
=Z 0.065=−1.51
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
√ σ
n
Entonces:
105,12 ±(−1.51) ∙
√ 1985,255
90

[98,028 ,112,211]
b. Para los datos agrupados se tiene que:
μ=105,338
2
σ =1941,99
n=90
Entonces, se supone un valor de confianza, en este caso, 50%, se calcula de la
siguiente manera:
0,50=1−α ⟹ α =0.50
Z 0.50
=Z 0.25=−0.67
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:
μ±Z∙
σ
n√
Entonces:
105,338 ±(−0.67)∙
√ 1941,99
90
[102,225,108,450]

Ahora para un segundo cálculo, se supone un valor de confianza, en este caso,


85%, se calcula de la siguiente manera:
0,85=1−α ⟹ α =0.15
Z 0.13
=Z 0.075=−1.44
2
Sabiendo este valor, se calcula el intervalo de confianza con la siguiente
fórmula:

μ±Z∙
σ
n √
Entonces:
105,338 ±(−1.44)∙
√ 1941,99
90

[98,649 ,112,02]

7. Calcular la recta de mínimos cuadrados y coeficiente de correlación de los datos.


Se construye a la recta de mínimos cuadrados teniendo en cuenta los siguientes
parámetros:
a. Recta de mínimos cuadrados.
X =Cantidad de datos =90
Y =Valor de cada dato
Se usan las siguientes fórmulas:
❑ ❑ ❑
n ∙ ∑ ❑ x ∙ y −∑ ❑ x ∙ ∑ ❑ y
m= ❑ ❑ ❑

(∑❑ ❑ x )
❑ ❑ 2
n ∙ ∑ ❑ x 2−

❑ ❑ ❑ ❑
∑ ❑x 2
∑ ❑ y−∑ ❑ x ∙ ∑ ❑ x ∙ y
b= ❑ ❑ ❑ ❑

(∑❑ ❑ x)
❑ ❑ 2
n ∙ ∑ ❑ x 2−

En donde se tiene que:


n=90



❑ x=4095




❑ y =9461,54




2
❑ x =247065




❑ x ∙ y=444868,62

Reemplazando los valores, entonces:


m=0.2365
b=94,365

b. Para el coeficiente de correlación se tiene que:





❑(x−x )( y− y )
r=
√∑ √∑
❑ ❑
2 2
❑ ( x−x ) ❑ ( y− y )
❑ ❑

En donde se tiene que:





2
❑ ( x−x ) =60742,5




2
❑ ( y− y ) =1766687,747




❑( x−x)( y − y)=14368,55

Entonces:
r =0,138696
2
r =0,0192

También podría gustarte