Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERÍA
INGENIERÍA AMBIENTAL Y RECURSOS NATURALES
Asignatura:
ESTADISTICA GENERAL
Docente:
Ing. EDWAR ILASACA CAHUATA
Presentado por:
■ CCONISLLA CASTILLO Rony Jhoel
■ ESTRADA CRUZ, Arnold
■ HUAMAN OSCCO, Herlinda
1
DEDICATORIA
2
AGRADECIMIENTO
3
ÍNDICE
DEDICATORIA................................................................................................................................2
AGRADECIMIENTO.......................................................................................................................3
3. Para los siguientes datos diga si se trata de variables cuantitativas (discretas o continuas) o
cualitativas (Nominales u ordinales).............................................................................................8
5. ¿Cuál es la clasificación de las variables?, y de dos ejemplos para cada caso aplicados a su
carrera..........................................................................................................................................9
7.La siguiente tabla muestra las concentraciones de Calcio (mg/L) al analizar muestras de agua
tomadas en dos ciudades del Perú – 2023:................................................................................11
4
1. Defina o responda las siguientes interrogantes:
a) ¿Qué es estadística?
Estadística descriptiva
Estadística inferencial
5
Muestra: Es una colección de personas, animales u objetos obtenidos a parti de la
población, también podemos decir que muestra es una parte representativa de la
población, obtenida con la finalidad de tener información de algúna característica de
esta.
b) Parámetros y estadísticos.
En la práctica, rara vez se conocen los parámetros de una población completa, ya que
generalmente es imposible o poco práctico observar todos los elementos de una
población.
6
decisiones y realizar predicciones sobre una población utilizando la información
obtenida de una muestra.
Variables discretas: Las variables discretas son aquellas que pueden tomar un
conjunto finito o contablemente infinito de valores separados y distintos. Estos valores
suelen ser enteros y no pueden ser divididos en valores más pequeños.
variables continuas: Las variables continuas son aquellas que pueden tomar un valor
infinito en un intervalo continuo de números reales. Estos valores pueden ser medidos
con cualquier grado de precisión y pueden incluir decimales.
7
Variables Ordinales: Las variables ordinales son aquellas que representan categorías
que tienen un orden específico o jerarquía. A diferencia de las variables nominales, los
valores de una variable ordinal tienen un significado ordinal o relativo, lo que significa
que se pueden ordenar en función de algún criterio específico.
Aunque las variables ordinales pueden ser clasificadas y ordenadas, la distancia entre
las categorías puede no ser uniforme o conocida, lo que limita la aplicación de ciertas
técnicas estadísticas.
8
Tipo: Variable cualitativa ordinal. Las calificaciones tienen un orden
jerárquico, pero las diferencias entre ellas no son necesariamente iguales.
9
5. ¿Cuál es la clasificación de las variables?, y de dos ejemplos para cada caso
aplicados a su carrera.
Variables cualitativas o categóricas:
Variables discretas: Son aquellas que toman valores enteros y no pueden ser
subdivididas en valores más pequeños.
Variables continuas: Son aquellas que pueden tomar cualquier valor dentro
de un rango específico y pueden ser subdivididas en valores más pequeños.
10
6. La siguiente tabla muestra la generación de residuos sólidos municipales
(Toneladas).
Tabla 1: Residuos sólidos municipales por regiones (2014 – 2020)
Tonelada
40,000.00 40,000.00
20,000.00 20,000.00
0.00 0.00
2014 2015 2016 2017 2018 2019 2020
AÑO
11
(C)PORCENTAJE DE RESIDUOS POR
AÑO (APURIMAC) 2014
2015
2020 2014 2016
15% 12%
2017
2015
2019 14% 2018
15%
2016
2019
2018 14% 2020
16%
2017
14%
2016 57,616.58
50,997.50 AMAZONAS
2015 45,788.54 57,889.05
2014 50,967.31
52,410.66
0.00 20,000.00 40,000.00 60,000.00 80,000.00
T/AÑO
12
e) Un gráfico de barras apiladas por años.
AMAZONAS APURIMAC
Concentración Ciudad
A B
Calcio (mg/L)
[ 110 ; 120 > 3 1
[ 120 ; 130 > 5 3
[ 130 ; 140 > 14 7
[ 140 ; 150 > 32 27
[ 150 ; 160 > 24 42
[ 160 ; 170 > 7 5
a) Construya un polígono de frecuencias con hi%. (Ambas ciudades)
CIUDAD "A"
Concentració
n Calcio Xi fi fi Xi fi Xi2 Fi hi%
(mg/L)
13
CIUDAD "B"
Concentración
Xi fi fi Xi fi Xi2 Fi hi%
Calcio (mg/L)
12375
x=
85
x=145.588
k
x=∑ f i x i
i=1
n
12685
x=
85
14
x=149.235
total 85 250
[ ]
n
−F m−1
2
x m=Lm + Cm
fm
x m=150+
[ 42.5−22
32 ]
x 10
x m=146.406
15
CIUDAD "B"
Hallando la mediana ciudad “B”
Concentració
n Calcio fi Fi
(mg/L)
Fm - 1 = 38
[ 110 ; 120 > 1 1
TOTAL 85 219
Cm = 10
[ ]
n
n 85 −F m−1
i) =¿ = 42.5 ii) 2
2 2 x m=Lm + Cm
fm
x m=150+
[ 42.5−38
42
x 10
]
x m=151.071
Concentración
fi
Calcio (mg/L) fo-1=14
Lm = 140
[ 110 ; 120 > 3
total 85
ii) x 0=L0 +
[ D1
]C
D1 + D2 0
x 0=140+
[ 18
18+ 8]x 10
x 0=¿ 146.923
CIUDAD "B"
Concentración
fi
Calcio (mg/L)
D1 = 42-27 = 15 fo+1= 5
D2 = 42-5 = 37
ii) x 0=L0 + [ D1
D1 + D2 ]C0 x 0=150+
15
[
15+37
x 10
]
x 0=¿ 152.884
17
c) ¿Cuál de las ciudades tiene la concentración de Calcio más homogénea?
CIUDAD "A"
Concentración
fi Fi
Calcio (mg/L)
[ ]
n
−Fr −1
2
Pr =Lr + Cr
fr
i¿
85(25)
100
=21.25 ii) P25=130+ [
21.25−8
14
x 10
]
P25=139.464
CIUDAD "A"
[ ]
n
−Fr −1
2 [ 120 ; 130 > 5 8
Pr =Lr + Cr
fr
[ 130 ; 140 > 14 22
total 85 250
i¿
85(75)
100
=63.75 ii) P75=150+
63.75−54
24 [x 10
]
P75=154. 062
Reemplazando en la formula:
P 25+ P75−2 X m
A s=
P 75−P25
139.464+154. 062−2(146.406)
A s=
154.062−139.464
A s=0.048
TOTAL 85 219
Hallando percentil 25:
[ ]
n
−Fr −1
2
Pr =Lr + Cr
fr
i¿
85(25)
100
=21.25 ii) P25=140+ [
21.25−11
27
x 10
]
P25=143. 796
Concentración
fi Fi
Calcio (mg/L)
[ ]
n
−Fr −1
2 [ 110 ; 120 > 1 1
Pr =Lr + Cr
fr [ 120 ; 130 > 3 4
P75=150+
[
63.75−38
42 ]
x 10 TOTAL 85 219
P75=1 56.130
Reemplazando en la formula :
P 25+ P75−2 X m
A s=
P 75−P25
20
143.796+1 56.130−2(151.071)
A s=
1 56.130−143.796
A s=−0.179
85(90)
i¿ =76.5
100
ii) P90=150+ [
76.5−54
24
x 10
]
P90=1 59.375
CIUDAD "A"
ii) P10=150+ [
8 , 5−8
14 ]
x 10 [ 120 ; 130 > 5 8
k =0.251
21
Interpretación: k < 0.251, en este caso la distribución es leptocúrtica, la
amplitud del calcio es pequeña.
CIUDAD "B"
Hallar el coeficiente de curtosis (Ciudad “B”)
Concentración
fi Fi
Calcio (mg/L)
TOTAL 85 219
Reemplazando en la formula:
P75−P25
k=
2(P90−P10)
1 56.130−143. 796
k=
2(159.166−136.428)
k =0.271
22
f) Construir el diagrama de cajas (ciudad “A”) e interprete dicho gráfico
CIUDAD "A"
Hallando percentil 50:
Concentración
fi Fi
Calcio (mg/L)
85(50)
i¿ =42.5
100 [ 110 ; 120 > 3 3
ii) P50=150+ [
42, 5−22
32
x 10
] [ 120 ; 130 > 5 8
total 85 250
P50 =146.406
“A”
Concentración
Construir el diagrama de cajas (ciudad fi Fi
Calcio (mg/L)
“B”) e interprete dicho gráfico
[ 110 ; 120 > 1 1
TOTAL 85 219
85(50)
i¿ =42.5
100
iii) P50=150+[ 42, 5−38
42 ]
x 10
P50=151.071
P50 =151.071
“B”
24
8. Se tiene la siguiente tabla de frecuencias corresponde a la cantidad de residuos
sólidos generados por familia semanalmente en el año 2019.
Residuos fi
sólidos (kg)
[05; 08> 2
[08; 11> 5
[11; 14> 13
[14; 17> 9
[17; 20> 5
[20; 23> 6
TOTAL
(Hi%).
Residuos xi fi hi Fi Hi % Grados
sólidos(kg)
[05; 08> 6.5 2 0.050 2 0.050 5 18°
[08; 11> 9.5 5 0.125 7 0.175 12.5 45°
[11; 14> 12.5 13 0.325 20 0.500 32.5 117°
[14; 17> 15.5 9 0.225 29 0.725 22.5 81°
TOTAL 40 100%
25
Histograma de frecuencia (hi)
0.35
0.3
Frecuencia relativa
0.25
0.2
0.15
0.1
0.05
0
6.5 9.5 12.5 15.5 18.5 21.5
Cantidad de residuos (kg)
12
10
Frecuencia absoluta
0
6.5 9.5 12.5 15.5 18.5 21.5
Cantidad de residuos solidos (kg)
0.8
0.6
0.4
0.2
0
6.5 9.5 12.5 15.5 18.5 21.5
Cantidad de residuos solidos
26
b) Hallar la media, mediana y moda.
Residuos fi Xi Fi Xi Fi
sólidos(kg)
[05; 08> 2 6.5 13 2
[08; 11> 5 9.5 47.5 7
[11; 14> 13 12.5 162.5 20
[14; 17> 9 15.5 139.5 29
TOTAL 40 562.5
Hallando la media:
k
562.5
x=∑ f i x i → x= =14.06
i=1 40
n
Hallando la mediana:
[ ]
n
n 40 −Fm −1
i) = =20 ii) 2
2 2 X m=Lm + Cm
fm
X m=11+
[ 20−2
13 ]
3 X m=12.61
Hallando la moda:
ii) X ° =L° +
[ D1
C
D 1+ D 2 °] X ° =11+
[ ]
9
9+ 4
3 = 13.08
Interpretación: La cantidad de residuos sólidos generados semanalmente por familia del 2019
es de 13.08kg.
27
c) Hallar la varianza, desviación estándar y coeficiente de variación.
Residuos fi Xi Fi Xi Fi Xi 2
sólidos(kg)
[05; 08> 2 6.5 13 84.5
[08; 11> 5 9.5 47.5 451.25
[11; 14> 13 12.5 162.5 2031.25
[14; 17> 9 15.5 139.5 2162.25
k
x=∑ f i x i
i=1
n
562.5
x=
40
x=14.07
k
Remplazaando : S = ∑ f i x i−n x 2
2
i=1
n−1
2
S =8751.75−40¿ ¿
Hallando la desviación estándar: s= √ 21.37 S = 4.62
S 4.62
Hallando CV: CV ( x )= × 100 CV(x) = ×100 CV(x)=32,83%
x 14.07
28
d) Hallar el segundo coeficiente de asimetría y de curtosis.
Residuos fi Fi
sólidos(kg)
[05; 08> 2 2
[08; 11> 5 7
[11; 14> 13 20
[14; 17> 9 29
[17; 20> 5 34
[20; 23> 6 40
TOTAL 40
P 25+ P75−2 X m
A s=
P 75−P25
Hallando el P25
i)
40(25)
100
=10 ii) P25=11+ [ 10−2
13 ]
3=12.84
Hallando el P50
i)
40(50)
100
=20 ii) P50=11+ [ 20−2
13 ]
3=15.15
Hallando P75
i)
40(75)
100
=30 ii) P75=17+ [ 30−29
5 ]
3 =17.60
Remplazando en A s
12.84+17.60−2(15.15)
A s= = 0.029
17.60−12.84
Interpretación:
A s = 0,029, nos indica que la distribución ligeramente sesgada hacia la derecha, también que
hay una mayor dispersión a la derecha del centro de distribución de frecuencia.
Hallando curtosis:
P75−P25
k=
2(P90−P10)
Hallando P10
29
i)
40(10)
100
=4 ii) P10=08+ [ ]
4−2
5
3=9 , 20
Hallando P90
i)
40(90)
100
=36 ii) P90=20+ [ 36−34
6 ]3=21
Remplazando en k:
17.60−12 , 84
k= = 0.202
2(21−9 , 20)
Interpretación:
K= 0,202, nos indica que la distribución es leptocúrtica (alto apuntamiento), también nos indica
que hay una alta concentración de los datos alrededor del centro de distribución de frecuencia.
Pr =15 ϵ [11;14>
[ ]
n(r )
−Fr −1
100
Pr =Lr + Cr
fr
[ ]
40 r
−7 13
11+ 100 15 → 0,5r −7= (4)= 32%
3 =¿ 3
13
30