Está en la página 1de 30

UNIVERSIDAD TECNOLÓGICA DE LOS ANDES

FACULTAD DE INGENIERÍA
INGENIERÍA AMBIENTAL Y RECURSOS NATURALES

Asignatura:
ESTADISTICA GENERAL
Docente:
Ing. EDWAR ILASACA CAHUATA

Presentado por:
■ CCONISLLA CASTILLO Rony Jhoel
■ ESTRADA CRUZ, Arnold
■ HUAMAN OSCCO, Herlinda

Abancay – Abancay- Apurímac


2024

1
DEDICATORIA

Este trabajo está dedicado


primordialmente a Dios que nos ha dado la vida
y fortaleza necesaria para culminar esta
monografía a nuestros padres a quienes le
debemos todo lo que tenemos, a nuestros
docentes quienes nos dan las herramientas
necesarias para desenvolvernos en nuestra
vida profesional y a todas las personas que
confiaron en nosotros, apoyándonos moral y
emocionalmente.

A nuestros hermanos (as) por estar


siempre presentes, acompañándonos y por el
apoyo moral que nos brindaron a lo largo de
esta etapa de nuestras vidas.

A todas las personas que nos han apoyado y


han hecho que el trabajo se realice con éxito en
especial a aquellos que nos abrieron las
puertas y compartieron sus conocimientos.

2
AGRADECIMIENTO

A la Universidad Tecnológica de los Andes por darnos la oportunidad de


realizar esta monografía, y brindarnos información académica para
realizarlo.
Agradecemos a la Ing. Edwar Ilasaca Cahuata por permitirnos realizar este
gran trabajo el cual fue un proceso de aprendizaje para todo el grupo.

3
ÍNDICE

DEDICATORIA................................................................................................................................2

AGRADECIMIENTO.......................................................................................................................3

1. Defina o responda las siguientes interrogantes:.......................................................................5

2. Explique las diferencias entre:..................................................................................................6

3. Para los siguientes datos diga si se trata de variables cuantitativas (discretas o continuas) o
cualitativas (Nominales u ordinales).............................................................................................8

4. De dos ejemplos de población y muestra aplicado a su carrera (que no estén en las


diapositivas).................................................................................................................................8

5. ¿Cuál es la clasificación de las variables?, y de dos ejemplos para cada caso aplicados a su
carrera..........................................................................................................................................9

6. La siguiente tabla muestra la generación de residuos sólidos municipales (Toneladas).........10

7.La siguiente tabla muestra las concentraciones de Calcio (mg/L) al analizar muestras de agua
tomadas en dos ciudades del Perú – 2023:................................................................................11

8. Se tiene la siguiente tabla de frecuencias corresponde a la cantidad de residuos sólidos


generados por familia semanalmente en el año 2019................................................................22

4
1. Defina o responda las siguientes interrogantes:
a) ¿Qué es estadística?

La estadística es una ciencia que nos proporciona un conjunto de métodos y


procedimientos que hacen posible recopilar, clasificar, describir y presentar los datos
de forma adecuada con la finalidad de tomar decisiones o predecir algo acerca de la
población con el menor grado de incertidumbre a partir de los datos extraídos de esta
esta definición nos permite clasificar en:

 Estadística descriptiva
 Estadística inferencial

Estadística descriptiva: Parte de la estadística que trata de la recopilación,


clasificación, interpretación y presentación de datos, mediante cuadros, valores o
gráficos, sin poder sacar conclusiones para un grupo mayor.

Estadística inferencial: Parte de la estadística que proporciona la teoría necesaria


para afirmar algo acerca de la población o tomar decisiones generales en base a
muestra representativa con el menor grado de incertidumbre. El propósito fundamental
de la inferencia estadística es el de reducir el nivel de incertidumbre en el proceso de
la toma de decisiones y predicciones.

b) ¿Cuándo se dice que la muestra es grande?

Cuando la muestra es igual o mayor a 30

c) ¿Cuándo se dice que la información es sesgada?

Cuando los datos obtenidos son aproximados a cero

d) A qué medida de tendencia central se le conoce como estimador resistente y


porqué.

2. Explique las diferencias entre:


a) Población y muestra.

Población: Estadísticamente hablando, se entiende por población al mayor conjunto


de individuos objetos o entidades que tienen una característica común, cuyo estudio
nos interesa, definidos en un espacio y tiempo específicos, donde cada uno de los
elementos de este conjunto de denominan unidades de análisis.

5
Muestra: Es una colección de personas, animales u objetos obtenidos a parti de la
población, también podemos decir que muestra es una parte representativa de la
población, obtenida con la finalidad de tener información de algúna característica de
esta.

b) Parámetros y estadísticos.

Parámetros: Los parámetros son medidas numéricas que describen características de


una población completa. Son constantes fijas y desconocidas que caracterizan a una
distribución de probabilidad o a una población.

Ejemplos de parámetros son la media poblacional, la desviación estándar poblacional,


la proporción poblacional, etc.

En la práctica, rara vez se conocen los parámetros de una población completa, ya que
generalmente es imposible o poco práctico observar todos los elementos de una
población.

Estadísticos: Los estadísticos son medidas numéricas que describen características


de una muestra extraída de una población. Son variables aleatorias que se calculan a
partir de los datos de una muestra y se utilizan para estimar los parámetros
poblacionales desconocidos.

Ejemplos de estadísticos son la media muestral, la desviación estándar muestral, la


proporción muestral, etc.

c) Estadística descriptiva y estadística inferencial.

Estadística descriptiva: La estadística descriptiva se centra en la descripción y


resumen de características importantes de un conjunto de datos. Su objetivo principal
es organizar, resumir y presentar los datos de manera informativa y comprensible.

Las técnicas comunes de estadística descriptiva incluyen el cálculo de medidas de


tendencia central (como la media, la mediana y la moda), medidas de dispersión
(como la varianza y la desviación estándar), así como la visualización de datos a
través de gráficos y tablas.

La estadística descriptiva proporciona una comprensión básica y general de los datos,


permitiendo identificar patrones, tendencias y características destacadas.

Estadística inferencial: La estadística inferencial se centra en realizar inferencias y


conclusiones sobre una población más amplia a partir de una muestra de datos
recopilada de esa población. Su objetivo principal es hacer estimaciones, tomar

6
decisiones y realizar predicciones sobre una población utilizando la información
obtenida de una muestra.

Las técnicas comunes de estadística inferencial incluyen la estimación de parámetros


poblacionales, las pruebas de hipótesis y la construcción de intervalos de confianza.
Utiliza la teoría de la probabilidad y el muestreo aleatorio para sacar conclusiones
sobre la población en general a partir de la muestra proporcionada.

d) Variables discretas y variables continuas.

Variables discretas: Las variables discretas son aquellas que pueden tomar un
conjunto finito o contablemente infinito de valores separados y distintos. Estos valores
suelen ser enteros y no pueden ser divididos en valores más pequeños.

Ejemplos comunes de variables discretas incluyen el número de hijos en una familia, el


número de estudiantes en una clase o el número de veces que ocurre un evento
determinado.

Las variables discretas se representan típicamente mediante histogramas o gráficos


de barras en análisis estadísticos.

variables continuas: Las variables continuas son aquellas que pueden tomar un valor
infinito en un intervalo continuo de números reales. Estos valores pueden ser medidos
con cualquier grado de precisión y pueden incluir decimales.

Ejemplos comunes de variables continuas incluyen la altura de una persona, el peso


de un objeto o la temperatura ambiental.

Las variables continuas se representan típicamente mediante histogramas de


densidad o curvas de distribución en análisis estadísticos.

e) Variables nominales y ordinales.

Variables nominales: Las variables nominales son aquellas que representan


categorías o clases que no tienen un orden inherente. Los valores de una variable
nominal son etiquetas o nombres que se asignan a diferentes grupos o categorías,
pero no existe un ordenamiento jerárquico entre ellas.

Ejemplos comunes de variables nominales son el género, la nacionalidad, el color


favorito o el tipo de vehículo.

En términos estadísticos, las variables nominales se utilizan principalmente para


clasificar o categorizar datos, pero no se pueden someter a operaciones matemáticas
como sumas, restas o promedios

7
Variables Ordinales: Las variables ordinales son aquellas que representan categorías
que tienen un orden específico o jerarquía. A diferencia de las variables nominales, los
valores de una variable ordinal tienen un significado ordinal o relativo, lo que significa
que se pueden ordenar en función de algún criterio específico.

Ejemplos comunes de variables ordinales son el nivel educativo (primaria, secundaria,


universitaria), la clasificación de productos (bajo, medio, alto) o la escala de
satisfacción (baja, media, alta).

Aunque las variables ordinales pueden ser clasificadas y ordenadas, la distancia entre
las categorías puede no ser uniforme o conocida, lo que limita la aplicación de ciertas
técnicas estadísticas.

3. Para los siguientes datos diga si se trata de variables cuantitativas (discretas o


continuas) o cualitativas (Nominales u ordinales)
a) Las edades de un grupo de personas.

 Tipo: Variable cuantitativa continua. Las edades pueden tomar cualquier


valor dentro de un rango continuo

b) La longitud de las piezas que fabrica una máquina.

 Tipo: Variable cuantitativa continua. La longitud de las piezas puede tomar


cualquier valor dentro de un rango continuo.

c) La antigüedad en el puesto de los empleados de una compañía.

 Tipo: Variable cuantitativa discreta. La antigüedad se cuenta en años o meses,


y estos valores son discretos.

d) La preferencia por partidos políticos entre ciudadanos.

 Tipo: Variable cualitativa nominal. Las preferencias políticas se clasifican en


diferentes categorías sin un orden específico.

e) El número de artículos defectuosos en un lote de producción.

 Tipo: Variable cuantitativa discreta. El número de artículos defectuosos es un


valor numérico y discreto.

f) Las calificaciones de un grupo de empleados que participaron en un curso de


capacitación y que se especifican como S (satisfactorio), B (bueno) y M (magnífico).

8
 Tipo: Variable cualitativa ordinal. Las calificaciones tienen un orden
jerárquico, pero las diferencias entre ellas no son necesariamente iguales.

g) Tipo de sangre de una persona.

 Tipo: Variable cualitativa nominal. Los tipos de sangre se clasifican en


diferentes categorías sin un orden específico.

4. De dos ejemplos de población y muestra aplicado a su carrera (que no estén en


las diapositivas).
a) Población: Todos los árboles en un bosque determinado.

En ingeniería ambiental, puede ser necesario estudiar la población


completa de árboles en un bosque para evaluar su salud, calcular la
biomasa total o determinar la diversidad de especies presentes.

Muestra: Un conjunto de árboles seleccionados aleatoriamente en el


bosque.

Para realizar un estudio detallado sobre la población de árboles, se


podría seleccionar una muestra representativa de árboles de diferentes
especies, edades y ubicaciones dentro del bosque. Esta muestra
permitiría realizar mediciones detalladas en un número manejable de
individuos, extrapolando los resultados a toda la población.

b) población: Todos los cuerpos de agua de un determinado río.

En ingeniería ambiental, podría ser de interés estudiar la calidad del


agua en todos los cuerpos de agua a lo largo de un río para evaluar su
salud ambiental y determinar la presencia de contaminantes.

Muestra: Una serie de puntos de muestreo estratégicamente ubicados


a lo largo del río.

Para realizar un monitoreo efectivo de la calidad del agua en el río, se


podría seleccionar una muestra de puntos de muestreo distribuidos a lo
largo de su curso. Estos puntos de muestreo podrían estar ubicados en
diferentes tramos del río, desde su nacimiento hasta su
desembocadura, y permitirían recopilar datos representativos sobre la
calidad del agua en toda el área de estudio.

9
5. ¿Cuál es la clasificación de las variables?, y de dos ejemplos para cada caso
aplicados a su carrera.
Variables cualitativas o categóricas:

 Variables nominales: Son aquellas que representan una cualidad o


característica sin un orden específico.

Ejemplos en ingeniería ambiental:

1. Tipo de hábitat: bosque, río, humedal, desierto.


2. Estado de conservación: excelente, bueno, regular, malo.

 Variables ordinales: Son aquellas que representan una cualidad o


característica con un orden específico.

Ejemplos en ingeniería ambiental

1. Grado de contaminación: bajo, medio, alto.


2. Nivel de erosión del suelo: leve, moderado, severo.

Variables cuantitativas o numéricas:

 Variables discretas: Son aquellas que toman valores enteros y no pueden ser
subdivididas en valores más pequeños.

Ejemplos en ingeniería ambiental:


1. Número de especies de árboles en un bosque.
2. Cantidad de lluvia caída en milímetros durante un período de tiempo.

 Variables continuas: Son aquellas que pueden tomar cualquier valor dentro
de un rango específico y pueden ser subdivididas en valores más pequeños.

Ejemplos en ingeniería ambiental:


1. Temperatura del agua en un lago.
2. Concentración de contaminantes en partes por millón (ppm) en una
muestra de suelo.

10
6. La siguiente tabla muestra la generación de residuos sólidos municipales
(Toneladas).
Tabla 1: Residuos sólidos municipales por regiones (2014 – 2020)

AÑOS AMAZONAS APURIMAC


2014 52,410.66 50,967.31
2015 45,788.54 57,889.05
2016 50,997.5 57,616.58
2017 51,433.35 57,703.76
2018 54,454.82 66,827.02
2019 67,229.72 61,342.17
2020 56,528.41 59,891.18

Fuente: Ministerio del ambiente

Construir e interpretar los siguientes gráficos:

a) Construir un gráfico de líneas.

(A) RESIDUOS MUNICIPALES AMAZONAS-APURIMAC


(2014 - 2020)
80,000.00 80,000.00
60,000.00 60,000.00
Tonelada

Tonelada
40,000.00 40,000.00
20,000.00 20,000.00
0.00 0.00
2014 2015 2016 2017 2018 2019 2020
AÑO

AMAZONAS APURIMAC Linear (APURIMAC)

b) Un gráfico de sectores circulares por regiones

11
(C)PORCENTAJE DE RESIDUOS POR
AÑO (APURIMAC) 2014
2015
2020 2014 2016
15% 12%
2017
2015
2019 14% 2018
15%
2016
2019
2018 14% 2020
16%
2017
14%

(C)PORcENTAJE DE RESIDUOS POR


AÑO (AMAZONAS) 2014
2015
2020 2014
15% 14% 2016
2017
2015
2019
18%
12% 2018
2016
2019
13%
2020
2018
14% 2017
14%

c) Un gráfico de barras agrupadas por regiones

RESIDUOS MUNICIPALES AMAZONAS-APURIMAC (2014


- 2020)
2020 59,891.18
56,528.41
2019 61,342.17
67,229.72
2018 54,454.82 66,827.02 APURIMAC
2017 57,703.76
51,433.35
AÑO

2016 57,616.58
50,997.50 AMAZONAS
2015 45,788.54 57,889.05
2014 50,967.31
52,410.66
0.00 20,000.00 40,000.00 60,000.00 80,000.00
T/AÑO

12
e) Un gráfico de barras apiladas por años.

RESIDUOS MUNICIPALES AMAZONAS-APURIMAC (2014


- 2020)
2020 56,528.41 59,891.18
67,229.72 61,342.17
2018 54,454.82 66,827.02
51,433.35 57,703.76
AÑO

2016 50,997.50 57,616.58


45,788.54 57,889.05
2014 52,410.66 50,967.31
0.00 20,000.00 40,000.00 60,000.00 80,000.00 100,000.00120,000.00140,000.00
Tonelada

AMAZONAS APURIMAC

7.La siguiente tabla muestra las concentraciones de Calcio (mg/L) al analizar


muestras de agua tomadas en dos ciudades del Perú – 2023:

Concentración Ciudad
A B
Calcio (mg/L)
[ 110 ; 120 > 3 1
[ 120 ; 130 > 5 3
[ 130 ; 140 > 14 7
[ 140 ; 150 > 32 27
[ 150 ; 160 > 24 42
[ 160 ; 170 > 7 5
a) Construya un polígono de frecuencias con hi%. (Ambas ciudades)
CIUDAD "A"

Concentració
n Calcio Xi fi fi Xi fi Xi2 Fi hi%
(mg/L)

[ 110 ; 120 > 115 3 345 39675 3 0.03529412

[ 120 ; 130 > 125 5 625 78125 8 0.09411765

[ 130 ; 140 > 135 14 1890 255150 22 0.25882353

[ 140 ; 150 > 145 32 4640 672800 54 0.63529412

[ 150 ; 160 > 155 24 3720 576600 78 0.91764706

[ 160 ; 170 > 165 7 1155 190575 85 1

total 840 85 1237 181292 25 2.94117647


5 5 0

13
CIUDAD "B"

Concentración
Xi fi fi Xi fi Xi2 Fi hi%
Calcio (mg/L)

[ 110 ; 120 > 115 1 115 13225 1 0.01176471

[ 120 ; 130 > 125 3 375 46875 4 0.04705882

[ 130 ; 140 > 135 7 945 127575 11 0.12941176

[ 140 ; 150 > 145 27 3915 567675 38 0.44705882

[ 150 ; 160 > 155 42 6510 1009050 80 0.94117647

[ 160 ; 170 > 165 5 825 136125 85 1

TOTAL 840 85 12685 1900525 219 2.57647059


b) Halla
r la media, mediana y moda (Ambas ciudades)

 Hallar la media ciudad “A”


k
x=∑ f i x i
i=1
n

12375
x=
85

x=145.588

Interpretación: la concentración de calcio media es de 145.588 mg/L en la


ciudad “A”.

 Hallar la media ciudad “B”

k
x=∑ f i x i
i=1
n

12685
x=
85

14
x=149.235

Interpretación: la concentración de calcio media es de 149.235mg/L en la


ciudad “A”.

 Hallando la mediana ciudad “A”

Lm = 140 CIUDAD "A"


Fm - 1 = 22
Concentración
fi Fi
Calcio (mg/L) Contiene xm
[ 110 ; 120 > 3 3
Cm = 10
[ 120 ; 130 > 5 8

[ 130 ; 140 > 14 22

n 85 [ 140 ; 150 > 32 54


i) =¿ = 42.5 ii)
2 2 [ 150 ; 160 > 24 78

[ 160 ; 170 > 7 85

total 85 250

[ ]
n
−F m−1
2
x m=Lm + Cm
fm

x m=150+
[ 42.5−22
32 ]
x 10

x m=146.406

15
CIUDAD "B"
 Hallando la mediana ciudad “B”
Concentració
n Calcio fi Fi
(mg/L)
Fm - 1 = 38
[ 110 ; 120 > 1 1

[ 120 ; 130 > 3 4

[ 130 ; 140 > 7 11

[ 140 ; 150 > 27 38


Lm =
[ 150 ; 160 > 42 80 Contiene xm
150
[ 160 ; 170 > 5 85

TOTAL 85 219
Cm = 10

[ ]
n
n 85 −F m−1
i) =¿ = 42.5 ii) 2
2 2 x m=Lm + Cm
fm

x m=150+
[ 42.5−38
42
x 10
]
x m=151.071

 Hallando la Moda ciudad “A”


CIUDAD "A"

Concentración
fi
Calcio (mg/L) fo-1=14
Lm = 140
[ 110 ; 120 > 3

[ 120 ; 130 > 5 Contiene x0


i) [ 130 ; 140 > 14
Determinar la clase
fo+1=
modal (clase con
D
242 = 32-24 = 8
más [ 140 ; 150 > 32 alta frecuencia)
D1 = 32-14 = 18
[ 150 ; 160 > 24
16
[ 160 ; 170 > 7

total 85
ii) x 0=L0 +
[ D1
]C
D1 + D2 0
x 0=140+
[ 18
18+ 8]x 10

x 0=¿ 146.923

Interpretación: la precipitación de calcio fue de 146.923mg/L

CIUDAD "B"

Concentración
fi
Calcio (mg/L)

[ 110 ; 120 > 1

[ 120 ; 130 > 3

[ 130 ; 140 > 7


 [ 140 ; 150 > 27 Hallando la Moda ciudad “B”

[ 150 ; 160 > 42

[ 160 ; 170 > 5


fo-1=27
Lm = 150 TOTAL 85
Contiene x0

D1 = 42-27 = 15 fo+1= 5
D2 = 42-5 = 37

i)Determinar la clase modal (clase con más alta frecuencia)

ii) x 0=L0 + [ D1
D1 + D2 ]C0 x 0=150+
15
[
15+37
x 10
]
x 0=¿ 152.884

Interpretación: mientras que la precipitación de calcio fue de 152.884mg/L

17
c) ¿Cuál de las ciudades tiene la concentración de Calcio más homogénea?

CIUDAD "A"

Concentración
fi Fi
Calcio (mg/L)

[ 110 ; 120 > 3 3


d) Hallar el segundo coeficiente de
[ 120 ; 130 > 5 8
Pearson (ciudad “A”)
[ 130 ; 140 > 14 22

[ 140 ; 150 > 32 54


P 25+ P75−2 X m [ 150 ; 160 > 24 78
A s=
P 75−P25
[ 160 ; 170 > 7 85

 Hallando percentil 25: total 85 250

[ ]
n
−Fr −1
2
Pr =Lr + Cr
fr

i¿
85(25)
100
=21.25 ii) P25=130+ [
21.25−8
14
x 10
]
P25=139.464

CIUDAD "A"

 Hallando percentil 75: Concentración


fi Fi
Calcio (mg/L)

[ 110 ; 120 > 3 3

[ ]
n
−Fr −1
2 [ 120 ; 130 > 5 8
Pr =Lr + Cr
fr
[ 130 ; 140 > 14 22

[ 140 ; 150 > 32 54

[ 150 ; 160 > 24 78


18
[ 160 ; 170 > 7 85

total 85 250
i¿
85(75)
100
=63.75 ii) P75=150+
63.75−54
24 [x 10
]
P75=154. 062

Reemplazando en la formula:

P 25+ P75−2 X m
A s=
P 75−P25

139.464+154. 062−2(146.406)
A s=
154.062−139.464

A s=0.048

Interpretación: A s> 0.048, quiere decir que la distribución es segada hacia la


derecha, lo que hace que haya mayor dispersión.

Hallar el segundo coeficiente de CIUDAD "B"


Pearson (ciudad “B”)
Concentración
fi Fi
Calcio (mg/L)
P 25+ P75−2 X m
A s= [ 110 ; 120 > 1 1
P 75−P25
[ 120 ; 130 > 3 4

[ 130 ; 140 > 7 11

[ 140 ; 150 > 27 38

[ 150 ; 160 > 42 80


19
[ 160 ; 170 > 5 85

TOTAL 85 219
 Hallando percentil 25:

[ ]
n
−Fr −1
2
Pr =Lr + Cr
fr

i¿
85(25)
100
=21.25 ii) P25=140+ [
21.25−11
27
x 10
]
P25=143. 796

 Hallando percentil 75:


CIUDAD "B"

Concentración
fi Fi
Calcio (mg/L)

[ ]
n
−Fr −1
2 [ 110 ; 120 > 1 1
Pr =Lr + Cr
fr [ 120 ; 130 > 3 4

[ 130 ; 140 > 7 11

[ 140 ; 150 > 27 38

[ 150 ; 160 > 42 80


85(75)
i¿ =63.75 ii)
100 [ 160 ; 170 > 5 85

P75=150+
[
63.75−38
42 ]
x 10 TOTAL 85 219

P75=1 56.130

Reemplazando en la formula :
P 25+ P75−2 X m
A s=
P 75−P25

20
143.796+1 56.130−2(151.071)
A s=
1 56.130−143.796

A s=−0.179

Interpretación: A s ←0.179, quiere decir que la distribución es segada hacia la


izquierda, lo que hace que haya mayor dispersión.

e) Hallar el coeficiente de curtosis (Ciudad “A”)

 Hallando percentil 90:

85(90)
i¿ =76.5
100
ii) P90=150+ [
76.5−54
24
x 10
]
P90=1 59.375

CIUDAD "A"

 Hallando percentil 10: Concentración


fi Fi
Calcio (mg/L)
85(10)
i¿ =8.5
100 [ 110 ; 120 > 3 3

ii) P10=150+ [
8 , 5−8
14 ]
x 10 [ 120 ; 130 > 5 8

P10=130.357 [ 130 ; 140 > 14 22

[ 140 ; 150 > 32 54


Reemplazando en la formula:
[ 150 ; 160 > 24 78
P75−P25 [ 160 ; 170 > 7 85
k=
2(P90−P10)
total 85 250
154. 062−139.464
k=
2(159.375−130.357)

k =0.251

21
Interpretación: k < 0.251, en este caso la distribución es leptocúrtica, la
amplitud del calcio es pequeña.

CIUDAD "B"
Hallar el coeficiente de curtosis (Ciudad “B”)
Concentración
fi Fi
Calcio (mg/L)

[ 110 ; 120 > 1 1


 Hallando percentil 90:
85(90) [ 120 ; 130 > 3 4
i¿ =76.5
100
[ 130 ; 140 > 7 11
ii) P90=150+ [
76.5−38
42
x 10
] [ 140 ; 150 > 27 38

[ 150 ; 160 > 42 80


P90=159.166
[ 160 ; 170 > 5 85

TOTAL 85 219

 Hallando percentil 10:


85(10)
i¿ =8.5
100
ii) P10=130+ [
8 , 5−4
7 ]
x 10 P10=136.428

Reemplazando en la formula:

P75−P25
k=
2(P90−P10)

1 56.130−143. 796
k=
2(159.166−136.428)

k =0.271

Interpretación: k > 0.271, En este caso la distribución es Platicurtica, la amplitud


de calcio y la dispersión de datos es mayor que el caso anterior.

22
f) Construir el diagrama de cajas (ciudad “A”) e interprete dicho gráfico

CIUDAD "A"
 Hallando percentil 50:
Concentración
fi Fi
Calcio (mg/L)
85(50)
i¿ =42.5
100 [ 110 ; 120 > 3 3

ii) P50=150+ [
42, 5−22
32
x 10
] [ 120 ; 130 > 5 8

P50=146.406 [ 130 ; 140 > 14 22

[ 140 ; 150 > 32 54

[ 150 ; 160 > 24 78

[ 160 ; 170 > 7 85

total 85 250

P50 =146.406

“A”

P25 =139.464 P75 =154.062

100 120 130 140 150 160

BANCO “A” : P25 =139.464 ; P50 =151.071; P75 CIUDAD "B"


=154.062

Concentración
Construir el diagrama de cajas (ciudad fi Fi
Calcio (mg/L)
“B”) e interprete dicho gráfico
[ 110 ; 120 > 1 1

[ 120 ; 130 > 3 4


 Hallando percentil 50:
[ 130 ; 140 > 7 11

[ 140 ; 150 > 27 38

[ 150 ; 160 > 42 80


23
[ 160 ; 170 > 5 85

TOTAL 85 219
85(50)
i¿ =42.5
100
iii) P50=150+[ 42, 5−38
42 ]
x 10

P50=151.071

P50 =151.071

“B”

P25 =143. 796 P75 =


1 56.130

100 120 130 140 150 160

BANCO “B” : P25 = 143. 796 ; P50 =151.071 ; P75 ¿ 1 56.130

g. ¿Cuántas muestras tienen una concentración de Calcio comprendida entre


135 a 155 mg/L (Ambas ciudades)

24
8. Se tiene la siguiente tabla de frecuencias corresponde a la cantidad de residuos
sólidos generados por familia semanalmente en el año 2019.

Residuos fi
sólidos (kg)

[05; 08> 2
[08; 11> 5
[11; 14> 13
[14; 17> 9
[17; 20> 5
[20; 23> 6

TOTAL

a) Construir un histograma de frecuencias (hi%), un polígono de frecuencias (fi) y la ojiva


menor que

(Hi%).

Residuos xi fi hi Fi Hi % Grados
sólidos(kg)
[05; 08> 6.5 2 0.050 2 0.050 5 18°
[08; 11> 9.5 5 0.125 7 0.175 12.5 45°
[11; 14> 12.5 13 0.325 20 0.500 32.5 117°
[14; 17> 15.5 9 0.225 29 0.725 22.5 81°

[17; 20> 18.5 5 0.125 34 0.850 12.5 45°

[20; 23> 21.5 6 0.150 40 1 15 54°

TOTAL 40 100%

25
Histograma de frecuencia (hi)
0.35
0.3
Frecuencia relativa

0.25
0.2
0.15
0.1
0.05
0
6.5 9.5 12.5 15.5 18.5 21.5
Cantidad de residuos (kg)

Poligono de frecuencia (fi)


14

12

10
Frecuencia absoluta

0
6.5 9.5 12.5 15.5 18.5 21.5
Cantidad de residuos solidos (kg)

Ojiva menor que (Hi%)


1.2
Frecuencia relativa acomulada

0.8

0.6

0.4

0.2

0
6.5 9.5 12.5 15.5 18.5 21.5
Cantidad de residuos solidos

26
b) Hallar la media, mediana y moda.

Residuos fi Xi Fi Xi Fi
sólidos(kg)
[05; 08> 2 6.5 13 2
[08; 11> 5 9.5 47.5 7
[11; 14> 13 12.5 162.5 20
[14; 17> 9 15.5 139.5 29

[17; 20> 5 18.5 92.5 34

[20; 23> 6 21.5 107.5 40

TOTAL 40 562.5

Hallando la media:
k
562.5
x=∑ f i x i → x= =14.06
i=1 40
n

Interpretación: La cantidad media de residuos sólidos generados por familia semanalmente es


de 14.06 kg.

Hallando la mediana:

[ ]
n
n 40 −Fm −1
i) = =20 ii) 2
2 2 X m=Lm + Cm
fm

X m=11+
[ 20−2
13 ]
3 X m=12.61

Interpretación: El 40% de la cantidad de los residuos sólidos generados por familia


semanalmente es menor a 12.61 kg y el 60% de la cantidad de residuos sólidos es mayor a
12.61 kg.

Hallando la moda:

i) Determinado la clase modal (clase con más alta frecuencia)

ii) X ° =L° +
[ D1
C
D 1+ D 2 °] X ° =11+
[ ]
9
9+ 4
3 = 13.08

Interpretación: La cantidad de residuos sólidos generados semanalmente por familia del 2019
es de 13.08kg.

27
c) Hallar la varianza, desviación estándar y coeficiente de variación.

Residuos fi Xi Fi Xi Fi Xi 2
sólidos(kg)
[05; 08> 2 6.5 13 84.5
[08; 11> 5 9.5 47.5 451.25
[11; 14> 13 12.5 162.5 2031.25
[14; 17> 9 15.5 139.5 2162.25

[17; 20> 5 18.5 92.5 1711.25

[20; 23> 6 21.5 107.5 2311.25

TOTAL 40 562.5 8751.75

k
x=∑ f i x i
i=1
n

562.5
x=
40

x=14.07

k
Remplazaando : S = ∑ f i x i−n x 2
2

i=1
n−1

2
S =8751.75−40¿ ¿
Hallando la desviación estándar: s= √ 21.37 S = 4.62

S 4.62
Hallando CV: CV ( x )= × 100 CV(x) = ×100 CV(x)=32,83%
x 14.07

28
d) Hallar el segundo coeficiente de asimetría y de curtosis.

Residuos fi Fi
sólidos(kg)
[05; 08> 2 2
[08; 11> 5 7
[11; 14> 13 20
[14; 17> 9 29

[17; 20> 5 34

[20; 23> 6 40

TOTAL 40

P 25+ P75−2 X m
A s=
P 75−P25

Hallando el P25

i)
40(25)
100
=10 ii) P25=11+ [ 10−2
13 ]
3=12.84

Hallando el P50

i)
40(50)
100
=20 ii) P50=11+ [ 20−2
13 ]
3=15.15

Hallando P75

i)
40(75)
100
=30 ii) P75=17+ [ 30−29
5 ]
3 =17.60

Remplazando en A s

12.84+17.60−2(15.15)
A s= = 0.029
17.60−12.84
Interpretación:

A s = 0,029, nos indica que la distribución ligeramente sesgada hacia la derecha, también que
hay una mayor dispersión a la derecha del centro de distribución de frecuencia.

Hallando curtosis:

P75−P25
k=
2(P90−P10)

Hallando P10

29
i)
40(10)
100
=4 ii) P10=08+ [ ]
4−2
5
3=9 , 20

Hallando P90

i)
40(90)
100
=36 ii) P90=20+ [ 36−34
6 ]3=21

Remplazando en k:

17.60−12 , 84
k= = 0.202
2(21−9 , 20)
Interpretación:

K= 0,202, nos indica que la distribución es leptocúrtica (alto apuntamiento), también nos indica
que hay una alta concentración de los datos alrededor del centro de distribución de frecuencia.

e) ¿Cuántas familias generan residuos sólidos mayores 15 kg?

Pr =15 ϵ [11;14>

[ ]
n(r )
−Fr −1
100
Pr =Lr + Cr
fr

[ ]
40 r
−7 13
11+ 100 15 → 0,5r −7= (4)= 32%
3 =¿ 3
13

Finalmente hay 32 familias que generan residuos sólidos mayores a 15 kg.

30

También podría gustarte