Está en la página 1de 18

UNIVERSIDAD TECNOLOGICA DEL PERÚ

Facultad de ingeniería

AVANCE DE TRABAJO DE ESTADÍSTICA INFERENCIAL

Curso:
Estadística Inferencial

Tema:

Análisis de los valores de ph del agua de proceso más


utilizados por la empresa ECOLAB S.A. en el periodo 2019-2020

Integrantes:

Profesora:

SILVA RUBIO. EDITH


I. Título del Trabajo aplicado:

Análisis de los valores de ph del agua de proceso para la fabricación de detergentes


más utilizados por la empresa ECOLAB S.A. en el periodo 2019-2020

II. Introducción:
Para lograr su papel limpiador. un detergente debe producir numerosos fenómenos. los
cuales dependen en general del tipo de sustrato. del tipo de sucio y de las condiciones.
Así se han diseñado fórmulas especificas capaces de actuar con eficiencia en casos
particulares. y fórmulas generales con resultados más o menos satisfactorios en la
mayoría de los casos.

En estas formulaciones entran un gran número de componentes cuyos papeles se


complementan unos a otros. en ese aspecto al ser el detergente una mezcla de varios
componentes no es factible el realizar la medición de la concentración de un detergente
por lo que su medición se realiza en base a la conductividad en el agua desionizada.
La empresa ECOLAB S.A. se encarga de la revisión y verificación del proceso de
desionización del agua potable en una planta de osmosis inversa. verificando que esta
cumpla la concentración de iones de hidrogeno (Ph) en cada muestra realizada.
La planta de osmosis inversa es la encargada de transformar al agua potable que llega
a nuestros hogares en agua desionizada mediante la eliminación de la sales ionizadas
del agua. para comprobar si el agua a alcanzado la condición de desionizada se le hace
un control de su valor de concentración de iones de hidrogeno (Ph). si el valor es
superior a 6 se arroja que la muestra esta desionizada. caso contrario se debe repetir el
proceso hasta alcanzar el valor adecuado. se quiere conocer la efectividad de la planta
en el año 2020 respecto al año 2019.
OBJETIVOS.
- Determinar cálculos estadísticos inferenciales mediante muestras aleatorias.
- Conocer si las muestras del año 2020 alcanzan un valor de Ph superior al de las
muestras del año 2019.
- Demostrar si la efectividad de la planta de tratamiento en el año 2020 a sido
superior a la efectividad del año 2019.
- Aplicar los conocimientos adquiridos en la asignatura de Estadística Inferencial

III. Modelo de encuesta:


En base a las mediciones realizadas en la planta se pudo obtener valores de muestras
para los años 2019 y 2020.
Para ello. se tomaron como variables lo siguientes valores:
VARIABLES DESCRIPCION DE VARIABLE

Cualitativa Nominal Conformidad de la muestra


Cuantitativa Continua Valores de Ph
IV. Características de la base de datos:

a. Población:

La población en este caso será la planta de tratamiento de osmosis


inversa.

b. Muestra

Se establecerá dos muestras para el estudio correspondiente.

Muestra 1: 2019
Se realizaron 78 tomas de datos en el año 2019 obteniendo para cada
una de ellas el valor de la concentración de iones de hidrogeno (Ph)

Muestra 2: 2020
Se realizaron 191 tomas de datos en el año 2020 obteniendo para cada
una de ellas el valor de la concentración de iones de hidrogeno (Ph)

c. Unidad de análisis

La unidad de análisis tanto para el año 2019 asi como para el año 2020
seria una toma de la muestra de concentración de iones de hidrogeno
(Ph)

d. Variables

Muestra de concentración de iones de hidrogeno (Ph)

e. Tipos de Variables

VARIABLES TIPO DE VARIABLE

Ph Cuantitativa continua
V. Elaboración de tabla de frecuencia para la población en estudio

VALORES
fi Fi hi Hi hi% Hi%
DE PH
5.2 1 5.2 0.0037 0.0037 0.37 0.37
5.3 1 6.2 0.0037 0.0074 0.37 0.74
5.4 3 9.2 0.0112 0.0186 1.12 1.86
5.5 1 10.2 0.0037 0.0223 0.37 2.23
5.6 10 20.2 0.0372 0.0595 3.72 5.95
5.7 12 32.2 0.0446 0.1041 4.46 10.41
5.8 27 59.2 0.1004 0.2045 10.04 20.45
5.9 26 85.2 0.0967 0.3011 9.67 30.11
6 31 116.2 0.1152 0.4164 11.52 41.64
6.1 30 146.2 0.1115 0.5279 11.15 52.79
6.2 25 171.2 0.0929 0.6208 9.29 62.08
6.3 22 193.2 0.0818 0.7026 8.18 70.26
6.4 10 203.2 0.0372 0.7398 3.72 73.98
6.5 23 226.2 0.0855 0.8253 8.55 82.53
6.6 16 242.2 0.0595 0.8848 5.95 88.48
6.7 10 252.2 0.0372 0.9219 3.72 92.19
6.8 5 257.2 0.0186 0.9405 1.86 94.05
6.9 10 267.2 0.0372 0.9777 3.72 97.77
7 3 270.2 0.0112 0.9888 1.12 98.88
7.2 2 272.2 0.0074 0.9963 0.74 99.63
7.4 1 273.2 0.0037 1.0000 0.37 100.00
269 3118.2 1 11.2639 100 1126.39

14.00

12.00 11.52
11.15
10.04
9.67
10.00 9.29
8.55
8.18
PORCENTAJE

8.00

5.95
6.00
4.46
3.72 3.72 3.72 3.72
4.00

1.86
2.00 1.12 1.12
0.74
0.37 0.37 0.37 0.37
0.00
5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7 7.2 7.4
VALORES DE PH MAS UTILIZADOS
VI. Medidas de tendencia central
Para la muestra del año 2019 se evalúan las siguientes medidas de tendencia central

MODA (Mo):
Se observa al dato con mayor frecuencia.
Mo= 5.8

Media (x̄ ):
Es el resultado de efectuar la suma de los valores de un conjunto y divido entre
la cantidad de estos.

(x̄)= 6.14

Mediana (Me):
Es el dato que se ubica exactamente en la mitad de un conjunto de datos. Según
la cantidad de datos en el conjunto. par e impar.

Ya que la cantidad de datos es 89. se usará la siguiente formula.

Me= 6.06

Para la muestra del año 2020 se evalúan las siguientes medidas de tendencia central

MODA (Mo):
Se observa al dato con mayor frecuencia.
Mo= 6.05

Media (x̄ ):
Es el resultado de efectuar la suma de los valores de un conjunto y divido entre
la cantidad de estos.

(x̄)= 6.18

Mediana (Me):
Es el dato que se ubica exactamente en la mitad de un conjunto de datos. Según
la cantidad de datos en el conjunto. par e impar.

Ya que la cantidad de datos es 89. se usará la siguiente formula.

Me= 6.16
VII. Medidas de dispersión:
Para la variable cuantitativa del año 2019 se calculó:
a. Varianza:

o Varianza muestral: 0.21

b. Desviación estándar

o Desviación estándar: 0.46

c. Coeficiente de variación

o Coef de variación: 7.54%

Para la variable cuantitativa del año 2020. se calculó:


d. Varianza:

o Varianza muestral: 0.11

e. Desviación estándar

o Desviación estándar: 0.33

f. Coeficiente de variación

o Coef de variación: 5.33%

VIII. Análisis inferencial:

INTERVALO DE CONFIANZA PARA LA MEDÍA DE UNA POBLACIÓN:


Para la medición del año 2019 ,se extrajo una muestra aleatoria de 78 muestras, para conocer
el valor de ph más utilizado En la empresa ECOLAB S.A. se obtuvo una media de 6.18 con
una desviación estándar muestral de 0.46. Se quiere calcular un intervalo de confianza del 95%
para la media de la población.
DATOS:
X=6.14 α =0.05
n=78 α/2=0.025
s=0.46
α=95%
Reemplazando los datos a la fórmula:

1.96𝑥0.46 1.96𝑥0.46
IC: 6.14 − ≤ 𝜇 ≤ 6.14 +
√78 √78

[6.0379 ≤ μ ≤6.2421]
INTERPRETACIÓN:
Con un nivel de confianza del 95% existe evidencia estadística para afirmar que la media
poblacional del valor de ph de agua de proceso está comprendida entre 6.0379 y 6.2421

INTERVALO DE CONFIANZA PARA LAS MEDIAS DE DOS POBLACIONES.


Se necesita determinar si hay diferencia entre el valor de ph medido en el año
2019 y 2020. Por lo cual, se sabe que las desviaciones muéstrales son 0.46 y 0.33
respectivamente. Para eso se usa dos muestras aleatorias de 78 y 191 y la media fue
6.14 y 6.18 respectivamente. Se requiere determinar un intervalo de confianza del
95% para determinar si la media de valores usados en el 2019 es mayor a la del 2020.

DATOS:
Ҳ=0.46 X=0.33
S1= 6.14 S2= 6.18 α =0.05
n1=78 n2=191 α/2=0.025
α= 95%
Z α/2= 1.96

Reemplazando los datos en la fórmula:

−1.48 ≤ 𝜇1 − 𝑢2 ≤ 1.73
PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN
Se sabe que promedio poblacional del ph de agua de proceso es de 6.5 se tomó 60
muestras , encontrando un valor promedio de 6.14 con una desviación de 0.46 ¿Se
puede inferir con un nivel de significancia de 5% que el gasto muestral es menor
que el gasto poblacional?

DATOS:
µ=6.5
x= 6.14
s=0.46
n=60
α=0.05

1) H0= µ≥ 6.5
H1= µ 6.5

2) α= 0.05

6.14−6.5
3) 𝑍 = 0.46 = −6.1016
√60

4) como Z cae en la zona de rechazo


5) se rechaza H0

PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES


Se necesita saber si elo valor del ph del agua de proceso de ( 78 muestras 2019 y 191
muestras 2020) son diferentes, para ello se obtuvo una media de 6.14 y 6.18 con una
desviación de 0.46 y 0.33 respectivamente. ¿ se podrá afirmar que μ1>μ2? Usar nivel
de significancia de 5%
DATOS:
X1=6.14 X2=6.18
S1=0.46 S2= 0.33
n1=78 n2=191

1) H0= µ1 ≤ µ2
H1=µ1>µ 2

2) α = 0.05
3)

(6.14−6.18)−(0)
4)𝑍 = 2 2
= −0.702
√0.46 +0.33
78 191

5)como Z cae en la zona de aceptación se acepta H0

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA POBLACIÓN

En una toma aleatoria de 60 muestras , el 56 % tiene ph de 6,1. Vamos a calcular el intervalo


de confianza para la proporción de la población de todas las tomas o, con un nivel de confianza
del 95 %.

DATOS:
p = 0.56
q = 0.44 (1 - α) = 95
α = 0.05
α/2 = 0.025
Z(0.25) = 1.96

0.56𝑥0.44 0.56𝑥0.44
: 0.56 − √ ≤ 𝜋 ≤ 0.56 + √
60 60

0.434 ≤ π ≤ 0.685
INTERVALO DE CONFIANZA PARA LAS PROPORCIONES DE DOS POBLACIONES

Ahora compararemos la proporción de los valores del 2019 y 2020 .Realizamos 2 muestras
aleatorias, cada una de 30 mediciones , si las muestras revelan que 16 valores son de 6.1 , y,
por otro lado, 5 de 6.8. ¿Se puede inferir que existe una diferencia significativa en los valores
del año 2019 y 2020, con un nivel de confianza del 95%?

DATOS:

p1 = 16/30 = 0.53
p2 = 5/30 = 0.17
n1 = 30
n2 = 30
q1 = 0.47
q2 = 0.83
(1 - α) = 0.95
α = 0.05 α/2 = 0.025
Z α/2 =∓ 1.96

IC (π1−π2 )= [ 0.136;0.583]

Prueba de hipótesis para las proporciones de dos poblaciones.


En base a los muestreos realizados en el año 2019 (78 muestras) y 2020 (191 muestras) se
encontraron que los valores de agua desionizado para ambos periodos fueron de 35 y 140
respectivamente, ahora teniendo en cuenta esos datos se desea saber con una significancia del
5% si hay diferencia en la eficiencia de la planta para ambos periodos.

Usaremos la siguiente formula

Formula de Intervalo de Confianza para dos poblaciones


Reemplazando los datos obtenemos

2019 2020
N 78 191
X 35 140

P1 0.45 Q1 0.55
P2 0.73 Q2 0.27

P 0.65 0.35

Paso 1 H0: P1=P2


H1: P1≠P2 si existe diferencia

Zcal -4.44
Luego de evaluar nuestro Zcal, vemos que cae en zona de rechazo por ende rechazamos nula y
decimos que si existe diferencia en la eficacia de la planta de tratamiento en los años 2019 y
2020.

Intervalo de confianza para la varianza de una población

Se desea calcular el intervalo de confianza para las tomas de los datos realizados en el año
2020, en base a las 191 muestras realizadas y la varianza muestral de 0.11 con un nivel de
confianza de 95%

Usaremos la siguiente formula


Formula de la varianza de una población

Reemplazando los datos obtenemos:

Reemplazando los datos obtenemos:


Varianza muestral: 0.11
Muestra: 191
Nivel de significancia: 0.05
α/2 0.025
1-α/2 0.975

calculamos el valor de chi cuadrado tabular

Chi cuadrado (1-α/2, n-1): 153.74


Chi cuadrado (α/2, n-1): 230.05

Reemplazando los datos obtenemos el intervalo de confianza

IC: 0.09 ≤ σ2 ≤ 0.14

Hay un 95% de confianza de que las variaciones de las mediciones en la toma de los datos en el
año 2020 caigan entre 0.09 y 0.14

Intervalo de confianza para la razón de dos varianzas poblacionales


Se desea calcular el intervalo de confianza para la razón de dos varianzas poblacionales de las
tomas de los datos realizados en los años 2019 y 2020, en base a las 78 y 191 muestras realizadas
respectivamente, teniendo ya los datos calculados de las varianzas muestrales de esos años, los
cuales son 0.21 y 0.11 respectivamente, así como un nivel de confianza de 95%.

Aplicaremos la siguiente formula

Formula de la varianza de dos poblaciones


Reemplazando los datos obtenemos:

Varianza muestral 1: 0.21


Varianza muestral 2: 0.11
n1: 78
n2: 191
Nivel de significancia: 0.05
α/2 0.025
1-α/2 0.975

calculamos el valor de fisher tabular

F α/2( 77,190): 1.43


F 1-α/2(190,77): 1.47

Reemplazando los datos obtenemos el intervalo de confianza


σ12
IC: 1.34 ≤ ≤ 2.81
σ22

Hay un 95% de confianza de que las variaciones de las mediciones en la toma de los datos en el
año 2020 caigan entre 1.34 y 2.81

Prueba de hipótesis para la varianza de una población.

Las tomas muestrales durante el año 2020 han sido de 191 de las cuales 140 son consideradas
como muestras desionizadas, y se obtiene una varianza muestral de 0.06, se realiza la prueba
de hipótesis con una confianza de 95% a fin de afirmar si disminuye la variabilidad de los datos
tomados en el año 2020, la variabilidad disminuye si la varianza es menor a 0.01

Aplicaremos la siguiente formula

Formula de la hipótesis de la varianza de una población


Reemplazando los datos obtenemos:

2020
n1 140
S2 0.06

Paso 1 H0: σ2>= 0.01


disminucion de
H1: σ2< 0.01
variabilidad

Xcal 816.00

Como nuestro estadístico de prueba es menor a nuestro valor calculado aceptamos la hipótesis
nula, por lo tanto, no hay una disminución de la variabilidad en la planta de tratamiento

Prueba de hipótesis para la razón de dos varianzas poblacionales.

Queremos evaluar si existe más variabilidad en las mediciones del 2020 respecto a las del 2019,
¿podemos concluir eso con los datos obtenidos y un nivel de significancia de 5%?

S12=0.21 S22=0.11

N1=78 n2=191

Aplicaremos la siguiente formula


Formula de la hipótesis de la varianza de una población

Reemplazando los datos obtenemos:

H0: σ12< σ22


H1: σ12> σ22

S1^2 S2^2
0.21 0.11

Fcal 1.91

F (α, v1, v2) = f (0.05, 77, 190) = 1.35

Como el valor calculado es mayor al teórico, rechazamos la hipótesis nula por lo que la
variación en los datos del 2020 es mayor a los del 2019.

Prueba de bondad de ajuste. (Para una distribución Binomial o Poisson).

El estudio nos indica la cantidad de valores de Ph obtenidos durante las mediciones en la plata
de osmosis en los años 2019 y 2020, analizaremos si siguen una distribución binomial

Ph frecuencia
5 81
6 182
7 6

Paso 1 hipotesis
H0: los valores de Ph siguen una distribucion binomial
H1: los valores de Ph no siguen una distribucion binomial

Paso 2 nivel de significacion

α=5%

Paso 3 estadistico de prueba

Clase (Xi) Oi Pi Ei Xc2


0 0 0.00 0.00 0.00
1 0 0.00 0.02 0.02
2 0 0.00 0.31 0.31
3 0 0.01 2.93 2.93
4 0 0.06 16.59 16.59
5 81 0.21 56.40 10.73
6 182 0.40 106.53 53.47
7 6 0.32 86.24 74.65
158.70
E(x)=np=7p calculamos la probabilidad para cada x

P(X=0) 0.00
405 P(X=1) 0.00
1092 P(X=2) 0.00
42 P(X=3) 0.01
5.72 0.82 P(X=4) 0.06
p= 0.85 P(X=5) 0.21
P(X=6) 0.40
P(X=7) 0.32

Evaluamos la región critica con un valor de significancia de 0.05

Con un nivel de significancia del 5 se ha encontrado evidencia estadística suficiente para


rechazar la Hipótesis Nula, las mediciones de Ph no siguen una Distribución Binomial.
Prueba de independencia

Queremos evaluar si el resultado del análisis de los valores de potencial hidrogeno y el año de
uso de la planta guardan una relación de independencia.
Planteamos:
H0: No existe relación entre el resultado del análisis y el año de evaluación de la muestra.
H1: Existe relación entre el resultado del análisis y el año de evaluación de la muestra.

RESULTADO DE AÑO
TOTAL
PRUEBA 2019 2020
CONFORME 35 124 159
NO CONFORME 39 77 116
TOTAL 74 201 275

74𝑥159 201𝑥159
𝐸1 = = 42.79 𝐸2 = = 116.21
275 275
74𝑥116 201𝑥116
𝐸3 = = 31.21 𝐸1 = = 84.79
275 275

(35−42.79)2 (124−116.21)2 (39−31.21)2 (77−84.79)2


𝑋𝐶2 = + + + = 4.59
42.79 116.21 31.21 84.79

Vemos que el grado de libertad para el caso seria de (2-1)(2-1) =1


A un nivel de significancia del 5%, Existe evidencia estadística para Rechazar Ho.
Existe relación entre el resultado del análisis y el año de evaluación de la muestra.

Conclusiones y recomendaciones:

- Podemos observar de el tratamiento de los datos que la eficiencia de la planta


vario respecto al año 2019

- Podemos observar que las mediciones en el año 2020 presentan mayor


variabilidad respecto al año anterior

- Para el análisis correcto de los datos, recomendamos realizar un análisis


estadístico de las muestras cada año, a fin de conocer los resultados anuales de
la eficiencia de la planta de tratamiento

También podría gustarte