Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anlisis Estadstico Comparativo Entre Dos Marcas De Leche. Segn Estndares De Calidad
Integrantes: o Monica Prado Lince o Adan Zambrano len o Sulay Zambrano Vera
Tabla de Contenido
Resumen ........................................................................................................................................ 4 Objetivos ........................................................................................................................................ 5 Objetivo general........................................................................................................................ 5 Objetivos especficos ................................................................................................................ 5 Marco terico ................................................................................................................................ 5 Media de una Muestra ............................................................................................................. 5 Desviacin estndar ................................................................................................................. 6 Cuartiles o percentiles ............................................................................................................. 6 Coeficiente de Curtosis ............................................................................................................ 6 Valor P........................................................................................................................................ 7 Prueba de Anderson y Darling ............................................................................................... 8 Intervalos de confianza ............................................................................................................ 8 Diferencias de varianzas........................................................................................................ 10 Diferencias de medias ............................................................................................................ 11 Muestras Independientes ...................................................................................................... 12 Regresin Lineal ..................................................................................................................... 13 Descripcin de las variables...................................................................................................... 14 Densidad relativa: .................................................................................................................. 14 % Agua aadida: .................................................................................................................... 14 PH: ............................................................................................................................................ 14 Marca de la leche: ................................................................................................................... 14 2
Tratamiento estadstico de datos.............................................................................................. 15 Estadstica descriptiva ........................................................................................................... 15 Estadstica inferencial................................................................................................................ 17 Intervalos de confianza. ......................................................................................................... 25 Prueba de Hiptesis para la diferencia de Varianzas........................................................ 28 Diferencias de medias ............................................................................................................ 31 Regresin Lineal Simple ........................................................................................................ 33 Conclusiones ............................................................................................................................... 36 Anexos ......................................................................................................................................... 37 Bibliografa .................................................................................................................................. 43
Resumen
Desde la antigedad la leche animal ha sido por preferencia un alimento consumido de forma regular por parte del hombre, remontndose al momento en que nuestros antepasados dejaron de ser nmadas y comenzaron a cultivar la tierra para alimentar a los animales capturados que mantenan en su hogar. En el siglo XX, se realizaron importantes progresos en el mbito de la transformacin de la leche. Mdicos y especialistas en nutricin precisaron las condiciones que deba cumplir para responder exactamente a las necesidades del organismo humano. Y es que indudablemente la leche se puede considerar como el alimento mas completo que existe debido a su rica composicin en protenas, lactosa, enzimas, grasas, vitaminas, minerales y sales minerales. En la actualidad podemos encontrar en el mercado un extenso surtido de caractersticas, presentaciones, marcas y precios que establecen la diferencia ante las exigencias del consumidor. Siendo la calidad y la experiencia los principales parmetros con los que una empresa puede destacarse sobre las dems. El presente trabajo est orientado al estudio estadstico de parmetros de control para leche de 2 marcas conocidas en el mercado, como lo son Toni y La Lechera de Nestl (en presentaciones Tetra Pack de 250 cm3 cada una), para esto se van a tomar muestras de tamao n= 80 y se realizaran los clculos pertinentes para determinar cul de las marcas que participan en este estudio presenta mejores resultados con respecto a la otra. Entre las variables de estudio se encuentran la densidad, % de Agua aadida y PH, entre los clculos estadsticos se presentaran resultados de pruebas de bondad de ajuste para verificar normalidad, pruebas de diferencias de varianzas, pruebas de diferencias de medias y una regresin lineal simple para relacionar dos de estas variables. Adicional a los clculos estadsticos tambin se presentaran graficas como los diagramas de cajas e Histogramas de frecuencias as como tambin Intervalos de confianza entre otros.
Objetivos
Objetivo general Utilizar las herramientas adquiridas en el curso de mtodos estadsticos II en un caso aplicable en la industria alimenticia. Objetivos especficos Describir y analizar cada una de las variables cuantitativas mediante grficos en programas estadsticos como MINITAB. Estimar medidas de tendencia central como la media de la densidad relativa, % de agua aadida y el PH. Obtener intervalos de confianza para cada una de las variables cuantitativas. Identificar el tipo de distribucin para cada una de las variables. Determinar si las varianzas de cada uno de las variables son iguales Determinar si existe una diferencia significativa entre los parmetros de estudio entre marcas. Determinar un modelo de regresin lineal Simple entre la densidad y % de Agua aadido.
Marco terico
Media de una Muestra Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valores observados, dividido por el nmero total de observaciones.
Desviacin estndar
La desviacin estndar de una coleccin de datos se usa para describir la variabilidad en esa coleccin y se puede definir como la diferencia estndar entre los elementos de una coleccin de datos y su media. Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un conjunto), la ecuacin sera:
Cuartiles o percentiles Un percentil X, PX, es un valor de la distribucin muestral o poblacional de la variable que es mayor o igual que el X% de las observaciones de la variable P(Y PX) = X%. Existe un tipo especial de cuantiles llamados cuartiles. Los cuartiles son tres valores que dividen la distribucin en cuatro partes equivalentes porcentualmente. El primer cuartil es el valor que es mayor o igual que el 25% de las observaciones de la muestra y menor o igual que el 75%. El segundo cuartil es la mediana El tercer cuartil es mayor o igual que el 75% de las observaciones de la muestra y menor o igual que el 25%. Coeficiente de Curtosis El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin.
Se definen 3 tipos de distribuciones segn su grado de curtosis: Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.
Valor P Un p valor es la probabilidad de que la hiptesis nula (Ho) sea cierta. La anterior respuesta es, adems de pragmtica y utilitarista, falsa. Lo cierto es que, tcnicamente, la definicin de p valor es la siguiente: Un p valor es la probabilidad, calculada al asumir que Ho es cierta, de que la estadstica de prueba tome valore tan extremos o ms extremos que los calculados con la muestra actual. Ahora, dado que las estadsticas de prueba se construyen para cuantificar las desviaciones de la hiptesis nula con los datos actuales, entonces rechazamos Ho cuando el p valor es pequeo porque si ste es pequeo entonces los datos actuales proveen una fuerte evidencia en contra de Ho. En otras palabras, el hecho de que el p valor sea grande hace 7
que Ho sea difcil de rechazar; por tanto es casi intuitivo, pero no valido, tomar al p valor como una medida de soporte en contra (o a favor) del rechazo de Ho.
Prueba de Anderson y Darling La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribucin especifica. Esta prueba es una modificacin de la prueba de KolmogorovSmirnov donde se le da ms peso a las colas de la distribucin que la prueba de Kolmogorov-Smirnov . En estadstica, la prueba de Anderson-Darling es una prueba no paramtrica sobre si los datos de una muestra provienen de una distribucin especfica. La frmula para el estadstico determina si los datos (observar que los datos se deben ordenar) vienen de una distribucin con funcin acumulativa F. Formulas: A2= N S Donde:
Intervalos de confianza De una poblacin de media y desviacin tpica se pueden tomar muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin:
.
8
En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el uso de las tablas en una distribucin normal). Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamar{ 1 (debido a que es el error que se cometer, un trmino opuesto). Para ello se necesita calcular el punto X / 2 o, mejor dicho, su versin estandarizada Z / 2 o valor crtico junto con su "opuesto en la distribucin" X / 2. Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:
Diferencias de varianzas A veces, los analistas investigan la variabilidad de una poblacin, en lugar de su media o proporcin. Esto es debido a que la uniformidad de la produccin muchas veces es crtica en la prctica industrial. La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hiptesis est diseada para determinar si la varianza de una poblacin es igual a algn valor predeterminado. La varianza de un conjunto de datos se define como el cuadrado de su desviacin estndar; y la varianza muestral se utiliza para probar la hiptesis nula que se refiere a la variabilidad y es til para entender el procedimiento de anlisis de la varianza. La hiptesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algn valor previamente especificado. Como el aspecto de inters, por lo general es si la varianza de la poblacin es mayor que este valor, siempre se aplica una de una cola. Para probar la hiptesis nula, se toma una muestra aleatoria de elementos de una poblacin que se investiga; y a partir de esos datos, se calcula el estadstico de prueba. Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas 10
H0 : H1 :
=k k
En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( ) la estadstica de trabajo es la expresin (1.4):
(3.7)
Diferencias de medias En ocasiones interesa definir un intervalo de valores tal que permita establecer cuales son los valores mnimo y mximo aceptables para la diferencia entre las medias de dos poblaciones. Pueden darse dos situaciones segn las muestras sean o no independientes;
11
siendo en ambos casos condicin necesaria que las poblaciones de origen sean normales o aproximadamente normales: Muestras Independientes Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza para la diferencia de medias poblacionales est centrado en la diferencia de las medias muestrales, siendo sus lmites superior e inferior:
t /2 es el valor crtico correspondiente al grado de confianza 1- de la distribucin t de Student con n1+ n2-2 grados de libertad y
Es una estimacin de la desviacin tpica comn a ambas poblaciones obtenida a partir de las varianzas de las dos muestras. En la prctica si n1 y n2 son moderadamente grandes, el valor crtico t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribucin normal. Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de confianza son:
El valor crtico t /2 corresponde a una distribucin t cuyos grados de libertad se calculan en base a ambos tamaos muestrales y a las desviaciones tpicas de cada grupo segn la correccin propuesta por Dixon y Massey:
12
Regresin Lineal Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr
De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces
Ei es el error o desviacin aleatoria de Yi . Densidad La densidad de la leche es igual al peso en Kilogramos de un litro de leche a una temperatura de 20C. La densidad de la leche no es un valor constante por estar determinada por dos factores opuestos y variables. Concentracin de slidos no grasos; la densidad varia proporcionalmente a esta concentracin. Proporcin de materia grasa; la densidad de la leche vara de manera inversa al contenido graso. De aqu que la leche procedente de un hato mezclado de razas flucta entre 1.029 y 1.033 a 15C, a temperaturas diferentes es necesario realizar una correccin, agregndose o substrayndose el factor 0.0002 por cada grado centgrado arriba o debajo de la temperatura mencionada. La determinacin de la densidad se la realiza por medio de un lactodensmetro o de un picnmetro, de la forma descrita en la Norma INEM 11
13
% Agua aadida Regularmente, la leche es sometida a pruebas (punto de congelacin) para detectar presencia de agua agregada. Independientemente de mala intencin, el agua puede ser agregada accidentalmente a la leche al fallar el drene del sistema de ordeo previo al inicio de sta. Es Permite determinar la cantidad de agua aadida a la leche, a medida que se aade, su punto de congelacin ser ms cerca de cero, siendo un punto crioscpico P.C. =-0,54 grados centgrados. PH Las variaciones del PH en la leche, dependen de varios factores, entre los que se destacan: el estado sanitario de la glndula mamaria; de la cantidad de CO2 disuelto en la leche; del desarrollo de micro organismos productores de cidos lcticos o alcalinizantes; pero en general la leche tiene una reaccin inica cercana a la neutralidad con valores de ph comprendidos entre 6.6 y 6.8 y se deben considerar como anormales los valores inferiores a 6.5 o superiores a 6.9
14
Variable: Densidad_Tony A continuacin se se presenta el histograma de frecuencia de la densidad relativa de la leche de marca Tony, en donde se puede observar que la muestra tiende a comportarse como una variable que sigue una distribucin Normal, la que ser comprobada mas adelante.
Histogram of Density_Tony
Normal 25
Mean StDev N 25,15 0,1886 80
20
Frequency
15
10
24,6
24,8
25,4
25,6
Tabla.- 1 Density_Tony
N 80
Media 25,14
St Dv 0,2114
Kurtosis 1,766
Minimo 24,517
Mediana 25,164
En la tabla anterior (Tabla.- 1) nos proporciona la informacin sobre las medidas ms representativas obtenida de la muestra como es la desviacin estndar, la mediana, el coeficiente de Kurtosis, tamao de la muestra y los cuartiles.
Diagrama de cajas de la variable Densidad_Tony El diagrama de cajas nos da una visin mas clara de los datos atpicos presentes en la muestra, con esto podemos observar de mejor manera los cuartiles.
Boxplot of Density_Tony
25,75
25,50
Density_Tony
25,25
25,00
24,75
24,50
Para concluir con la estadstica descriptiva de las variables de estudio se presenta la siguiente tabla con los datos ms representativos como son las medidas de tendencia central las desviaciones estndares y los cuartiles de las variables en estudio. Variables N Media St Dv Kurtosis Minimo 1er cuartil Mediana 3er cuartil 16
80 80 80 80 80 80
Estadstica inferencial
Pruebas de Normalidad A continuacin se va a presentar la grafica sumaria que incorpora la prueba de normalidad de Anderson y Darling para inferir acerca de la poblacin a la que pertenece una muestra, especficamente si la muestra de la variable en estudio pertenece a una poblacin Normal. Para lo que se plantea el siguiente contraste de Hiptesis para cada una de las variables en estudio: Ho: La muestra de sigue una distribucin de tipo Normal N(,) Vs H1: Los no siguen una distribucin Normal N(,) Variable: Densidad_Tony Contraste de hiptesis: Ho: La muestra de la variable N(25,153,0,036) Vs H1: Los datos no siguen una distribucin Normal N(,) Densidad_Tony sigue una distribucin de tipo Normal
17
0,69 0,070 25,153 0,189 0,036 -0,02957 1,76656 80 24,517 25,023 25,164 25,270 25,709 25,195 25,202 0,223
24,6
24,8
25,0
25,2
25,4
25,6
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,163
Con un valor p = 0,07 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(25,153,0,036).
Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 25,112 y 25,195. Tambin se puede concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,163 y 0,223.
Variable: PH_Tony
Contraste de hiptesis: Ho: La muestra de la variable PH_Tony sigue una distribucin de tipo Normal N(5,85 ;
0,0013) Vs 18
0,51 0,192 5,8598 0,0359 0,0013 0,282402 -0,243802 80 5,7883 5,8345 5,8600 5,8800 5,9400 5,8678 5,8660 0,0426
5,79
5,82
5,85
5,88
5,91
5,94
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,0311
Con un valor p = 0,192 Se puede concluir que no se encontr la suficiente evidente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que se podemos asumir que la muestra proviene de una poblacin Normal del tipo N(5,85 ; 0,0013). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 5,8518 y 5,8678. Tambin se puede concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,0311 y 0,0426.
19
Variable: % agua aadida_Tony Contraste de hiptesis: Ho: La muestra de la variable %agua aadida_Tony sigue una distribucin de tipo Normal N(13,532 ; 0,169) Vs H1: Los datos no siguen una distribucin Normal N(,)
0,56 0,142 13,532 0,411 0,169 0,201644 -0,907182 80 12,860 13,197 13,504 13,838 14,450 13,623 13,652 0,487
12,9
13,2
13,5
13,8
14,1
14,4
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,356
Con un valor p = 0,142 Se puede concluir que no se encontr la suficiente evidente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que se podemos asumir que la muestra proviene de una poblacin Normal del tipo N(13,532 ; 0,169). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. 20
Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 13,440 y 13,623. Tambin se puede concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,356 y 0,487.
Variable: PH_Lechera Contraste de hiptesis: Ho: La muestra de la variable Ph_Lechera sigue una distribucin de tipo Normal N(6,4037 ; 0,0745) Vs H1: Los datos no siguen una distribucin Normal N(,)
0,32 0,533 6,4037 0,2730 0,0745 0,086370 -0,637808 80 5,9100 6,2090 6,3921 6,6000 7,0594 6,4645 6,4800 0,3234
6,0
6,2
6,4
6,6
6,8
7,0
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,2363
21
Con un valor p = 0,533 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(6,4037 ; 0,0745). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 6,3429 y 6,4645. Tambin podemos concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,2363 y 0,3234. Variable: % Agua aadida_Lechera Contraste de hiptesis: Ho: La muestra de la variable % Agua aadida_Lechera sigue una distribucin de tipo Normal N(14,080 ; 1,361) Vs H1: Los datos no siguen una distribucin Normal N(,)
22
0,40 0,352 14,080 1,361 1,852 0,069451 -0,656071 80 11,204 12,931 14,115 15,171 17,540 14,383 14,404 1,612
11
12
13
14
15
16
17
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 1,178
Con un valor p = 0,352 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(14,080 ; 1,361). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 13,777 y 14,383. Tambin podemos concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 1,178 y 1,612. Variable: Densidad_Lechera Contraste de hiptesis: Ho: La muestra de la variable Densidad_Lechera sigue una distribucin de tipo Normal N(25,201 ; 0,096) 23
0,41 0,339 25,201 0,309 0,096 -0,277176 -0,493344 80 24,550 25,018 25,220 25,408 25,740 25,269 25,303 0,366
24,6
24,8
25,0
25,2
25,4
25,6
95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,268
Con un valor p = 0,339 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(25,201 ; 0,096). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 25,132 y 25,269. Tambin podemos concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,268 y 0,366.
24
Intervalos de confianza.
A continuacin se mostraran graficas de los intervalos de confianza en los cuales se contrasta las marcas, ya que se han tomado los intervalos de confianza para las medias en cada uno de los parmetros en estudio y se los compara por marcas, esto nos permitir tener una idea ms clara de la diferencia existente entre estas. Intervalos de confianzas para las densidades
Data
Como ya se menciono anteriormente el valor de los intervalos para las densidades, los mismos se presentaran a continuacin en la siguiente tabla. Por lo que el valor de los intervalos de los intervalos de confianza para las medias de las densidades con un 95% de confianza se encuentra entre los siguientes valores. Densidad Limite inferior 25,112 25,132
En la grafica podemos observar que la diferencia que existe entre el lmite superior y el inferior de el intervalo de confianza de la marca la Lechera es de de 0,137 mientras que el de la marca Tony es de 0,083 lo que nos indica que la dispersin de los datos en la Lechera es mayor que la de Tony. Adicional que se puede observar que la existe una diferencia entre las medias, esto se comprobara mas adelante. Intervalos de confianzas para el PH
En el grafico se puede observar una clara diferencia entre las medias la que ser comprobada ms adelante, adicional se observa que las diferencia entre los Limites superior e inferior e inferior del intervalo de confianza en la marca la Lechera es superior en la Lechera nuevamente.
PH Limite superior 26
Data
Marcas
Limite inferior
Tony Lechera
5,8518 6,3429
5,8678 6,4645
14,25
Data
14,00
13,75
En este grafico se observa que los datos de la marca la lechera son ms dispersos que la marca Tony ya que la diferencia entre los lmites del intervalo de confianza es mayor en la Lechera que en la anterior mencionada. Adicional tambin se observa una diferencia de medias. % Agua aadida Limite Limite inferior superior 13,44 13,623 13,77 14,383 27
Prueba de Hiptesis para la diferencia de Varianzas A continuacin se proceder a presentar la prueba de varianzas para los parmetros, ya que este uno de los supuestos que se necesita comprobar para realizar la prueba de diferencia de medias entre los parmetros de estudio. Para esta prueba se contrastara la siguiente prueba de hiptesis: Ho: Tony Lechera =0 Vs H1: Tony Lechera 0 Diferencia de varianzas para la densidad
diefrencias de varianzas
F-Test Density _Tony Test Statistic P-Value Test Statistic P-Value 0,37 0,000 18,56 0,000
Density _Lechera
0,15
0,20 0,25 0,30 0,35 95% Bonferroni Confidence Intervals for StDevs
0,40
Density _Tony
Density _Lechera
24,50
24,75
25,00 Data
25,25
25,50
25,75
H1: Tony Lechera 0 Valor p = 0 Con un valor p = 0 se puede concluir que existe la suficiente evidencia estadstica para rechazar la Hiptesis nula por la alterna, por lo que se puede determinar que las varianzas en las densidades son diferentes.
diefrencias de varianzas
F-Test ph_Tony Test Statistic P-Value Lev ene's Test Test Statistic P-Value 114,41 0,000 0,02 0,000
Ph_Lechera
0,00
0,05 0,10 0,15 0,20 0,25 0,30 95% Bonferroni Confidence Intervals for StDevs
0,35
ph_Tony
Ph_Lechera
6,0
6,3 Data
6,6
6,9
7,2
Se comprob la siguiente hiptesis para el PH: Ho: Tony Lechera =0 Vs H1: Tony Lechera 0 29
Valor p = 0 Con un valor p = 0 se puede concluir que existe la suficiente evidencia estadstica para rechazar la Hiptesis nula por la alterna, por lo que se puede determinar que las varianzas en el PH son diferentes.
diefrencias de varianzas
F-Test Added water_Tony Test Statistic P-Value Test Statistic P-Value 0,09 0,000 71,72 0,000
A dded water_Lechera
0,50 0,75 1,00 1,25 1,50 95% Bonferroni Confidence Intervals for StDevs
1,75
Added water_Tony
A dded water_Lechera
11
12
13
14 Data
15
16
17
18
Se comprob la siguiente hiptesis para el % Agua aadida : Ho: Tony Lechera =0 Vs H1: Tony Lechera 0 Valor p = 0 30
Con un valor p = 0 se puede concluir que existe la suficiente evidencia estadstica para rechazar la Hiptesis nula por la alterna, por lo que se puede determinar que las varianzas en el % Agua aadida son diferentes.
Diferencias de medias Para realizar la prueba de diferencia de medias primero se tena que comprobar dos supuestos: Normalidad de los datos. Diferencias de Varianzas.
Una vez que estos supuestos fueron comprobados se procedi a realizar la prueba de diferencia de medias contrastando la siguiente prueba de hiptesis. Diferencia de medias para la densidad Como se tiene un inters en determinar si las densidades de las leches en las diferentes marcas son Iguales se plantea el siguiente contraste de Hiptesis. Ho: _Tony - _Lechera = 0 o Ho: _Tony = _Lechera Vs H1: _Tony - _Lechera 0 = 0,05 N Mean StDev SE Mean Density_Tony 80 25,153 0,189 0,021 Density_Lechera 80 25,201 0,309 0,035
Diferencia = (Density_Tony) - (Density_Lechera) Estadistico de prueba: - 0,047093 95% de confianza en intervalo para la diferencia: (-0,127244. 0,033059) T-Test of difference = 0 (vs not =): T-Value = -1,16 P-Value = 0,247 31
25,50
25,25
Data
25,00
24,75
Con el valor p = 0,247 se puede concluir que no se encontro la suficiente evidencia estadistica para rechazar la Hipotresis Nula, y se puede asumir que no existe una diferencia significativa en tre las densidades de la Leche en las Marcas en estudio.
Diferencias de medias para % Agua aadida Como se tiene un inters en determinar si el % Agua aadida_Tony es mayor que % Agua aadida_Lechera par esto se plantea el siguiente contraste de Hiptesis. Ho: _Tony - _Lechera = 0 o Ho: _Tony = _Lechera Vs H1: _Tony < _Lechera = 0,05 N 80 80 Mean 13,532 14,08 StDev 0,411 1,36 SE Mean 0,046 0,15 32
Diferencia = (Added water_Tony) - (Added water_Lechera) Estimate for difference: -0,548450 95% upper bound for difference: -0,284376 T-Test of difference = 0 (vs <) T-Value = -3,45 P-Value = 0,000
Data
Con el valor p =0 se encontr la suficiente evidencia estadstica para rechazar Hiptesis Nula en favor de la Hiptesis Alterna, por lo que podemos asumir que el % Agua aadida_Tony es menor que % Agua aadida_Lechera Regresin Lineal Simple Un factor de inters es poder determinar la densidad a partir del % Agua aadido_Tony para lo cual se utilizara un modelo de regresin lineal simple. 33
Es de nuestro inters probar la siguiente hiptesis: Ho: 1 = 1,0 Vs H1: 1 1,0 Adicional se tiene que cumplir con los supuestos que los errores son Normales e Independientes N(0,2) Los clculos en la computadora reflejaron los siguientes resultados: La ecuacin de la regresin es: Density_Tony = 25,78 - 0,04658 Added water_Tony
25,50
Density_Tony
25,25
25,00
24,75
24,50 13,00 13,25 13,50 13,75 14,00 Added water_Tony 14,25 14,50
DF 1 78 79
F 0,81
P 0,37
Con un valor p=0,37 se puede concluir que no existe la suficiente evidencia estadstica para rechazar Ho, lo que es equivalente a decir que no existe una relacin lineal entre la variable de respuesta y la variable prediccin. Esto tambin es notorio en el valor R2 = 1,0% lo que me indica que tan capaz es la variable %Agua_aadida en predecir la densidad.
Residual
-0,50 -0,25 0,00 Residual 0,25 0,50
Percent
90 50 10 1 0,1
0,25 0,00 -0,25 -0,50 25,10 25,12 25,14 25,16 Fitted Value 25,18
Frequency
Residual
Observation Order
En este grafico se puede observar que se cumplen con los supuestos de la normalidad de los errores.
35
Conclusiones
Cuando se determinaron Intervalos de confianza de los parmetros de estudio se concluyo que los datos de la muestra de la Marca Lechera estaban ms dispersos por lo que se puede concluir que estos parmetros tienen menos control con respecto a la marca Tony. Se concluyo que las muestras de os parmetros de estudios pertenecen a poblaciones del tipo normal con sus respectivos parmetros (Media; Varianza), se llego a esta conclusin mediante la prueba de Anderson Y Darling. Cuando se realizaron las pruebas de diferencias de varianzas estas para los tres parmetros se llego a la conclusin que las varianzas eran diferentes en los parmetros de estudios. Se pudo concluir que no existe evidencia estadstica para determinar que hay una diferencia significativa entre las densidades de las dos marcas y tambin se pudo concluir que el %agua aadida en Tony es menor que en Lechera. Con el modelo de regresin lineal simple se pudo determinar que no existe una relacin lineal entre la densidad y el % Agua aadida, pero esto se debe a que al momento de la tabulacin de los datos no se tomaron las debidas precauciones y se perdi la relacin Xi Yi en los valores.
36
Anexos
Added water_Tony
Histogram of ph_Tony
Normal 14 12 10
Mean StDev N 5,861 0,03641 50
Frequency
8 6 4 2 0
5,80
5,84
5,88 ph_Tony
5,92
Boxplot of ph_Tony
5,950 5,925 5,900
ph_Tony
Histogram of Density_Lechera
Normal 12 10 8
Mean StDev N 25,18 0,3269 50
Frequency
6 4 2 0
24,6
24,9
25,2 Density_Lechera
25,5
25,8
Boxplot of Density_Lechera
25,75
25,50
Density_Lechera
25,25
25,00
24,75
24,50
Frequency
5 4 3 2 1 0 11 12 13 14 15 Added water_Lechera 16 17
Added water_Lechera
Histogram of Ph_Lechera
Normal 7 6 5
Mean StDev N 6,404 0,2894 49
Frequency
4 3 2 1 0
5,8
6,0
6,2
6,8
7,0
Boxplot of Ph_Lechera
7,2 7,0 6,8
Ph_Lechera
Frecuencia
50 40 30 20 10 0 0 Marca de Leche 1
0,8
Marca de Leche
0,6
0,4
0,2
0,0
Bibliografa
Probabilidad y estadstica aplicada a la ingeniera Montgomery & Runger da edicin. Probabilidad y estadstica, fundamentos y aplicaciones, ediciones del instituto de ciencias matemticas - Zurita Gaudencio. http://www.dspace.espol.edu.ec/bitstream/123456789/8673/1/D-39834.pdf http://www.dspace.espol.edu.ec/bitstream/123456789/7574/2/Tesis%20Determinaci on%20de%20los%20Costos%20de%20Calidad%20en%20el%20Proceso%20Producti vo%20de%20la%20Leche.pdf http://es.scribd.com/doc/57462344/53176942-Carac-Fisico-Quimicas-de-La-LecheModulo1 http://bibdigital.epn.edu.ec/bitstream/15000/1717/1/CD-2330.pdf
43