Está en la página 1de 43

Mtodos Estadsticos Para La Industria II

Anlisis Estadstico Comparativo Entre Dos Marcas De Leche. Segn Estndares De Calidad

Integrantes: o Monica Prado Lince o Adan Zambrano len o Sulay Zambrano Vera

Escuela Superior Politcnica Del Litoral

Tabla de Contenido
Resumen ........................................................................................................................................ 4 Objetivos ........................................................................................................................................ 5 Objetivo general........................................................................................................................ 5 Objetivos especficos ................................................................................................................ 5 Marco terico ................................................................................................................................ 5 Media de una Muestra ............................................................................................................. 5 Desviacin estndar ................................................................................................................. 6 Cuartiles o percentiles ............................................................................................................. 6 Coeficiente de Curtosis ............................................................................................................ 6 Valor P........................................................................................................................................ 7 Prueba de Anderson y Darling ............................................................................................... 8 Intervalos de confianza ............................................................................................................ 8 Diferencias de varianzas........................................................................................................ 10 Diferencias de medias ............................................................................................................ 11 Muestras Independientes ...................................................................................................... 12 Regresin Lineal ..................................................................................................................... 13 Descripcin de las variables...................................................................................................... 14 Densidad relativa: .................................................................................................................. 14 % Agua aadida: .................................................................................................................... 14 PH: ............................................................................................................................................ 14 Marca de la leche: ................................................................................................................... 14 2

Escuela Superior Politcnica Del Litoral

Tratamiento estadstico de datos.............................................................................................. 15 Estadstica descriptiva ........................................................................................................... 15 Estadstica inferencial................................................................................................................ 17 Intervalos de confianza. ......................................................................................................... 25 Prueba de Hiptesis para la diferencia de Varianzas........................................................ 28 Diferencias de medias ............................................................................................................ 31 Regresin Lineal Simple ........................................................................................................ 33 Conclusiones ............................................................................................................................... 36 Anexos ......................................................................................................................................... 37 Bibliografa .................................................................................................................................. 43

Escuela Superior Politcnica Del Litoral

Resumen

Desde la antigedad la leche animal ha sido por preferencia un alimento consumido de forma regular por parte del hombre, remontndose al momento en que nuestros antepasados dejaron de ser nmadas y comenzaron a cultivar la tierra para alimentar a los animales capturados que mantenan en su hogar. En el siglo XX, se realizaron importantes progresos en el mbito de la transformacin de la leche. Mdicos y especialistas en nutricin precisaron las condiciones que deba cumplir para responder exactamente a las necesidades del organismo humano. Y es que indudablemente la leche se puede considerar como el alimento mas completo que existe debido a su rica composicin en protenas, lactosa, enzimas, grasas, vitaminas, minerales y sales minerales. En la actualidad podemos encontrar en el mercado un extenso surtido de caractersticas, presentaciones, marcas y precios que establecen la diferencia ante las exigencias del consumidor. Siendo la calidad y la experiencia los principales parmetros con los que una empresa puede destacarse sobre las dems. El presente trabajo est orientado al estudio estadstico de parmetros de control para leche de 2 marcas conocidas en el mercado, como lo son Toni y La Lechera de Nestl (en presentaciones Tetra Pack de 250 cm3 cada una), para esto se van a tomar muestras de tamao n= 80 y se realizaran los clculos pertinentes para determinar cul de las marcas que participan en este estudio presenta mejores resultados con respecto a la otra. Entre las variables de estudio se encuentran la densidad, % de Agua aadida y PH, entre los clculos estadsticos se presentaran resultados de pruebas de bondad de ajuste para verificar normalidad, pruebas de diferencias de varianzas, pruebas de diferencias de medias y una regresin lineal simple para relacionar dos de estas variables. Adicional a los clculos estadsticos tambin se presentaran graficas como los diagramas de cajas e Histogramas de frecuencias as como tambin Intervalos de confianza entre otros.

Escuela Superior Politcnica Del Litoral

Objetivos
Objetivo general Utilizar las herramientas adquiridas en el curso de mtodos estadsticos II en un caso aplicable en la industria alimenticia. Objetivos especficos Describir y analizar cada una de las variables cuantitativas mediante grficos en programas estadsticos como MINITAB. Estimar medidas de tendencia central como la media de la densidad relativa, % de agua aadida y el PH. Obtener intervalos de confianza para cada una de las variables cuantitativas. Identificar el tipo de distribucin para cada una de las variables. Determinar si las varianzas de cada uno de las variables son iguales Determinar si existe una diferencia significativa entre los parmetros de estudio entre marcas. Determinar un modelo de regresin lineal Simple entre la densidad y % de Agua aadido.

Marco terico
Media de una Muestra Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valores observados, dividido por el nmero total de observaciones.

Cuando los valores representan una poblacin la ecuacin se define como:

Escuela Superior Politcnica Del Litoral

Desviacin estndar

La desviacin estndar de una coleccin de datos se usa para describir la variabilidad en esa coleccin y se puede definir como la diferencia estndar entre los elementos de una coleccin de datos y su media. Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un conjunto), la ecuacin sera:

Cuartiles o percentiles Un percentil X, PX, es un valor de la distribucin muestral o poblacional de la variable que es mayor o igual que el X% de las observaciones de la variable P(Y PX) = X%. Existe un tipo especial de cuantiles llamados cuartiles. Los cuartiles son tres valores que dividen la distribucin en cuatro partes equivalentes porcentualmente. El primer cuartil es el valor que es mayor o igual que el 25% de las observaciones de la muestra y menor o igual que el 75%. El segundo cuartil es la mediana El tercer cuartil es mayor o igual que el 75% de las observaciones de la muestra y menor o igual que el 25%. Coeficiente de Curtosis El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin.

Escuela Superior Politcnica Del Litoral

Se definen 3 tipos de distribuciones segn su grado de curtosis: Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

Los resultados pueden ser los siguientes:


g2 = 0 (distribucin mesocrtica). g2 > 0 (distribucin leptocrtica). g2 < 0 (distribucin platicrtica).

Valor P Un p valor es la probabilidad de que la hiptesis nula (Ho) sea cierta. La anterior respuesta es, adems de pragmtica y utilitarista, falsa. Lo cierto es que, tcnicamente, la definicin de p valor es la siguiente: Un p valor es la probabilidad, calculada al asumir que Ho es cierta, de que la estadstica de prueba tome valore tan extremos o ms extremos que los calculados con la muestra actual. Ahora, dado que las estadsticas de prueba se construyen para cuantificar las desviaciones de la hiptesis nula con los datos actuales, entonces rechazamos Ho cuando el p valor es pequeo porque si ste es pequeo entonces los datos actuales proveen una fuerte evidencia en contra de Ho. En otras palabras, el hecho de que el p valor sea grande hace 7

Escuela Superior Politcnica Del Litoral

que Ho sea difcil de rechazar; por tanto es casi intuitivo, pero no valido, tomar al p valor como una medida de soporte en contra (o a favor) del rechazo de Ho.

Prueba de Anderson y Darling La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribucin especifica. Esta prueba es una modificacin de la prueba de KolmogorovSmirnov donde se le da ms peso a las colas de la distribucin que la prueba de Kolmogorov-Smirnov . En estadstica, la prueba de Anderson-Darling es una prueba no paramtrica sobre si los datos de una muestra provienen de una distribucin especfica. La frmula para el estadstico determina si los datos (observar que los datos se deben ordenar) vienen de una distribucin con funcin acumulativa F. Formulas: A2= N S Donde:

Intervalos de confianza De una poblacin de media y desviacin tpica se pueden tomar muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: Pero adems, si el tamao de las muestras es lo suficientemente grande, la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin:

.
8

Escuela Superior Politcnica Del Litoral

Esto se representa como sigue:

. Si estandarizamos, se sigue que:

En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el uso de las tablas en una distribucin normal). Se desea obtener una expresin tal que

En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamar{ 1 (debido a que es el error que se cometer, un trmino opuesto). Para ello se necesita calcular el punto X / 2 o, mejor dicho, su versin estandarizada Z / 2 o valor crtico junto con su "opuesto en la distribucin" X / 2. Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

Escuela Superior Politcnica Del Litoral

Diferencias de varianzas A veces, los analistas investigan la variabilidad de una poblacin, en lugar de su media o proporcin. Esto es debido a que la uniformidad de la produccin muchas veces es crtica en la prctica industrial. La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hiptesis est diseada para determinar si la varianza de una poblacin es igual a algn valor predeterminado. La varianza de un conjunto de datos se define como el cuadrado de su desviacin estndar; y la varianza muestral se utiliza para probar la hiptesis nula que se refiere a la variabilidad y es til para entender el procedimiento de anlisis de la varianza. La hiptesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algn valor previamente especificado. Como el aspecto de inters, por lo general es si la varianza de la poblacin es mayor que este valor, siempre se aplica una de una cola. Para probar la hiptesis nula, se toma una muestra aleatoria de elementos de una poblacin que se investiga; y a partir de esos datos, se calcula el estadstico de prueba. Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas 10

Escuela Superior Politcnica Del Litoral

H0 : H1 :

=k k

- Prueba de hiptesis a una cola superior H0 : H1 : =k >k H0 : H1 : k >k

- Prueba de hiptesis a una cola inferior H0 : H1 : =k <k H1 : H1 : k <k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( ) la estadstica de trabajo es la expresin (1.4):

(3.6) Si se utiliza la varianza corregida, la estadstica de trabajo es la expresin (1.5):

(3.7)

Diferencias de medias En ocasiones interesa definir un intervalo de valores tal que permita establecer cuales son los valores mnimo y mximo aceptables para la diferencia entre las medias de dos poblaciones. Pueden darse dos situaciones segn las muestras sean o no independientes;

11

Escuela Superior Politcnica Del Litoral

siendo en ambos casos condicin necesaria que las poblaciones de origen sean normales o aproximadamente normales: Muestras Independientes Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza para la diferencia de medias poblacionales est centrado en la diferencia de las medias muestrales, siendo sus lmites superior e inferior:

t /2 es el valor crtico correspondiente al grado de confianza 1- de la distribucin t de Student con n1+ n2-2 grados de libertad y

Es una estimacin de la desviacin tpica comn a ambas poblaciones obtenida a partir de las varianzas de las dos muestras. En la prctica si n1 y n2 son moderadamente grandes, el valor crtico t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribucin normal. Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de confianza son:

El valor crtico t /2 corresponde a una distribucin t cuyos grados de libertad se calculan en base a ambos tamaos muestrales y a las desviaciones tpicas de cada grupo segn la correccin propuesta por Dixon y Massey:

12

Escuela Superior Politcnica Del Litoral

Regresin Lineal Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr

De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi . Densidad La densidad de la leche es igual al peso en Kilogramos de un litro de leche a una temperatura de 20C. La densidad de la leche no es un valor constante por estar determinada por dos factores opuestos y variables. Concentracin de slidos no grasos; la densidad varia proporcionalmente a esta concentracin. Proporcin de materia grasa; la densidad de la leche vara de manera inversa al contenido graso. De aqu que la leche procedente de un hato mezclado de razas flucta entre 1.029 y 1.033 a 15C, a temperaturas diferentes es necesario realizar una correccin, agregndose o substrayndose el factor 0.0002 por cada grado centgrado arriba o debajo de la temperatura mencionada. La determinacin de la densidad se la realiza por medio de un lactodensmetro o de un picnmetro, de la forma descrita en la Norma INEM 11

13

Escuela Superior Politcnica Del Litoral

% Agua aadida Regularmente, la leche es sometida a pruebas (punto de congelacin) para detectar presencia de agua agregada. Independientemente de mala intencin, el agua puede ser agregada accidentalmente a la leche al fallar el drene del sistema de ordeo previo al inicio de sta. Es Permite determinar la cantidad de agua aadida a la leche, a medida que se aade, su punto de congelacin ser ms cerca de cero, siendo un punto crioscpico P.C. =-0,54 grados centgrados. PH Las variaciones del PH en la leche, dependen de varios factores, entre los que se destacan: el estado sanitario de la glndula mamaria; de la cantidad de CO2 disuelto en la leche; del desarrollo de micro organismos productores de cidos lcticos o alcalinizantes; pero en general la leche tiene una reaccin inica cercana a la neutralidad con valores de ph comprendidos entre 6.6 y 6.8 y se deben considerar como anormales los valores inferiores a 6.5 o superiores a 6.9

Descripcin de las variables


Densidad relativa: Es una variable cuantitativa que representa el peso en Kilogramos de un litro de leche a una temperatura de 20C. % Agua aadida: Es una variable cuantitativa que representa la fase continua de la leche y sirve como medio de solucin y de dispersin o suspensin para los componentes slidos gaseosos. PH: Es una variable cuantitativa que representa una medida de la acidez o alcalinidad de una solucin. Marca de la leche: Para nuestra investigacin representara nuestra variable cualitativa arrojando valores de 1 para la marca de leche Toni y 0 para la competencia (la lechera de Nestl).

14

Escuela Superior Politcnica Del Litoral

Tratamiento estadstico de datos


Estadstica descriptiva A manera de ejemplo pasaremos a explicar una de las variables de estudio y as realizar una breve descripcin de los grficos que se obtuvo de las muestras, las graficas de las variables restantes se encuentran en los anexos correspondientes.

Variable: Densidad_Tony A continuacin se se presenta el histograma de frecuencia de la densidad relativa de la leche de marca Tony, en donde se puede observar que la muestra tiende a comportarse como una variable que sigue una distribucin Normal, la que ser comprobada mas adelante.
Histogram of Density_Tony
Normal 25
Mean StDev N 25,15 0,1886 80

20

Frequency

15

10

24,6

24,8

25,0 25,2 Density_Tony

25,4

25,6

Grafico 1.- Histograma de frecuencia de Densidad_Tony

Estadstica descriptiva de la variable Densidad_Tony 15

Escuela Superior Politcnica Del Litoral

Tabla.- 1 Density_Tony

N 80

Media 25,14

St Dv 0,2114

Kurtosis 1,766

Minimo 24,517

1er cuartil 25,023

Mediana 25,164

3er cuartil 25,27

En la tabla anterior (Tabla.- 1) nos proporciona la informacin sobre las medidas ms representativas obtenida de la muestra como es la desviacin estndar, la mediana, el coeficiente de Kurtosis, tamao de la muestra y los cuartiles.

Diagrama de cajas de la variable Densidad_Tony El diagrama de cajas nos da una visin mas clara de los datos atpicos presentes en la muestra, con esto podemos observar de mejor manera los cuartiles.
Boxplot of Density_Tony
25,75

25,50

Density_Tony

25,25

25,00

24,75

24,50

Grafico 2.- Diagrama de cajas del % Agua aadida_Tony

Para concluir con la estadstica descriptiva de las variables de estudio se presenta la siguiente tabla con los datos ms representativos como son las medidas de tendencia central las desviaciones estndares y los cuartiles de las variables en estudio. Variables N Media St Dv Kurtosis Minimo 1er cuartil Mediana 3er cuartil 16

Escuela Superior Politcnica Del Litoral

Density_Tony Added water_Tony ph_Tony Density_Lechera Added water_Lechera Ph_Lechera

80 80 80 80 80 80

25,14 13,54 5,861 25,18 14,11 6,404

0,2114 0,4444 0,03641 0,3269 1,369 0,2894

1,766 -0,9071 -0,2438 -0,4933 -0,656 -0,6378

24,517 12,86 5,7883 24,55 11,204 5,91

25,023 13,197 5,8345 25,018 12,931 6,209

25,164 13,504 5,86 25,22 14,115 6,3921

25,27 13,088 5,88 25,408 15,171 6,6

Estadstica inferencial
Pruebas de Normalidad A continuacin se va a presentar la grafica sumaria que incorpora la prueba de normalidad de Anderson y Darling para inferir acerca de la poblacin a la que pertenece una muestra, especficamente si la muestra de la variable en estudio pertenece a una poblacin Normal. Para lo que se plantea el siguiente contraste de Hiptesis para cada una de las variables en estudio: Ho: La muestra de sigue una distribucin de tipo Normal N(,) Vs H1: Los no siguen una distribucin Normal N(,) Variable: Densidad_Tony Contraste de hiptesis: Ho: La muestra de la variable N(25,153,0,036) Vs H1: Los datos no siguen una distribucin Normal N(,) Densidad_Tony sigue una distribucin de tipo Normal

17

Escuela Superior Politcnica Del Litoral

Summary for Density_Tony


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tD ev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 25,112 25,124 9 5 % C onfidence Inter vals
Mean Median 25,10 25,12 25,14 25,16 25,18 25,20

0,69 0,070 25,153 0,189 0,036 -0,02957 1,76656 80 24,517 25,023 25,164 25,270 25,709 25,195 25,202 0,223

24,6

24,8

25,0

25,2

25,4

25,6

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,163

Grafica.- 13 Grafica Sumaria Densidad_Tony

Con un valor p = 0,07 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(25,153,0,036).
Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 25,112 y 25,195. Tambin se puede concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,163 y 0,223.

Variable: PH_Tony

Contraste de hiptesis: Ho: La muestra de la variable PH_Tony sigue una distribucin de tipo Normal N(5,85 ;
0,0013) Vs 18

Escuela Superior Politcnica Del Litoral

H1: Los datos no siguen una distribucin Normal N(,)


Summary for ph_Tony
A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 5,8518 5,8500 9 5 % C onfidence Inter vals
Mean Median 5,850 5,855 5,860 5,865 5,870

0,51 0,192 5,8598 0,0359 0,0013 0,282402 -0,243802 80 5,7883 5,8345 5,8600 5,8800 5,9400 5,8678 5,8660 0,0426

5,79

5,82

5,85

5,88

5,91

5,94

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,0311

Grafica.- 13 Grafica Sumaria Densidad_Tony

Con un valor p = 0,192 Se puede concluir que no se encontr la suficiente evidente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que se podemos asumir que la muestra proviene de una poblacin Normal del tipo N(5,85 ; 0,0013). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 5,8518 y 5,8678. Tambin se puede concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,0311 y 0,0426.

19

Escuela Superior Politcnica Del Litoral

Variable: % agua aadida_Tony Contraste de hiptesis: Ho: La muestra de la variable %agua aadida_Tony sigue una distribucin de tipo Normal N(13,532 ; 0,169) Vs H1: Los datos no siguen una distribucin Normal N(,)

Summary for Added water_Tony


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 13,440 13,360 9 5 % C onfidence Inter vals
Mean Median 13,35 13,40 13,45 13,50 13,55 13,60 13,65

0,56 0,142 13,532 0,411 0,169 0,201644 -0,907182 80 12,860 13,197 13,504 13,838 14,450 13,623 13,652 0,487

12,9

13,2

13,5

13,8

14,1

14,4

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,356

Grafica.- 13 Grafica Sumaria Densidad_Tony

Con un valor p = 0,142 Se puede concluir que no se encontr la suficiente evidente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que se podemos asumir que la muestra proviene de una poblacin Normal del tipo N(13,532 ; 0,169). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. 20

Escuela Superior Politcnica Del Litoral

Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 13,440 y 13,623. Tambin se puede concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,356 y 0,487.

Variable: PH_Lechera Contraste de hiptesis: Ho: La muestra de la variable Ph_Lechera sigue una distribucin de tipo Normal N(6,4037 ; 0,0745) Vs H1: Los datos no siguen una distribucin Normal N(,)

Summary for Ph_Lechera


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 6,3429 6,3386 9 5 % C onfidence Inter vals
Mean Median 6,350 6,375 6,400 6,425 6,450 6,475 6,500

0,32 0,533 6,4037 0,2730 0,0745 0,086370 -0,637808 80 5,9100 6,2090 6,3921 6,6000 7,0594 6,4645 6,4800 0,3234

6,0

6,2

6,4

6,6

6,8

7,0

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,2363

Grafica.- 13 Grafica Sumaria PH_Lechera

21

Escuela Superior Politcnica Del Litoral

Con un valor p = 0,533 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(6,4037 ; 0,0745). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 6,3429 y 6,4645. Tambin podemos concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,2363 y 0,3234. Variable: % Agua aadida_Lechera Contraste de hiptesis: Ho: La muestra de la variable % Agua aadida_Lechera sigue una distribucin de tipo Normal N(14,080 ; 1,361) Vs H1: Los datos no siguen una distribucin Normal N(,)

22

Escuela Superior Politcnica Del Litoral

Summary for Added water_Lechera


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 13,777 13,725 9 5 % C onfidence Inter vals
Mean Median 13,80 13,95 14,10 14,25 14,40

0,40 0,352 14,080 1,361 1,852 0,069451 -0,656071 80 11,204 12,931 14,115 15,171 17,540 14,383 14,404 1,612

11

12

13

14

15

16

17

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 1,178

Con un valor p = 0,352 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(14,080 ; 1,361). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 13,777 y 14,383. Tambin podemos concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 1,178 y 1,612. Variable: Densidad_Lechera Contraste de hiptesis: Ho: La muestra de la variable Densidad_Lechera sigue una distribucin de tipo Normal N(25,201 ; 0,096) 23

Escuela Superior Politcnica Del Litoral

Vs H1: Los datos no siguen una distribucin Normal N(,)

Summary for Density_Lechera


A nderson-D arling N ormality Test A -S quared P -V alue M ean S tDev V ariance S kew ness Kurtosis N M inimum 1st Q uartile M edian 3rd Q uartile M aximum 25,132 25,110 9 5 % C onfidence Inter vals
Mean Median 25,10 25,15 25,20 25,25 25,30

0,41 0,339 25,201 0,309 0,096 -0,277176 -0,493344 80 24,550 25,018 25,220 25,408 25,740 25,269 25,303 0,366

24,6

24,8

25,0

25,2

25,4

25,6

95% C onfidence Interv al for M ean 95% C onfidence Interv al for M edian 95% C onfidence Interv al for S tDev 0,268

Con un valor p = 0,339 Se puede concluir que no se encontr la suficiente evidencia estadstica para rechazar la Hiptesis Nula Ho, por lo que podemos asumir que la muestra proviene de una poblacin Normal del tipo N(25,201 ; 0,096). Adicional la grafica muestra los intervalos de confianza de la media y la desviacin estndar. Por lo que se puede concluir que con un 95% de confianza el valor de la media se encuentra entre 25,132 y 25,269. Tambin podemos concluir que con un 95% de confianza el valor de la desviacin estndar se encuentra entre 0,268 y 0,366.

24

Escuela Superior Politcnica Del Litoral

Intervalos de confianza.
A continuacin se mostraran graficas de los intervalos de confianza en los cuales se contrasta las marcas, ya que se han tomado los intervalos de confianza para las medias en cada uno de los parmetros en estudio y se los compara por marcas, esto nos permitir tener una idea ms clara de la diferencia existente entre estas. Intervalos de confianzas para las densidades

Interval Plot of Density_Tony. Density_Lechera


95% CI for the Mean 25,28 25,26 25,24 25,22

Data

25,20 25,18 25,16 25,14 25,12 25,10 Density_Tony Density_Lechera

Como ya se menciono anteriormente el valor de los intervalos para las densidades, los mismos se presentaran a continuacin en la siguiente tabla. Por lo que el valor de los intervalos de los intervalos de confianza para las medias de las densidades con un 95% de confianza se encuentra entre los siguientes valores. Densidad Limite inferior 25,112 25,132

Marcas Tony Lechera

Limite superior 25,195 25,269 25

Escuela Superior Politcnica Del Litoral

En la grafica podemos observar que la diferencia que existe entre el lmite superior y el inferior de el intervalo de confianza de la marca la Lechera es de de 0,137 mientras que el de la marca Tony es de 0,083 lo que nos indica que la dispersin de los datos en la Lechera es mayor que la de Tony. Adicional que se puede observar que la existe una diferencia entre las medias, esto se comprobara mas adelante. Intervalos de confianzas para el PH

Interval Plot of ph_Tony. Ph_Lechera


95% CI for the Mean 6,5 6,4 6,3 6,2 6,1 6,0 5,9 5,8 ph_Tony Ph_Lechera

En el grafico se puede observar una clara diferencia entre las medias la que ser comprobada ms adelante, adicional se observa que las diferencia entre los Limites superior e inferior e inferior del intervalo de confianza en la marca la Lechera es superior en la Lechera nuevamente.
PH Limite superior 26

Data

Marcas

Limite inferior

Escuela Superior Politcnica Del Litoral

Tony Lechera

5,8518 6,3429

5,8678 6,4645

Intervalos de confianza para el % Agua aadido

Interval Plot of Added water_Tony. Added water_Lechera


95% CI for the Mean 14,50

14,25

Data

14,00

13,75

13,50 Added water_Tony Added water_Lechera

En este grafico se observa que los datos de la marca la lechera son ms dispersos que la marca Tony ya que la diferencia entre los lmites del intervalo de confianza es mayor en la Lechera que en la anterior mencionada. Adicional tambin se observa una diferencia de medias. % Agua aadida Limite Limite inferior superior 13,44 13,623 13,77 14,383 27

Marcas Tony Lechera

Escuela Superior Politcnica Del Litoral

Prueba de Hiptesis para la diferencia de Varianzas A continuacin se proceder a presentar la prueba de varianzas para los parmetros, ya que este uno de los supuestos que se necesita comprobar para realizar la prueba de diferencia de medias entre los parmetros de estudio. Para esta prueba se contrastara la siguiente prueba de hiptesis: Ho: Tony Lechera =0 Vs H1: Tony Lechera 0 Diferencia de varianzas para la densidad

diefrencias de varianzas
F-Test Density _Tony Test Statistic P-Value Test Statistic P-Value 0,37 0,000 18,56 0,000

Lev ene's Test

Density _Lechera

0,15

0,20 0,25 0,30 0,35 95% Bonferroni Confidence Intervals for StDevs

0,40

Density _Tony

Density _Lechera

24,50

24,75

25,00 Data

25,25

25,50

25,75

Se comprob la siguiente hiptesis para la densidad: Ho: Tony Lechera =0 Vs 28

Escuela Superior Politcnica Del Litoral

H1: Tony Lechera 0 Valor p = 0 Con un valor p = 0 se puede concluir que existe la suficiente evidencia estadstica para rechazar la Hiptesis nula por la alterna, por lo que se puede determinar que las varianzas en las densidades son diferentes.

Diferencia de varianzas para el Ph

diefrencias de varianzas
F-Test ph_Tony Test Statistic P-Value Lev ene's Test Test Statistic P-Value 114,41 0,000 0,02 0,000

Ph_Lechera

0,00

0,05 0,10 0,15 0,20 0,25 0,30 95% Bonferroni Confidence Intervals for StDevs

0,35

ph_Tony

Ph_Lechera

6,0

6,3 Data

6,6

6,9

7,2

Se comprob la siguiente hiptesis para el PH: Ho: Tony Lechera =0 Vs H1: Tony Lechera 0 29

Escuela Superior Politcnica Del Litoral

Valor p = 0 Con un valor p = 0 se puede concluir que existe la suficiente evidencia estadstica para rechazar la Hiptesis nula por la alterna, por lo que se puede determinar que las varianzas en el PH son diferentes.

Diferencia de varianzas para el % Agua aadida

diefrencias de varianzas
F-Test Added water_Tony Test Statistic P-Value Test Statistic P-Value 0,09 0,000 71,72 0,000

Lev ene's Test

A dded water_Lechera

0,50 0,75 1,00 1,25 1,50 95% Bonferroni Confidence Intervals for StDevs

1,75

Added water_Tony

A dded water_Lechera

11

12

13

14 Data

15

16

17

18

Se comprob la siguiente hiptesis para el % Agua aadida : Ho: Tony Lechera =0 Vs H1: Tony Lechera 0 Valor p = 0 30

Escuela Superior Politcnica Del Litoral

Con un valor p = 0 se puede concluir que existe la suficiente evidencia estadstica para rechazar la Hiptesis nula por la alterna, por lo que se puede determinar que las varianzas en el % Agua aadida son diferentes.

Diferencias de medias Para realizar la prueba de diferencia de medias primero se tena que comprobar dos supuestos: Normalidad de los datos. Diferencias de Varianzas.

Una vez que estos supuestos fueron comprobados se procedi a realizar la prueba de diferencia de medias contrastando la siguiente prueba de hiptesis. Diferencia de medias para la densidad Como se tiene un inters en determinar si las densidades de las leches en las diferentes marcas son Iguales se plantea el siguiente contraste de Hiptesis. Ho: _Tony - _Lechera = 0 o Ho: _Tony = _Lechera Vs H1: _Tony - _Lechera 0 = 0,05 N Mean StDev SE Mean Density_Tony 80 25,153 0,189 0,021 Density_Lechera 80 25,201 0,309 0,035

Diferencia = (Density_Tony) - (Density_Lechera) Estadistico de prueba: - 0,047093 95% de confianza en intervalo para la diferencia: (-0,127244. 0,033059) T-Test of difference = 0 (vs not =): T-Value = -1,16 P-Value = 0,247 31

Escuela Superior Politcnica Del Litoral

Boxplot of Density_Tony. Density_Lechera


25,75

25,50

25,25
Data

25,00

24,75

24,50 Density_Tony Density_Lechera

Con el valor p = 0,247 se puede concluir que no se encontro la suficiente evidencia estadistica para rechazar la Hipotresis Nula, y se puede asumir que no existe una diferencia significativa en tre las densidades de la Leche en las Marcas en estudio.

Diferencias de medias para % Agua aadida Como se tiene un inters en determinar si el % Agua aadida_Tony es mayor que % Agua aadida_Lechera par esto se plantea el siguiente contraste de Hiptesis. Ho: _Tony - _Lechera = 0 o Ho: _Tony = _Lechera Vs H1: _Tony < _Lechera = 0,05 N 80 80 Mean 13,532 14,08 StDev 0,411 1,36 SE Mean 0,046 0,15 32

Added water_Tony Added water_Lech

Escuela Superior Politcnica Del Litoral

Diferencia = (Added water_Tony) - (Added water_Lechera) Estimate for difference: -0,548450 95% upper bound for difference: -0,284376 T-Test of difference = 0 (vs <) T-Value = -3,45 P-Value = 0,000

Boxplot of Added water_Tony. Added water_Lechera


18 17 16 15

Data

14 13 12 11 Added water_Tony Added water_Lechera

Con el valor p =0 se encontr la suficiente evidencia estadstica para rechazar Hiptesis Nula en favor de la Hiptesis Alterna, por lo que podemos asumir que el % Agua aadida_Tony es menor que % Agua aadida_Lechera Regresin Lineal Simple Un factor de inters es poder determinar la densidad a partir del % Agua aadido_Tony para lo cual se utilizara un modelo de regresin lineal simple. 33

Escuela Superior Politcnica Del Litoral

Es de nuestro inters probar la siguiente hiptesis: Ho: 1 = 1,0 Vs H1: 1 1,0 Adicional se tiene que cumplir con los supuestos que los errores son Normales e Independientes N(0,2) Los clculos en la computadora reflejaron los siguientes resultados: La ecuacin de la regresin es: Density_Tony = 25,78 - 0,04658 Added water_Tony

Density_Tony = 25,78 - 0,04658 Added water_Tony 25,75


S R-Sq R-Sq(adj) 0,188842 1,0% 0,0%

Fitted Line Plot

25,50

Density_Tony

25,25

25,00

24,75

24,50 13,00 13,25 13,50 13,75 14,00 Added water_Tony 14,25 14,50

S = 0,188842 R-Sq = 1,0% R-Sq(adj) = 0,0% 34

Escuela Superior Politcnica Del Litoral

Source Regression Error Total

DF 1 78 79

SS MS 0,029 0,029001 2,78158 0,035661 2,81059

F 0,81

P 0,37

Con un valor p=0,37 se puede concluir que no existe la suficiente evidencia estadstica para rechazar Ho, lo que es equivalente a decir que no existe una relacin lineal entre la variable de respuesta y la variable prediccin. Esto tambin es notorio en el valor R2 = 1,0% lo que me indica que tan capaz es la variable %Agua_aadida en predecir la densidad.

Residual Plots for Density_Tony


Normal Probability Plot of the Residuals
99,9 99

Residuals Versus the Fitted Values


0,50

Residual
-0,50 -0,25 0,00 Residual 0,25 0,50

Percent

90 50 10 1 0,1

0,25 0,00 -0,25 -0,50 25,10 25,12 25,14 25,16 Fitted Value 25,18

Histogram of the Residuals


20

Residuals Versus the Order of the Data


0,50

Frequency

Residual

15 10 5 0 -0,6 -0,4 -0,2 0,0 Residual 0,2 0,4 0,6

0,25 0,00 -0,25 -0,50


1 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80

Observation Order

En este grafico se puede observar que se cumplen con los supuestos de la normalidad de los errores.

35

Escuela Superior Politcnica Del Litoral

Conclusiones
Cuando se determinaron Intervalos de confianza de los parmetros de estudio se concluyo que los datos de la muestra de la Marca Lechera estaban ms dispersos por lo que se puede concluir que estos parmetros tienen menos control con respecto a la marca Tony. Se concluyo que las muestras de os parmetros de estudios pertenecen a poblaciones del tipo normal con sus respectivos parmetros (Media; Varianza), se llego a esta conclusin mediante la prueba de Anderson Y Darling. Cuando se realizaron las pruebas de diferencias de varianzas estas para los tres parmetros se llego a la conclusin que las varianzas eran diferentes en los parmetros de estudios. Se pudo concluir que no existe evidencia estadstica para determinar que hay una diferencia significativa entre las densidades de las dos marcas y tambin se pudo concluir que el %agua aadida en Tony es menor que en Lechera. Con el modelo de regresin lineal simple se pudo determinar que no existe una relacin lineal entre la densidad y el % Agua aadida, pero esto se debe a que al momento de la tabulacin de los datos no se tomaron las debidas precauciones y se perdi la relacin Xi Yi en los valores.

36

Escuela Superior Politcnica Del Litoral

Anexos

Histogram of Added water_Tony


Normal 9 8 7
Frequency
Mean StDev N 13,54 0,4444 50

6 5 4 3 2 1 0 12,8 13,2 13,6 Added water_Tony 14,0 14,4

Grafico 3.- Histograma de frecuencia de % Agua aadida

Boxplot of Added water_Tony


14,50 14,25 14,00 13,75 13,50 13,25 13,00

Added water_Tony

Grafico 4.- Diagrama de cajas del % Agua aadida_Tony 37

Escuela Superior Politcnica Del Litoral

Histogram of ph_Tony
Normal 14 12 10
Mean StDev N 5,861 0,03641 50

Frequency

8 6 4 2 0

5,80

5,84

5,88 ph_Tony

5,92

Grafico 5.- Histograma de frecuencia de PH_Tony

Boxplot of ph_Tony
5,950 5,925 5,900
ph_Tony

5,875 5,850 5,825 5,800

Grafico 6.- Diagrama de cajas del PH_Tony 38

Escuela Superior Politcnica Del Litoral

Histogram of Density_Lechera
Normal 12 10 8
Mean StDev N 25,18 0,3269 50

Frequency

6 4 2 0

24,6

24,9

25,2 Density_Lechera

25,5

25,8

Grafico 7.- Histograma de frecuencia de Densidad_Lechera

Boxplot of Density_Lechera
25,75

25,50
Density_Lechera

25,25

25,00

24,75

24,50

Grafico 8.- Diagrama de cajas de densidad_Lechera 39

Escuela Superior Politcnica Del Litoral

Histogram of Added water_Lechera


Normal 9 8 7 6
Mean StDev N 14,11 1,369 50

Frequency

5 4 3 2 1 0 11 12 13 14 15 Added water_Lechera 16 17

Grafico 9.- Histograma de frecuencia de % Agua aadida_Lechera

Boxplot of Added water_Lechera


18 17 16 15 14 13 12 11

Added water_Lechera

Grafico 10.- Diagrama de cajas del % Agua aadida_Lechera 40

Escuela Superior Politcnica Del Litoral

Histogram of Ph_Lechera
Normal 7 6 5
Mean StDev N 6,404 0,2894 49

Frequency

4 3 2 1 0

5,8

6,0

6,2

6,4 6,6 Ph_Lechera

6,8

7,0

Grafico 11.- Histograma de frecuencia de PH_Lechera

Boxplot of Ph_Lechera
7,2 7,0 6,8
Ph_Lechera

6,6 6,4 6,2 6,0

Grafico 12.- Diagrama de cajas del PH_Lechera 41

Escuela Superior Politcnica Del Litoral

Histograma de Marca de Leche


90 80 70 60

Frecuencia

50 40 30 20 10 0 0 Marca de Leche 1

Grafico 13.- Histograma de frecuencia de Variable cualitativa

Grfica de caja de Marca de Leche


1,0

0,8
Marca de Leche

0,6

0,4

0,2

0,0

Grafico 14.- Diagrama de Cajas de Variable cualitativa 42

Escuela Superior Politcnica Del Litoral

Bibliografa
Probabilidad y estadstica aplicada a la ingeniera Montgomery & Runger da edicin. Probabilidad y estadstica, fundamentos y aplicaciones, ediciones del instituto de ciencias matemticas - Zurita Gaudencio. http://www.dspace.espol.edu.ec/bitstream/123456789/8673/1/D-39834.pdf http://www.dspace.espol.edu.ec/bitstream/123456789/7574/2/Tesis%20Determinaci on%20de%20los%20Costos%20de%20Calidad%20en%20el%20Proceso%20Producti vo%20de%20la%20Leche.pdf http://es.scribd.com/doc/57462344/53176942-Carac-Fisico-Quimicas-de-La-LecheModulo1 http://bibdigital.epn.edu.ec/bitstream/15000/1717/1/CD-2330.pdf

43

También podría gustarte