Está en la página 1de 40

UNIVERSIDAD NACIONAL ABIERTA VICERRECTORADO ACADMICO REA DE MATEMTICA

TRABAJO PRCTICO DE Estadstica General CODIGO 738 OBJETIVO 1. LAPSO 2013-2

Prof. Trino Vivas Asignatura: Estadstica General

MARACAY, DICIEMBRE 2013.

FORMULACIN DEL PROBLEMA.

CASO DE ESTUDIO:

Un grupo de trabajadores pone en marcha un proyecto pisccola, el mismo est conformado por diez (10) estanques cada uno de 500 m2 de superficie para una capacidad de 750 m3 de agua. Se siembra alevines de Cachama Blanca (Piaractus Brachipomus) la cual es la especie con mayor demanda en el mercado local y regional. Esta siembra se hace a razn de dos alevines por cada m2 de superficie. Se planifica que el proyecto tenga una duracin aproximada de ocho meses (240 das).

VARIABLES DEL ESTUDIO:

X1 : Tasa de mortalidad (en porcentajes). X2 : Numero de identicacion de estanque. X3 : Tiempo desde el inicio de la siembra (en das ). X4 : Cantidad de alimento suministrado (en gramos). X5 : Nivel de oxigeno del agua (medido en ppm). X6 : Temperatura del agua (medida en grados centgrados). X7 : Ph del agua. X8 : Peso promedio (en gramos). X9 : Etapa de crecimiento.

OBJETIVO 8 8.1 Determine si las variables X7 y X8 siguen una distribucin normal. Tome en cuenta las siguientes indicaciones: Aplicar la prueba Chi-cuadrado (paramtrica) explicada en el material instruccional. Tomar como nivel de significacin = 0;01 y aplicar Sturges. Evitar el construir clases vacas. Calcular y expresar los resultados con cuatro cifras significativas. 8.2 Determine el correcto manejo del agua, investigando si existe una diferencia significativa entre la concentracin de oxigeno (X5) respecto a los tanques (X2), considerando las siguientes pautas: Categorizacin de la concentracin de oxigeno: X5 4 baja y X5 5 adecuada a ptima. Nivel de significacin = 0,01. Calcular y expresar resultados con cuatro cifras significativas

MARCO TEORICO PRUEBA CHI-CUADRDADO. PRUEBAS DE BONDAD DE AJUSTE Estas pruebas permiten verificar que la poblacin de la cual proviene una muestra tiene una distribucin especificada o supuesta. Sea X: variable aleatoria poblacional f0(x) la distribucin (o densidad) de probabilidad especificada o supuesta para X Se desea probar la hiptesis: Ho: f(x) = f0(x) En contraste con la hiptesis alterna: Ha: f(x) no= f0(x) (negacin de Ho) PRUEBA JI-CUADRADO Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea una muestra aleatoria de tamao n tomada de una poblacin con una distribucin especificada f0(x) que es de inters verificar. Suponer que las observaciones de la muestra estn agrupadas en k clases, siendo oi la cantidad de observaciones en cada clase i = 1, 2, ..., k Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que segn el modelo especificado deberan estar incluidos en la clase i: Ei = pi* n, i = 1, 2, ..., k Tenemos entonces dos valores de frecuencia para cada clase i oi: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto) La teora estadstica demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste:

Definicin Estadstico para la prueba de bondad de ajuste Ji-cuadrado 2 = ( Oi Ei)2/Ei; distribucin Ji-cuadrado con =kr1 grados de libertad donde r es la cantidad de parmetros de la distribucin que deben estimarse a partir de la muestra Es una condicin necesaria para aplicar esta prueba que i, ei 5

Dado un nivel de significancia se define un valor crtico 2 para el rechazo de la hiptesis propuesta Ho: f(x) = f0(x). Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto, entonces el valor de estadstico de prueba ser cercano a cero, pero si 2 estas diferencias son significativas, entonces el valor del estadstico 2 estar en la regin de rechazo de Ho rechazo 2 > 2

PRESENTACIN DE LOS RESULTADOS DE LA VARIABLE X7.


Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta 6,975 0,015666786 7 7 0,17162104 0,029453782 0,864262732 0,031698737 1,1 6,4 7,5 837 120

K= Sturges n= tamao de la muestra

Formula de Sturges. K 1 3,322 log10 ( n) K 1 3,322 log10 (120) 7,90704 8 Intervalo de Clase. R I K 1,1 I 0,1375 0, 2 8

I= Intervalo de Clase R= Rango K= Sturges

Tabla 1 de Distribucin de Frecuencia con Ji cuadrado.


Frecuencia observada Oi 1 27 53 33 5 1 120 Frecuencia Oi Ei 2 X Esperada Ei Ei=n*P(z) 2 17 48 42 11 1
2

clase

F(z)

P(z)

6,4 - 6,6 6,6 - 6,8 6,8 - 7 7 - 7,2 7,2 - 7,4 7,4 - 7,8 Total

-2,19 -1,02 0,15 1,31 2,48 4,81

0,014443 0,153938 0,557909 0,905076 0,993364 0,999999

0,014443 0,139495 0,403971 0,347167 0,088288 0,006635 1,00000

Como la Frecuencia esperada no pueden tener valores inferiores a 5, debemos agruparlas para que cumplan la condicin necesaria para aplicar esta prueba que i, ei 5.

Tabla 2 de Distribucin Ji cuadrado.


2 Frecuencia Frecuencia Oi Ei observada Esperada X 2 Ei Oi Ei=n*P(z)

clase

6,4 - 6,8 6,8 - 7 7 - 7,2 7,2 - 7,8 Total

28 53 33 6 120

19 48 42 12

4,26 0,52 1,93 3,00 2 = 9,7126

Prueba De Hiptesis Para La Prueba De Bondad De Ajuste Para El Ph Del Agua (Variable X7) 1) Formulacin de la Hiptesis. H0= la distribucin del PH del agua se Distribuye en forma Normal. H1= la distribucin del PH del agua no se Distribuye en forma Normal. 2) Nivel de Significacin. = 0.01 Clculo del valor de Ji- Cuadrado Critico 2 segn sea el grado de libertad encontrado y el nivel de significacin de = 0.01. Grado de Libertad o valor crtico para Bondad de Ajuste: Grado de Libertad = N de clase r 1 N de clase = 4 Tomamos r = 2 debido a que no se dio a conocer lo valores de los parmetros y , y se debi realizar su estimacin basado en la media aritmtica y desviacin tpica de la muestra. Calculo de los grado de libertad: Grado de libertad: gl = 4 2 1= 1 Entonces el Valor Critico es 2 = 6.6348966

3) Estadstica de Prueba. 2 = ( Oi Ei)2/Ei = 9,7126 4) Regla de Decisin. Si 2 > 2 , Se rechaza la H0 ; en caso contrario se acepta H0 Entonces como el valor del estadstico 2 = 9,7126 > 2 = 6.6348966 que el Valor Critico, se debe rechazar la H0. Entonces se concluye que la distribucin del PH del agua no se Distribuye en forma Normal.

PRESENTACIN DE LOS RESULTADOS DE LA VARIABLE X8. (Peso promedio en gramos)


X8 Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta 240,82025 13,4455763 237,845 24,8 147,288908 21694,0225 -1,27025568 0,07614174 457,43 23,29 480,72 28898,43 120

Formula de Sturges. K= Sturges n= tamao de la muestra Intervalo de Clase. I= Intervalo de Clase R= Rango K= Sturges

K 1 3,322 log10 ( n) K 1 3,322 log10 (120) 7,90704 8

R K 457, 43 I 57,17875 57, 2 8 I

Tabla 3 de Distribucin con Ji cuadrado.


Frecuencia observada Oi 20 20 10 10 20 10 10 20 120 Frecuencia Esperada Ei=n*P(z) 17 12 16 18 18 15 11 7
2

Clase 23,29 80,49

Z -1,09 -0,70 -0,31 0,08 0,46 0,85 1,24 1,63

F(z) 0,13817782 0,24190427 0,3775819 0,53049515 0,67898664 0,80323117 0,8928027 0,94844124

P(z) 0,1382 0,1037 0,1357 0,1529 0,1485 0,1242 0,0896 0,0556 1

Oi Ei
Ei
0,7048 4,5830 2,4233 3,7993 0,2670 1,6165 0,0521 26,5871

80,49 - 137,69 137,69 - 194,89 194,89 - 252,09 252,09 - 309,29 309,29 - 366,49 366,49 - 423,69 423,69 - 480,89 Total

= 40,0332

PRUEBA DE HIPOTESIS PARA LA PRUEBA DE BONDAD DE AJUSTE PARA EL PESO PROMEDIO (gramos) 1) Formulacin de la Hiptesis. H0= la distribucin del peso promedio de los peces (gr.) se Distribuye en forma Normal. H1= la distribucin del peso promedio de los peces (gr.) no se Distribuye en forma Normal. 2) Nivel de Significacin. = 0.01 Clculo del valor de Ji- Cuadrado Critico 2 segn sea el grado de libertad encontrado y el nivel de significacin de = 0.01. Grado de Libertad o valor crtico para Bondad de Ajuste: Grado de Libertad = N de clase r 1 N de clase = 8 Tomamos r = 2 debido a que no se dio a conocer lo valores de los parmetros y , y se debi realizar su estimacin basado en la media aritmtica y desviacin tpica de la muestra. Calculo de los grado de libertad: Grado de libertad: gl = 8 2 1= 5 Entonces el Valor Critico es 2 = 15.0863 3) Estadstica de Prueba. 2 = ( Oi Ei)2/Ei = 40.0332 4) Regla de Decisin. Si 2 > 2 , Se rechaza la H0 ; en caso contrario se acepta H0 Entonces como el valor del estadstico 2 = 40.0332 > 2 =15.0863 que el Valor Critico, se debe rechazar la H0. Entonces se concluye que la distribucin del peso promedio de los peces (gr.) no se Distribuye en forma Normal.

OBJETIVO 9 Anlisis de Regresin Mltiple Introduccin El Anlisis de Regresin Lineal Mltiple nos permite establecer la relacin que se produce entre una variable dependiente Y y un conjunto de variables independientes (X1, X2, ... XK). El anlisis de regresin lineal mltiple, a diferencia del simple, se aproxima ms a situaciones de anlisis real puesto que los fenmenos, hechos y procesos sociales, por definicin, son complejos y, en consecuencia, deben ser explicados en la medida de lo posible por la serie de variables que, directa e indirectamente, participan en su concrecin. Al aplicar el anlisis de regresin mltiple lo ms frecuente es que tanto la variable dependiente como las independientes sean variables continuas medidas en escala de intervalo o razn. No obstante, caben otras posibilidades: (1) tambin podremos aplicar este anlisis cuando relacionemos una variable dependiente continua con un conjunto de variables categricas; (2) o bien, tambin aplicaremos el anlisis de regresin lineal mltiple en el caso de que relacionemos una variable dependiente nominal con un conjunto de variables continuas. La anotacin matemtica del modelo o ecuacin de regresin lineal mltiple es la que sigue: Y = a + b1x1 + b2x2 + ... + bnxn + e presente = a + b1pasado + b2futuro + e

en donde: Y es la variable a predecir; a, b1x1, b2x2... bnxn, son parmetros desconocidos a estimar; y e es el error que cometemos en la prediccin de los par- metros. Al ocuparnos del anlisis lineal bivariado, anlisis de regresin simple, vimos como el modelo final resultante poda ser calificado de un buen modelo. Sin embargo, en muchas ocasiones los modelos bivariados o simples pueden verse mejorados al introducir una segunda (tercera, cuarta,...) variable independiente o explicativa. Consideramos que un modelo de regresin lineal simple se ha mejorado cuando al introducir en el mismo ms variables independientes la proporcin de variabilidad explicada se incrementa. Pero qu variables son las que mejor explican el hecho, proceso o fenmeno social objeto de estudio?; o, qu variables no son necesario incluir en el modelo dada su nula o escasa capacidad explicativa? Esta es, sin lugar a dudas, la decisin ms importante ligada al anlisis de regresin mltiple y la inclusin de este proceso es lo que diferencia, sustancialmente, al anlisis de regresin mltiple del de regresin simple.

La exposicin de este captulo se estructura en torno a los siguientes puntos, a saber: 1. Determinacin de la bondad de ajuste de los datos al modelo de regresin lineal mltiple. 2. Eleccin del modelo que con el menor nmero de variables explica ms la variable dependiente o criterio. Para ello exponemos el proceso de paso a paso o stepwise. 3. Estimacin de los parmetros de la ecuacin y del modelo o ecuacin predictiva. 4. Exposicin de los pasos y Cuadro de Dilogo del Anlisis de Regresin Lineal (Mltiple) que podemos seguir para la obtencin de los estadsticos y las pruebas necesarias citadas en cada uno de los puntos precedentes. Eleccin del modelo: el mtodo stepwise o paso a paso En el anlisis de regresin mltiple, los estadsticos, pruebas y anlisis que se aplican para determinar la relacin y grado de asociacin entre una variable dependiente y sus supuestas variables explicativas, as como la estimacin de los parmetros de la ecuacin, no difieren de los determinados en el anlisis de regresin simple. De hecho, una parte del anlisis de regresin bivariado se realiza aplicando el cuadro de dilogo especfico del anlisis de regresin mltiple. La diferencia estriba, pues, en que mientras en el anlisis de regresin simple al contar exclusivamente con la relacin de un par de variables el proceso se resolva en un solo paso; en el anlisis de regresin mltiple es necesario calcular estadsticos, pruebas y anlisis a medida que vamos introduciendo y/o sacando variables independientes en el modelo. En el anlisis de regresin lineal mltiple la construccin de su correspondiente ecuacin se realiza seleccionando las variables una a una, paso a paso. La finalidad perseguida es buscar de entre todas las posibles variables explicativas aquellas que ms y mejor expliquen a la variable dependiente sin que ninguna de ellas sea combinacin lineal de las restantes. Este procedimiento implica que: (1) en cada paso solo se introduce aquella variable que cumple unos criterios de entrada; (2) una vez introducida, en cada paso se valora si alguna de las variables cumplen criterios de salida; y (3), en cada paso se valora la bondad de ajuste de los datos al modelo de regresin lineal y se calculan los parmetros del modelo verificado en dicho paso. El proceso se inicia sin ninguna variable independiente en la ecuacin de regresin y el proceso concluye cuando no queda ninguna variable fuera de la ecuacin que satisfaga el criterio de seleccin (garantiza que las variables seleccionadas son significativas) y/o el criterio de eliminacin (garantizar que una variable seleccionada no es redundante). 1.- Verificacin de los criterios de probabilidad de entrada. El p-valor asociado al estadstico T, o probabilidad de entrada, nos indica si la informacin proporcionada por cada una de las variables es redundante. Si ste es menor que un determinado valor crtico, la variable ser seleccionada.

El criterio de tolerancia puede ser aplicado como un criterio adicional a la probabilidad de entrada. ste nos ayuda a identificar si alguna de las variables del modelo es una combinacin lineal de las restantes. Si dicho valor es prximo a 0, la variable analizada ser una combinacin lineal de las restantes variables independientes introducidas. Si el valor de la tolerancia se aproxima a 1 puede reducir la parte de la variabilidad de Y no explicada por las restantes. En sntesis, si la tolerancia para una variable es muy pequea se excluir del modelo. 2.- Verificacin del criterio de probabilidad de salida. En este caso, si el p-valor asociado al estadstico T, o probabilidad de salida, es mayor que un determinado valor crtico, la variable ser eliminada. La probabilidad de salida (ntese que con la finalidad de que una variable no pueda entrar y salir de la ecuacin en dos pasos consecutivos, el valor crtico de la probabilidad de salida debe ser mayor que el de la probabilidad de entrada). En el caso prctico que recogemos en los resultados puede apreciarse que las dos variables independientes han superado los criterios de entrada y de salida. 3.- Lmite al nmero de pasos. Por ltimo, y para evitar que el proceso de seleccin se convierta en un proceso cclico se debe establecer un nmero lmite de pasos. Normalmente este lmite es el que equivale al doble del nmero de variables independientes.

Bondad de ajuste de los datos al modelo de regresin lineal mltiple


En cada paso, en el que se introduce o elimina una variable, se obtienen los estadsticos de bondad de ajuste (R, R2, R2 corregido, error tpico de la estimacin), el anlisis de varianza y la estimacin de parmetros considerando las variables introducidas. El SPSS ofrece dos tablas con esta informacin: en la primera resume los estadsticos de bondad de ajuste y en la segunda nos presenta el anlisis de varianza. En ellas se comparan los resultados obtenidos para cada una de las ecuaciones o modelo obtenidos con la secuencia de pasos utilizados. En nuestro ejemplo, y dado que dos han sido las variables incluidas en la ecuacin, dos han sido los pasos, dos son los modelos definidos: el primero slo incluye una variable explicativa, mientras que el segundo utiliza las dos variables independientes. A continuacin exponemos los principales elementos a considerar en el anlisis de regresin mltiple. Recordemos que stos ya se expusieron en el captulo de regresin simple. Aqu enfatizamos aquellos aspectos que debemos considerar cuando stos son aplicados en el anlisis de regresin mltiple.

1.- Coeficiente de Correlacin Mltiple (Mltiple R). Mide la intensidad de la relacin entre un conjunto de variables independientes y una variable dependiente. La primera variable que se introducir en el modelo, primer paso, ser aquella que ofrezca una correlacin parcial ms alta. Para ello es necesario calcular la matriz de correlaciones parciales.

Para determinar si la asociacin es estadsticamente significativa podemos contrastar la H0 de que el coeficiente de correlacin lineal es igual a 0; o lo que es lo mismo, que las dos variables estn incorrelacionadas. Si el p-valor asociado al estadstico de contraste (r) es menor que el nivel de significacin elegido (normalmente 0.05) rechazaremos H0.

Anlisis de Varianza.
La tabla de anlisis de varianza que incluye en su salida de resultados que nos permite valorar hasta qu punto es adecuado el modelo de regresin lineal para estimar los valores de la variable dependiente. La tabla de anlisis de varianza se basa en que la variabilidad total de la muestra puede descomponerse entre la variabilidad explicada por la regresin y la variabilidad residual. La tabla de ANOVA proporciona el estadstico F a partir del cual podemos contrastar la H0 de que R2 es igual a 0, la pendiente de la recta de regresin es igual a 0, o lo que es lo mismo, la hiptesis de que las dos variables estn incorrelacionadas. Si el p-valor asociado al estadstico F es menor que el nivel de significacin (normalmente 0.05), rechazaremos la hiptesis nula planteada. Del mismo modo podremos considerar que los resultados obtenidos con la muestra son generalizables a la poblacin a la que pertenece la muestra. En el caso de anlisis de regresin mltiple la tabla del anlisis de varianza nos indica los p-valores asociados al estadstico F en cada uno de los modelos generados.

Anlisis de Residuales.
Como ya hemos comentado los residuos, e, son la estimacin de los verdaderos errores. En regresin lineal la distribucin de la variable formada por los residuos debe ser Normal, esto es, los residuos observados y los esperados bajo hiptesis de distribucin normal deben ser parecidos. Adems, los residuos deben ser independientes. En consecuencia, el anlisis de los residuales nos va a permitir no solo profundizar en la relacin que se produce entre las variables, sino tambin, ponderar la bondad de ajuste de la regresin obtenida.

PRESENTACIN DE LOS ANALISIS ESTADSTICO. 9.1 Obtener los siguientes modelos de regresin lineal mltiple, Modelo 1: X1 = b0 + b1X3 + b2X4 + b3X5 + b4X6 + b5X7 + b6X8 Modelo 2: X8 = b0 + b1X3 + b2X4 + b3X5 + b4X6 + b5X7 PRESENTACIN DEL MODELO 1, OBTENIDO POR EXCEL
Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones

0.19218534 0.03693521 -0.01420098 0.65273566 120

ANLISIS DE VARIANZA Grados de libertad Regresi n 6 Residuos 113 Total 119

Suma de cuadrados 1.84645248 48.1452142 49.9916667

Promedio de los cuadrados 0.30774208 0.42606384

F 0.722291

Valor crtico de F 0.63247534

Coeficientes Intercepcin X3 X4 X5 X6 X7 X8 0.5142318 -0.00917479 -9.8385E-06 0.03324357 0.07840421 -0.12124632 0.00500297

Error tpico 4.49395009 0.02101834 1.8442E-05 0.03521337 0.12757945 0.3574292 0.00972176

Estadstico t 0.11442757 -0.43651375 -0.5334954 0.94406105 0.61455203 -0.33921773 0.51461603

Probabilidad 0.90910193 0.66329694 0.59473851 0.34715261 0.54008605 0.73507531 0.60782645

Inferior 95% -8.38909386 -0.05081591 -4.6375E-05 -0.03652047 -0.17435369 -0.82937804 -0.01425758

Superior 95% 9.41755745 0.03246632 2.6698E-05 0.10300761 0.33116211 0.58688539 0.02426352

Inferior 90.0% -6.9387607 -0.04403266 -4.0423E-05 -0.02515605 -0.13317996 -0.71402486 -0.01112008

Superior 90.0% 7.9672243 0.02568307 2.0746E-05 0.0916432 0.28998838 0.47153222 0.02112602

Construccin del Modelo 1: X1 = b0 + b1X3 + b2X4 + b3X5 + b4X6 + b5X7 + b6X8 Valores de los coeficientes estimados de la variables presente del modelo:
Coeficientes(bi) Intercepcin X3 X4 X5 X6 X7 X8

b0 =0.5142318 b1 =-0.00917479 b2 =-9.8385E-06 b3 =0.03324357 b4 =0.07840421 b5 =-0.12124632 b6 =0.00500297

Modelo 1: X1 = 0.5142318 - 0.00917479X3 - 9.8385E-06X4 + 0.03324357X5 + 0.07840421X6 -0.12124632X7 + 0.00500297X8

MODELO 2
Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.99912651 Coeficiente de determinacin R^2 0.99825378 R^2 ajustado 0.99817719 Error tpico 6.28840022 Observaciones 120 ANLISIS DE VARIANZA Grados de libertad Regresi n 5 Residuos 114 Total 119

Suma de cuadrados 2577080.67 4508.01341 2581588.68

Promedio de los cuadrados 515416.134 39.5439773

F 13033.998 3

Valor crtico de F 2.103E-155

Coeficientes Intercepcin X3 X4 X5 X6 X7 -5.74002126 2.15874685 -0.00026255 -0.46892886 -0.1727397 -0.5435341

Error tpico 43.2909976 0.01108643 0.00017595 0.33638769 1.22898317 3.44306644

Estadstico t -0.13259157 194.719813 -1.49214631 -1.39401314 -0.14055497 -0.15786338

Probabilidad 0.89475015 1.121E-145 0.13842302 0.16602488 0.88846957 0.87484374

Inferior 95% -91.4991542 2.13678473 -0.00061112 -1.13531027 -2.60734589 -7.36422219

Superior 95% 80.0191116 2.18070898 8.6015E-05 0.19745256 2.26186649 6.277154

Inferior 90.0% -77.53078 2.1403619 -0.00055434 -1.02677064 -2.21079932 -6.25327436

Superior 90.0% 66.0507375 2.17713181 2.9241E-05 0.08891293 1.86531992 5.16620617

Modelo 2: X8 = b0 + b1X3 + b2X4 + b3X5 + b4X6 + b5X7


Coeficientes Intercepcin X3 X4 X5 X6 X7

b0 =-5.74002126 b1 =2.15874685 b2 =-0.00026255 b3 =-0.46892886 b4 =-0.1727397 b5 =-0.5435341

Modelo 2: X8 = -5.74002126 - 2.15874685X3 -0.00026255X4 -0.46892886X5 -0.1727397X6 0.5435341X7

--

9.2 A ambos modelos aplicar, en caso de ser necesario, el procedimiento de regresin eliminacin hacia atrs. De usar el mtodo aqu mencionado interpretar en cada paso los resultados arrojados por el programa; coeficientes, estadsticos, etc. Nota: considere un nivel de confianza de 90 %.justifique, usando argumentos estadsticos cuando parar el proceso. Interprete los modelos obtenidos en relacin al caso de estudio. Para mayor claridad inserte una impresin de pantalla al reporte, de manera que facilite el seguimiento de las explicaciones dadas. ELIMINACIN DEL TERMINO INDEPENDIENTE (b0)
Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 6 114 120 Suma de cuadrados 438.8492071 48.15079293 487 Promedio de los cuadrados F 73.14153451 173.167137 0.422375377 Valor crtico de F 1.4607E-54

0.949277481 0.901127735 0.888019303 0.649904129 120

Coeficientes Intercepcin X3 X4 X5 X6 X7 X8 0 -0.00919027 -9.30208E-06 0.033656847 0.090651635 -0.093437762 0.004989158

Error tpico Estadstico t #N/A #N/A 0.020926728 -0.439164195 1.77584E-05 -0.523811929 0.034875718 0.965051014 0.069129676 1.311327348 0.260960977 -0.358052619 0.009678838 0.515470788

Probabilidad #N/A 0.66137385 0.60142622 0.33656201 0.19238224 0.72096606 0.60722227

ELIMINACIN DE LA VARIABLE (X7)

Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.94921891 Coeficiente de determinacin R^2 0.90101655 R^2 ajustado 0.88887799 Error tpico 0.64743603 Observaciones 120 ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 5 115 120 Suma de cuadrados 438.7950578 48.20494216 487 Promedio de los cuadrados F 87.75901157 209.362067 0.41917341 Valor crtico de F 1.0242E-55

Coeficientes Intercepcin X3 X4 X5 X6 X8 0 -0.00938627 -1.0307E-05 0.03197739 0.06618962 0.00509894 Coeficientes

Error tpico Estadstico t #N/A #N/A 0.020840122 -0.450394323 1.74689E-05 -0.58999666 0.034427616 0.928829721 0.010511919 6.296626323 0.009637242 0.529086585 Error tpico Estadstico t

Probabilidad #N/A 0.653274097 0.556350393 0.354922837 5.74037E-09 0.597765163 Probabilidad

ELIMINACIN DE LA VARIABLE (X3)


Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.94912694 Coeficiente de determinacin R^2 0.90084194 R^2 ajustado 0.88965682 Error tpico 0.64520762 Observaciones 120

ANLISIS DE VARIANZA Grados de libertad Grados de libertad Regresin Residuos 4 116 Suma de cuadrados Suma de cuadrados 438.710026 48.2899736 Promedio de los cuadrados F Promedio de los cuadrados F 109.6775066 263.4623674 0.416292876 Valor crtico de F Valor crtico de F 6.56134E-57

Coeficientes Intercepcin 0 X4 -1.174E-05 X5 0.02991696 X6 0.06383012 X8 0.00076405

Error tpico #N/A 1.7117E-05 0.03400487 0.00908214 0.0004911

Estadstico t #N/A -0.685850749 0.87978445 7.028096061 1.555795707

Probabilidad #N/A 0.494175708 0.380795067 1.53935E-10 0.122480835

ELIMINACIN DE LA VARIABLE (X4)


Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.94891509 Coeficiente de determinacin R^2 0.90043985 R^2 ajustado 0.89019096 Error tpico 0.64374568 Observaciones 120

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 3 117 120 Suma de cuadrados 438.514206 48.4857941 487 Promedio de los cuadrados F 146.171402 352.7229849 0.4144085 Valor crtico de F 4.06411E-58

Estadstico Coeficientes Error tpico t Intercepcin 0 #N/A #N/A X5 0.02616612 0.03348617 0.78140081 X6 0.06225328 0.0087664 7.10134636 X8 0.00057275 0.00040329 1.42020561

Probabilidad #N/A 0.436145116 1.03314E-10 0.158207104

ELIMINACIN DE LA VARIABLE (X4)


Estadsticas de la regresin Coeficiente de correlacin mltiple 0.94891509 Coeficiente de determinacin R^2 0.90043985 R^2 ajustado 0.89019096 Error tpico 0.64374568 Observaciones 120

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 3 117 120 Suma de cuadrados 438.514206 48.4857941 487 Promedio de los cuadrados F 146.171402 352.7229849 0.4144085 Valor crtico de F 4.06411E-58

Coeficientes Error tpico Intercepcin 0 #N/A X5 0.02616612 0.03348617 X6 0.06225328 0.0087664 X8 0.00057275 0.00040329

Estadstico t #N/A 0.78140081 7.10134636 1.42020561

Probabilidad #N/A 0.436145116 1.03314E-10 0.158207104

Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones

0.94864128 0.89992027 0.89059756 0.64268258 120

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 2 118 120 Suma de cuadrados 438.261173 48.7388267 487 Promedio de los cuadrados 219.130587 0.4130409 F 530.52999 Valor crtico de F 2.11631E-59

Intercepcin X6 X8

Estadstico Coeficientes Error tpico t Probabilidad 0 #N/A #N/A #N/A 0.06818719 0.00437248 15.5946289 1.9217E-30 0.00057522 0.00040261 1.42873536 0.15572207

Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico Observaciones

0.94772833 0.89818899 0.88978563 0.64548829 120

ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total 1 119 120 Suma de cuadrados 437.418039 49.5819608 487 Promedio de los cuadrados 437.418039 0.41665513 F 1049.83236 Valor crtico de F 1.42361E-60

Intercepcin X6

Estadstico Coeficientes Error tpico t Probabilidad 0 #N/A #N/A #N/A 0.07353541 0.00226953 32.4011166 7.0787E-61

Modelo 1: X1= 0,07840421X6

MODELO 2
Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.99976345 Coeficiente de determinacin R^2 0.99952696 R^2 ajustado 0.99089404 Error tpico 6.23756509 Observaciones 120

ANLISIS DE VARIANZA Grados de libertad Regresi n 4 Residuos 116 Total 120

Suma de cuadrados 9536402.58 4513.23732 9540915.82

Promedio de los cuadrados

Valor F crtico de F 61276.563 2384100.65 8 2.278E-190 38.9072183

Coeficientes Intercepcin 0 X3 2.159628 X4 -0.00027804 X5 -0.48945727 X6 -0.53362918

Error tpico #N/A 0.0102668 0.00016631 0.32855649 0.08832724

Estadstico t Probabilidad Inferior 95% #N/A #N/A #N/A 210.350659 1.204E-151 2.13929331 -1.67184062 0.09725119 -0.00060743 -1.48972031 0.13901176 -1.1402048 -6.04150187 1.8933E-08 -0.7085724

Superior Inferior Superior 95% 90.0% 90.0% #N/A #N/A #N/A 2.17996269 2.14260466 2.17665133 5.1353E-05 -0.00055379 -2.2859E-06 0.16129025 -1.03423539 0.05532084 -0.35868595 -0.6800842 -0.38717416

Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.99975893 Coeficiente de determinacin R^2 0.99951791 R^2 ajustado 0.99096266 Error tpico 6.26998195 Observaciones 120

ANLISIS DE VARIANZA Grados de libertad Regresi n 3 Residuos 117 Total 120

Suma de cuadrados 9536316.24 4599.58281 9540915.82

Promedio de los cuadrados 3178772.08 39.3126736

Valor F crtico de F 80858.710 1 2.199E-192

Coeficientes Intercepcin X3 X4 X6 0 2.16082177 -0.0003169 -0.6366743

Error tpico #N/A 0.01028867 0.0001651 0.05521363

Estadstico t #N/A 210.019489 -1.9194239 -11.531107

Probabilidad #N/A 1.215E-152 0.05736602 5.1716E-21

Modelo 2: X8= 2.16082177X3 -0.0003169X4--0.6366743X6

Basado en el resultado anterior, presentamos una tabla comparativa de las estadsticas ms importantes para establecer la seleccin del mejor modelo obtenido:

Coeficiente de correlacin mltiple R2 ajustado Valor crtico de F Modelo

Modelo 1 0,947728333 0,889785631 1,42361E-60 X1= 0,07840421X6

Modelo 2 0,999758926 0,99096266 2,1988E-192

X8= 2.16082177X3 -0.0003169X4-0.6366743X6

Anlisis: los clculos realizados anteriormente en los cuadro anterior, nos muestran el valor del coeficiente de correlacin, de la confiabilidad del modelo y se detecta que el mejor de los dos planteado anteriormente es la segunda opcin (2) ya que posee un valor de confiabilidad mejor que el anterior (1). Por otro lado al evaluar el resultado del coeficiente que determina a R2 Ajustado que mide el porcentaje de variacin de un modelo que es explicado por las variables independientes presente en el modelo, el modelo que se ajusta mas es el modelo uno. Finalmente el modelo numero dos conservo tres variables de las cinco variables propuestas del modelo original en comparacin con el modelo uno que de seis variables conservo una. En conclusin el modelo 2 es el mejor. Ya que conservo tres variable de las cinco variables propuestas en comparacin con el modelo 1 que solo conservo 1 de 6 variable propuestas

9.4 Realizar, usando el resultado anterior, un anlisis de residuos. Anlisis grafico de los residuos:

X3 Grfico de los residuales


60 Residuos 40 20 0 -20 0 50 100 X3 150 200 250

Al analizarlos los residuos de la variable X3 con respecto a la variable X8 , sigue un patrn al eje de coordenada (x), donde hay un leve movimiento que toma la forma de ondas alrededor de esta lnea. Esto es indicativo que el modelo ajustado no el ms ptimo para que la variable X3 explique la variaciones que se producen en la variable X8.

X4 Grfico de los residuales


60 Residuos 40 20 0 -20 0 5000 10000 X4 15000 20000

Al realizar el estudio del comportamiento de los residuos de la variable X4 con respecto a X8 , el grafico muestra un ajuste adecuada a un modelo de ajuste de tipo lineal., Ya que la variacin de sus datos con el eje de coordenada( x) no sufre ninguna variacin

X6 Grfico de los residuales


60 Residuos 40 20 0 -20 24 24.5 25 25.5 26 X6 26.5 27 27.5 28

Al analizar el estudio del comportamiento de los residuos de la variable X6 con respecto a X8, el grafico muestra que el movimiento de los puntos alrededor de la lnea cero no exhibe ningn patrn, lo que significa que la relacin entre estas dos variables se muestra muy adecuada a un modelo de ajuste de tipo lineal.

OBJETIVO 10. 10.1 Establezca si la tasa de mortalidad observada durante el tiempo del proceso difiere significativamente en los tanques. Utilizar un anlisis de varianza de una va con un nivel de contabilidad del 95 %. 10.2 El supervisor del proyecto asignado por el MPPAT planifica seis visitas programadas de la siguiente manera, Visita 1 2 3 4 5 6 da 35 80 115 160 200 240 considerando estos bloques de tiempo (x3), establezca si existe una diferencia significativa entre los tanques (x2) respecto a la cantidad de alimento suministrado(x4). Utilizar un anlisis de varianza de dos vas con un nivel de confianza del 95 %. Elaborado. ESTUDIO SOBRE LA TASA DE MORTALIDAD EN LOS TANQUES.
TANQUE 1 1 3 2 1 2 1 2 1 2 1 3 3 TANQUE 2 2 2 3 2 1 2 2 3 2 1 3 3 TANQUE 3 2 2 2 2 2 2 1 2 2 2 2 2 TANQUE 4 1 2 2 2 2 3 1 2 2 2 1 2 TANQUE 5 2 2 2 2 2 2 1 1 2 2 2 2 TANQUE 6 1 3 2 2 2 2 0 1 3 1 2 2 TANQUE 7 2 1 1 2 2 1 2 2 3 3 3 2 TANQUE 8 2 2 1 1 2 2 3 2 2 2 3 2 TANQUE 9 2 1 2 2 3 1 3 2 2 2 2 2 TANQUE 10 2 1 3 1 2 2 3 1 1 2 2 1

PRESENTACIN DE LOS RESULTADOS OBTENIDO CON EXCEL. Anlisis de varianza de un factor


RESUMEN Grupos TANQUE 1 TANQUE 2 TANQUE 3 TANQUE 4 TANQUE 5 TANQUE 6 TANQUE 7 TANQUE 8 TANQUE 9 TANQUE 10

Cuenta 12 12 12 12 12 12 12 12 12 12

Suma 22 26 23 22 22 21 24 24 24 21

Promedio 1.83333333 2.16666667 1.91666667 1.83333333 1.83333333 1.75 2 2 2 1.75

Varianza 0.6969697 0.51515152 0.08333333 0.33333333 0.15151515 0.75 0.54545455 0.36363636 0.36363636 0.56818182

ANLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total Suma de Grados de cuadrados libertad
1.90833333 48.0833333 49.9916667 9 110 119

Promedio de los cuadrados


CMT=0.21203704 CME=0.43712121

F
0.48507606

Probabilidad
0.88196812

Valor crtico para F


1.96605372

PRUEBA ESTADISTICA PARA LA DIFERENCIAS DE MEDIAS DE LA LA PROMEDIO DE MORTALIDAD EN LOS TANQUE. Con los resultados del cuanto 3, del anlisis de varianza, se permite probar las hiptesis siguientes: I. Formulacin de la hiptesis. H0: 1= 2= 3= 4= 5= 6= 7= 8= 9= 10 H1: Al menos una es diferente: ij II. III. Nivel de significancia: =5% Valor crtico: Valor crtico = valor a partir del cual se rechaza H0., proviene de una tabla de probabilidad de la distribucin de la variable. es El nivel de significacin . 1 - es el nivel de confianza , que es la probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza. F=1.96605372 IV. V. Estadstico de prueba: FC = CMT/CME=6,969632 Regla de Decisin Estadstica: Se rechaza H0, si FC F No se rechaza H0, si Fc < F VI. Decisin Estadstica: Como Fc = 0.48507606 < F =1.96605372, no se rechaza la hiptesis nula

VII. Conclusin: Se concluye a un nivel de significancia del = 0.05 que no se encontr diferencia significativa entre los promedo de la tasa de mortalidad de los peces en los diez tanques.

10.2

ESTUDIO SOBRE EL ESTABLECIMIENTO DE DIFERENCIA SIGNIFIOCATIVA ENTRE LOS TANQUES (X2) RESPECTO A LA CANTIDAD DE ALIMENTO SUMINISTRADO(X4) EN CONSIDERACIN CON LAS VISISTA PROGRAMADAS.

VISITAS
1

Dias
35 dias

Tanque 1
2568 3155

Tanque 2
2511 3308

Tanque 3
2329 3277

Tanque 4
2480 3278 6124

Tanque 5
2383 3269 6123 9038

Tanque 6
2410 3247

Tanque 7
2509 3305

Tanque 8
2544 3120

Tanque 9
2371 3391

Tanque 10
2480 3330

2 80 dias

6190 8966

6125 9063 8518 10849 13005 15133 17298 7818 8686 9578

6134 9036 8621 10688 12889 15199 17366 7830 8730 9579

9084

6067 9026

5923 8988 8681 10810 13086 15120 17246 7834 8726 9557

6150 9090 8618 10736 12922 15270 17369 7817 8681 9562

6093 9076 8643 10771 12924 15224 17321 7807 8711 9614

6155 9123 8608 10818 13028 15237 17310 7831 8709 9604

3 115 dias

8587 10770

8595 10775 12966 15068 17400 7835 8710 9582

8627 10895 13005 15124 17302 7800 8695 9569

8563 10765 12969 15149 17290 7770 8647 9578

4 160 dias

12918 15189

5 200 dias

17414 7829

6 240 dias

8685 9561

MODIFICACION DE LA TABLA.
Dias
35 dias 80 dias 115 dias 160 dias 200 dias 240 dias

Tanque 1
3155 6190 10770 15189 7829 9561

Tanque 2
3308 6125 10849 15133 7818 9578

Tanque 3
3277 6134 10688 15199 7830 9579

Tanque 4
3278 9084 10775 15068 7835 9582

Tanque 5
3269 9038 10895 15124 7800 9569

Tanque 6
3247 6067 10765 15149 7770 9578

Tanque 7
3305 5923 10810 15120 7834 9557

Tanque 8
3120 6150 10736 15270 7817 9562

Tanque 9
3391 6093 10771 15224 7807 9614

Tanque 10
3330 6155 10818 15237 7831 9604

Anlisis de varianza de dos factores con una sola muestra por grupo

RESUMEN 35 dias 80 dias 115 dias 160 dias 200 dias 240 dias Tanque 1 Tanque 2 Tanque 3 Tanque 4 Tanque 5 Tanque 6 Tanque 7 Tanque 8 Tanque 9 Tanque 10

Cuenta 10 10 10 10 10 10 6 6 6 6 6 6 6 6 6 6

Suma 32680 66959 107877 151713 78171 95784 52694 52811 52707 55622 55695 52576 52549 52655 52900 52975

Promedio 3268 6695.9 10787.7 15171.3 7817.1 9578.4 8782.33333 8801.83333 8784.5 9270.33333 9282.5 8762.66667 8758.16667 8775.83333 8816.66667 8829.16667

Varianza 6359.77778 1559222.77 3396.45556 3935.56667 413.433333 339.377778 16979687.1 16638513.4 16733825.9 14795411.5 15045025.9 16826789.1 16790071.8 17287465 16676945.1 16800898.2

ANLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados Filas( Visitas) Columnas(Tanques) Error Total 811018850 2308692.73 11854313.7 825181856

Grados de libertad 5 9 45 59

Promedio de los cuadrados 162203770 256521.415 263429.193

F 615.73954 0.97377748

Probabilidad 3.1476E-40 0.47410667

Valor crtico para F 2.42208547 2.09575509

PRUEBA DE HIPOTESIS DE LAS MEDIAS DE LA CANTIDAD POR VISITAS

I.

Formulacin de la hiptesis. H0: 1= 2= 3= 4= 5= 6 H1: Al menos una es diferente: ij

II. III.

Nivel de significancia: =5% Valor crtico: Valor crtico = valor a partir del cual se rechaza H0., proviene de una tabla de probabilidad de la distribucin de la variable. es El nivel de significacin . 1 - es el nivel de confianza , que es la probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza. F=2.42208547

IV. V.

Estadstico de prueba: FC = CMT/CME=615.73954 Regla de Decisin Estadstica: Se rechaza H0, si FC F No se rechaza H0, si Fc < F

VI.

Decisin Estadstica: Como Fc = 615.73954 > F =1.96605372, se rechaza la hiptesis nula

VII. Conclusin: Se concluye a un nivel de significancia del = 0.05 que se encontr diferencia significativa entre los promedios de la cantidad de alimento por visita.

PRUEBA ESTADISTICA PARA LA DIFERENCIAS DE MEDIAS DE LA CANTIDAD DE ALIMENTO POR TANQUE. I. Formulacin de la hiptesis. H0: 1= 2= 3= 4= 5= 6= 7= 8= 9= 10 H1: Al menos una es diferente: ij II. III. Nivel de significancia: =5% Valor crtico: Valor crtico = valor a partir del cual se rechaza H0., proviene de una tabla de probabilidad de la distribucin de la variable. es El nivel de significacin . 1 - es el nivel de confianza , que es la probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza. F=2.09575509 IV. V. Estadstico de prueba: FC = CMT/CME=0.97377748 Regla de Decisin Estadstica: Se rechaza H0, si FC F No se rechaza H0, si Fc < F VI. Decisin Estadstica: Como Fc = 0.97377748< F =2.09575509, no se rechaza la hiptesis nula VII. Conclusin: Se concluye a un nivel de significancia del = 0.05 que no se encontr diferencia significativa entre los promedio de la cantidad de alimento peces en los diez tanques.

CONCLUSION

Del objetivo 8 se aplicado la prueba Chi-Cuadrado de la bondad de ajuste a la distribucin normal para cada una de las variables: Se concluye que la distribucin del Distribuye en forma Normal peso promedio de los peces (gr.) no se

Del objetivo 9, donde se realizaron los anlisis y las pruebas estadstica relacin con el anlisis de regresin y correlacin mltiple para los tres modelos presentados para el estudio. De los tres modelos estudiados, se concluy que el modelo 2 es el mejor modelo.

Podemos concluir que el modelo 2 es el mejor. Ya que conservo tres variable de las cinco variables propuestas en comparacin con el modelo 1 que solo conservo 1 de 6 variable propuestas

Finalizamos con el objetivo 10, que trata sobre el estudio del anlisis de varianza de un solo factor, se realizaron dos estudio para dos variables dependientes o respuesta, definidos como: anlisis de varianza, considerando el factor . Se concluye a un nivel de significancia del = 0.05 que no se encontr diferencia significativa entre los promedo de la tasa de mortalidad de los peces en los diez tanques .Se concluye a un nivel de significancia del = 0.05 que no se encontr diferencia significativa entre los promedio de la cantidad de alimento peces en los diez tanques

También podría gustarte