Está en la página 1de 6

ANLISIS AVANZADO DE DATOS Analice la figura en la que aparecen los grficos BoxPlot para la Variable produccin, en dos cultivos

A y B y a partir de ese anlisis responda a las siguientes preguntas. 1. El valor mediano es el mismo en ambos cultivos. 2.La distribucin de la variable produccin en el cultivo A es simtrica. 3.La variable produccin en el cultivo A, presenta mayor dispersin que en el cultivo B. 4.En el cultivo B el 25% de los datos toman valores entre 14 y 15 aproximadamente. 5.Al menos el 25% de los datos del cultivo B son mayores que cualquiera (el 100%) de los datos del cultivo A.

6.La media aritmtica no se ve afectada por los valores ms extremos de la distribucin. 7.La suma de frecuencias absolutas coincide con el tamao de la muestra. 8.La frecuencia absoluta es un valor acotado entre cero y uno. 9.La mediana est afectada por valores extremos de la variable. 10.La desviacin tpica muestral sirve para valorar la dispersin de los datos en torno al valor central de la muestra. 11.El error estndar de la media sirve para valorar la variabilidad de la media en el muestreo. 12.La varianza es una medida de dispersin que presenta la ventaja de venir expresada en las mismas unidades que la variable. 13.La desviacin tpica muestral y el error estndar de la media proporcionan la misma informacin, por eso es indiferente utilizar una u otra en una publicacin cientfica. 14.Cuando tenemos una distribucin asimtrica utilizaremos la mediana en lugar de la media como medida de tendencia central. 15.El coeficiente de variacin es una medida de dispersin adimensional. 16.En una distribucin simtrica la media y la mediana coinciden. 17.Una medida de tendencia central ir siempre acompaada de una medida de dispersin. 18.Por riesgo tipo I entendemos la probabilidad de aceptar la hiptesis alternativa indebidamente. 19.Por riesgo tipo II entendemos la probabilidad de rechazar la hiptesis nula indebidamente.

20.Por potencia del contraste entendemos la probabilidad de aceptar la hiptesis nula cuando es verdadera. 21.La potencia del contraste es 1 donde es la probabilidad de cometer un error de tipo II. 22.En un contraste de comparacin de medias la hiptesis nula depende del propsito del investigador. 23.En un contraste para comparacin de dos medias, la hiptesis nula es: Ho: x1 = x2 24.En un contraste bilateral para comparacin de dos medias, la hiptesis alternativa es: Ha: x1 = x2 La tabla siguiente muestra el anlisis de la varianza para la comparacin de la temperatura media del agua en cuatro semanas diferentes: DF SEMANA RESIDUAL 3 24 SUM OF SQUARES 64,777 127,417 MEAN SQUARE 21,592 5,309 FVALUE 4,067 PVALUE 0,181

Y las correspondientes medias para las semanas son Count 7 7 7 7 Mean 6,886 7,857 9,171 10,943 Std.Dev. 0,694 1,277 2,052 3,862 Std Error. 0,262 0,482 0,775 1,460

25.La hiptesis nula es Ho: 1= 2 = 3 = 4 = 5 26. La hiptesis alternativa correspondiente es: Ha: 1 = 2 = 3 =4 27.El contraste es significativo. 28.No es necesario realizar un contraste de hiptesis ya que las medias muestrales son claramente diferentes. 29.Basndonos en el pvalor es claro que las diferencias observadas en la medias pueden ser debidas al azar. 30.El contraste es altamente significativo. 31.El pvalor de un contraste es la probabilidad de encontrar valores ms extremos que los encontrados para nuestra muestra particular. 32.Si el pvalor correspondiente a un contraste es menor de 0.5 rechazaremos la hiptesis nula. 33.Rechazaremos la hiptesis nula si el pvalor es menor que el nivel de significacin . 34.En este caso aceptamos la hiptesis alternativa.

El grfico siguiente muestra las medias de las semanas con los respectivos intervalos de confianza: 35.El grfico con los intervalos de confianza es una primera aproximacin a la comparacin de medias. 36.Un intervalo de confianza para un nivel de significacin, ser tanto ms preciso cuanta ms amplitud tenga. 37. Para que la estimacin de un parmetro mediante un intervalo de confianza sea ms precisa (diferencia entre el estimador y el verdadero parmetro poblacional ms pequea), podemos aumentar el nivel de confianza. 38.Para que la estimacin de un parmetro mediante un intervalo de confianza sea ms precisa, podemos aumentar el nivel de significacin. 39.La precisin de la estimacin aumenta con el tamao muestral. 40.En este caso, todos los intervalos se cruzan por lo que no se detectan diferencias claras en las semanas. 41.La contradiccin entre en ANOVA y el grfico se debe a que este ltimo no tiene en cuenta simultneamente la informacin de todas las semanas. La tabla siguiente muestra el test LSD para la comparacin de las medias. Mean diff. 0,971 2,286 4,057 1,314 3,086 1,771 Crit.Diff 2,542 2,542 2,542 2,542 2,542 2,542 Pvalue 0,4380 0,0758 0,0031 0,2965 0,0194 0,1633

42.Se detectan diferencias significativas entre todas las parejas salvo la (1,4) y la (2,4). 43.Parece que hay una contradiccin ya que si el ANOVA ha resultado significativo, todas las medias poblacionales son distintas. 44.El ANOVA requiere que las poblaciones sean normales y homoscedasticas. 45.El test LSD est protegido frente al riesgo tipo I por lo que se puede encontrar ms diferencias de las que realmente existen en los datos. 46.El test LSD para la comparacin de medias por parejas es el ms conservador. La tabla siguiente muestra el test de Bonferroni para la comparacin de las medias por parejas: Mean diff. 0,971 2,286 4,057 1,314 Crit. Diff 3,541 3,541 3,541 3,541 Pvalue 0,4380 0,0758 0,0031 0,2965 3

1,2 1,3 1,4 2,3

2,4 3,4

3,086 1,771

3,541 3,541

0,0194 0,1633

Comparisons in this table are not significant unless the corresponding pvalue is less than 0,0083. 47.La prueba de Bonferroni permite llevar a cabo cualquier tipo de comparaciones por parejas, manteniendo el riesgo Tipo I por debajo de uno prefijado. 48. La prueba de Bonferroni se puede utilizar con tamaos demuestras iguales o diferentes. 49. Para este caso solamente se detectan diferencias significativas entre las semanas 1 y 4. 50.Si utilizramos la prueba de Tukey para la comparacin de las semanas 1 y 2, el contraste sera no significativo. 51.Si utilizramos la prueba Tukey para la comparacin de las semanas 1 y 4, el contraste sera significativo. 52.No tenemos informacin suficiente para contestar las preguntas 50 y 51. 53.Cuando intervienen en el contraste ms de dos tratamientos los valores crticos de Tukey son mayores que los de Student para un mismo nivel de significacin. 54.Cuando intervienen en el contraste ms de dos tratamientos los valores crticos de Bonferroni son mayores que los de Student para un mismo nivel de significacin. 55.Cuando intervienen en el contraste ms de dos tratamientos los valores crticos de Bonferroni son menores que los de Tukey par un mismo nivel de significacin. 56. Si se comparan 4 grupos, es decir se pueden llevar a cabo 6 comparaciones por parejas, con un nivel de significacin global de 0.05; el nivel de significacin para cada comparacin utilizando la aproximacin de Bonferroni es 0.0083. Se desean comparar el porcentaje de mejora que producen 3 tipos de droga (A, B, C) en dos tipos de pacientes (esquizofrnicos y depresivos), para lo cual se realiza un diseo factorial con dos rplicas por casilla, obtenindose los siguientes resultados para el Anlisis de la varianza. DF Drogas Enfermedad D*E Residual 2 1 2 6 SUM OF SQUARES 0,040 3,333E5 0,086 0,005 MEAN SQUARE 0,20 3,333E5 0,043 0,001 FVALUE 26,130 0,043 56,130 PVALUE 0,0011 0,8417 0,0001

57.En el anlisis de la varianza de dos vas tenemos tres hiptesis a contrastar, dos para los efectos principales y una para la interaccin. 58.En general, el anlisis de la varianza no detecta significacin si la variabilidad entre grupos es ms pequea que la variabilidad dentro de los grupos. 59.En principio se detectan diferencias significativas entre drogas pero no entre tipos de pacientes.

60.Se detectan una interaccin significativa entre drogas y tipos de pacientes. 61.Si en un ANOVA de dos factores con interaccin no se detectan diferencias entre los niveles de los factores principales pero se detecta interaccin, la conclusin es que los factores no influyen en la respuesta. 62. Si en un ANOVA de dos factores con interaccin no se detectan diferencias entre los niveles de los factores principales pero se detecta interaccin, la conclusin es que cada uno de los factores influye en la respuesta de manera diferente en cada uno de los niveles del otro factor. 63.Si en un ANOVA dos factores con interaccin se detecta una interaccin significativa, las conclusiones obtenidas a partir de los contrastes para los factores principales pueden ser errneas. 64.En un ANOVA de dos factores con interaccin slo sacaremos conclusiones a partir de los contrastes para los factores principales si la interaccin es significativa. 65. En el ejemplo anterior, no podemos saber si hay diferencias entre enfermedades ya que stas dependen de las drogas. 66. Para que un experimento est correctamente diseado los tratamientos han de seleccionarse al azar sobre unidades experimentales homogneas. 67.La aleatorizacin puede introducir errores sistemticos en las observaciones que aumentan el error experimental. 68.Los modelos de diseo experimental tienen una parte controlada y una parte no controlada que mide la variabilidad intrnseca del material experimental. 69.Para que un experimento est diseado es necesario que las unidades experimentales difieran de forma sistemtica. 70.La precisin de un diseo experimental es mayor cuanto ms pequeo sea el tamao muestral. 71.Los diseos factoriales permiten controlar todas las combinaciones de niveles de los factores. 72.El diseo en bloques permite controlar la variabilidad experimental procedente de la heterogeneidad de las observaciones. 73.En un diseo factorial se prueban todas las combinaciones de niveles de los factores. 74.El trmino de error en un modelo de diseo experimental recoge la variabilidad intrnseca de las unidades experimentales. 75.Los efectos de los tratamientos se estiman a partir de las medias de las observaciones que recibieron cada uno de ellos. 76.La parte que depende slo de la unidad experimental se estima como la observacin menos la media de tratamiento que se le aplic. 77.La normalidad de las poblaciones estudiadas no es necesaria par la aplicacin correcta de los mtodos de diseo experimental. 78.Slo es posible aislar la interaccin cuando se prueban varias rplicas de cada tratamiento. 5

79.Cuando existe interaccin se dice que el modelo es aditivo. 80.El modelo para un experimento con bloques al azar es xij = + i + ij 81.El modelo para un experimento factorial con dos factores de variacin considerando la interaccin es xij = + i + j + ()ij + ij 82.La suma de cuadrados dentro de los grupos en el anlisis de la varianza de 1 va se calcula como: QE = 83.La suma de cuadrados entre grupos mide la variabilidad controlada. 84.La suma de cuadrados entre grupos mide la variabilidad no controlada en un anlisis de la varianza. 85.Todos los factores no controlados aumentan la variabilidad intrnseca de las observaciones y por tanto la variabilidad residual en el anlisis de la varianza. 86.Es ms fcil detectar significacin en las diferencias entre tratamientos cuanto mayor sea la variabilidad residual. 87.Cuando dos factores no interactan se dice que sus efectos son aditivos. 88. En un grfico de interaccin, las lneas que representan a los niveles de uno de los factores son paralelas cuando la interaccin result significativa en el anlisis de la varianza. 89.En un anlisis de la varianza de dos vas con interaccin se contrastan tres hiptesis distintas. 90.Cuando en un experimento factorial se detecta interaccin se dice que el modelo es multiplicativo.

También podría gustarte