Está en la página 1de 40

UNIVERSIDAD NACIONAL DE TUMBES

FACULTAD DE CIENCIAS AGRARIAS


DEPARTAMENTO ACADÉMICO DE INGENIERÍA FORESTAL Y MEDIO
AMBIENTE.

TRABAJO ENCARGADO DE MÉTODOS ESTADÍSTICOS PARA LA


INVESTIGACIÓN

TITULO:

INFERENCIA ESTADÍSTICA. PH PARA MUESTRAS


PAREADAS, TAMAÑO DE LA MUESTRA, DCA, DBCA, DCL
Y PRUEBAS DE COMPARACIÓN MÚLTIPLE

ALUMNO:

Neyra Izquierdo Elvis Frank

TUMBES, PERU

2019-I

PÁG. 1
DEDICATORIA

En primer lugar, quiero dedicar este trabajo a mí familia, por


acompañarme en cada una de mis locuras que he emprendido y el de
ser siempre mis más fieles hinchas A mis padres, por todo lo que nos
han dado en esta vida, especialmente por sus sabios consejos y por
estar a mí lado en los momentos difíciles.

En segundo lugar, quiero dedicar esta monografía para todas aquellas


personas que aún no tienen un concepto bien definido de las funciones,
para que al leerlo puedan entender lo maravilloso he importante de los
Diseños Experimentales aplicados a la Ingeniería Forestal y del Medio
Ambiente y qué si la llegaran a aplicar, la podrían utilizar en sus
experiencias diarias, en su trabajo, etc.

PÁG. 2
AGRADECIMIENTO

En esta oportunidad quisiera agradecer en primer lugar a Dios por haberme


brindado la vida y la oportunidad de poder estudiar en la UNT con profesores de
alto nivel académico.

Agradecer a mis padres, que han sabido orientar, guiar, brindar su respaldo
esfuerzo y dedicación para poder estar en donde estamos hoy en día.

Le agradecemos infinitamente a nuestro docente de asignatura que nos brindó su


apoyo y conocimientos y gracias a ello hemos logrado captar sus enseñanzas
teóricas y prácticas en el salón de clases que nos servirán en nuestra formación
tanto laboral como personal y que nos harán mejor persona.

También queremos dar las gracias todos los profesores que les pedimos su apoyo
y sin poner obstáculos nos lo brindaron.

PÁG. 3
INDICE:

I. INTRODUCCIÓN.
II. OBJETIVOS.
III. FUNDAMENTO TEÓRICO.
3.1. Inferencia Estadística.
3.2. Prueba de Hipótesis para Muestras Pareadas.
3.3. Técnicas de Muestreo y Tamaño de la Muestra.
3.4. Diseño Completamente Aleatorio (DCA).
3.5. Diseño por Bloques Completamente Aleatorio (DBCA).
3.6. Diseño de Cuadro Latino.
3.7. Pruebas de Comparación Múltiples.
IV. FUNDAMENTO PRÁCTICO.
V. CONCLUSIONES Y RECOMENDACIONES.
5.1. RECOMENDACIONES.
5.2. CONCLUSIONES.
VI. RESEÑA BIBLIOGRÁFICA.

PÁG. 4
I. INTRODUCCIÓN
El análisis de diseños experimentales tuvo su origen en el área de las
ciencias Agrícolas siendo el científico ingles Fisher, quien estableció las
bases de la experimentación agrícola en la estación experimental de
ROTHAMSTED, Inglaterra, durante los años veinte y treinta. Fisher
desarrolló las ideas que llevaron a los tres principios básicos del diseño
experimental, los cuales son: aleatorización, réplica y la formación de
bloques; incluyendo el concepto de diseño factorial y análisis de
varianza.

Por otra parte el desarrollo actual de la estadística ofrece grandes áreas,


tanto en la esfera teórica como en las aplicaciones, que están
cercanamente vinculadas con el advenimiento de las computadoras y la
disponibilidad de paquetes estadísticos; cada día más se acepta la
supremacía de la filosofía del análisis de datos, la cual reconoce la
importancia de las técnicas y procedimientos descriptivos y gráficos en
un proceso iterativo de aplicación de la metodología estadística, que
puede llegar hasta la modelación. Cabe destacar que este proceso

PÁG. 5
iterativo de análisis de datos del que posteriormente analizaremos se
facilita a través del uso de los paquetes estadísticos computacionales.
II. OBJETIVOS:

1. Tener la capacidad de realizar diseños muestrales descriptivos


adecuados y con capacidad para reflexionar sobre los parámetros
requeridos en el diseño.

2. Estudiar los estadísticos apropiados para hallar el tamaño de la muestra


según la media que se desea conocer, así como el tipo de problemas
para el desarrollo de los ejercicios aplicativos a la Ingeniería Forestal y
del Medio Ambiente.

3. Diferenciar las situaciones en las que un contraste basado en muestras


pareadas es adecuado, de aquellas en las que se debe aplicar un
contraste basado en muestras independientes.

4. Conocer, analizar e interpretar los dos casos de estudio de los


ANOVAS, el completamente aleatorio, como el por bloques al azar,
además de sus respectivas pruebas de Comparación Múltiple.

5. Dar a conocer las diferentes formas de comparación entre las Pruebas


de comparación múltiple como son l Prueba de DUNCAN, TUKEY, DMS
Y SHEFFE.

PÁG. 6
III. FUNDAMENTO TEÓRICO.

3.1. Inferencia Estadística.

La inferencia estadística es el conjunto de métodos y técnicas que


permiten inducir, a partir de la información empírica proporcionada
por una muestra, cual es el comportamiento de una determinada
población con un riesgo de error medible en términos de
probabilidad.

Los métodos paramétricos de la inferencia estadística se pueden


dividir, básicamente, en dos: métodos de estimación de parámetros
y métodos de contraste de hipótesis. Ambos métodos se basan en el
conocimiento teórico de la distribución de probabilidad del
estadístico muestral que se utiliza como estimador de un parámetro.

La estimación de parámetros consiste en asignar un valor concreto


al parámetro o parámetros que caracterizan la distribución de
probabilidad de la población. Cuando se estima un parámetro
poblacional, aunque el estimador que se utiliza posea todas las
propiedades deseables, se comete un error de estimación que es la
diferencia entre la estimación y el verdadero valor del parámetro. El
error de estimación es desconocido por lo cual es imposible saber
en cada caso cual ha sido la magnitud o el signo del error; para
valorar el grado de precisión asociado con una estimación puntual
se parte de dicha estimación para construir un intervalo de
confianza. En síntesis, un intervalo de confianza está formado por un
conjunto de valores numéricos tal que la probabilidad de que éste
contenga al verdadero valor del parámetro puede fijarse tan grande
como se quiera. Esta probabilidad se denomina grado de confianza
del intervalo, y la amplitud de éste constituye una medida del grado
de precisión con el que se estima el parámetro.

PÁG. 7
3.2. Prueba de Hipótesis para Muestras Pareadas.

La característica distintiva de las muestras apareadas es que, para


cada observación del primer grupo, hay una observación relacionada
en el segundo grupo.
Las muestras apareadas se obtienen cuando se realizan
comparaciones sobre una misma unidad experimental:
 se determina en la misma unidad la concentración de una
sustancia con dos métodos diferentes.
 se estudia un mismo individuo antes y después de un
tratamiento.

TEST T PAREADO:
Supuestos: La muestra de las diferencias es una muestra aleatoria
de una población de diferencias. El modelo de la población de las
diferencias es Normal, supuesto que no es relevante si el tamaño de
la muestra n es grande.
1. Hipótesis.
𝐻0 : 𝜇𝑑 = 0 versus
𝐻1 : 𝜇𝑑 ≠ 0 o 𝐻1 : 𝜇𝑑 > 0 o 𝐻1 : 𝜇𝑑 < 0.
2. Tabla para el cálculo de los variables.
𝟐
Variable Proceso Proceso Diferencias ̅)
(𝑫𝒋 − 𝑫
Actual Analizado 𝑫𝒋

1 𝑃1 𝑃𝐴1 𝐷1 2
̅)
( 𝐷1 − 𝐷 1

2 𝑃2 𝑃𝐴2 𝐷2 ̅ )2
( 𝐷2 − 𝐷 2
2
3 𝑃3 𝑃𝐴3 𝐷3 ̅)
( 𝐷3 − 𝐷 3

.….. .….. .….. .….. .…..


2
n 𝑃𝑛 𝑃𝐴𝑛 𝐷𝑛 ̅)
( 𝐷𝑛 − 𝐷 𝑛

∑ 𝐷𝑗 2
̅= ̅)
( 𝐷𝑗 − 𝐷
𝐷 𝑛
𝑛
𝑛−1

PÁG. 8
∑ 𝐷𝑗
̅=
𝐷
𝑛
2
̅)
(𝐷𝑗 − 𝐷
𝑆𝐷̅ = √
𝑛−1

3. Nivel de Significancia.
𝑡(𝛼,𝑛−1) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑡 − 𝑠𝑡𝑢𝑑𝑒𝑛𝑡
4. Estadístico de Prueba.
𝐷̅
𝑡𝐶 =
𝑆𝐷̅
√𝑛
5. Decisión y Conclusión.
Comparar si 𝑡(𝛼,𝑛−1) >, <, ≥, ≤ ó = 𝑡𝐶 y decidir con la hipótesis.

3.3. Técnicas de Muestreo y Tamaño de la Muestra.

Es evidente que un conocimiento previo por parte del investigador


de las características de la realidad de la población mejora o debe
mejorar los resultados inferenciales que se pueden obtener de la
obtención de una muestra; parece claro qué si bien el método de
selección aleatoria conlleva los mejores resultados, quizá el adecuar
la manera de extraer la muestra a las posibles distintas naturalezas
de las poblaciones puede mejorar el rendimiento, aunque sólo fuere
a nivel de coste. No es por tanto lo mismo intentar conocer la altura
media de los habitantes de un país, que el número de errores en una
gran contabilidad, dado que la naturaleza de su universo y por tanto
el comportamiento poblacional son distintos. Es por ello, que para
distintas "naturalezas" del problema han de plantearse distintas
soluciones, si bien todas, o casi todas, pasan por la aleatoriedad; de
ahí que se establezcan diversas "técnicas" o "métodos" de
muestreo, de los que brevemente enumeramos algunos.

PÁG. 9
a) Técnicas de Muestreo:

1. Muestreo aleatorio sistemático: Esta técnica consiste en


extraer elementos de la población mediante una
regla sistematizadora que previamente hemos creado
(sencillamente cada K elementos). Así; numerada la
población, se elige(aleatoriamente) un primer elemento base,
partiendo de éste se aplica la regla para conseguir los demás
hasta conseguir el tamaño muestral adecuado. Este
procedimiento conlleva el riesgo de dar resultados sesgados
si en la población se dan periodicidades o rachas.
2. Muestreo aleatorio estratificado. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen
una gran homogeneidad interna (poca varianza interna) y no
obstante son heterogéneos entre sí (mucha varianza entre
estratos). La muestra se distribuye (se extrae de) entre los
estratos predeterminados según la naturaleza de la población
(ejemplo: sexo, lugar geográfico, etc.). Dicha distribución-
reparto de la muestra se denomina afijación; que puede ser
de varias formas:
 Afijación simple: a cada estrato le corresponde igual
número de elementos (extracciones) muestrales.
 Afijación proporcional: la distribución se hace de
acuerdo con el peso(tamaño) relativo de cada estrato.
 Afijación óptima: Se tiene en cuenta la previsible
dispersión de los resultados, de modo que se
considera la proporción y la desviación típica.
3. Muestreo por conglomerados: La unidad muestral es un
grupo de elementos de la población que forman
previsiblemente una unidad de comportamiento
representativo. Dicha unidad es el conglomerado cuyo
comportamiento interno puede ser muy disperso (varianza
grande) pero que presumiblemente poseerá un
comportamiento próximo a otros conglomerados (varianza

PÁG. 10
entre conglomerado, pequeña). Los conglomerados se
estudian en profundidad hasta conseguir el tamaño muestral
adecuado.
4. Otros tipos de muestreo: Es evidente que los planteados no
son las únicas técnicas de muestreo. Existen otras como las
no aleatorias: Cuotas, Intencional, Incidental, bola de nieve,
etc. Y otras aleatorias y complicadas como el muestreo por
superpoblaciones, y que en otras que se necesitan
Programas Informáticos para su desarrollo.

b) Tamaño de la Muestra:

Población: Llamado también universo o colectivo, es el conjunto


de todos los elementos que tienen una característica común. Una
población puede ser finita o infinita. Es población finita cuando
está delimitada y conocemos el número que la integran, así por
ejemplo: Estudiantes de la Universidad UNT. Es población infinita
cuando a pesar de estar delimitada en el espacio, no se conoce
el número de elementos que la integran, así por ejemplo: Todos
los profesionales universitarios que están ejerciendo su carrera.

Muestra: La muestra es un subconjunto de la población.


Ejemplo: Estudiantes de 2do Ciclo de la Universidad UNT.

Elemento o Individuo: Es la unidad mínima que compone una


población. El elemento puede ser una entidad simple (una
persona) o una entidad compleja (una familia), y se denomina
unidad investigativa.

PÁG. 11
FÓRMULA PARA CALCULAR EL TAMAÑO DE LA MUESTRA
1) Cuando No se conoce la Población:
Para calcular el tamaño de la muestra suele utilizarse la
siguiente fórmula:
𝑍𝛼2 𝜎 2
𝑛=
𝑒2
𝝈 = Desviación estándar de la población que, generalmente
cuando no se tiene su valor, suele utilizarse un valor
constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor
constante que, si no se tiene su valor, se lo toma en relación,
al 95% de confianza equivale a 1,96 (como más usual).
e = Límite aceptable de error muestral que, generalmente
cuando no se tiene su valor, suele utilizarse un valor que varía
entre el 1% (0,01), 9% (0,09) y 5% (0.05), valor que queda a
criterio del encuestador.

Para calcular el tamaño de la muestra para proporciones de la


población no conocida se suele utilizarse la siguiente fórmula:
𝑍𝛼2 𝑝𝑞
𝑛=
𝑒2
𝒑 = Proporción de aceptación de la inferencia, cuando N0 se
conoce se asume en 0.5.
𝒒 = Proporción de NO aceptación de la inferencia, cuando NO
se conoce se asume en 0.5.
Z = Valor obtenido mediante niveles de confianza. Es un valor
constante que, si no se tiene su valor, se lo toma en relación,
al 95% de confianza equivale a 1,96 (como más usual).
e = Límite aceptable de error muestral que, generalmente
cuando no se tiene su valor, suele utilizarse un valor que varía
entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del
encuestador.

PÁG. 12
2) Cuando se conoce la Población:
Para calcular el tamaño de la muestra suele utilizarse la
siguiente fórmula:
𝑁𝜎 2 𝑍 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2

n = el tamaño de la muestra.
N = tamaño de la población.
𝝈 = Desviación estándar de la población que, generalmente
cuando no se tiene su valor, suele utilizarse un valor
constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor
constante que, si no se tiene su valor, se lo toma en relación,
al 95% de confianza equivale a 1,96 (como más usual).
e = Límite aceptable de error muestral que, generalmente
cuando no se tiene su valor, suele utilizarse un valor que varía
entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del
encuestador.

3.4. Diseño Completamente Aleatorio (DCA).

Este diseño consiste en la asignación de los tratamientos en forma


completamente aleatoria a las unidades experimentales (individuos,
grupos, parcelas, jaulas, animales, insectos, etc.). Debido a su
aleatorización irrestricta, es conveniente que se utilicen unidades
experimentales de lo más homogéneas posibles: animales de la
misma edad, del mismo peso, similar estado fisiológico; parcelas de
igual tamaño, etc., de manera de disminuir la magnitud del error
experimental, ocasionado por la variación intrínseca de las unidades
experimentales.
TEST FC DCA:

1. Hipótesis:
H0: μ1= μ2=… μn
H1: μ1≠ μ2≠… μn

PÁG. 13
2. Nivel de significancia:

𝐹(1−𝛼,𝑘−1,𝑛−𝑘) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐹𝑖𝑠ℎ𝑒𝑟

3. Cálculos de los Cuadrados Medios:

2
𝑦.2
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 −
𝑛

∑ 𝑦𝑖2 𝑦.2
𝑆𝐶𝑇𝑟 = −
𝑟𝑖 𝑛

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟

𝑆𝐶𝑇𝑟
𝐶𝑀𝑇𝑟 =
𝑘−1

𝑆𝐶𝐸
𝐶𝑀𝐸 =
𝑛−𝑘

4. Estadístico de Prueba:

𝐶𝑀𝑇𝑟
𝐹𝐶 =
𝐶𝑀𝐸

5. Tabla ANOVA:

FUENTE DE GL SC CM FC FTabla
VARIACIÓN
TRATAMIENTOS k-1 ∑ 𝑦𝑖2 𝑦.2 𝑆𝐶𝑇𝑟 𝐶𝑀𝑇𝑟 Valor de
− Tablas
𝑟𝑖 𝑛 𝑘−1 𝐶𝑀𝐸

ERROR n-k 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟 𝑆𝐶𝐸


𝑛−𝑘
TOTAL N-1 2 𝑦2
∑ ∑ 𝑦𝑖𝑗 −
𝑛

6. Decisión y Conclusión:
Comparar si 𝐹(1−𝛼,𝑘−1,𝑛−𝑘) >, <, ≥, ≤ ó = 𝐹𝐶 y decidir con la
hipótesis.

PÁG. 14
3.5. Diseño por Bloques Completamente Aleatorio (DBCA).

Conocido como diseño de doble vía, se aplica cuando el material es


heterogéneo. las unidades experimentales homogéneas se agrupan
formando grupos homogéneos llamados bloques. Si el experimento
se realiza de la manera mencionada, entonces se tendrá un diseño
de bloques al azar, considerando el pH como un efecto de bloque
aleatorio, y las variedades como efecto fijo, generándose, entonces,
un modelo mixto (con efectos tanto fijos como aleatorios). Esta
situación de modelos mixtos casi siempre estará presente en los
diseños de bloques.

TEST FC DBCA:

1. Hipótesis:
H0: μ1= μ2=… μn
H1: μ1≠ μ2≠… μn
2. Nivel de significancia:

𝐹(1−𝛼,𝑘−1,(𝑘−1)(𝑟𝑖 −1) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐹𝑖𝑠ℎ𝑒𝑟


𝐹(1−𝛼,𝑟−1,(𝑘−1)(𝑟𝑖 −1) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐹𝑖𝑠ℎ𝑒𝑟

3. Cálculos de los Cuadrados Medios:

2
𝑇..2
𝑆𝐶𝑇 = ∑ ∑ 𝑋𝑖𝑗 −
𝑟𝑘

∑ 𝑇𝑖.2 𝑇..2
𝑆𝐶𝑇𝑟 = −
𝑟𝑖 𝑟𝑘

1 𝑇..2
𝑆𝐶𝐵𝐿 = ∑ 𝑇.𝑗2 −
𝑘 𝑟𝑘

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟 − 𝑆𝐶𝐵𝐿

𝑆𝐶𝑇𝑟
𝐶𝑀𝑇𝑟 =
𝑘−1

PÁG. 15
𝑆𝐶𝐵𝐿
𝐶𝑀𝐵𝐿 =
𝑟𝑖 − 1

𝑆𝐶𝐸
𝐶𝑀𝐸 =
(𝑟𝑖 − 1)(𝑘 − 1)

4. Estadístico de Prueba:

𝐶𝑀𝑇𝑟
𝐹𝐶 =
𝐶𝑀𝐸

𝐶𝑀𝐵𝐿
𝐹𝐶 =
𝐶𝑀𝐸

5. Tabla ANOVA:

FUENTE DE GL SC CM FC FTabla
VARIACIÓN
TRATAMIENTO 𝑘−1 ∑ 𝑇𝑖.2 𝑇..2 𝑆𝐶𝑇𝑟 𝐶𝑀𝑇𝑟 Valor de
− Tablas
𝑟𝑖 𝑟𝑘 𝑘−1 𝐶𝑀𝐸

BLOQUES 𝑟𝑖 − 1 1 𝑇..2 𝑆𝐶𝐵𝐿 𝐶𝑀𝐵𝐿 Valor de


∑ 𝑇.𝑗2 −
𝑘 𝑟𝑘 𝑟𝑖 − 1 𝐶𝑀𝐸 Tablas

ERROR (𝑟𝑖 − 1)(𝑘 − 1) 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟 − 𝑆𝐶𝐵𝐿 𝑆𝐶𝐸


(𝑟𝑖 − 1)(𝑘 − 1)
TOTAL 𝑟𝑘 − 1 2
𝑇..2
∑ ∑ 𝑋𝑖𝑗 −
𝑟𝑘

6. Decisión y Conclusión:

PARA LOS TRATAMIENTOS


Comparar si 𝐹(1−𝛼,𝑘−1,(𝑘−1)(𝑟𝑖 −1) >, <, ≥, ≤ ó = 𝐹𝐶 y decidir con la
hipótesis.

PARA LOS BLOQUES


Comparar si 𝐹(1−𝛼,𝑟−1,(𝑘−1)(𝑟𝑖 −1) >, <, ≥, ≤ ó = 𝐹𝐶 y decidir con la
hipótesis.

PÁG. 16
3.6. Diseño de Cuadro Latino (DCL).

Este diseño es una ampliación del diseño de bloques, el cuadro


latino permite la comparación de los tratamientos cuando están
sujetos simultáneamente a dos conjuntos de bloques. Un conjunto
de bloques es asignado a las filas del cuadrado latino, y el otro
conjunto de bloques se asignan a las columnas del cuadrado. Luego
los tratamientos, generalmente representados con letras latinas, se
asignan al azar en cada celda de las intersecciones filas- columnas
bajo la única condición de que cada tratamiento aparezca una vez y
sólo una vez en cada fila y en cada columna, este diseño adolece de
la condición de que el número de bloques de cada conjunto debe ser
igual al número de tratamientos.

TEST FC DCL:

1. MODELO MATEMÁTICO:

Yijk    Ti  Fj  CK  ijk

2. HIPÓTESIS:
H0: μ1= μ2= … μn
H1: μ1≠ μ2 ≠ … μn

3. ORDENAMIENTO DE LOS DATOS:

COLUMNAS
FILAS
1 2 n Total
I
II
n
Total

PÁG. 17
TRATAMIENTOS TOTALES
1
2
n

4. NIVEL DE SIGNIFICANCIA:

𝐹(1−𝛼,𝑖−1,(𝑝−2)(𝑝−1) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐹𝑖𝑠ℎ𝑒𝑟


𝐹(1−𝛼,𝑘−1,(𝑝−2)(𝑝−1) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐹𝑖𝑠ℎ𝑒𝑟
𝐹(1−𝛼,𝑝−1,(𝑝−2)(𝑝−1) = 𝑒𝑛 𝑡𝑎𝑏𝑙𝑎𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝐹𝑖𝑠ℎ𝑒𝑟

5. CÁLCULO DE LOS CUADRADOS MEDIOS:

2
𝑌..2
SCDTOTAL = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 −
𝑁
𝑖 𝑗

1 𝑌..2
SCDTRAT = ∑ 𝑌𝑗..2 −
𝑃 𝑁

1 2
𝑌..2
SCDFILA = ∑ 𝑌𝑖.. −
𝑃 𝑁

1 2
𝑌..2
SCDCOLUM = ∑ 𝑌𝑘.. −
𝑃 𝑁

SCDERROR = SCDTOTAL − SCDTRAT − SCDFILA − SCDCOLUM


GlTOTAL = N − 1

GlTRAT = #TRAT − 1

GlFILA = #FILAS − 1

GlCOLUM = #COLUM − 1

GlERROR = GlTOTAL − GlTRAT − GlFILA − GlCOLUM

SCDTRAT
CMTRAT =
GlTRAT

PÁG. 18
SCDFILA
CMFILA =
GlFILA

SCDCOLUM
CMCOLUM =
GlCOLUM

SCDERROR
CMERROR = =
GlERROR

6. TABLA ANOVA:

FUENTES DE Fc FTAB
VARIACIÓN. GL SDC CM α%
CMFILA Valor
1 𝑌2.. SCDFILA de
∑ 𝑌2𝑖.. − CMERROR
FILAS #FILAS − 1 𝑃 𝑁 GlFILA Tablas
CMCOLUM Valor
1 𝑌2.. SCDCOLUM de
2
∑ 𝑌𝑘.. − CMERROR
COLUMNAS #COLUM − 1 𝑃 𝑁 GlCOLUM Tablas
CMTRAT Valor
1 𝑌2.. SCDTRAT de
2
∑ 𝑌𝑗.. − CMERROR
TRATAMIENTOS #TRAT − 1 𝑃 𝑁 GlTRAT Tablas
GlTOTAL SCDTOTAL
− GlTRAT − SCDTRAT
− GlFILA − SCDFILA SCDERROR
ERROR − GlCOLUM − SCDCOLUM GlERROR
2
∑ ∑ ∑ 𝑌𝑖𝑗𝑘
𝑖 𝑗
𝑌..2

𝑁
TOTAL N−1

7. DECISIÓN Y CONCLUSIÓN:
PARA LOS TRATAMIENTOS

Comparar si 𝐹(1−𝛼,𝑗−1,(𝑝−2)(𝑝−1) >, <, ≥, ≤ ó = 𝐹𝐶 y decidir

con la hipótesis.

PARA LAS FILAS


Comparar si 𝐹(1−𝛼,𝑖−1,(𝑝−2)(𝑝−1) >, <, ≥, ≤ ó = 𝐹𝐶 y decidir

con la hipótesis.

PARA LAS COLUMNAS


Comparar si 𝐹(1−𝛼,𝑘−1,(𝑝−2)(𝑝−1) >, <, ≥, ≤ ó = 𝐹𝐶 y decidir

con la hipótesis.

PÁG. 19
3.7. Pruebas de Comparación Múltiples.

a) Prueba DMS.

Si:

1 1
𝐷𝑀𝑆 = 𝑡(1−𝛼,,𝐺𝐿𝐸) √𝐶𝑀𝐸( + )
2 𝑛𝑖 𝑛𝑗

1. Hipótesis:
,
H0: μ1= μ2 H0: μ1= μ3 …. H0: μ1= μn
H1: μ1≠ μ2 H1: μ1≠ μ3 …. H1: μ1≠ μn

2. Comparativo DMS:

𝑌̅5 =, 𝑌̅6 =, 𝑌̅8 =, 𝑌̅2 =, … . , = 𝑌̅𝑛

|𝑌̅5 − 𝑌̅6 | = |𝑎1 − 𝑎2 | = 𝐷𝑀𝑆1

|𝑌̅5 − 𝑌̅8 | = |𝑎1 − 𝑎3 | = 𝐷𝑀𝑆2

|𝑌̅5 − 𝑌̅2 | = |𝑎1 − 𝑎2 | = 𝐷𝑀𝑆3

………………, así sucesivamente…con todos, hasta:


|𝑌̅𝑛−1 − 𝑌̅𝑛 | = |𝑎𝑛−1 − 𝑎𝑛 | = 𝐷𝑀𝑆𝑛

3. Estadístico de Prueba:

1 1
𝐷𝑀𝑆 = 𝑡(1−𝛼,,𝐺𝐿𝐸) √𝐶𝑀𝐸( + )
2 𝑛𝑖 𝑛𝑗

4. Decisión y Conclusión: (Interpretación)

|𝑌̅5 − 𝑌̅6 | < 𝐷𝑀𝑆


|𝑌̅5 − 𝑌̅8 | < 𝐷𝑀𝑆
|𝑌̅5 − 𝑌̅2 | > 𝐷𝑀𝑆
……………………………………………..
|𝑌̅𝑛−1 − 𝑌̅𝑛 | < 𝐷𝑀𝑆

PÁG. 20
b) Prueba TUKEY.

Si:

𝑋𝑖 − 𝑋𝑗
𝑇𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑞𝑖 =
𝐶𝑀𝐸

𝑟𝑏
Y

𝑇𝑡𝑎𝑏𝑙𝑎 = 𝑞(𝛼,𝑘,𝑛−𝑘)

1. Valor en Tablas “T”:

𝑇𝑡𝑎𝑏𝑙𝑎 = 𝑞(𝛼,𝑘,𝑛−𝑘)

2. Ordenamos los promedios de mayor a menor:

𝑋3 = 𝑚𝑎𝑦𝑜𝑟, 𝑋2 = 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 … .. 𝑋𝑛 = 𝑚𝑒𝑛𝑜𝑟

3. Realizamos las comparaciones múltiples con el de tabla:

𝑋𝑖 − 𝑋𝑗
𝑇𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑞𝑖 =
𝐶𝑀𝐸

𝑟𝑏

4. Decisión y Conclusión: (Interpretación)

PÁG. 21
c) Prueba DUNCAN.

Si:

𝐶𝑀𝐸
𝐷𝑝 = 𝑑𝛼 (𝑝, 𝑛 − 𝑘)√ 𝑑𝑜𝑛𝑑𝑒: 𝑝 = 2, … , 𝑘
𝑟𝑏

1. Cálculo de las medias

𝑋5 = mayor, 𝑋6 = siguiente … .. 𝑋𝑛 = menor

2. Encontrando los Rangos de Duncan

𝐶𝑀𝐸
𝐷𝑝 = 𝑑𝛼 (𝑝, 𝑛 − 𝑘)√
𝑟𝑏

𝐶𝑀𝐸
𝐷𝑝−1 = 𝑑𝛼 (𝑝 − 1, 𝑛 − 𝑘)√
𝑟𝑏

𝐶𝑀𝐸
𝐷𝑝−𝑘 = 𝑑𝛼 (𝑝 − 𝑘, 𝑛 − 𝑘)√
𝑟𝑏

3. Realizamos las comparaciones con el cuadro de


diferencia de medias

Diferencia de >,< Rango(mínimo)


medias
𝑋̅5 − 𝑋̅6 mayor − 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 < 𝑉𝑎𝑙𝑜𝑟(𝐷𝑝 )
𝑋̅5 − 𝑋̅2 mayor − 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 < 𝑉𝑎𝑙𝑜𝑟(𝐷𝑝−1 )
…….. …….. …….. ……..
𝑋̅5 − 𝑋̅𝑛 mayor − 𝑚𝑒𝑛𝑜𝑟 > 𝑉𝑎𝑙𝑜𝑟(𝐷𝑝−𝑘 )

4. Decisión y Conclusión: (Interpretación)

d) Prueba SHEFFÉ.

Si:
𝑡

𝐶 = ∑ 𝑎 𝑖 𝜇𝑖
𝑖=1

PÁG. 22
Y

𝑎 2
|𝐶̂ | = √𝑆𝐸2 ∑𝑡𝑖=1 𝑖 √(𝑡 − 1)𝐹(𝛼,𝑡−1,𝑁−𝑡)
𝑛 𝑖

1. Hipótesis:

H0: C=0
H1: C ≠0

2. Nivel de Significancia:

𝐹(𝛼,𝑡−1,𝑁−𝑡)

3. Estadístico de prueba:

𝑺[𝑪𝟏 ]
𝑺[𝑪𝟐 ]
..…
𝑺[𝑪𝒏 ]

4. Comparaciones Múltiples:

𝑪𝟏 >, < 𝑺[𝑪𝟏 ]


𝑪𝟐 >, < 𝑺[𝑪𝟐 ]

..…
𝑪𝒏 >, 𝑺[𝑪𝒏 ]

5. Decisión y Conclusión: (Interpretación)

IV. FUNDAMENTO PRÁCTICO.

1. La empresa RECURSOS FORESTALES DEL NORTE S.A.C desea colocar


su centro de capacitación y transformación para la obtención de Especies
Forestales en la Región tumbesina y afirman que contratarán a con una
desviación a 40 trabajadores. De qué tamaño se necesita una muestra si se
desea tener 95.99% de confianza que la media muestral esté dentro de 10
trabajadores de la media real, se sabe que la empresa cuenta con un stock

PÁG. 23
poblacional de 3000 posibles trabajadores de dicha región según un sondeo
hechos por ellos mismos.
SOLUCIÓN:

De la formula anteriormente dada:

𝑁𝜎 2 𝑍 2
𝑛=
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2

Remplazando los valores dados:

𝑁𝜎 2 𝑍 2 (3000)(40)2 (1.75)2
𝑛= = = 48.118 ≈ 49 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠
(𝑁 − 1)𝑒 2 + 𝜎 2 𝑍 2 (3000 − 1)(10)2 + (40)2 (1.75)2

Interpretación: Por lo tanto, si el tamaño de la muestra es de 49


trabajadores aproximadamente, se puede tener un 95.99% de confianza de
que la media poblacional (μ), difiere en menos de 10 trabajadores respecto a
la media muestral (𝑋̅).

2. Un Empresario desea comparar su proceso de sembrado de los árboles


(OSF) con la que una empresa del rubro ambientalista ésta proponiéndole,
con el que actualmente posee su OSF, que supuestamente reduce el tiempo
de sembrado en dos minutos por árbol. Se seleccionaron ocho trabadores
de la OSF de su empresa y se les pidió que usaran ambos procesos. Los
siguientes son los tiempos de cada trabajador en minutos.

Trabajador Proceso Actual Proceso propuesto


1 38 30
2 32 32
3 41 34
4 35 37
5 42 35
6 32 26

PÁG. 24
7 45 38
8 37 32

En 𝛼 = 0.05, ¿existe alguna razón para creer que el tiempo de sembrado del
proceso actual es mayor que el del método propuesto por la empresa
ambientalista en dos minutos?
SOLUCIÓN:
1. Hipótesis.
𝐻0 : 𝜇𝐷 ≤ 2
𝐻1 : 𝜇𝐷 > 2

2. Tabla para el cálculo de los variables.

𝟐
Trabajador Proceso Proceso Diferencias ̅)
(𝑫𝒋 − 𝑫
Actual propuesto 𝑫𝒋
1 38 30 8 10.5625
2 32 32 0 22.5625
3 41 34 7 5.0625
4 35 37 -2 45.5625
5 42 35 7 5.0625
6 32 26 6 1.5625
7 45 38 7 5.0625
8 37 32 5 0.0625
38 95.5

∑ 𝐷𝑗 38
̅=
𝐷 = = 4.75
𝑛 8

2
̅)
(𝐷𝑗 − 𝐷 95.5
𝑆𝐷̅ = √ =√ = 3.69
𝑛−1 8−1

3. Nivel de Significancia.
𝑡(𝛼,𝑛−1) = 𝑡(0.05,7) = 1.8946

PÁG. 25
4. Estadístico de Prueba.

𝐷̅ 4.75 − 2
𝑡𝐶 = = = 2.108
𝑆𝐷̅ 3.69
√𝑛 √8
5. Decisión y Conclusión.

𝑡(𝛼,𝑛−1) = 𝑡(0.05,7) = 1.896 , debido a que 2.108 > 1.8946


rechazamos H0, y aceptamos la H1: es decir que el de sembrado de los
trabajadores para el proceso actual es mayor en dos minutos que el
método propuesto por la empresa ambientalista.

3. La ONG “SALVEMOS EL MUNDO”, que se dedica a la compra y venta de


semillas para la obtención de Recursos Forestales, está necesita aumentar
su Inventario para el Periodo 2018, para lo cual negocia semillas de dichos
Recursos con algunos agricultores; pero con el fin de cerrar el negocio
propone a los Agricultores evaluar el efecto del tipo de fertilizante sobre la
siembra de sus semillas, respecto a la cantidad de almidón que determinará
el rendimiento en dureza de la semilla. Se decidió sembrar semillas y que las
cantidades de almidón a probar en ellas fueran de 2%, 5% y 10%. Se
hicieron 4 réplicas por tratamiento con diferentes fertilizantes y se obtuvieron
los siguientes resultados:

% ALMIDON FERTILIZANTE
2% 4.3 5.2 4.8 4.5
5% 6.5 7.3 6.9 6.1
10% 9.0 7.8 8.5 8.1

a) ¿Hay evidencia suficiente de que el rendimiento en dureza de las semillas


de los Recursos Forestales debido al contenido de almidón No depende del
tipo de Fertilizante utilizado? Halle el ANOVA (α=5%). De conclusiones.
b) Si existen diferencias significativas, haga una prueba de comparación de
DUNCAN (α=5%). Interprete.

c) Replique la prueba de comparación de DUNCAN con una prueba de TUKEY


(α=5%). Interprete.

PÁG. 26
SOLUCIÓN:

a) ¿Hay evidencia suficiente de que el rendimiento en dureza de las semillas


de los Recursos Forestales debido al contenido de almidón No depende
del tipo de Fertilizante utilizado? Halle el ANOVA (α=5%). De
conclusiones.

2% 5% 10%
4.3 6.5 9
5.2 7.3 7.8
4.8 6.9 8.5
4.5 6.1 8.1

Yi ∑ 𝑌𝐼 = 79
18.8 26.8 33.4
ni ∑ 𝑛𝐼 = 12
4 4 4
Yprom 4.7 6.7 8.35 Y.= 6.583333

1. Hipótesis:
H0: El rendimiento en dureza de las semillas de los RF debido al contenido
de almidón, SI depende del tipo de Fertilizante utilizado.

H1: Al menos un rendimiento en dureza de las semillas de los RF debido al


contenido de almidón NO depende del tipo de Fertilizante utilizado

H0: μ1= μ2= μ3


H1: μ1≠ μ2≠ μ3

2. Nivel de significancia:

Si α=0.05, entonces: 𝐹(1−𝛼,𝑘−1,𝑛−𝑘) = 𝐹(0.95,2,9) = 4.26

3. Cálculos de los Cuadrados Medios:

2
𝑦.2 (79)2
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = (4.3)2 + (6.5)2 + ⋯ + (8.1)2 − = 28.80
𝑛 12

∑ 𝑦𝑖2 𝑦.2 (18.8)2 +(26.8)2 +(33.4)2 (79)2


𝑆𝐶𝑇𝑟 = − = − = 26.73
𝑟𝑖 𝑛 4 12

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟 = 28.80 − 26.73 = 2.07

PÁG. 27
𝑆𝐶𝑇𝑟 26.73
𝐶𝑀𝑇𝑟 = = = 13.365
𝑘−1 2

𝑆𝐶𝐸 2.07
𝐶𝑀𝐸 = = = 0.23
𝑛−𝑘 9

4. Estadístico de Prueba:

𝐶𝑀𝑇𝑟 13.365
𝐹𝐶 = = = 𝟓𝟖. 𝟏𝟏
𝐶𝑀𝐸 0.23

5. Tabla ANOVA:

FUENTE DE GL SC CM FC FTabla
VARIACIÓN
% DE 2 26.73 13.365 58.11 4.26
ALMIDÓN
ERROR 9 2.07 0.23
TOTAL 11 28.80

6. Decisión y Conclusión:

Como FC > Ftabla, por lo tanto, aceptamos H1 y rechazamos H0 y diremos que


Al menos un rendimiento en dureza de las semillas de los RF debido al
contenido de almidón NO depende del tipo de Fertilizante utilizado, a un
nivel de confianza del 95%.
b) Si existen diferencias significativas, haga una prueba de comparación de
DUNCAN (α=5%). Interprete.

PRUEBA DE DUNCAN:
Si:

𝐶𝑀𝐸
𝐷𝑝 = 𝑑𝛼 (𝑝, 𝑛 − 𝑘)√ 𝑑𝑜𝑛𝑑𝑒: 𝑝 = 2, … , 𝑘
𝑟𝑏

1. Cálculo de las medias


𝑋̅1 = 4.7

𝑋̅2 = 6.7

𝑋̅3 = 8.35

PÁG. 28
2. Encontrando los Rangos de Duncan

0.23
𝐷3 = 𝑑0.05 (3,9)√ = (3.34)(0.24) = 0.802
4

0.23
𝐷2 = 𝑑0.05 (2,9)√ = (3.20)(0.24) = 0.768
4

3. Realizamos las comparaciones con el cuadro de diferencia de medias

Diferencia de >,< Rango(mínimo)


medias
𝑋̅3 − 𝑋̅2 8.35 − 6.7 = 1.65 > 0.802(𝐷3 )
𝑋̅3 − 𝑋̅1 8.35 − 4.7 = 3.65 > 0.802(𝐷3 )
𝑋̅2 − 𝑋̅1 6.7 − 4.7 = 2.00 > 0.802(𝐷3 )

4. Decisión y Conclusión: (Interpretación)

Por lo tanto, las parejas de las medias (3 y 2), (3 y 1) y (2 y 1), difieren


significativamente entre sí, a un nivel de confianza del 95%, por lo que la
comparación de Duncan nos da el respaldo de la prueba de ANOVA, antes
hecha.

c) Replique la prueba de comparación de DUNCAN con una prueba de


TUKEY (α=5%). Interprete.

PRUEBA TUKEY:

1. Valor en Tablas “T”:

𝑇𝑡𝑎𝑏𝑙𝑎 = 𝑞(𝛼,𝑘,𝑛−𝑘) = 𝑞(0.05,3,9) = 3.95

2. Ordenamos los promedios de mayor a menor:

𝑋3 = 8.35, 𝑋2 = 6.7, 𝑋1 = 4.7

PÁG. 29
3. Realizamos las comparaciones múltiples con el de tabla:

𝑋𝑖 − 𝑋𝑗
𝑇𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑞𝑖 =
𝐶𝑀𝐸

𝑟𝑏

8.35 − 6.7
𝑞1 = = 6.88 > 3.95 → 𝜇3 ≠ 𝜇2
√0.23
4

8.35 − 4.7
𝑞2 = = 15.22 > 3.95 → 𝜇3 ≠ 𝜇1
√0.23
4

6.7 − 4.7
𝑞3 = = 8.34 > 3.95 → 𝜇2 ≠ 𝜇1
√0.23
4

4. Decisión y Conclusión: (Interpretación)

Concluyendo, con una confianza del 95%, diremos que el rendimiento en


dureza de las semillas de los RF de los tratamientos 1, 2 y 3 debido al
contenido de almidón NO depende del tipo de Fertilizante utilizado, con lo que
verificaremos el resultado de nuestro ANOVA y replicamos y respaldamos de
igual forma la prueba Duncan antes hecha.

4. Para poder utilizar un Fertilizante como base para las Pruebas de


Reforestación de terrenos del Parque Nacional de los Bosques Secos de
Tumbes INRENA hace un estudio de los tipos de Fertilizante utilizado por
otras empresas del mercado nacional, con lo cual su área de Investigación y
Desarrollo hace un experimento, para esto se usaron ocho (08) variedades
de Terrenos con fines de Reforestación con cuatro repeticiones en un diseño
de bloques completos al azar. Los rendimientos se dan en Kg del
Fertilizante/Ha de terreno, en la siguiente tabla:

VARIEDAD DEL Repeticiones


TERRENO r1 r2 r3 r4
ARENOSO 0.265 0.525 0.265 0.440
II-S4-599-599-M 0.320 0.545 0.495 0.465
II-S18-CADEL-6-M 0.315 0.410 0.510 0.445

PÁG. 30
ARCILLOSO 0.175 0.410 0.410 0.250
LIMOSO 0.400 0.760 0.650 0.545
PEDREGOSO 0.260 0.685 0.615 0.550
SALINOS 0.240 0.310 0.425 0.410
HUMÍFERO 0.460 0.525 0.425 0.575

a) Realice un ANOVA, del tipo DBCA, para α=5%, de conclusiones.


b) Haga una prueba de DMS para α=5%.
c) Si se rechaza la Hipótesis Nula, entonces haga una prueba de comparación
de SHEFFÉ (α=5%).

SOLUCIÓN:

a) Realice un ANOVA, del tipo DBCA, para α=5%, de conclusiones.

TRATAMIENTOS TOTAL MEDIAS


DEL DE
BLOQUE BLOQUES
1 2 3 4 5 6 7 8 T.j X.j
0.265 0.32 0.32 0.17 0.4 0.26 0.24 0.46 2.435 0.304375
BLOQUES 0.525 0.545 0.41 0.41 0.76 0.68 0.31 0.53 4.17 0.52125
0.265 0.495 0.51 0.41 0.65 0.62 0.42 0.42 3.795 0.474375
0.44 0.465 0.45 0.25 0.55 0.55 0.41 0.58 3.68 0.46
TOTAL T..=14.08

Ti. 1.495 1.825 1.69 1.24 2.36 2.11 1.38 1.99


MEDIAS X..= 1.76
Xi. 0.374 0.456 0.42 0.31 0.59 0.53 0.35 0.50

1. Hipótesis:

H0: μ1= μ2= …. =μ8


H1: μ1≠ μ2≠ …. ≠μ8

2. Nivel de significancia:

Si α=0.05, entonces: 𝐹(1−𝛼,𝑘−1,(𝑘−1)(𝑟𝑖 −1) = 𝐹(0.95,7,21) = 2.49


𝐹(1−𝛼,𝑟−1,(𝑘−1)(𝑟𝑖 −1) = 𝐹(0.95,3,21) = 3.07

3. Cálculos de los Cuadrados Medios:

2 𝑇..2 (14.08)2
𝑆𝐶𝑇 = ∑ ∑ 𝑋𝑖𝑗 − = 0.2652 + 0.322 + ⋯ + 0.582 − = 0.6055
𝑟𝑘 32
∑ 𝑇𝑖.2 𝑇2.. 1.4952 + 1.8252 + ⋯ + 1.992 (14.08)2
𝑆𝐶𝑇𝑟 = − = − = 0.2662
𝑟𝑖 𝑟𝑘 4 32

PÁG. 31
1 𝑇..2 1 2 2 2 2 (14.08)2
𝑆𝐶𝐵𝐿 = ∑ 𝑇.𝑗2 − = (2.435 + 4.17 + 3.795 + 3.68 ) − = 0.2126
𝑘 𝑟𝑘 8 32
𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑇𝑟 − 𝑆𝐶𝐵𝐿 = 0.1267

𝑆𝐶𝑇𝑟 0.2662
𝐶𝑀𝑇𝑟 = = = 0.0380
𝑘−1 7

𝑆𝐶𝐵𝐿 0.2126
𝐶𝑀𝐵𝐿 = = = 0.0709
𝑟𝑖 − 1 3
𝑆𝐶𝐸 0.1267
𝐶𝑀𝐸 = = = 0.00603
(𝑟𝑖 − 1)(𝑘 − 1) 21

4. Estadístico de Prueba:
𝐶𝑀𝑇𝑟 0.0380
𝐹𝐶 = = = 𝟔. 𝟑𝟎𝟐
𝐶𝑀𝐸 0.00603

𝐶𝑀𝐵𝐿 0.0709
𝐹𝐶 = = = 𝟏𝟏. 𝟕𝟓𝟖
𝐶𝑀𝐸 0.00603

5. Tabla ANOVA:

FUENTE DE GL SC CM FC FTabla
VARIACIÓN
TRATAMIENTO 7 0.2662 0.0380 6.302 2.49
BLOQUES 3 0.2126 0.0709 11.758 3.07
ERROR 21 0.1267 0.00603
TOTAL 31 0.6055
6. Decisión y Conclusión:

PARA LOS TRATAMIENTOS


Como FC > Ftabla, por lo tanto, rechazamos H0 y aceptamos H1 y diremos que
existen diferencias significativas entre los tratamientos se las variedades de
los terrenos con fines de reforestación, a un nivel de confianza del 95%.

PARA LOS BLOQUES


Como FC > Ftabla, por lo tanto, por lo tanto, rechazamos H0 y aceptamos H1 y
diremos que existen diferencias significativas dentro de los bloques a un
nivel de confianza del 95%.

PÁG. 32
b) Haga una prueba de DMS para α=5%.
PRUEBA DMS

1. Hipótesis:
,
H0: μ1= μ2 H0: μ1= μ3 H0: μ1= μ4 …. H0: μ1= μ8
H1: μ1≠ μ2 H1: μ1≠ μ3 H1: μ1≠ μ4 …. H1: μ1≠ μ8 …….

2. Comparativo DMS:

𝑌̅5 = 0.59, 𝑌̅6 = 0.53, 𝑌̅8 = 0.50, 𝑌̅2 = 0.456,

𝑌̅3 = 0.42, 𝑌̅1 = 0.374, 𝑌̅7 = 0.35, 𝑌̅4 = 0.31

|𝑌̅5 − 𝑌̅6 | = |0.59 − 0.53| = 0.06

|𝑌̅5 − 𝑌̅8 | = |0.59 − 0.50| = 0.09

|𝑌̅5 − 𝑌̅2 | = |0.59 − 0.456| = 0.137

|𝑌̅5 − 𝑌̅3 | = |0.59 − 0.42| = 0.17

|𝑌̅5 − 𝑌̅1 | = |0.59 − 0.374| = 0.216

|𝑌̅5 − 𝑌̅7 | = |0.59 − 0.35| = 0.24

|𝑌̅5 − 𝑌̅4 | = |0.59 − 0.31| = 0.28

|𝑌̅6 − 𝑌̅8 | = |0.53 − 0.50| = 0.03

|𝑌̅6 − 𝑌̅2 | = |0.53 − 0.456| = 0.134

|𝑌̅6 − 𝑌̅3 | = |0.53 − 0.42| = 0.11

|𝑌̅6 − 𝑌̅1 | = |0.53 − 0.374| = 0.156

|𝑌̅6 − 𝑌̅7 | = |0.53 − 0.35| = 0.18

|𝑌̅6 − 𝑌̅4 | = |0.53 − 0.31| = 0.22


………………, así sucesivamente…con todos, hasta:

PÁG. 33
|𝑌̅7 − 𝑌̅4 | = |0.35 − 0.31| = 0.04

3. Estadístico de Prueba:

1 1 1 1
𝐷𝑀𝑆 = 𝑡(1−𝛼,,𝐺𝐿𝐸) √𝐶𝑀𝐸( + ) = 𝑡(0.975,21) √(0.00603)( + )
2 𝑛𝑖 𝑛𝑗 4 4
= (2.0796)(0.055) = 0.1144

4. Decisión y conclusión:

|𝑌̅5 − 𝑌̅6 | < 𝐷𝑀𝑆


|𝑌̅5 − 𝑌̅8 | < 𝐷𝑀𝑆
|𝑌̅5 − 𝑌̅2 | > 𝐷𝑀𝑆
|𝑌̅5 − 𝑌̅3 | > 𝐷𝑀𝑆
|𝑌̅5 − 𝑌̅1 | > 𝐷𝑀𝑆
|𝑌̅5 − 𝑌̅7 | > 𝐷𝑀𝑆
|𝑌̅5 − 𝑌̅4 | > 𝐷𝑀𝑆
|𝑌̅6 − 𝑌̅8 | < 𝐷𝑀𝑆
|𝑌̅6 − 𝑌̅2 | > 𝐷𝑀𝑆
|𝑌̅6 − 𝑌̅3 | < 𝐷𝑀𝑆
|𝑌̅6 − 𝑌̅1 | > 𝐷𝑀𝑆
……………………………………………..
|𝑌̅7 − 𝑌̅4 | < 𝐷𝑀𝑆

Como: En algunos casos |𝑌̅𝑖 − 𝑌̅𝑗 | < 𝐷𝑀𝑆 , entonces rechazamos H0 y


aceptamos H1 y diremos que sí existen diferencias significativas entre casi
todas las medias, por lo que corroboramos con lo obtenido con el ANOVA.
c) Si se rechaza la Hipótesis Nula, entonces haga una prueba de
comparación de SHEFFÉ (α=5%).

PRUEBA DE SCHEFFÉ:
Si:
𝑡

𝐶 = ∑ 𝑎 𝑖 𝜇𝑖
𝑖=1

Y
2
𝑎
|𝐶̂ | = √𝑆𝐸2 ∑𝑡𝑖=1 𝑛𝑖 √(𝑡 − 1)𝐹(𝛼,𝑡−1,𝑁−𝑡)
𝑖

PÁG. 34
Sea:
𝑪𝟏 = 𝑌̅5 + 𝑌̅6 + 𝑌̅8 − 𝑌̅2 = 0.59 + 0.53 + 0.50 − 0.456 = 1.164
𝑪𝟐 = 𝑌̅8 − 𝑌̅2 = 0.50 − 0.456 = 0.044

1. Hipótesis:
H0: C=0
H1: C ≠0

2. Nivel de Significancia:

α=0.05 → 𝐹(𝛼,𝑡−1,𝑁−𝑡) = 𝐹(0.05,7,24) = 2.42

3. Estadístico de prueba:

1 1 1 1
𝑺[𝑪𝟏 ] = √(0.00603)( + + + )(7)(2.42) = 𝟎. 𝟑𝟏𝟗
4 4 4 4

1 1
𝑺[𝑪𝟐 ] = √(0.00603)( + )(7)(2.42) = 𝟎. 𝟐𝟐𝟔
4 4

4. Comparaciones Múltiples:
𝑪𝟏 > 𝑺[𝑪𝟏 ], 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝒔𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 𝒚 𝒔𝒆 𝒂𝒄𝒆𝒑𝒕𝒂 𝑯𝟏

𝑪𝟐 < 𝑺[𝑪𝟐 ], 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝒔𝒆 𝒂𝒄𝒆𝒑𝒕𝒂 𝑯𝟎 𝒚 𝒔𝒆 𝒂𝒄𝒆𝒑𝒕𝒂 𝑯𝟏

5. Conclusión:
A un nivel de confianza del 95%, diremos que entre las medias 8 y 2
existen diferencias significativas entre sus medias.

5. Los datos que se le adjuntan son las densidades de un producto herbicida


utilizado en la recuperación de árboles afectados por una plaga de insectos
temporales, se desea saber si influye en la recuperación de los árboles, para
esto se plantean tres eventos, como se muestra en la tabla antes mencionada,
se podría decir que par todos los eventos no existen diferencias significativas
(use α=5%). Para esto haga uso del diseño del cuadro latino.

EVENTOS 1 2 3
I 1.58(B) 1.60(C) 1.80(A)
II 1.48(A) 1.65(C) 1.82(B)
III 1.60(C) 1.62(B) 1.83(A)

PÁG. 35
SOLUCIÓN:

1. MODELO MATEMÁTICO:

Yijk    Ti  Fj  CK  ijk

2. HIPÓTESIS:
H0: μ1= μ2= μ3
H1: μ1≠ μ2 ≠ μ3

3. ORDENAMIENTO DE LOS DATOS:

COLUMNAS
FILAS
1 2 3 Total
I 1.58(B) 1.60(C) 1.80(A) 4.98
II 1.48(A) 1.65(C) 1.82(B) 4.95
III 1.60(C) 1.62(B) 1.83(A) 5.05
Total 4.66 4.87 5.45 14.98

TRATAMIENTOS TOTALES
A 5.11
B 5.02
C 4.85

4. NIVEL DE SIGNIFICANCIA:

𝐹(1−𝛼,𝑖−1,(𝑝−2)(𝑝−1) = 𝐹(0.95,2,2) = 19.00


𝐹(1−𝛼,𝑘−1,(𝑝−2)(𝑝−1) = 𝐹(0.95,2,2) = 19.00
𝐹(1−𝛼,𝑝−1,(𝑝−2)(𝑝−1) = 𝐹(0.95,2,2) = 19.00

5. CÁLCULO DE LOS CUADRADOS MEDIOS:

2
𝑌..2 14.982
SCDTOTAL = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 − = 1.582 + ⋯ . +1.832 −
𝑁 9
𝑖 𝑗
= 0.1216

1 2
𝑌..2 5.112 + ⋯ . +4.852 14.982
SCDTRAT = ∑ 𝑌𝑗.. − = − = 0.01162
𝑃 𝑁 3 9

PÁG. 36
1 2
𝑌..2 4.982 + ⋯ + 5.052 14.982
SCDFILA = ∑ 𝑌𝑖.. − = − = 0.00176
𝑃 𝑁 3 9

1 2
𝑌..2 4.662 + ⋯ + 5.452 14.982
SCDCOLUMNA = ∑ 𝑌𝑘.. − = − = 0.0116
𝑃 𝑁 3 9

Reemplazando los valores:

SCDERROR = SCDTOTAL − SCDTRAT − SCDFILA − SCDCOLUMNA = 0.09662


GlTOTAL = N − 1 = 12 − 1 = 11

GlTRAT = #TRAT − 1 = 3 − 1 = 2

GlFILA = #FILAS − 1 = 3 − 1 = 2

GlCOLUMNA = #COLUM − 1 = 3 − 1 = 2

GlERROR = GlTOTAL − GlTRAT − GlFILA − GlCOLUMNA = 5

SCDTRAT 0.01162
CMTRAT = = = 0.00581
GlTRAT 2

SCDFILA
CMFILA = = 0.00088
GlFILA

SCDCOLUM
CMCOLUMNA = = 0.0058
GlCOLUM

SCDERROR 0.09662
CMERROR = = = 0.0193
GlERROR 5

6. TABLA ANOVA:

Fc FTAB
FUENTES DE
VARIACIÓN. GL SDC CM 5%
FILAS 2 0.00176 0.00088 0.0456 19.00
COLUMNAS 2 0.0116 0.0058 0.30052 19.00
TRATAMIENTOS 2 0.01162 0.00581 0.30104 19.00
ERROR 5 0.09662 0.0193
TOTAL 11

PÁG. 37
7. DECISIÓN Y CONCLUSIÓN:

PARA LOS TRATAMIENTOS.


Como FCAL < FTAB, para todos los eventos entonces aceptamos H0 y
rechazamos a H1 por lo diremos que la densidad del herbicida no presenta
diferencias significativas al aplicarse a los árboles en su recuperación de la
plaga a un nivel de confianza del 95%.

PARA LAS FILAS.


Como FCAL < FTAB, para todos los eventos entonces aceptamos H0 y
rechazamos a H1 por lo diremos que NO existen diferencias significativas
entre las filas del DCL a un nivel de confianza del 95%.

PARA LAS COLUMNAS.


Como FCAL < FTAB, para todos los eventos entonces aceptamos H0 y
rechazamos a H1 por lo diremos que NO existen diferencias significativas
entre las columnas del DCL a un nivel de confianza del 95%.

V. CONCLUSIONES Y RECOMENDACIONES.

5.1. CONCLUSIONES:

1. Mediante este trabajo se puede mostrar como los investigadores


seleccionan el tamaño de una muestra (para las diferentes
investigaciones) para que sea significativa con relación a la población
a trabajar y que esta significación está dada por tres aspectos muy
importantes, que son: el nivel de confianza a trabajar, en lo que se
prefiere hacerlo sobre el 95 % de confianza; el error a considerar en el
cálculo, que debe estar entre un 1 hasta un 5 %, y la proporción de
considerar que la muestra calculada no posee las características o
propiedades de la población.
2. El análisis de varianza o ANOVA, en su Test DCA, el cual es un
método que se utiliza para comparar dos o más medias partiendo de
una hipótesis sobre la igualdad de medias poblacionales. Cuando se
comparan las varianzas muestrales es posible llegar a algunas

PÁG. 38
conclusiones o inferencia de los valores relativos de las medias
poblacionales.
3. Los ANEVAS en su Test DCBA se aplica con la finalidad de analizar
las diferencias o semejanzas significativas tanto de las medias como
de las varianzas, donde una alta o baja razón implicarían la
aceptación o rechazo de la hipótesis, y por otro lado se revelará el
efecto que tiene una variable sobre la otra de acuerdo, a su población
en cuanto a su grado de predictibilidad, a mayor o menor covarianza.
4. Las comparaciones múltiples de las medias permiten examinar cuáles
medias son diferentes y estimar el grado de diferencia, se puede
evaluar la significancia estadística de las diferencias entre las medias
usando un conjunto de intervalos de confianza, un conjunto de
pruebas de hipótesis o ambos. Los intervalos de confianza permiten
evaluar la significancia práctica de las diferencias entre las medias,
además de la significancia estadística. Como es habitual, la hipótesis
nula de no diferencia entre medias se rechaza si y solo si el intervalo
de confianza no contiene el cero.

5.2. RECOMENDACIONES:

1. Se recomienda que los experimentos sean evaluados empleando las


técnicas de diseño de experimentos para confirmar y aumentar los
resultados alcanzados en esas investigaciones.
2. Contrario a lo que suele pensarse, el tamaño muestral o número de
individuos en este tipo de modelos, no resultó relevante en la
estimación de los parámetros. Del estudio se observó que el sesgo
relativo no se vio afectado al variar el número de individuos
3. Para que los métodos estadísticos utilizados para los experimentos
descritos en los artículos se puedan adecuar a nuestros problemas.
En cada experimento se verifica que los datos cumplieran con una
distribución normal. Se tuvo en cuenta que los factores de estudios
eran cuantitativos para la toma de decisión de la prueba estadística
a aplicar.

PÁG. 39
VI. RESEÑA BIBLIOGRÁFICA.

1. AHYNN S, ANDERSON J, (2016). “Sample size determination for


comparing more than two survival distributions”. Stat Med. Michigan.
2. ANDERSON, D., SWEENEY, D., WILLIAMS, T, (2014). “Estadística para
administración y la Ingeniería”. (10ª ed.). México: Editorial Cengage.
3. SUÁREZ, M, (2012), “Interaprendizaje de los métodos estadísticos en las
muestras para medias conocidas y desconocidas con Excel”, WINSTATS
Y GRAPH, Primera Edición. Imprenta M & V, Ibarra.
4. SPIEGEL, M, (2014). “Estadística II”, McGraw-Hill, México.
5. OLAV K, (2018). “Symmetries and Invariance Principles”. Springer-
Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4.
6. MONTES DE OCA, F, (2015). “RESOLUCION TOTAL DE PROBLEMAS
DE METODOS ESTADISTICOS”. Vol. 1 y 2.
7. LENTNER M. y BISHOP T. (2016). “Experimental design and analysis”.
Valley Book Company, Blacksburg. 565 p.
8. LITTELL, R.C., MILLIKEN, G. A., STROUP, W. W. And WOLFINGER, R.
D. (2016). “System for Mixed Models”. SAS Institute Inc, Cary, NC. 633p.
9. MONTGOMERY, D, (2014). “Diseño y Análisis de Experimentos”.
Iberoamericana, México, D.F. 589 p.
10. HOSTETLER, R, (2015). “Estadística Inferencial de Carling”. 6ta edición.
Editorial Norma. Perú.

PÁG. 40

También podría gustarte