Está en la página 1de 14

UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA

‘’ANTONIO JOSÉ DE SUCRE’’

VICERRECTORADO BARQUISIMETO

DEPARTAMENTO DE INGENIERÍA INDUSTRIAL

SECCIÓN DE ADMINISTRACION

PROBABILIDAD Y ESTADÍSTICA

II - 3043

TRABAJO 3

ANÁLISIS DE VARIANZA

Asignatura:

Probabilidad y estadística

Profesora:

Ing. Tamara Fuentes

Autores:

- Oscar Peña / oscarpl1610@gmail.com


- José Medina / elreydavid.0708@gmail.com

Barquisimeto, 06 De octubre del 2023


Índice

INTRODUCCIÓN............................................................................................................3

ANÁLISIS DE VARIANZA...................................................................................................4

¿Para qué sirve ANOVA?:........................................................................................5

¿Para qué se utiliza el Análisis de la Varianza (ANOVA)?:...................................5

¿Cuál es el Procedimiento de ANOVA?:...........................................................6

¿Qué es ANOVA en dos sentidos? ANOVA para dos factores:......................7

Planteamiento del problema.................................................................8

Conclusiones.............................................................................................11

Referencias Electrónicas.......................................................................12
Introducción
En esta investigación, se abordará el tema del Análisis de Varianza (ANOVA) y su
aplicación práctica utilizando la herramienta de Excel. El ANOVA es una técnica estadística
utilizada para determinar si existen diferencias significativas entre las medias de dos o más
grupos.

En primer lugar, se explorará en detalle qué es el ANOVA y para qué se utiliza. Se


examinará cómo esta técnica permite comparar las medias y determinar si las diferencias
observadas son resultado de la variabilidad dentro de los grupos o de la variabilidad entre los
grupos.

Luego, se analizará el procedimiento de ANOVA, detallando los pasos necesarios para


llevar a cabo esta prueba estadística. Se describirá cómo se recopilan y organizan los datos,
cómo se calculan las sumas de cuadrados y se obtienen los valores de F para evaluar la
significancia de las diferencias entre las medias.

Además, se profundizará en el concepto de ANOVA en dos sentidos o ANOVA para


dos factores. Se explicará cómo esta variante del ANOVA analiza el efecto conjunto de dos
variables independientes en una variable dependiente, permitiendo evaluar si existen
diferencias significativas debido a la combinación de los niveles de los dos factores.

Finalmente, se diseñará un conjunto de datos específico para aplicar la prueba de


ANOVA utilizando Excel. Se describirá paso a paso el procedimiento para realizar el análisis
en Excel, incluyendo el cálculo de las sumas de cuadrados, los grados de libertad y los
valores de F. Además, se presentarán los resultados obtenidos en Excel de manera clara y
visualmente atractiva.

Entonces, esta investigación proporcionará una comprensión profunda del ANOVA, su


utilidad y su procedimiento. Además, demostrará la aplicación práctica de esta técnica
utilizando Excel, a través del diseño de un conjunto de datos y la presentación de los
resultados obtenidos. Este conocimiento será de gran valor en diversos campos de estudio y
en la toma de decisiones basada en datos.
Análisis De Varianza
Análisis de la Varianza (ANOVA):

Análisis de la Varianza (ANOVA) es una fórmula estadística que se utiliza para


comparar las varianzas entre las medias (o el promedio) de diferentes grupos. Una variedad
de contextos lo utilizan para determinar si existe alguna diferencia entre las medias de los
diferentes grupos.

Por ejemplo, para estudiar la efectividad de diferentes medicamentos para la diabetes,


los científicos diseñan y experimentan para explorar la relación entre el tipo de medicamento
y el nivel de azúcar sanguínea resultante. La población de la muestra es un conjunto de
personas. Dividimos la población de la muestra en varios grupos y cada grupo recibe un
medicamento en particular durante un período de prueba. Al final del período de prueba, se
miden los niveles de azúcar sanguínea para cada uno de los participantes individuales.
Luego, para cada grupo, se calcula el nivel medio de azúcar sanguínea. ANOVA ayuda a
comparar las medias de estos grupos para averiguar si son estadísticamente diferentes o si
son similares.

El resultado de ANOVA es la 'estadística F'. Esta ratio muestra la diferencia entre la


varianza dentro del grupo y la varianza entre grupos, lo que finalmente produce una cifra que
permite concluir que la hipótesis nula es respaldada o rechazada. Si hay una diferencia
significativa entre los grupos, la hipótesis nula no es compatible y la razón F será mayor.
¿Para qué sirve ANOVA?:
Algunas personas cuestionan la necesidad de ANOVA; después de todo, los valores
medios se podrían evaluar con solo mirarlos. Pero ANOVA hace más que comparar los
valores medios.

Aunque los valores medios de varios grupos parecen ser diferentes, esto podría ser
debido a un error de muestreo más que al efecto de la variable independiente sobre la
variable dependiente. Si se debe a un error de muestreo, la diferencia entre las medias de los
grupos no tendrá sentido. ANOVA ayuda a averiguar si la diferencia en los valores medios es
estadísticamente significativa.

ANOVA también revela indirectamente si una variable independiente está influyendo


en la variable dependiente. Por ejemplo, en el experimento de nivel de azúcar sanguíneo
anterior, suponga que ANOVA encuentra que las medias de los grupos no son
estadísticamente significativas y que la diferencia entre las medias de los grupos se debe
solo a un error de muestreo. Este resultado infiere que el tipo de medicación (variable
independiente) no es un factor significativo que influya en el nivel de azúcar sanguíneo.

¿Para qué se utiliza el Análisis de la Varianza (ANOVA)?:


El Análisis de la Varianza (ANOVA) es una técnica estadística muy versátil y se utiliza
en una amplia variedad de campos. Algunos de los principales usos del ANOVA son:

1. Comparación de medias: El ANOVA se utiliza para comparar la media de tres o más


grupos y determinar si existen diferencias significativas entre ellas.

2. Experimentos controlados: Se utiliza en experimentos controlados para analizar los


efectos de diferentes tratamientos o intervenciones en los resultados.

3. Investigación de mercados: Se usa en investigación de mercados para analizar la


preferencia de los consumidores por diferentes productos o servicios.

4. Ciencias sociales: Para analizar la relación entre diferentes variables, como la edad,
la educación y los ingresos.

5. Investigación médica: El ANOVA se utiliza en investigación médica para analizar los


efectos de diferentes tratamientos en pacientes con una determinada enfermedad.
Ciencias ambientales: Para analizar los efectos de diferentes variables en el medio
ambiente, como la contaminación y el clima.

¿Cuál es el Procedimiento de ANOVA?:


El primer concepto fundamental es suponer que todo valor observado puede
expresarse mediante la siguiente función:

y ij sería el valor observado (variable dependiente) [valor j-ésimo del tratamiento i-ésimo],

y es el efecto del tratamiento i.

µ sería una constante que en la recta de regresión equivale a la ordenada en el origen.

τ i es una variable que varía de tratamiento a tratamiento.

Eij es una variable aleatoria que añade a la función cierto error que desvía la puntuación
observada de la puntuación pronosticada.

Por tanto, a la función de pronóstico la podemos llamar "media del tratamiento i":

Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones


esperadas, más el error aleatorio ( y ij =µ+τ i x y ). A partir de esa idea, se puede operar:
2

1. Restamos a ambos lados de la ecuación (para mantener la igualdad) la media de la


variable dependiente:

Operando se llega finalmente a que:

Esta ecuación se reescribe frecuentemente como:


De un factor, que es el caso más sencillo, la idea básica del análisis de la varianza es
comparar la variación total de un conjunto de muestras y descomponerla como:

Donde:

SSfact es un número real relacionado con la varianza, que mide la variación debida al "factor",
"tratamiento" o tipo de situación estudiado.

SSint es un número real relacionado con la varianza, que mide la variación dentro de cada
"factor", "tratamiento" o tipo de situación.

En el caso de que la diferencia debida al factor o tratamiento no sea estadísticamente


significativa puede probarse que las varianzas muestrales son iguales:

Donde:

a es el número de situaciones diferentes o valores del factor se están comparando.

b es el número de mediciones en cada situación se hacen o número de valores disponibles


para cada valor del factor.

Así lo que un simple test a partir de la F de Snedecor puede decidir si el factor o


tratamiento es estadísticamente significativo.

¿Qué es ANOVA en dos sentidos? ANOVA para dos factores:

En el contexto de la estadística, ANOVA (Análisis de Varianza) se refiere a una técnica


utilizada para analizar si existen diferencias significativas entre las medias de dos o más
grupos. En el caso de ANOVA de dos factores, se analiza el efecto de dos variables
independientes (factores) en una variable dependiente.

Específicamente, ANOVA de dos factores evalúa si hay diferencias significativas en la


variable dependiente debido a la combinación de los niveles de los dos factores. Por ejemplo,
se puede utilizar para analizar si hay diferencias en el rendimiento académico de los
estudiantes en función de su género y el tipo de escuela a la que asisten.
Entonces, el ANOVA para dos factores es una técnica estadística utilizada para
estudiar el efecto conjunto de dos variables independientes en una variable dependiente.

Planteamiento del problema:


Se ha investigado el efecto de cuatro tipos de fertilizantes A, B, C y D, sobre el
crecimiento de una planta en centímetros. La estrategia experimental es aplicar cuatro veces
los tres tipos de fertilizantes en orden completamente aleatorio (16 pruebas en orden
aleatorio). Si se usa el diseño completamente al azar (DCA), se supone que, además del tipo
de fertilizante, no existe ningún otro factor que influya de manera significativa sobre la
variable de respuesta (crecimiento de la planta).

Tabla de datos:

Tipo de Fertilizante (Centím etros)


N ro A B C D
1 2 3 7 6
2 4 5 12 8
3 3 6 7 7
4 4 4 9 5

Solución:

Se entregan los registros (datos) de las pruebas en donde reflejado está el crecimiento en
centímetros de las plantas con cada tipo de fertilizante aplicado en ellas. De ahí aplicamos
las siguientes formulas y hallamos cada valor correspondiente:

Fórmulas simplificadas a usar:


Hallamos cada variable usando los datos:

Suma(x i.)= 13 18 35 26
Media= 3,3 4,5 8,8 6,5
Suma total(x ..)= 92
n i= 4 4 4 4
N= 16 k= 4

Donde:

 Suma (xi): Sumatoria de la columna 1, 2, 3, 4


 Media: Es el promedio de los valores de cada columna (1, 2, 3 y 4)
 ni: Cantidad de calores en una columna (1, 2, 3 y 4)
 N = Cantidad total de valores

Ahora se puede aplicar las fórmulas correspondientes quedando tal que:

SC Trat = 69,5
SC Total= 99,0
SC Error = 29,5

Para simplificar el trabajo, con ayuda de la herramienta Excel, podemos calcular cada
una usando los siguientes comandos:

Se enseñará una imagen para hacerlo visualmente más fácil de notar y entender:

1. SCTrat:
2. SCTotal:

3. SCError:

Sencillamente es la resta de SCTotal – SCTrat:

Con los datos que obtuvimos vamos a calcular el ANOVA

Para ello debemos hacer uso de las siguientes formulas


Realizamos cada calculo para la suma de cuadrados, grados de libertad, cuadrado medio y F

Ahora vamos a calcular el valor critico y el p-valor mediante la fórmula de Excel

Vamos a hacer el análisis de varianza a través de este módulo, le damos simplemente


análisis de datos, análisis de varianza de un factor, el rango de entrada en este caso será el
siguiente:

Y así el Excel nos ha calculado los valores de salida, tenemos los grupos, la suma total, los
promedios y las varianzas y además la tabla de análisis de varianza.
Luego en la prueba de hipótesis donde si se tiene un valor F calculado a la derecha del valor
crítico, entonces la teoría nos dice que debemos rechazar la hipótesis nula.

Para el método de Tukey vamos a utilizar los datos que hemos obtenido anteriormente

Ahora para poder identificar cuales son las diferencias significativas, vamos a calcular la
diferencia de los promedios para cada una de las muestras. Entonces vamos a calcular
primero la diferencia del promedio de a menos el promedio de b y así sucesivamente hasta
llegar al promedio de c menos d

En conclusión, podemos decir que el método A=B=D y el método C=D


En conclusión, se ha definido ANOVA como el Análisis de Varianza, una técnica
estadística utilizada para determinar si existen diferencias significativas entre las medias de
dos o más grupos. Se utiliza para comparar las medias y determinar si estas diferencias se
deben a la variabilidad dentro de los grupos o a la variabilidad entre los grupos.

El procedimiento de ANOVA implica varios pasos. Se inicia recopilando los datos y


organizándolos en grupos según el factor de interés. Luego, se calculan las sumas de
cuadrados para determinar la variabilidad total, entre grupos y dentro de los grupos. A
continuación, se determinan los grados de libertad y se obtienen los valores de F para
evaluar la significancia de las diferencias entre las medias.

En particular, se ha explorado ANOVA en dos sentidos o ANOVA para dos factores,


que analiza el efecto conjunto de dos variables independientes en una variable dependiente.
Esto implica evaluar si existen diferencias significativas en la variable dependiente debido a
la combinación de los niveles de los dos factores.

Para aplicar ANOVA utilizando Excel, se ha diseñado un conjunto de datos y se ha


seguido un procedimiento paso a paso en Excel. Mediante las herramientas y funciones
estadísticas disponibles en Excel, se han realizado los cálculos necesarios y se han
presentado los resultados de manera clara y precisa.

Finalmente, el diseño del conjunto de datos ha sido crucial para asegurar la


representatividad de las variables y grupos de interés. Además, se ha seguido un
procedimiento riguroso para organizar los datos y calcular las sumas de cuadrados, los
grados de libertad y los valores de F. La herramienta de Excel ha sido de gran utilidad en
este proceso, ya que ha facilitado los cálculos estadísticos y ha permitido presentar los
resultados de manera clara y visualmente atractiva.
Referencias Electrónicas
 ¿Qué es Análisis de la Varianza (ANOVA)?. (2023). Recuperado de
https://www.tibco.com/es/reference-center/what-is-analysis-of-variance-anova
 Cristina Ortega. (2023). Anova: Qué es y cómo hacer un análisis de la varianza.
Recuperado de https://www.questionpro.com/blog/es/anova/#:~:text=La%20prueba
%20ANOVA%20o%20an%C3%A1lisis,o%20aceptar%20la%20hip%C3%B3tesis
%20alternativa.
 ANOVA de un factor. (2023). Recuperado de https://www.ibm.com/docs/es/spss-
statistics/saas?topic=features-one-way-anova
 Academia Minier. (2018). ANÁLISIS DE VARIANZA (ANOVA). Recuperado de
https://www.youtube.com/watch?v=ZpXVjHRZAIw

 El Tío Estadístico. (2022). Cómo realizar el Análisis de Varianza ANOVA ✅ paso a paso

en Excel. Recuperado de https://www.youtube.com/watch?v=k1b0CTFrfEY

También podría gustarte