Está en la página 1de 16

INFERENCIA ESTADÍSTICA

Fase 4 - ANOVA

Presentado por:

Ledy Milena Sanchez

C.C. 1.031.122.467

Grupo: 100403_10

Presentado a:
Luis Antonio Cely

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


UNAD
5/3/2020
1. Definición y características principales del análisis de varianza
El análisis de varianza es un método con el cual se realiza comparación de 2 o más medias,
con el fin de evaluar si son iguales. Esta comparación permite determinar si las diferencias
entre las medias muestrales revelan verdaderas diferencias son reales o por el contrario
son indicativas de una variabilidad en el muestreo.
Características:
- Una variable dependiente cuantitativa
- Poseer una o más variables independientes cualitativas
- Los datos deben poseer una distribución normal
- Establecer las hipótesis de la población y la muestra
- Sus valores no pueden ser negativos

2. ¿Cuándo y cómo aplicar un análisis de varianza?


Se aplica el ANOVA cuando existe homogeneidad de varianza en las poblaciones, las
muestras sobre las que se aplican los tratamientos son independientes y cuando las
distribuciones de probabilidad de la variable dependiente correspondiente a cada factor
son normales.
Para aplicar un análisis de varianza, se debe:
Para aplicar el análisis de varianza, se deben seguir los siguientes pasos:
a. Calcular la media muestral
b. Restar la media de cada valor de la muestra
c. Elevar al cuadrado cada una de las diferencias
d. Sumar las diferencias elevadas al cuadrado
e. Dividir entre n-1
f. Realizar el contraste de hipótesis
3. Explique cada uno de los modelos de análisis de varianza. De ejemplos.
Modelo I: Efectos fijos
Se aplica a situaciones en donde el experimentador ha sometido a un grupo o población a
varios factores, cada uno de los cuales afectan sólo a la media, permaneciendo la variable
respuesta con una distribución normal.
Ejemplo:
Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial,
comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y
se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún
tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin
sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis.
Las presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:

La tabla de anova es:


Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.
La tabla de anova que devuelve el programa es

Modelo II: Efectos aleatorios


Los niveles de factor o factores, se extraen de forma aleatoria de un conjunto más aplio de
niveles. Los resultados son validos para el conjunto de niveles que se tuvo en cuenta en el
diseño inicial.
Ejemplo:
Al fin de determinar si 3 marcas de galletas (I, II, III) de bajo contenido en grasa tienen
distinto porcentaje de lípidos, se analizan muestras de cada una de las marcas por cuatro
analistas (A, B, C, D) diferentes.

Cada analista determina el porcentaje de lípidos en una muestra de cada tipo de galleta.
Las mediciones fueron:

Sumas de cuadrados:

Conclusión: Al nivel de significación α = 0.05, no se puede afirmar que ninguno de los


factores influya en la media

4. ¿Es útil aplicar análisis de varianza a la problemática de estudio? - Explique por qué
Si, es útil, debido a que nos permite determinar el comportamiento de una variable en
muestras aleatorias. Asimismo podemos determinar si las muestras son iguales o
diferentes con el análisis de sus variables cualitativas.
Densidad Crioscopia % Sólidos
Proveedor Departamento % Proteína % Grasa
(g/ml) (°C) totales

29 4 1.04 -0.56 3.2 2.9 12.1


45 4 0.97 -0.55 3.2 2.9 11.5
109 4 1.10 -0.57 3.3 3.1 12.0
117 4 1.01 -0.54 3.3 3.1 11.8
157 4 1.00 -0.51 3.2 3.0 12.4
165 4 0.97 -0.5 3.2 3.1 12.3
341 4 1.04 -0.56 3.3 3.0 12.3
389 4 0.98 -0.51 3.1 2.9 12.3
421 4 1.02 -0.55 3.3 3.0 11.5
469 4 0.96 -0.53 3.2 3.0 12.2
501 4 1.16 -0.49 3.1 3.0 12.2
581 4 1.11 -0.53 3.1 3.2 12.1
605 4 1.10 -0.54 3.3 3.0 12.0
701 4 1.03 -0.54 3.0 3.0 11.2
749 4 1.00 -0.5 3.1 2.9 12.0
773 4 1.00 -0.5 3.3 2.9 12.3
885 4 0.97 -0.54 3.3 3.0 12.0
965 4 1.04 -0.53 3.1 3.0 11.8
1021 4 1.05 -0.53 3.3 2.9 12.0
1029 4 1.08 -0.54 3.0 3.0 11.8
1085 4 1.02 -0.51 3.2 3.2 11.3
1221 4 1.08 -0.51 3.2 3.1 11.9
1349 4 1.00 -0.55 3.3 3.1 11.6
1365 4 0.91 -0.52 3.2 2.7 11.9
1373 4 0.99 -0.54 3.0 2.9 11.8
1445 4 1.01 -0.52 3.2 2.9 12.2
1589 4 0.99 -0.54 3.2 2.9 12.0
1653 4 0.98 -0.52 3.2 2.9 11.5
1677 4 1.03 -0.5 3.2 3.0 11.4
1837 4 1.00 -0.49 3.3 3.0 11.1
1861 4 1.02 -0.5 3.1 3.1 11.4
2005 4 1.02 -0.52 3.3 3.0 11.9
2677 4 1.03 -0.51 3.2 3.0 12.0
2709 4 1.00 -0.54 3.1 2.9 11.5
Células
somáticas Tipo de Prueba de
Peroxidasa Fosfatasa Temperatura Precio
(células/ml leche yodo
de leche)
1891091 2 2 1 1 530 1
1883431 2 2 2 2 609 2
1897896 2 2 3 2 938 2
1900423 2 2 1 2 598 2
1893141 2 2 4 2 554 2
1900393 1 2 4 3 789 2
1901123 2 1 2 1 893 2
1911823 2 2 4 1 495 2
1901978 2 2 4 1 480 2
1923260 2 2 1 3 878 2
1907446 1 2 4 2 790 1
1884143 2 2 3 3 430 1
1895253 2 2 1 3 1258 2
1890927 2 2 2 1 722 2
1897488 2 2 3 3 667 2
1910548 1 2 4 2 848 2
1901186 2 2 3 3 766 2
1898611 2 2 1 2 496 2
1902580 2 2 1 2 703 2
1897054 2 2 1 2 637 2
1896758 2 2 1 2 576 2
1903301 2 2 1 1 838 2
1890986 2 2 1 2 929 2
1900664 2 2 1 1 1005 2
1886323 1 2 2 1 901 2
1885853 2 2 1 2 925 2
1891507 2 2 2 2 889 2
1887022 2 2 2 2 792 2
1901369 1 2 1 3 455 2
1884220 2 2 1 2 733 2
1899280 2 2 2 2 570 2
1896757 2 2 1 3 878 2
1908617 2 1 2 2 737 2
1922262 1 2 1 1 342 2
Temperatura
Satisfacción
de recepción

2 4
1 2
1 2
1 2
1 3
1 2
1 2
1 2
1 1
2 4
1 2
1 2
2 2
1 2
1 2
1 2
1 4
2 2
1 3
1 2
2 3
1 3
1 2
1 2
2 2
2 2
1 2
1 2
1 2
1 2
1 2
1 4
1 4
1 3
Evaluar si el “costo” depende de la “satisfacción” que se tiene de cada proveedor en el de
trabajar debe ser así

Satisfecho Poco satisfecho


Costo promedio proveedor Costo promedio proveedor
1 6
Costo promedio proveedor Costo promedio proveedor
2 7
Costo promedio proveedor Costo promedio proveedor
3 8
Costo promedio proveedor Costo promedio proveedor
4 9
Costo promedio proveedor Costo promedio proveedor
5 10

Paso 1: Describir la hipótesis

H0: El costo depende de la satisfacción suministrada por cada proveedor en el depa


H1: El costo no depende de la satisfacción suministrada por cada proveedor en el d

Paso 2: Establecer el nivel de significancia con el que se va a trabajar


a = 0.05

Paso 3: Estadístico de prueba F (o calculado)

Satisfecho Poco satisfecho


Observación 1 938 554
Observación 2 790 703
Observación 3 848 576
Observación 4 929 838
Observación 5 733 342

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma
Satisfecho 5 4238
Poco Satisfecho 5 3013
Nada Satisfecho 5 3789
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad
Entre grupos 153626.8 2
Dentro de los grupos 249013.2 12

Total 402640 14

No se rechaza H0
3.70165437012978

Paso 5: Tomar la decisión

El estadístico calculado (F) presenta un valor menor al valor crítico de F, razón por la qu

Paso 6: Conclusión

La media de las observaciones son homogéneas, lo que permite concluir que el costo d
en el Departamento 4.
ada proveedor en el departamento 4. La organización de los datos a
ebe ser así

Nada satisfecho
Costo promedio proveedor
11
Costo promedio proveedor
12
Costo promedio proveedor
13
Costo promedio proveedor
14
Costo promedio proveedor
15

ada proveedor en el departamento 4


or cada proveedor en el departamento 4

Nada satisfecho
530
878
766
878
737

Promedio Varianza
847.6 7812.30000000005
602.6 34118.8
757.8 20322.2
Promedio de los cuadrados F Probabilidad Valor crítico para F
76813.4 3.70165437012978 0.055954202679459 3.88529383470338
20751.1

3.88529383470338
Rechazar H0

o de F, razón por la que se acepta la Hipótesis Nula.

oncluir que el costo depende de la satisfacción suministrada por cada proveedor


Conclusiones
Al realizar el Análisis de Varianza (ANOVA), se puede comparar el comportamiento de la
variable resultado, para el costo, la cual es dependiente de la satisfacción suministrada por
los proveedores (Satisfecho, Poco satisfecho y Nada Satisfecho). Los datos presentan una
distribución normal y no son negativos, cumpliendo con las características necesarias para
el Análisis.

La muestra presenta homogeneidad en su comportamiento, lo que permite la selección al


azar.
Referencias
- Espejo, M. I., Fernández, P. F., & López, S. M. (2016). Inferencia estadística: teoría y
problemas (2a. ed.). Madrid, ESPAÑA: Servicio de Publicaciones de la Universidad de Cádiz.
Pp. 147-178. Recuperado de
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11245681
- Romero, R. E. (2016). Estadística para todos: análisis de datos: estadística descriptiva, teoría
de la probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones Pirámide. Pp. 313 -328.
Recuperado de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?
ppg=314&docID=11231145&tm=1492554719817
- Gutiérrez,H. (2013). Capítulo 4: Elementos de Inferencia Estadística Control estadístico de la
calidad y Seis Sigma.(3a. ed.) McGraw-Hill Interamericana. Pp.72- 90. Recuperado de
http://bibliotecavirtual.unad.edu.co:2053/?il=280
Satisfecho Poco satisfecho Nada satisfecho
938 554 530
790 703 878
848 576 766
929 838 878
733 342 737

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Satisfecho 5 4238 847.6 7812.3
Poco Satisfecho 5 3013 602.6 34118.8
Nada Satisfecho 5 3789 757.8 20322.2

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad
Promedio de los cuadradosF
Entre grupos 153626.8 2 76813.4 3.70165437
Dentro de los grupos 249013.2 12 20751.1

Total 402640 14
Probabilidad
Valor crítico para F
0.0559542 3.88529383

También podría gustarte