Está en la página 1de 20

Año la lucha contra la corrupción e impunidad

UNIVERSIDAD ALAS PERUANAS

FACULTAD DE PSICOLOGÍA

Análisis de
Varianza
ALUMNOS : Cabrera Murillo, Aldhair Angel
Flores Roque, Jhosin
Grimaldo Villagaray, Alexis
Lujan Bautista Yulissa

DOCENTES : Ramos Torrealva Zully

CURSO : Bioestadística

CICLO : Segundo

SECCIÓN : A

2019
DEDICATORIA
En primer lugar, a Dios, que es el creador de todas las
cosas, el que nos ha dado fortaleza para continuar
cuando a punto de caer hemos estado; por ello, con
humildad, que de nuestro corazón puede emanar,
dedicamos el presente.

De igual forma, a nuestros padres, a quienes les


debemos la vida, les agradecemos su cariño y
comprensión, a ustedes, quienes han sabido formarnos
con buenos sentimientos, hábitos y valores, lo cual nos
ha ayudado a salir adelante buscando siempre el mejor
camino.
I. INTRODUCCIÓN

Si no existiera la estadística en psicología no podríamos saber si los


resultados que estamos observando son válidos y fiables. “La psicología es
una ciencia, y por esta razón se tiene que acatar de un sistema que le
permita trabajar lo más alejado posible de la opinión y la subjetividad.”

En muchas ocasiones el analista o investigador se enfrenta al problema de


determinar, si dos o más grupos son iguales, si dos o más cursos de acción
arrojan resultados similares, o si dos o más conjuntos de observaciones son
parecidos. Pensemos por ejemplo en el caso de determinar si dos niveles
de renta producen consumos iguales o diferentes de un determinado
producto o si las notas de dos grupos en una asignatura son similares a su
vez, si tres muestras de análisis químico de una sustancia son iguales, o tal
vez, si los municipios de cuatro provincias colindantes tienen el mismo nivel
de paro.

El ANOVA se aplica con la finalidad de analizar las diferencias o semejanzas


significativas tanto de las medias como de las varianzas, donde una alta o
baja razón implicarían la aceptación o rechazo de la hipótesis, y por otro lado
se revelará el efecto que tiene una variable sobre la otra de acuerdo a su
población en cuanto a su grado de predictibilidad, a mayor o menor
covarianza.

El presente trabajo tiene el fin de explicar el uso de análisis de varianza


(ANOVA) ya que es una potente herramienta estadística, de gran utilidad
tanto en la Psicología, y otras ciencias de la Salud; empresas como en la
industria para el control de métodos analíticos.

4
II. MARCO TEÓRICO
La estadística es una ciencia que
trata de la recolección,
clasificación y de la
representación de los hechos
sujetos a una apreciación
numérica como base a la
explicación, descripción y
comparación de los fenómenos.
El propósito de la estadística es
darles sentido o carácter a los
datos recolectados.
“La Estadística es una disciplina
metodológica que ofrece a otras
áreas del saber un conjunto coherente de ideas y herramientas y puede
verse como la aplicación científica de la Matemática situaciones sujetas a
variabilidad e incerteza, particularmente la recolección y análisis de los
datos”. (Guido, 2015, p. 4)

2.1 TIPOS
2.1.1 ESTADÍSTICA INFERENCIAL
Comprende un conjunto de técnicas que nos permiten estimar
los parámetros de una población a partir de la muestra de la
misma y con ello tomar decisiones sobre esa población.

5
2.1.2 ESTADÍSTICA DESCRIPTIVA
Incluyen técnicas que nos permiten resumir y describir datos.
La preparación de tablas, la elaboración de gráficos y las
técnicas para el cálculo de los diferentes parámetros de las
poblaciones forman parte de las técnicas de la estadística
descriptiva.

6
2.2 PARTES
2.2.1 ESTIMACIÓN
Es un valor estadístico obtenido a partir de la muestra.
2.2.2 MUESTRA
Una muestra es el subconjunto de datos de una población.
2.2.3 PARÁMETRO
Es una propiedad o cualidad de la población que puede
expresarse numéricamente.
2.2.4 POBLACIÓN
La población en estadística es la recolección de un conjunto,
elementos, artículos o sujetos que gozan de características
comunes con el fin de estudiarlos y de esta forma se sacar
conclusiones específicas para determinar sus resultados.
2.3 BIOESTADÍSTICA
Es una rama de la estadística que aplica el desarrollo y las
técnicas a la investigación o campos relacionados a la salud
incluyendo a la medicina, epidemiologia, salud pública y
también en áreas de estudio ambientales, investigación
agrícola como también biología.
Así, el campo de aplicación de la Bioestadística es muy
extenso. Los tratamientos médicos actuales se seleccionan en
base a los resultados de ensayos clínicos que son diseñados y
analizados de acuerdo con principios de la Bioestadística.

7
2.4 ANÁLISIS DE VARIANZA
En estadística, encontramos el concepto de análisis de Varianza
(ANOVA), que consiste en una agrupación de modelos estadísticos y
sus procedimientos asociados, donde la varianza está particionada en
ciertos componentes, debido a variables explicativas diversas. Si
desglosamos sus siglas en inglés, ANOVA significa: ANalysis Of
VAriance (Análisis de la varianza).
El Análisis de Varianza (ANOVA) es un tipo de prueba paramétrica.
Esto quiere decir que deben cumplirse una serie de supuestos para
aplicarla, y que el nivel de la variable de interés debe ser, como
mínimo, cuantitativo (es decir, como mínimo de intervalo, por ejemplo,
el coeficiente intelectual, donde existe un 0 relativo).

2.4.1 TÉCNICAS DE ANÁLISIS DE VARIANZA


Las primeras
técnicas de análisis
de varianza fueron
desarrolladas en
los años ‘20 y ‘30
por R.A. Fisher, un
estadístico y
genetista. Es por
ello que el análisis
de Varianza
(ANOVA) también
se conoce como
“Anova de Fisher” o
“ANÁLISIS DE
VARIANZA DE FISHER”; esto también es debido al uso de la
distribución F de Fisher (una distribución de probabilidad)
como parte del contraste de hipótesis.

8
El análisis de varianza (ANOVA) surge de los conceptos de
regresión lineal. La regresión lineal, en estadística, es un
modelo matemático que se utiliza para aproximar la relación
de dependencia entre una variable dependiente Y (por
ejemplo, la ansiedad), las variables independientes Xi (por
ejemplo, diferentes tratamientos) y un término aleatorio.
Las características de la distribución F, son:
• Es continua
• Sus valores no pueden ser negativos
• Tiene sesgo positivo
• Existe una familia de distribución F cada vez que
cambia los grados de libertad, ya sea en el
numerador o en el denominador, se crea una nueva
distribución.
La distribución Fisher se usa para probar si dos muestras
provienen de dos poblaciones con varianzas iguales.
• Las poblaciones muestradas deben ser normales
• Se calcula la razón de dos varianzas muestrales y
se comparan el resultado con el valor critico de F.
• La mayor varianza se muestra se coloca en el
numerador, forzando que la mayor sea 1.00.
• El mayor F se calcula, aplicando la siguiente
ecuación:

𝑆12
𝐹= 2
𝑆2
SUMA DE CUADRADO TOTAL:

2
(∑ 𝑋)
𝑆𝑆𝑡𝑜𝑡𝑎𝑙 = ∑ 𝑋 2 −
𝑛
SUMA DE CUADRADOS DE TRATAMIENTOS:

(𝑇 2 𝐶 ) (∑ 𝑋)2
𝑆𝑆𝑇 = ∑ ( )−
𝑁𝐶 𝑁

9
SUMA DE CUADRADOS ERROR:

𝑆𝑆𝐸 = 𝑆𝑆𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑆𝑇


TABLA DE DESARROLLO:

Pruebas de Suma de Grado de Cuadrado


F
variación tratamientos libertad Medio

SST/K-
Tratamientos SST K-1 MST
1=MST
SSE/N-
Error SSE N-K MSE
K=MSE

Total SStotal N-1

GRÁFICO DE MEDICIÓN

2.4.2 FUNCIÓN DE ESTA PRUEBA PARAMÉTRICA


Así, un análisis de varianza (ANOVA) sirve para determinar si
diferentes tratamientos (por ejemplo, tratamientos
psicológicos) muestran diferencias significativas, o si, por el
contrario, puede establecerse que sus medias poblacionales
no difieren (son prácticamente iguales, o su diferencia no es
significativa).
Es decir, se utiliza la ANOVA para contrastar hipótesis acerca
de diferencias de medias (siempre más de dos).

10
El ANOVA implica un análisis o descomposición de la
variabilidad total; ésta, a su vez, se puede atribuir
principalmente a dos fuentes de variación:
• Variabilidad intergrupo
• Variabilidad intragrupo o error
2.4.3 TIPOS DE MODELOS DE ANOVA
2.4.3.1 ANOVA I O EFECTOS FIJOS
Cuando solo existe un criterio de clasificación
(variable independiente; por ejemplo, tipo de
técnica terapéutica). A su vez, puede ser
intergrupo (existen varios grupos experimentales)
e intragrupo (existe un único grupo experimental).
El modelo de efectos fijos de análisis de la
varianza se aplica a situaciones en las que el
experimentador ha sometido al grupo o material
analizado a varios factores, cada uno de los
cuales le afecta sólo a la media, permaneciendo
la "variable respuesta" con una distribución
normal.
Este modelo se supone cuando el investigador se
interesa únicamente por los niveles del factor
presentes en el experimento, por lo que cualquier
variación observada en las puntuaciones se
deberá al error experimental.

2.4.3.2 ANOVA II O EFECTOS ALEATORIOS


En este caso, hay más de un criterio de
clasificación (variable independiente). Igual que
en el caso anterior, esta puede ser intergrupo e
intragrupo.

11
Los modelos de efectos aleatorios se usan para
describir situaciones en que ocurren diferencias
incomparables en el material o grupo
experimental. El ejemplo más simple es el de
estimar la media desconocida de una población
compuesta de individuos diferentes y en el que
esas diferencias se mezclan con los errores del
instrumento de medición.
Este modelo se supone cuando el investigador
está interesado en una población de niveles,
teóricamente infinitos, del factor de estudio, de los
que únicamente una muestra al azar (t niveles)
están presentes en el experimento.

2.4.4 CARACTERÍSTICAS Y SUPUESTOS


Cuando se aplica el análisis de varianza (ANOVA) en
estudios experimentales, cada grupo consta de un
determinado número de sujetos, siendo posible que difieran
los grupos en cuanto a este número. Cuando el número de
sujetos coincide, se habla de un modelo equilibrado o
balanceado.

12
En estadística, para poder aplicar el análisis de varianza
(ANOVA) deben cumplirse una serie de supuestos:
2.4.4.1 NORMALIDAD
Esto quiere decir que las puntuaciones en la
variable dependiente (por ejemplo, la ansiedad)
deben seguir una distribución normal. Este
supuesto se comprueba mediante las llamadas
pruebas de bondad de ajuste.
2.4.4.2 INDEPENDENCIA
Implica que no exista autocorrelación entre las
puntuaciones, es decir, la existencia de
independencia de las puntuaciones entre sí. Para
asegurarnos del cumplimiento de este supuesto,
deberemos realizar un MAS (muestreo aleatorio
simple) para seleccionar la muestra que vamos a
estudiar o sobre la que vamos a trabajar.
2.4.4.3 HOMOCEDASTICIDAD
Este término significa “igualdad de varianzas de
las subpoblaciones”. La varianza es un
estadístico de variabilidad y dispersión, y
aumenta cuanto mayor sea la variabilidad o
dispersión de las puntuaciones.
El supuesto de homocedasticidad se comprueba
mediante la Prueba de Levene o la de Barlett. En
caso de no cumplirlo, otra alternativa es realizar
una transformación logarítmica de las
puntuaciones.
2.4.4.4 ESFERICIDAD
Si no se cumple, indicaría que las diferentes
fuentes de error correlacionan entre sí. Una
posible solución si eso pasa es realizar un
MANOVA (Análisis Multivariado de la Varianza).
2.4.4.5 ADITIVIDAD
Supone la no interacción sujeto x tratamiento; si
se incumple engrosaría la varianza error.

13
III. EJERCICIOS
3.1 Los miembros de un equipo ciclista se dividen al azar en tres grupos que
entrenan con métodos diferentes. El primer grupo realiza largos
recorridos a ritmo pausado, el segundo grupo realiza series cortas de
alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita
en el pedaleo de alta frecuencia. Después de un mes de entrenamiento
se realiza un test de rendimiento consistente en un recorrido
cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:

A un nivel de confianza del 95% ¿Puede considerarse que los tres


métodos producen resultados equivalentes? O por el contrario ¿Hay
algún método superior a los demás?
Solución:
Comenzamos calculando los totales y los cuadrados de los totales
divididos por el número de observaciones:

A continuación, calculamos los cuadrados de las observaciones y su


total:

A partir de estas cantidades básicas calculamos las Sumas de


Cuadrados:
SC(total) = 2984 - 2940 = 44
SC(intra) = 2984 – 2966,8 = 17,2

14
SC(entre) = 2966,8 – 2940 = 26,8
Los cuadrados medios serán:
CM(entre) = 26,8/2 = 13,4
CM(intra) = 17,2/12 = 1,43
Por consiguiente el estadístico de contraste vale:
F = 13,4/ 1,43 = 9,37
El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de
confianza del 95% es 3,89. Por consiguiente se rechaza la hipótesis nula
y se concluye que los tres métodos de entrenamiento producen
diferencias significativas.
3.2 Una lista de palabras sin sentido se presenta en la pantalla del ordenador
con cuatro procedimientos diferentes, asignados al azar a un grupo de
sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas
palabras, obteniéndose los siguientes resultados:

¿Qué conclusiones pueden sacarse acerca de las cuatro formas de


presentación, con un nivel de significación del 5%?
Solución:
Comenzamos calculando los totales y los cuadrados de los totales
divididos por el número de observaciones:

A continuación, calculamos los cuadrados de las observaciones y su


total:

15
A partir de estas cantidades básicas calculamos las Sumas de
Cuadrados:
SC(total) = 988 – 819,8 = 168,2
SC(intra) = 988 – 902 = 86
SC(entre) = 902 – 819,8 = 82,2
Los cuadrados medios serán:
CM(entre) = 82,2/3 = 27,4
CM(intra) = 86/22 = 3,9
Por consiguiente, el estadístico de contraste vale:
F = 27,4/ 3,9 = 7,03
El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de
confianza del 95% es 3,05. Por consiguiente, se rechaza la hipótesis
nula y se concluye que los cuatro procedimientos de presentación
producen diferencias significativas.
3.3 Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la
hipertensión arterial, comparándola con la de una dieta sin sal. Para ello
se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en
5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al
segundo una dieta con un contenido pobre en sal, al tercero una dieta
sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo
fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos
al finalizar los tratamientos son:

16
La tabla de anova es:

Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y


concluimos que los resultados de los tratamientos son diferentes.
Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS,
deberíamos crear un archivo con 2 variables: Trata (con un código
distinto para cada grupo, p.e. de 1 a 5) y Presion con la presión
arterial de cada individuo al acabar el estudio. Para calcular el
Anova desplegamos los menús que se ven en la gráfica:

La tabla de anova que devuelve el programa es

17
18
IV. BIBLIOGRAFÍA
• Khan Academy.Análisis de Varianza (ANOVA) [Internet].
Es.Khanacademy.org, 2015 [citado 3 de diciembre de 2019].
Recuperado a partir de: https://es.khanacademy.org/math
/statistics-probability/analysis- of-variance-anova-library
• Wikipedia. Análisis de Varianza. [Internet]. Wikipedia.org, 2005
[citado 3 de diciembre de 2019]. Recuperado a partir de :
https://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza#M
odelo_I:_Efectos_fijos
• Soporte de Minitab. ¿Qué es ANOVA? [Internet].
Support.minitab.com, 2013 [citado 3 de diciembre de 2019]
Recuperado a partir de: https://support.minitab.com/es-
mx/minitab/19/help-and-how-to/modelingstatistics/anova/suppo
rting-topics/basics/what-is-anova/
• Bases de análisis de la Varianza [Internet] Hrc.es [citado 3 de
diciembre de 2019]. Recuperado a partir de: http://www.hrc.es
/bioest/Anova_2.html
• Análisis de la Varianza con un factor (ANOVA) [Internet] Ub.edu,
2009 [citado 3 de diciembre de 2019] Recuperado a partir de:
http://www.ub.edu/aplica_infor/spss/cap4-7.htm
• García M. La década 1989-1998 en la psicología española: un
análisis de las líneas de investigación en estadística,
metodología y teoría psicométrica. [Internet]
Ppaelesdelpsicologo.es, 2002 [citado 3 de diciembre de 2019]
Recuperado a partir de: http://www.papelesdelpsicologo.es
/resumen?pii=882
• Monleon A. ANOVA caso no balanceado: suma de cuadrados de
tipo I, II, III y IV [Internet] Researchgate.net , 2014 [citado 3 de
diciembre de 2019] Recuperado a partir de:
https://www.researchgate.net/publication/312167517_ANOVA_
caso_no_balanceado_suma_de_cuadrados_de_tipo_I_II_III_y_
IV

19
• Universidad Autónoma de Madrid. Análisis de Varianza [Internet]
Estadistica.net, 2010 [citado 3 de diciembre de 2019]
Recuperado a partir de: http://www.estadistica.net/
ECONOMETRIA/ANALISIS-VARIANZA/analisis-varianza.pdf

20

También podría gustarte