Está en la página 1de 14

ANOVA de un factor

Caso 1
1. Descargue la base ANOVA1
2. Codebook, compact
. codebook, compact
Variable
stemcell
partyid
female

Obs Unique
46
46
46

8
4
2

Mean

Min

Max

6.26087
2.391304
.4782609

1
1
0

9
4
1

Label
support for stem cell research
party identification
1 if female, 0 if mail

3. Desarrolle el modelo ANOVA


a. Statistics
b. Linear models an related
c. ANOVA/MANOVA
d. One-way ANOVA

Response variable: stemcell


Factor variable: partyid
La respuesta o variable dependiente debe ser cuantitativa y la variable independiente o
factor variable es categrica.
4. Multiple-comparison tests, seleccione Bonferroni
Se pueden elegir tre Bonferroni, Scheffe y Sidak. Son tres procedimientos para comparar
cada par de las medias
5. OK

. oneway stemcell partyid, bonferroni tabulate


party
identificat
ion

Summary of support for stem cell


research
Mean
Std. Dev.
Freq.

democrat
republica
independe
noninvolv

8
4.6666667
7
4.75

1.2060454
2.6053558
.78446454
.88640526

12
12
14
8

Total

6.2608696

2.0916212

46

Analysis of Variance
SS
df
MS

Source
Between groups
Within groups
Total

92.7028986
104.166667

3
42

30.9009662
2.48015873

196.869565

45

4.37487923

Bartlett's test for equal variances:

chi2(3) =

Prob > F

12.46

20.1167

0.0000

Prob>chi2 = 0.000

Comparison of support for stem cell research by party identification


(Bonferroni)
Row MeanCompara las medias de los grupos, que involucra 6 pruebas
Col Mean
democrat
republic
independ
republic

-3.33333
0.000

independ

-1
0.684

2.33333
0.003

noninvol

-3.25
0.000

.083333
1.000

-2.25
0.015

de significancia
Democracia vs Independientes,
Demcratas vs noinvolved,
Republican vs independent,
Republican vs noinvolved
Independient vs noinvol
Si la p<0.05 la diferencia es significativa

Se evala el valor de Prob>F, si es mayor a 0.05 no hay relacin, si es menor a 0.05 si hay relacin

Origen de las variaciones. El anlisis de la varianza requiere la estimacin de dos varianzas:


entre grupos (stemcell, apoyo a la investigacin de clulas madre) y la de grupos (identidad
partidista)

Suma de cuadrados: suma de las desviaciones al cuadrado

Grados de libertad:
o Entre grupos es 4, nmero de partidos menos 1
o Dentro de los grupos es 42. (nmero de observaciones-el nmero de partidos)

Promedio de los cuadrado: (varianzas estimadas)= Suma de cuadrados/grados de libertad.


(92.70/3=309, y 104.16/42=2.48)

F: es la distribucin de probabilidad. Es el cociente de dos varianzas. (30.900/2.48=12.46)

Probabilidad. Este es el valor que responde a la pregunta. Queremos saber si hay algn
tipo de relacin entre las carreras y las calificaciones. El anlisis de varianza (ANOVA) asume por
default que no hay relacin. Como regla general:
o Si la probabilidad es mayor que 0.05 significa que se cumple no se rechaza la
hiptesis: No hay relacin.
o Si la probabilidad es menor de 0.05 se rechaza la hiptesis, es decir hay algn tipo de
relacin entre las carreras y las calificaciones.

Caso 2
Cuando se tienen encuestas donde las respuestas son categricas, por ejemplo de acuerdo, no lo
s y no estoy de acuerdo. Se debe hacer la siguiente asignacin
De acuerdo=1
No lo se=2
No estoy de acuerdo=3
En este caso se usa las pruebas de rango Kruskal-Wallis para comparar los valores de las medianas
entre los grupos. Si estamos interesados en la identificacin de las diferencias entre los partidos y
el apoyo a la investigacin de las clulas madre. Para ello se seguir el siguiente procedimiento:
1.
2.
3.
4.
5.
6.

Statistics
Summaries, tables and test
Nonparametric tests of hypothese
Kruskal-Wallis Rank test
Outcome variable: stemcell
Variable defining groups: partyid

Se obtienen los siguientes resultados

Esta prueba ordena las observaciones del valor ms bajo al


ms alto. Con una escala de rangos de 1 a 9, hay muchos
vnculos, y el programa los ajusta. Si los grupos no fueron
diferentes, la suma de los rangos para cada grupo sera la
misma, asumiendo igual nmero de observaciones. Cuando
se comparan los resultados de la columna Rank Sum se
puede afirmar que los demcratas tienen mayor calificacin
que los republicanos. Dado que cuando se observa que la
probabilidad es menor a 0.05 se puede afirmar que las
diferencias entre los grupos que apoyan la investigacin de
clulas madre son significativas

Kruskal-Wallis equality-of-populations rank test


partyid

Obs

Rank Sum

democrat
republican
independent
noninvolved

12
12
14
8

422.00
174.00
391.00
94.00

chi-squared =
probability =

22.115 with 3 d.f.


0.0001

chi-squared with ties =


probability =
0.0001

22.696 with 3 d.f.

Puesto que estamos tratando los datos como ordinales tiene sentido hacer uso de las
medianas y no de las medias, para ello desarrolle el siguiente procedimiento:
1. Statistics
2. Summaries, tables and test
3. Tables
4. Table of summary statistics (tabstat)

Las medianas estn en la misma relacin


como las medias con los demcratas cuya
mediana es 8.5, seguidos por los
independientes con 7, mientras que
republicanos y no involucrados tienen los
menores valores (4.5)

Graficando las medias

Mediana de la posicin por partido respecto a la investigacin de las clulas madre

democrat

republican

independent

noninvolved

Caso 3.
Con la base ANOVA 2
1. codebook, compact

4
p 50 of stemcell

Los resultados
coinciden con los
resultados de la
tabla KruskalWallis.

2. Desarrolle el modelo ANOVA


a. Statistics
b. Linear models an related
c. ANOVA/MANOVA
d. One-way ANOVA
e. En la pestaa main:

3. En la pestaan by if/in restrinja la muestra para aquellos que estn entre los 30 y 59 aos
y tienen trabajo de tiempo completo

4.

Oprima OK

Aquellos adultos que se mudan a diferentes estados alcanzan


3.06 puntos ms en el indicador de prestigio que el promedio que
permanece en la misma ciudad. Mientras que los que se
mudaron dentro del mismo estado tienen 4.56 puntos mas. Para
el caso de misma ciudad vs diferente las diferencias no son
significativas ya que el valor de la probabilidad es mayor a 0.05
(0.487)

ANOVA de dos factores.


Se tienen dos variables cualitativas que actan como predictores. Usando por ejemplo la relacin
entre prestigio (prestige) y movilidad (mobile16) vara con base en el gnero (sex) del encuestado.
1. Hay que probar si hay relacin entre prestigio y movilidad.
2. Probar su el prestigio est influenciado por el gnero.
3. Verificar si hay un efecto de interaccin, es decir cuando el efecto de una variable, por
ejemplo movilidad, est supeditada a otra, como el gnero.
Procedimiento en stata
1.
2.
3.
4.

Statistics
Summaries, tables and test
Tables
One/two-way table of summary statistics

En la pestaa by if/in, incluya las siguientes condiciones:

age>29 & age<60 & wrkstat==1

La columna de total muestra que la media del


prestigio va de 44.12 a 48.67 y finalmente a
47.19 dependiendo del grado de movilidad de
la persona que responde a la encuesta.
Tambin se ve afectado por el gnero, con las
mujeres, tiene mayor peso el prestigio que en
el caso delos hombres. La media del prestigio
para las mujeres es 47.01 mientras que para
lo hombres es de 45.91.

Para verificar si las diferencias son significativas, es necesario seguir la siguiente ruta
1. Statistics
2. Linear models and related
3. ANOVA/MANOVA
4. Analysis of variance and covariance
a. Dependent variabel: perstg80
b. Model: mobile16 sex sex#mobile16
Lo que implica que hay tres hiptesis
La movilidad tienen un efecto
El gnero influye

La interaccin entre movilidad y gnero (sex#mobile16) tiene efectos

En la pestaa by/if/in: age>29 & age<60 & wrkstat==1


Prob>F, si es menor a 0.005, significa que
cada una de las variables es significativa,
en nuestro ejemplo solo se cumple para
mobile16 (movilidad).

Es necesario crear una grfica que represente los resultados del ANOVA de dos factores.
1. Generar las predicciones de la variable prestigio
adjust, xb generate( prestigio)
2. Crear la grfica
a. Graphics
b. Twoway graph (scatter, line, etc.)
c. Crate
d. Basic plots
e. Connected
i. Y variable: prestigio
ii. X variable: mobile16
iii. Sor ton x variable
iv. Marker properties
1. Add labels to markers

2. Variable: mobile16

f.

En la pestaa if/in, escriba la condicin


age>29 & age<60 & wrkstat==1 & sex==1
g. Oprima Accept, y regresara a la pestaa Plots
h. Create
i. Basic plots
ii. Connected
iii. Y variable: prestigio
iv. X variable: mobile16
v. Sor ton x variable
vi. Marker properties
1. Add labels to markers
2. Variable: mobile16
i. En la pestaa if/in, escriba la condicin que hemos manejado hasta ahora
age>29 & age<60 & wrkstat==1 & sex==2

50

Movilidad y prestigio por gnero

Linear Prediction

48

SAME ST,DIF CITY

DIFFERENT STATE

SAME ST,DIF CITY

46

DIFFERENT STATE

44

SAME CITY

SAME CITY

1.5
2
2.5
GEOGRAPHIC MOBILITY SINCE AGE 16
Linear Prediction

Linear Prediction

La lnea azul corresponde con la primera condicin sex==1, es decir a los hombres y la segunda a
las mujeres (sex==2). Lo que se puede modificar con el editor de grficas

48

SAME ST,DIF CITY

DIFFERENT STATE

SAME ST,DIF CITY

46

DIFFERENT STATE

SAME CITY

44

Linear Prediction

50

Movilidad y prestigio por gnero

SAME CITY

1.5
2
2.5
GEOGRAPHIC MOBILITY SINCE AGE 16
Hombres

Mujeres

Las mujeres tienen mayor prestigio que los hombres, respecto a la movilidad, pero hay que ser
cauteloso porque las diferencias no son significativas.
Las diferencias entre los gneros son mayores cuando se observa a quienes se han mudado de
diferentes ciudades, pero an viven en su estado de origen.
Tarea
Con la base Tarea ANOVA, desarrolle lo que se pide
1. El tiempo que una mujer observa la TV (tvhours) varia dependiendo de su estado civil
(MARITAL)? Haga un ANOVA de un factor, incluyendo la tabla de las medias, la
comparacin de Bonferri multiple-comparison y presente una grfica de barras que

muestre las medias de las horas que pasan viendo la TV por estado civil. Explique los
patrones de las medias y las diferencias de las medias.
2. Desarrolle la prueba de Kruskal-Wallis y compare los resultados que obtenga con los
resultados obtenidos en el punto 1.
3. Como condicin, considere a las mujeres entre 25 y 40 aos, que trabajan tiempo
completo

También podría gustarte