Está en la página 1de 22

Análisis Estadístico

Con Stata
Módulo 6: ANOVA y otros métodos de comparación

Instituto de Estudios Sociales y Económicos del Sur


Inferencia estadística

La inferencia estadística es el conjunto de métodos y técnicas que permiten


inducir, a partir de la información empírica proporcionada por una muestra,
cual es el comportamiento de una determinada población con un riesgo de
error medible en términos de probabilidad.

Se pueden clasificar en dos:


 Métodos paramétricos
 Métodos no paramétricos
Inferencia estadística

Métodos paramétricos:

Establece un supuesto acerca de la distribución de probabilidad de la


población, que a menudo es que la población tiene una distribución normal.
Con este supuesto se obtiene la distribución de muestreo que permite hacer
inferencias sobre uno o más parámetros, como la media poblacional µ o
desviación estándar poblacional . En mayor frecuencia sirven para analizar
datos cuantitativos.

Se pueden dividir, básicamente, en dos:


 Métodos de estimación de parámetros
 Métodos de contraste de hipótesis
Inferencia estadística

Métodos no paramétricos

Se utilizan para realizar inferencia sobre la población sin la necesidad de un


supuesto sobre la forma especifica de la distribución de probabilidad
poblacional.

Permiten realizar inferencias basadas en cualquier tipo de datos cuantitativos o


cualitativos.

Generalmente se usa con datos categóricos.


Test de muestra única

Prueba t-Student´s

El estadístico para µ = µ0 para  desconocida

(𝑥ҧ − 𝜇0 ) 𝑛 (𝑥ҧ − 𝜇0 ) 𝑛
𝑡= 𝑡=
 𝑠

El estadístico esta distribuido como una t de Student´s con (n-1) grados de


libertad.

use “D:\IESE\STATA\AES\Bases\Escritura.dta”, clear


describe
ttest preF = 10
Test de muestra única

Prueba de signos

La prueba estadística para la prueba de signos es el número n+ de diferencias

𝑑𝑗 = 𝑥1𝑗 − 𝑥2𝑗 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 − 𝑒𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛

Mayor que cero. Suponiendo que la probabilidad de que una diferencia sea
cero es de cero, entonces, bajo la hipótesis nula, n+  binomial(n, p=1/2),
donde n es el número total de observaciones.

use “D:\IESE\STATA\AES\Bases\Escritura.dta”, clear


describe
signtest preF = 10
Test de muestra única

Prueba de rangos con signos de Wilcoxon

La prueba de rango con signo de Wilcoxon se describe a menudo como una


prueba de la hipótesis de que dos distribuciones son iguales, es decir, X1  X2.
Donde dj denota la diferencia para cualquier par de observaciones
coincidentes:

𝑑𝑗 = 𝑥1𝑗 − 𝑥2𝑗 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 − 𝑒𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑗 = 1,2, … , 𝑛

𝑟𝑗 = 𝑠𝑖𝑔𝑛𝑜(𝑑𝑗 )𝑟𝑎𝑛𝑔𝑜( 𝑑𝑗 )

La prueba estadística es:


𝑛

𝑇𝑜𝑏𝑠 = ෍ 𝑟𝑗 = 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑟𝑎𝑛𝑔𝑜𝑠 𝑐𝑜𝑛 𝑠𝑖𝑔𝑛𝑜 + − ( 𝑠𝑢𝑚𝑎 𝑑𝑒 𝑟𝑎𝑛𝑔𝑜𝑠 𝑐𝑜𝑛 𝑠𝑖𝑔𝑛𝑜−)


𝑗=1
Test de muestra única

La distribución aleatoria de nuestra prueba estadística T puede ser computado


para considerar todos los 2n valores de:
𝑛

𝑇 = ෍ 𝑠𝑗 𝑟𝑗
𝑗=1

Donde rj es el signo de rango observado y sj esta entre -1 o +1


El estadístico de prueba para la prueba de rango con signo de Wilcoxon a
menudo se expresa (de manera equivalente) como la suma de los rangos con
signo positivo, T+, donde:
𝑛
𝑛(𝑛 + 1) 1
𝐸(𝑇+ ) = 𝑉𝑎𝑟𝑎𝑑𝑗 𝑇+ = ෍ 𝑠𝑗 𝑟𝑗
4 4
𝑗=1
Test de muestra única

Se utiliza una aproximación normal para calcular:

𝑇+ − 𝐸(𝑇+ )
𝑧=
𝑉𝑎𝑟𝑎𝑑𝑗 (𝑇+ )

use “D:\IESE\STATA\AES\Bases\Escritura.dta”, clear


describe
summ preF postF

ttest postF = preF

signrank postF = preF


Test de dos muestras

Prueba t de student´s

El test para µx=µy cuando x y y son desconocidos pero x=y esta dado por

𝑥ҧ − 𝑦ത
𝑡=
2 1/2
𝑛𝑥 − 1 𝑠𝑥2 + (𝑛𝑦 − 1)𝑠𝑦 1 1 1/2
+
𝑛𝑥 + 𝑛𝑦 − 2 𝑛𝑥 𝑛𝑦

El resultado esta distribuido como una t de Student´s con nx+ny-2 grados de


libertad.
Test de dos muestras

use “D:\IESE\STATA\AES\Bases\Estudiantes.dta”, clear


describe
tabulate fraternidad

ttest beber, by(fraternidad)


ttest beber, by(fraternidad) unequal
Test de dos muestras

Prueba U de Mann-Whitney

Conocida como prueba de suma de rangos de Wilcoxon que sirve para


identificar diferencias entre dos poblaciones basadas en el análisis de dos
muestras independientes.

Existen dos variables aleatorias independientes X1 y X2, y se prueba la


hipótesis nula de que X1  X2. Se tiene una muestra de tamaño n1 para X1 y una
muestra de tamaño n2 para X2.

El estadístico de Wilcoxon es la suma de rangos de la primera muestra.


𝑛1

𝑇 = ෍ 𝑅1𝑖
𝑖=1
Test de dos muestras

El estadístico U de Mann and Whitney´s es el numero de pares (X1i, X2j) tal


que X1i > X2j

𝑛1 (𝑛1 + 1)
𝑈=𝑇−
2
𝑛1 (𝑛1 + 1) 𝑛1 𝑛2 𝑠 2
𝐸(𝑇) = 𝑉𝑎𝑟(𝑇) =
2 𝑛

Donde s es la desviación estándar de los rangos agrupados, ri, para ambos


grupos
𝑛
2
1
𝑠 = ෍(𝑟𝑖 − 𝑟)ҧ 2
𝑛−1
𝑖=1
Test de dos muestras

Usando una aproximación normal nosotros calculamos:

𝑇 − 𝐸(𝑇)
𝑧=
𝑉𝑎𝑟(𝑇)

use “D:\IESE\STATA\AES\Bases\Estudiantes.dta”, clear


ranksum beber, by(fraternidad)
Análisis de varianza unidireccional (ANOVA)

ANOVA Unidireccional

Prueba si la media de y difiere en las categorías de x.

El modelo ANOVA unidireccional es: 𝑦𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜖𝑖𝑗

Para niveles de i = 1,…,k y observaciones j = 1,…,n.


Sea ӯi la media (ponderada) de yij sobre j y ӯ la media (ponderada) total de yij
Definamos wij como el peso asociado con yij, el cual es 1 si los datos son no
ponderados. wi se refiere a ෍ 𝑤𝑖𝑗 , y w se refiere a ෍ 𝑤𝑖
𝑗 𝑗

La suma de cuadrados entre grupos es entonces ത 2


𝑆1 = ෍ 𝑤𝑖 (𝑦ത𝑖 − 𝑦)
𝑖

La suma de cuadrados totales es ത 2


𝑆 = ෍ ෍ 𝑤𝑖𝑗 (𝑦𝑖𝑗 − 𝑦)
𝑖 𝑗
Análisis de varianza unidireccional (ANOVA)

La suma de cuadrados dentro del grupo esta dado por: Se = S - S1

El cuadrado promedio entre grupos es: 𝑆12 = 𝑆1 /(𝑘 − 1)

Y el cuadrado medio dentro del grupo es: 𝑆𝑒2 = 𝑆𝑒 /(𝑤 − 𝑘)

La prueba estadística es: 𝐹 = 𝑆12 /𝑆𝑒2

use “D:\IESE\STATA\AES\Bases\Estudiantes.dta”, clear


oneway beber fraternidad, tabulate
Análisis de varianza unidireccional (ANOVA)

Prueba de Kruskal–Wallis

Es una generalización de muestras múltiples de la prueba de suma de rangos


Wilcoxon (también llamada Mann-Whitney) de dos muestras. Pone a prueba la
hipótesis nula de igualdad de medianas de la población.

La muestra de tamaño nj, j=1,…,m, se combinan y clasifican en orden


ascendente de magnitud. 𝑛𝑗
Sea que n denota el tamaño total de la muestra, y que 𝑅𝑗 = ෍ 𝑅(𝑋𝑗𝑖 )
𝑖=1
denota la suma de rangos de la j ésima muestra.
La prueba de análisis de varianza unidireccional de Kruskal-Wallis (H), es
definida como:
𝑚
1 𝑅𝑗2 𝑛(𝑛 + 1)2 2
1 𝑛(𝑛 + 1)2
𝐻= 2 ෍ − 𝑆 = ෍ 𝑅(𝑋𝑗𝑖 )2 −
𝑆 𝑛𝑗 4 𝑛−1 4
𝑗=1 𝑟𝑎𝑛𝑔𝑜𝑠
Análisis de varianza unidireccional (ANOVA)

Si no hay pares la ecuación se simplifica a:


𝑚
12 𝑅𝑗2
𝐻= ෍ − 3𝑛(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛𝑗
𝑗=1

La distribución muestral de H es aproximadamente 2 con m-1 grados de


libertad.

use “D:\IESE\STATA\AES\Bases\Estudiantes.dta”, clear


kwallis beber, by(año)
Análisis de varianza de dos y N direcciones

Modelos ANOVA

Modelo de regresión puede contener variables explicativas exclusivamente


dicótomas o cualitativas, por naturaleza.

Caso de dos variables cualitativas con efecto interactivo:

Yi = β0+ β1D1i+ β2D2i+β3(D1iD2i)+ui

use “D:\IESE\STATA\AES\Bases\Estudiantes.dta”, clear


table fraternidad genero, contents(mean beber) row col

anova beber fraternidad genero fraternidad#genero


regress, baselevels
Variables factor y análisis de la covarianza (ANCOVA)

Modelos ANCOVA

Modelos que muestran una mezcla de variables cuantitativas y cualitativas.


Tales modelos representan una generalización de los modelos ANOVA en el
sentido de que proporcionan un método para controlar estadísticamente los
efectos de las regresoras cuantitativas (llamadas covariantes o variables de
control) en un modelo con regresoras cuantitativas y cualitativas (o
dicótomas).

Caso de una variable cualitativa y cuantitativa con efecto interactivo

Yi = β0+ β1D1i+ β2Xi+β3(D1iXi)+ui

Caso de dos variables cualitativas y una cuantitativa


Yi = β0+ β1D1i+ β2D2i+β3Xi+ui
Variables factor y análisis de la covarianza (ANCOVA)

use "D:\IESE\STATA\AES\Bases\Estudiantes.dta“, clear


anova beber fraternidad año fraternidad#año
anova beber i.fraternidad i.año i.fraternidad#i.año
regress, baselevels

anova beber i.fraternidad c.año i.fraternidad#c.año


regress, baselevels

anova beber fraternidad genero c.prom_calif


regress, baselevels
Gracias
Por su confianza
Educación de calidad

Instituto de Estudios Sociales y Económicos del Sur

También podría gustarte