Está en la página 1de 9

ANÁLISIS DATOS BIVARIADOS

a) Datos Cualitativos (Tablas Bivariadas)

ESTADÍSTICO JI CUADRADO (χ2)


El estadístico χ2, es el cálculo de la sumatoria de las diferencias de las frecuencias 2 k r (fij  eij )2 Donde:
χ   fi• f•j
observadas fij y las frecuencias esperados eij, dado por la fórmula: eij e ij 
i=1 j=1 n
fi• f•j
e ij 
n eij es el valor esperado en caso las dos
Tabla fij (frecuencias observadas) Tabla eij (valores esperados)
variables sean independientes entre sí.
X\Y Y1 … Yj … Yr Total X\Y Y1 … Yj … Yr Total
X1 f11 … f1j … f1r f1• X1 e11 … e1j … e1r
… … … … … … … … … … … … …
Xi fi1 … fij … fir fi• Xi ei1 … eij … eir
… … … … … … … … … … … … …
Xk fk1 … fkj … fkr fk• Xk ek1 … ekj … ekr
Total f•1 … f•2 … f•r n Total
Columnas (r)
TABLAS DE CONTINGENCIA
X\Y Y1 … Yr Total
Pasos para Prueba Estadística Chi Cuadrado
X1 f11 f1r f1•
Primero: Se plantean las hipótesis

Filas (k)
Ho : Las variables X e Y no están relacionadas … … … …
Ha : Las variables X e y están relacionadas
Xk fk1 fkr fk•
Segundo:Se calcula el valor del χ2 de la tabla fij. () Total f•1 f•r n
2
Tercero: Se plantea un nivel de confianza (1-α) para las conclusiones 𝜒 𝑡𝑎𝑏𝑙𝑎
Y un nivel de error (α) que se está dispuesto a asumir en equivocarnos
El nivel de confianza va a ayudar a determinar si dicha relación es o no significativa.
Normalmente se usa nivel de confianza 95%, con margen de error α=5% Usar la Tabla de Distribución Xi Cuadrado
Margen de error
 
Cuarto: Determinamos grados de libertad : g.l. = (Nº de filas - 1)(Nº de columnas - 1). Alfa (α)
g.l.
(grados 0.1 0.05 0.025 0.01 0.005
Quinto: Luego en la tabla de distribución de la variable χ 2 libertad)

De acuerdo al nivel confianza y grados de libertad, ubicamos el = 1 2.71 3.84 5.02 6.63 7.88
2 4.61 5.99 7.38 9.21
2 10.60
3 6.25 7.81 9.35
𝜒11.34
cr í tico
12.84
Sexto: Si : ≥ => Afirmamos a un nivel de confianza (1-α)% que las
4 7.78 9.49 11.14 13.28 14.86
variables están relacionadas 5 9.24 11.07 12.83 15.09 16.75
De lo contrario son independientes 6 10.64 12.59 14.45 16.81 18.55
Medidas de Asociación

1) Coeficiente de Contingencia de Pearson (Cajus) Columnas (r)


X\Y Y1 … Yr Total
El coeficiente de contingencia de Pearson (Cajus), se define en función al
estadístico χ2 , para lo cual se van a calcular dos valores “C” y “Cmax”. X1 f11 f1r f1•
χ2

Filas (k)
Primero: Calcular “C” : C = … … … …
n  χ2
Xk fk1 fkr fk•
h-1
Cmax = Total f•1 f•r n
Segundo: Calcular Cmax: h
Donde “h” es el mínimo valor entre filas(k) y columnas(r) que puede tener la tabla ( h=min{k,r} )
C
Tercero : Finalmente, se calcula Cajus: C ajus  , donde 0 ≤ Cajus ≤ 1
Cmax
Interpretación: Cajus = 0 no existe asociación (indep)
0 < Cajus ≤ 0.30 baja asociación
0.30 ≤ Cajus ≤ 0.60 moderada asociación
0.60 ≤ Cajus ≤ 1.00 alta asociación
2) Coeficiente V de Cramer (V) Columnas (r)

Se define el valor V de Cramer, de la forma siguiente: X\Y Y1 … Yr Total

X1 f11 f1r f1•


2
χ
0<V<1

Filas (k)
V= … … … …
n(h  1)
Xk fk1 fkr fk•
El valor “h” es: Total f•1 f•r n
h = Min {número de filas, número de columnas}

Toma valores en el intervalo:

Interpretación: V=0 Independencia absoluta


0 ≤ V ≤ 0.30 Baja relación
0.30 ≤ V ≤ 0.60 Relación significativa
0.60 ≤ V ≤ 1.00 Alta relación
V=1 Relación perfecta
ANÁLISIS DATOS BIVARIADOS
Obs X y
a) Datos Cuantitativos (Análisis Regresión) 1 12 16
2 8 11
Covarianza (SXY)
3 10 13
n 4 8 9

xiyi  n X Y …



SXY  i=1 231 10 12
n1 232 8 14

1  n 2 2  233 12 16
 S2x =  x i  n X 
n  1  i1 
Coeficiente de Correlación de Pearson (rXY)

SXY
rXY 
SX . S Y
Análisis de Regresión ˆ
ŷ  aˆ  bx
yn

ˆ
ˆ + bx
ŷ = a
yn 1
y3
e3
ei
yi
y1 e1
e2
y2

aˆ  Y  bX
x1 x2 x3 xi xn 1 xn
Sxy
bˆ 
2
Sx
PROBABILIDADES
nA
P(A) =
N

TÉCNICAS DE CONTEO
PERMUTACIÓN n!
n Pr 
(n-r)!

COMBINACIONES n n!
nC r    =
 r  (n-r)! r!
PROBABILIDADES
TEOREMAS BÁSICOS DE LA PROBABILIDAD

1. EVENTOS NO EXCLUYENTES

Dados dos eventos A y B, si existe la intersección A∩B ≠  (A y B eventos NO EXCLUYENTES)

 P(A U B) = P(A) + P(B) - P(A  B)

2. EVENTOS EXCLUYENTES

Dados dos eventos A y B, si no existe la intersección / A∩B =  (A y B eventos excluyentes)

 P(A UB) = P(A) + P(B)


PROBABILIDAD CONDICIONAL (Eventos Dependientes)
Se denomina probabilidad condicional cuando la probabilidad de que suceda un
evento (B) es afectada por la ocurrencia de un evento previo (A), en dicho caso se
dice que los EVENTOS SON DEPENDIENTES, por que la ocurrencia de un evento Ω
afecta a la ocurrencia del siguiente evento.
A B
A∩B
Definimos la probabilidad de ocurrencia del evento B, dado que el
evento A ha ocurrido, como P(B/A) :

P(A B)
P(B/A) =
P(A)

Observación : P(A  B) = P(AB )

También podría gustarte