Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AnalisisDCategóricos SP
AnalisisDCategóricos SP
Graciela Gei
graciela.gei@fce.uncu.edu.ar
Mayo de 2021
CONTENIDOS
6 APÉNDICE
Cálculo de valores esperados de una tabla de contingencia
Introducción
En muchas situaciones los experimentos resultan en mediciones
que son categóricas más que cuantitativas. Una variable categórica
es una variable para la cual la escala de medida consiste en un
conjunto de categorı́as.
En estos casos una cualidad o caracterı́stica es identificada para
cada una de las unidades experimentales u objetos de la población
bajo estudio.
Los datos que surgen de estas mediciones se pueden resumir
evaluando el número de mediciones que se obtienen en cada una
de las categorı́as de la variable bajo estudio.
Modelo Multinomial
Se dice que las variables aleatorias X1 , · · · , Xk tienen una
distribución multinomial si la función densidad conjunta está dada
por
n!
fX1 ,··· ,Xk (x1 , · · · , xk ) = π x1 . . . πkxk
x1 ! · · · xk ! 1
donde ki=1 πi = 1, para cada i, xi = 0, 1, . . . , n y ki=1 xi = n
P P
Demostración
La distribución marginal de Xi se puede utilizar para determinar la
media y la varianza.
Xi puede interpretarse como el número de intentos que caen en la
celda i. Podemos considerar todas las celdas, excluyendo la i,
combinadas en una celda grande.
Entonces cada intento resultará en la celda i o en la celda que no
es i, con probabilidades πi o 1 − πi , respectivamente.
Entonces Xi tiene distribución marginal binomial y en
consecuencia,
1 si el intento k resulta en la clase j
Vk =
0 de otro modo
Entonces
n
X n
X
Xi = Uk y Xj = Vh
k=1 h=1
E (Uk ) = πi
E (Vk ) = πj
cov (Uk , Vh ) = 0 si k 6= h porque los intentos son independientes
cov (Uk , Vk ) = E (Uk · Vk ) − E (Uk ) · E (Vk ) = 0 − πi · πj
= −πi · πj
n X
X n
cov (Xi , Xj ) = cov (Uk , Vh )
k=1 h=1
n
X n X
X n
= cov (Uk , Vk ) + cov (Uk , Vh )
k=1 k=1 h=1
k6=h
n
X n
XX n
= (−πi · πj ) + 0
k=1 k=1 h=1
k6=h
= −n πi · πj
Introducción
La primera aplicación inferencial a datos categóricos se desarrolló a
principios del siglo pasado y trataba de determinar si un conjunto
de datos sigue una cierta distribución de probabilidad.
Esta problemática se denomina prueba de bondad de ajuste.
En el proceso analı́tico se propone evaluar la discrepancia entre las
frecuencias observadas (ni ) y las esperadas bajo la distribución de
probabilidad considerada (mi ) .
Introducción
Es decir, consideremos que se dispone de una muestra aleatoria de
tamaño n de una variable aleatoria X dividida en k clases
exhaustivas y mutuamente excluyentes.
Sea Ni con i = 1, · · · , k la variable aleatoria que representa el
número de observaciones de la i-ésima clase de la variable aleatoria
X.
Entonces la hipótesis nula es
H0 : F (x) = F0 (x)
Introducción
Dado que F0 (x) está especificada se puede obtener la probabilidad
πi de que, bajo H0 , una observación corresponda a la i-ésima clase.
Además se verifica que
k
X
πi = 1.
i=1
Sea
Pk ni la realización de Ni con i = 1, ..., k de manera que
i=1 ni = n.
2
X [Ni − E (Ni )]2 [N1 − n · π1 ]2 [N2 − n · π2 ]2
= +
E (Ni ) n · π1 n · π2
i=1
[N1 − n · π1 ]2 [(n − N1 ) − n (1 − π1 )]2
= +
n · π1 n · (1 − π1 )
[N1 − n · π1 ]2
=
n · π1 · (1 − π1 )
2
X [Ni − E (Ni )]2 [N1 − n · π1 ]2
=
E (Ni ) n · π1 · (1 − π1 )
i=1
k
X [Ni − E (Ni )]2
∼ χ2 (k − p − 1)
E (Ni )
i=1
Ejemplo 1
Para ilustrar esta prueba consideremos el lanzamiento de un dado. Se
quiere chequear si es legal con un nivel de significación del 5%. Para esto
se lanza 120 veces el dado y se registra cada resultado. Si el dado es
legal la distribución es uniforme discreta luego bajo H0 resulta
1
fX (x) = I{1,2,3,4,5,6} (x)
6
Los resultados de los 120 lanzamientos se presentan en la tabla siguiente.
cara 1 2 3 4 5 6
observadas 20 22 17 18 19 24
esperadas 20 20 20 20 20 20
Luego,
(20 − 20)2 (22 − 20)2 (17 − 20)2 (18 − 20)2 (19 − 20)2 (24 − 20)2
uo = + + + + + = 1.7
20 20 20 20 20 20
Ejemplo 1
Al comparar las frecuencias observadas con las esperadas
correspondientes debemos decidir si es posible que tales discrepancias
ocurran como resultado de fluctuaciones en el muestreo o si en realidad
se deben a que el dado no está balanceado.
k 2
X [ni − n · πi ]
τ : Rechazar H0 ⇔ >h
n · πi
i=1
Decisión
uo = 1.7 < h = 11.07 =⇒ no se rechaza H0
ó
p-valor = P χ2 (5) > 1.7 = 0.8889 > α = 0.05 =⇒ no se rechaza H0 .
Concluimos que no hay suficiente evidencia de que el dado está
desbalanceado.
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD Frecuencias
DE AJUSTEesperadas
TABLAS pequeñas
DE CONTINGENCIA BIDIMENSIONA
Con R
> prob=c(1/6,1/6,1/6,1/6,1/6,1/6)
> fo=c(20,22,17,18,19,24)
> chisq.test(fo,p=prob)
data: n
X-squared = 1.7, df = 5, p-value = 0.8889
Ejemplo 2
El número de accidentes X por semana en un crucero se verificó por
n = 60 semanas con los resultados que se muestran en la tabla que se da
continuación.
Se quiere analizar si la variable aleatoria X tiene distribución de Poisson
suponiendo que las observaciones son independientes.
λx exp−λ
fX (x) = I{0,1,2,··· } (x)
x!
x 0 1 2 3 o más
frecuencias 35 15 10 0
Ejemplo 2
Las probabilidades asociadas a cada celda son,
π1 = P (X = 0) = exp−λ
π2 = P (X = 1) = λ · exp−λ
= P (X ≥ 2) = 1 − exp−λ +λ · exp−λ .
π3
π
b1 = 0.558 , π
b2 = 0.325 y π
b3 = 0.117
Ejemplo 2
Obtenemos la siguiente tabla.
x 0 1 2 o más
Frecuencias 35 15 10
observadas
Frecuencias
esperadas y 33.48 19.5 7.02
estimadas
i=1 Eb (Ni )
Ejemplo 2
Obtenemos la siguiente tabla.
x 0 1 2 o más
Frecuencias 35 15 10
observadas
Frecuencias
esperadas y 33.48 19.5 7.02
estimadas
2 2 2
(35 − 33.48) (15 − 19.5) (10 − 7.02)
uo = + + = 2.37
33.48 19.5 7.02
Ejemplo 2
Al comparar las frecuencias observadas con las esperadas
correspondientes debemos decidir si es posible que tales discrepancias
ocurran como resultado de fluctuaciones en el muestreo o si en realidad
se deben a que la distribución no es Poisson.
3 2
X [ni − n · π
bi ]
τ : Rechazar H0 ⇔ >h
n·πbi
i=1
Decisión
uo = 2.37 < h = 3.84 =⇒ no se rechaza H0
ó
p-valor = P χ2 (1) > 2.37 = 0.124 > α = 0.05 =⇒ no se rechaza H0 .
Concluimos que no hay suficiente evidencia para rechazar que el número
de accidentes por semana tiene una distribución de Poisson.
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD Frecuencias
DE AJUSTEesperadas
TABLAS pequeñas
DE CONTINGENCIA BIDIMENSIONA
Con R
> x=c(0,1,2)
> fo=c(35,15,10)
> lambda=sum(x*fo)/sum(fo)
> xx=c(0,1)
> prob=c(dpois(xx,lambda),1-sum(dpois(xx,lambda)))
> chisq.test(fo,p=prob)
Ejemplo 3
En un estudio de los efectos del estrés, un investigador enseñó a 18
estudiantes dos métodos diferentes para hacer el mismo nudo. La
mitad de los sujetos seleccionados aleatoriamente aprendieron
primero el método A y la otra mitad aprendió primero el método B.
Posteriormente se sometió a todos los estudiantes a una situación
de alto estrés,un examen final de cuatro horas de duración.
Después de la situación de estrés se le pidió a cada uno de los
estudiantes que hiciera el nudo. Se supone que después de una
situación de estrés los sujetos utilizarán el primer método
aprendido. Para analizar esto se registró si el estudiante utilizó el
primer método aprendido o el segundo después de la situación de
estrés. Los resultados se muestran en la siguiente tabla.
Método escogido
Aprendido antes Aprendido después Total
Frecuencia 16 2 18
Ejemplo 3
Consideramos la variable Y número de estudiantes que eligen el
primer método aprendido cuando se someten a estrés.
Y ∼ Binomial (n = 18, π)
En la hipótesis nula consideramos que no hay diferencias bajo
estrés, es decir no existen diferencias entre la probabilidad de usar
el primer método aprendido π y la probabilidad de usar el segundo
método aprendido 1 − π.
Se sospecha que bajo estrés es más probable que se utilice el
primer método que el segundo. Es decir las hipótesis se plantean,
1 1
H0 : π = vs. H1 : π >
2 2
Ejemplo 3
El test resulta,
τ : Rechazar H0 ⇔ y0 > h
donde y0 es el número de estudiantes que elijen el primer método
aprendido y h es el cuantil de orden 1 − α de la distribución
1
binomial bajo H0 , es decir con π = .
2
Ejemplo 3
Consideremos como nivel de significación α = 0.01
Decisión
h = 14 =⇒ y0 = 16 > h =⇒ se rechaza H0
O también podemos determinar el p-valor.
1
p-valor = P Y ≥ 16 | π = = 1 − pbinom(15, 18, 0.5)
2
= 0.0006561279 < α = 0.01
Con R
> fo=c(16,2)
> prob=c(1/2,1/2)
> chisq.test(fo, p=prob)
data: fo
X-squared = 10.889, df = 1, p-value = 0.0009674
TABLAS DE CONTINGENCIA
BIDIMENSIONALES
Introducción
Un problema frecuente en datos categóricos se refiere a la
evaluación de la independencia de dos criterios de clasificación de
las personas u objetos de una población bajo estudio.
Por ejemplo podrı́amos clasificar
una muestra de personas por género y por opinión acerca de
un problema polı́tico para analizar si las opiniones polı́ticas
son independientes del género.
una muestra de balances de una empresa, con sede en
distintas provincias, por el tipo de defecto y la sucursal donde
fue realizado. Se busca probar si el tipo de defecto es
independiente de la sucursal.
TABLAS DE CONTINGENCIA
BIDIMENSIONALES
TABLAS DE CONTINGENCIA
BIDIMENSIONALES
VALORES OBSERVADOS X × Y
Y
categorı́as 1 2 ··· c totales
1 n11 n12 ··· n1c n1·
X 2 n21 n22 ··· n2c n2·
.. .. .. .. .. ..
. . . . . .
r nr 1 nr 2 ··· nrc nr ·
totales n·1 n·2 ··· n·c n··
VALORES OBSERVADOS X × Y
VALORES ESPERADOS X × Y
VALORES ESPERADOS X × Y
VALORES ESPERADOS X × Y
Y
categorı́as 1 2 ··· c totales
1 m11 m12 ··· m1c m1·
X 2 m21 m22 ··· m2c m2·
.. .. .. .. .. ..
. . . . . .
r mr 1 mr 2 ··· mrc mr ·
totales m·1 m·2 ··· m·c m·· = n
mi· representan los totales marginales esperados por fila y m·j los
totales marginales esperados por columna.
VALORES ESPERADOS X × Y
ANÁLISIS DE INDEPENDENCIA
ANÁLISIS DE INDEPENDENCIA
ANÁLISIS DE INDEPENDENCIA
ni· n·j 2
r X
c Nij −
n
X
ni· n·j
i=1 j=1
n
ANÁLISIS DE INDEPENDENCIA
Estadı́stico de prueba
El estadı́stico de prueba es,
ni· n·j 2
r X c Nij −
n
X
ni· n·j
i=1 j=1
n
que tiene asintóticamente distribución χ2 con (r − 1)(c − 1)
grados de libertad.
ANÁLISIS DE INDEPENDENCIA
Ejemplo
Se desea determinar si las opiniones de los residentes votantes de
una ciudad respecto de una reforma impositiva son independientes
de sus niveles de ingresos. Se toma una muestra aleatoria de 1000
votantes registrados en esa ciudad clasificando sus ingresos como
bajo, medio y alto y registrando si están a favor o en contra de la
reforma.
Nivel de Ingresos
bajo medio alto totales
a favor 182 213 203 598
en contra 154 138 110 402
totales 336 351 313 1000
ANÁLISIS DE INDEPENDENCIA
Ejemplo
Determinaremos si existe dependencia entre el nivel de ingresos y
su opinión sobre la reforma con un nivel de significación del 5%.
Calculamos las frecuencias esperadas bajo el supuesto de
independencia. En la tabla siguiente se muestran entre paréntesis
las frecuencias esperadas.
Nivel de Ingresos
bajo medio alto totales
a favor 182 (200.9) 213 (209.9) 203 (187.2) 598
en contra 154 (135.1) 138 (141.1) 110 (125.8) 402
totales 336 351 313 1000
Luego,
(182 − 200.9)2 (154 − 135.1)2 (213 − 209.9)2 (138 − 141.1)2 (203 − 187.2)2 (110 − 125.8)2
uo = + + + + +
200.9 135.1 209.9 141.1 187.2 125.8
Ejemplo
Luego el valor observado es uo = 7.85
A partir de este valor calculamos el p-valor correspondiente
Con R
> tabla=matrix(c(182,154,213,138,203,110),2,3)
> chisq.test(tabla)
data: tabla
X-squared = 7.8782, df = 2, p-value = 0.01947
ANÁLISIS DE INDEPENDENCIA
Ejemplo
Determinaremos si existe dependencia entre el cáncer de pulmón y la
condición de ser fumador o no, con un nivel de significación del 5%.
Calculamos las frecuencias esperadas bajo el supuesto de independencia.
En la tabla siguiente se muestran entre paréntesis las frecuencias
esperadas.
Cáncer Totales
SI NO
Fumador 11 (7.7) 44 (47.3) 55
No Fumador 3 (6.3) 42 (38.7) 45
totales 14 86 100
Luego,
(| 11 − 7.7 | −0.5)2 (| 3 − 6.3 | −0.5)2 (| 44 − 47.3 | −0.5)2 (| 42 − 38.7 | −0.5)2
uo = + + + = 2.631
7.7 6.3 47.3 38.7
data: tabla
X-squared = 2.631, df = 1, p-value = 0.1048
>chisq.test(tabla, correct=F)
data: tabla
X-squared = 3.6545, df = 1, p-value = 0.05592
>chisq.test(tabla, correct=F)
Bajo H0 el estadı́stico
r X
c
X (Nij − n π
bi· πb·j )2
nπ
bi· π
b·j
i=1 j=1
ni· n·j 2
r X
c Nij −
n
X
ni· n·j
i=1 j=1
n
tiene asintóticamente distribución χ2 .
g .l. = r · c − c − (r − 1) = (r − 1) (c − 1)
Ejemplo
Una encuesta de las opiniones de los votantes se realizó en cuatro
distritos polı́ticos urbanos para comparar la fracción de votantes
que están a favor del candidato A. Muestras aleatorias de 200
votantes fueron entrevistados en cada uno de los cuatro distritos,
con los resultados que se muestran en la siguiente tabla.
Determinaremos si existe suficiente evidencia para indicar que las
fracciones de votantes a favor del candidato A difieren en los
distritos con un nivel de significación del 5%.
Distrito
Opinión 1 2 3 4 totales
a favor de A 76 53 59 48 236
no a favor de A 124 147 141 152 564
totales 200 200 200 200 800
Ejemplo
Si indicamos que la proporción de votantes a favor del candidato A
en el distrito i es πi para i = 1, . . . , 4 la hipótesis nula es
H0 : π1 = π2 = . . . = π4 = π
Ejemplo
El número esperado de personas que no están a favor de A en cada
distrito bajo H0 está dado por
Distrito
Opinión 1 2 3 4 totales
a favor de A 76 (59) 53 (59) 59 (59) 48 (59) 236
no a favor de A 124 (141) 147 (141) 141 (141) 152 (141) 564
totales 200 200 200 200 800
Luego,
(76 − 59)2 (124 − 141)2 (152 − 141)2
uo = + + ··· + = 10.722
59 141 141
Ejemplo
Luego el valor observado es uo = 10.722
A partir de este valor calculamos el p-valor correspondiente
Con R
> tabla=matrix(c(76,124, 53, 147, 59, 141, 48, 152),2,4)
> chisq.test(tabla)
data: tabla
X-squared = 10.722, df = 3, p-value = 0.01333
Pruebas de Homogeneidad
La prueba realizada en el ejemplo es una prueba de la igualdad de
cuatro proporciones binomiales con base en muestras
independientes a partir de cada una de las poblaciones
correspondientes.
Es frecuente que a esta prueba se la denomine prueba de
homogeneidad.
Si hay más de dos categorı́as en las filas y los totales de columna
son fijos, la prueba χ2 es una prueba de equivalencia de las
proporciones en c poblaciones multinomiales.
FAMILIA HIPERGEOMÉTRICA
Introducción
Para poder determinar la prueba de Fisher necesitamos conocer
otro modelo discreto. Este modelo está asociado, como en el
modelo binomial, al experimento de observar el número de éxitos
en selecciones de una población donde existen dos grupos distintos.
Sin embargo, en este modelo la selección de los elementos no se
hace con reposición, por lo tanto no tenemos independencia entre
una selección y la siguiente.
Tenemos N elementos de los cuales K son de un tipo N − K del
otro tipo. De este conjunto de elementos sacamos sin reposición n,
entonces
X representa el número de elementos seleccionados del grupo que
tiene K elementos cuando se seleccionan sin reposición n de los N
posibles.
FAMILIA HIPERGEOMÉTRICA
Definición
Una variable aleatoria X tiene distribución hipergeométrica con
parámetros N, K y n si su función densidad de probabilidad está
dada por:
K
N−K
x n−x
fX (x; N, K , n) = N
I{0,1,...,n} (x)
n
el espacio de parámetros es:
X ∼ Hipergeom(N, K , n)
K
E (X ) = n.
N
K K N −n
var (X ) = n. . 1 − .
N M N −1
Ejemplo
Considere un fabricante de automóviles que compra los motores a
una compañı́a donde se fabrican bajo estrictas especificaciones. El
fabricante recibe un lote de 40 motores. Su proceso de control de
calidad consiste en seleccionar 8, de manera aleatoria y someterlos
a prueba. Si encuentra que ninguno de los motores presenta falla,
acepta el lote, de otra forma lo rechaza. Si el lote contiene 2
motores con serios defectos ¿cuál es la probabilidad de que sea
aceptado?
Ejemplo
Sea X el número de motores defectuosos de n = 8 seleccionados en
un lote de N = 40 que tiene K = 2 defectuosos.
La probabilidad de aceptar el lote es,
2
38
0
P (X = 0) = 40
8 = 0.6359
8
Con R
El comando con R es ”dhyper(x,K,N-K,8)”.
En el ejemplo, resulta
dhyper(0,2,38,8)= 0.6358974
Observación
Calificación profesor
Varones Mujeres Totales
Varones 3 (4.5) 6 (4.5) 9
Mujeres 6 (4.5) 3 (4.5) 9
Totales 9 9 18
9 9
1 8
P (X = 1) = P1 = 18
= 0.00166598
9
9 9
0 9
P (X = 0) = P0 = 18
= 0.00002057
9
Observación
El cálculo de la prueba exacta de Fisher puede ser notablemente
más complicado con frecuencias altas o con tablas de contingencia
de mayor dimensión.
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD La
DEFamilia
AJUSTE Hipergeométrica
TABLAS DE CONTINGENCIA
Prueba exacta de BIDIMENSIONA
Fisher
Con R
> tabla=matrix(c(3,6,6,3),2,2)
> fisher.test(tabla)
data: tabla
p-value = 0.3469
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.02307113 2.46339977
sample estimates:
odds ratio
0.2717713
Con R
Para determinar el p-valor debemos sumar las probabilidades de las
tablas que tienen una probabilidad asociada menor o igual a la
tabla observada.
>x=c(0,1,2,3,4,5,6,7,8,9)
>dhyper(x,9,9,9)
> tabla=matrix(c(3,6,6,3),2,2)
> test=fisher.test(tabla)
> test$p.value
[1] 0.3469
> tabla=matrix(c(3,6,6,3),2,2)
> chisq.test(tabla)
data: tabla
X-squared = 0.88889, df = 1, p-value = 0.3458
Warning message:
In chisq.test(tabla) : Chi-squared approximation may be incorrect
APÉNDICE
CALCULO DE VALORES ESPERADOS DE UNA TABLA DE
CONTINGENCIA
Autor: Marcos Ayende
Cargamos los datos de la matriz correspondiente al ejemplo de ”Prueba
de Homogeneidad”.
datos=c(76,124,53,147,59,141,48,152)
tabla=matrix(datos,2,4)
dimnames(tabla)<-list(c("A","noA"),c("1","2","3","4"))
> tabla
1 2 3 4
A 76 53 59 48
noA 124 147 141 152
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD Cálculo
DE AJUSTEde valores
TABLAS
esperados
DE CONTINGENCIA
de una tabla de contingencia
BIDIMENSIONA
APÉNDICE
tablatotal=addmargins(tabla)
> tablatotal
1 2 3 4 Sum
A 76 53 59 48 236
noA 124 147 141 152 564
Sum 200 200 200 200 800
APÉNDICE
tf=c(tablatotal[,5])
tc=c(tablatotal[3,])
TF=tf[-3]
TC=tc[-5]
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD Cálculo
DE AJUSTEde valores
TABLAS
esperados
DE CONTINGENCIA
de una tabla de contingencia
BIDIMENSIONA
APÉNDICE
APÉNDICE
APÉNDICE
F=matrix(TF,2,4)
C=diag(TC,4,4)
FE=(F%*%C)/sum(TF)
APÉNDICE
CALCULO DE VALORES ESPERADOS DE UNA TABLA DE
CONTINGENCIA
Obtenemos
> F
[,1] [,2] [,3] [,4]
[1,] 236 236 236 236
[2,] 564 564 564 564 > C
[,1] [,2] [,3] [,4]
[1,] 200 0 0 0
[2,] 0 200 0 0
[3,] 0 0 200 0
> FE [4,] 0 0 0 200
[,1] [,2] [,3] [,4]
[1,] 59 59 59 59
[2,] 141 141 141 141
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD Cálculo
DE AJUSTEde valores
TABLAS
esperados
DE CONTINGENCIA
de una tabla de contingencia
BIDIMENSIONA
APÉNDICE
CALCULO DE VALORES ESPERADOS EN EL EJERCICIO 5.12
Aplicaremos los comandos anteriores para el ejercicio 5.12 ejemplo
de ”Análisis de Independencia”
datos=c(12,5,36,16,8,6,5,2)
tabla=matrix(datos,2,4)
dimnames(tabla)<-list(c("1","2"),c("A","B","C","D"))
tablatotal=addmargins(tabla)
tf=c(tablatotal[,5])
tc=c(tablatotal[3,])
TF=tf[-3]
TC=tc[-5]
F=matrix(TF,2,4)
C=diag(TC,4,4)
FE=(F%*%C)*(1/sum(TF))
dimnames(FE)<-list(c("A","noA"),c("1","2","3","4"))
ANÁLISIS DE DATOS CATEGÓRICOS
DESCRIPCIÓN DEL EXPERIMENTO PRUEBAS DE BONDAD Cálculo
DE AJUSTEde valores
TABLAS
esperados
DE CONTINGENCIA
de una tabla de contingencia
BIDIMENSIONA
APÉNDICE
> FE
1 2 3 4
A 11.522222 35.24444 9.488889 4.744444
noA 5.477778 16.75556 4.511111 2.255556
> round(FE,2)
1 2 3 4
A 11.52 35.24 9.49 4.74
noA 5.48 16.76 4.51 2.26