Está en la página 1de 21

Captulo 20

Comparacin de variables categorizadas entre poblaciones


con observaciones no relacionadas.

Introduccin
La prueba de chi cuadrada de Pearson (2 ) mide la relacin de independencia o
dependencia entre dos variables de tipo cualitativo o categrico; el hecho de que
dos variables sean independientes significa que los valores de una de ellas no
estn influenciados o asociados por la otra variable. Es una prueba estadstica
para evaluar hiptesis acerca de la relacin entre dos variables categricas
(nominal u ordinal). Se simboliza con 2
Hiptesis a probar : Ho= Amabas variables son independientes y no estn
asociadas; Ha=Afirma que ambas variables son dependientes o estn asociadas.
Ha: 1 2

Ho: 1 =
Variables involucradas: dos de tipo nominal u ordinal.
La prueba:
2 = donde es frecuencia observada y e es la frecuencia esperada
No considera relaciones causales.
Nivel de medicin de las variables involucradas: nominal u ordinal (o intervalo o
razn reducidos a ordinales).

Procedimiento
Se calcula por medio de una tabla de contingencia o tabulacin cruzada,
que es un cuadro de dos dimensiones, y cada dimensin contiene una
variable. A su vez, cada variable se subdivide en dos o ms categoras.

Tabla 2x2: Intencin del voto y gnero


Gnero
Intencin del
voto

Total

Total

Candidata A
Andy Miguel
Lara Ortz

40

58

98

Candidata B
Enrique Prez
Nieves

32

130

162

72

188

260

Un ejemplo de tabla 2x3


Las dos variables: Identificacin poltica (tres categoras) y Zona de
distrito electoral (dos categoras). Los nmeros que aparecen en las celdas
son frecuencias, por ejemplo, 180 personas de la zona norte se interesan
por el partido derechista. Lo importante es que todas las categoras de una
variable se crucen con todas las categoras de la otra.
Zona de distribucin
electoral
Norte

Sur

Identifica Partido
cin
derechista
poltica
Partido del
centro

180

100

280

198

280

470

Partido
izquierdista

170

120

290

Total

540

500

1 040

Caractersticas B

Introduccin
La prueba de chi cuadrada de Pearson ()2 mide la independencia o
dependencia entre dos variables de tipo cualitativo o categrico; el hecho de que
dos variables sean independientes significa que los valores de una de ellas no
estn influenciados o asociados con otra variable.
La ()2 de Pearson puede ser usada como prueba de significancia no
paramtrica para comparar proporciones o frecuencias. Los datos se presentan
en tablas de contingencia, en las celdas: a, b, c y d se encuentran los valores de
acuerdo a la presencia o ausencia de la variable o caracterstica medida. Las
cifras al final de las columnas y de las filas reciben el nombre de frecuencias
marginales o celdas totales, y la cifra situada en la esquina inferior derecha es el
gran total (n)

Caractersticas A
a
b
c

a+c

b+d

a+b
c+d
n

6.1Construccin e interpretacin de una tabla de 2x2 (muestras independientes)


Una de las limitaciones de la prueba de 2 es que requiere de un determinado
tamao de n, se refiere que el 75.5% de las celdas deben tener una frecuencia
esperada mayor a 5 (slo una celda puede tener un valor esperado menos a 5,
pero sin llegar a 0). Cuando no se cumple este requisito y se tienen celdas con
frecuencia esperada entre 3 y 5 se deben utilizar la correccin de Yates (o
correlacin por continuidad) que reduce el valor final de chi cuadrada,
hacindola un poco ms conservadora . En caso de que existan celdas con valores
entre 0 y 2, se debe utilizar la prueba exacta de Fisher que analiza la
dependencia o asociacin entre dos variables dicotmicas en muestras pequeas.
La prueba de chi cuadrada de Pearson ()2 para dos variables cualitativas, con
el objeto de determinar si existe asociacin estadstica entre las variables.

Prueba de 2 Pearson
Requisitos
Contar con dos variables cualitativas
Los datos deben ser obtenidos de forma aleatoria
La frecuencia esperada por celda debe ser >5, slo puede ser una celda con
valores <5, sin llegar a 0
Hiptesis estadsticas
Ha: 1 2

Ho: 1 =

Significancia estadstica
En general se trabaja con nivel de significacin=5% (IC95%), por lo que aceptan
que existe asociacin entre las variables estudiadas cuando el valor de p<0.05.
Estadstica de prueba
2 = donde es frecuencia observada y e es la frecuencia esperada.
Para obtener las frecuencias esperadas de cada una de las celdas se debe
multiplicar el total de la columna (tc) por el total de la fila (tf), y se divide entre
el gran total (n).

=odeacuerdoalatablade2x2
Laparalaceldaa es: = =

a+b

Laparalaceldab es: ==

c+d

Laparalaceldac es: ==
Laparalaceldad es: ==

a+c

b+d

=odeacuerdoalatablade2x2
Laparalaceldaa es: =
Laparalaceldab es: =

a+b

Laparalaceldac es: =

c+d

Laparalaceldad
es: =

a+c

b+d

2 =, nos indica primero:


Obtener la de su correspondiente la diferencia, dividida
con su misma y por ltimo, hacer la sumatoria de estos
cocientes para obtener el valor de 2

Gradosdelibertad
g.l.=(Columnasmenos1)(filasmenos1)=(2-1)(2-1)=1x1=1
Nota:Enunatablade2x2,losg.l.siempreesiguala1,suvalorcrtico=
3.84 con significancia de 0.05(pg.296,tabladedistribucindechi
cuadradaysusvalorescrticos,paraunniveldesignificanciade0.05)

Regladedecisin
Compararelvalorcalculadoconelcrticotabular,enfuncindelnivel
designificanciaydeacuerdoconlosgradosdelibertad.Parap<0.05,el
valorcrticotabularcon1g.l.=3.84,esteeselvalorquedebeexcederse
parapoderrechazarlaHo.
Seutilizaprincipalmenteendiseosepidemiolgicostransversal

Ejercicio:
Ungrupodeinvestigacindeseasabersipracticaralgndeporteesun
factorqueevitaelhbitodefumar.Seseleccionunamuestrade45
personas.Acadaunaselesolicitquecontestarauncuestionariocon
informacinsobresuhbitodefumarylaprcticadealgndeporte.Una
vezobtenidalainformacinseencontrque20personaseranfumadoras
y,deellas,5erandeportistas,mientrasquelas20quenopracticanalgn
deporte15eranfumadores.

1. Determinarlashiptesisestadsticasyelniveldesignificancia.
2. Organizarlosdatosenunatabladecontingenciade2x2
3. Aplicacindelaecuacindelaprueba:2 =
4. Regladedecisin
5. Interpretacinderesultados
DETENER

1.

Determinar las hiptesis estadsticas y el nivel de significancia.

Ho:fumadoresdeportistas=
Lafrecuenciadefumadoresserlamismaentrelaspersonasque
hacendeporteynodeporte,quelasvariablesqueseinvestiganson
independientes.


Ha:fumadoresdeportistas
Lafrecuenciadefumadoresentrepersonasquehacendeporteser
diferentedelafrecuenciadefumadoresquenopracticanalgn
deporte,quelasvariablesqueseinvestigansondependientes.

2. Organizar los datos en una tabla de contingencia

Prac.deporte

Fumador(fo)
SNo
S

20

25

No

15

20

20

25

45

Prac.deporte

Fumador(fe)
SNo
S

11.1

13.9

25

No

8.9

11.1

20

20

25

45


3. Aplicacin de la ecuacin de la prueba 2 =
a
=11.1

=3.35

=13.9

=8.9

=11.1

=2.68

=4.18

=3.35

2 ==++=
=(3.35+2.68+4.18+3.35)=13.56

4.

Regla de decisin

2 calculadoesde13.56yesmayoralvalorcrtico=3.84,esposiblerechazarlaHo
deindependenciayaceptarHaaunniveldesignificanciap<0.05

5.

Interpretacin de resultados

Existeunarelacinestadsticamentesignificativaentrelafrecuenciadela
prcticadealgndeporteyelhbitodefumar.
Sisecomparalaocurrenciadeconsumodetabacoentrelosquepracticandeporte
(5/25=0.20x100=20%) con la de los que no lo practican (15/20=0.75= 75%), se
puedesugerirquehacerloesunfactorquedisminuyelaprobabilidaddeconsumir
tabaco.

Ejercicio
Se realiz una investigacin con el objetivo de conocer la relacin
entre osteoporosis y fracturas de hueso, misma que incluyo a 60
adultosmayores.Acadaunoselesrealizunadensitometrayatravs
deuncuestionarioselespreguntosihabantenidoalgunafracturade
huesosenelltimoao.
Alanalizarlainformacinseencontrquedelos18adultosmayores
quepresentabanosteoporosis,7habantenidoalgunafractura,entanto
que entre los 42 adultos mayores que no tuvieron osteoporosis, 6
sufrierondealgunafractura.
Existe alguna relacin en la cantidad de adultos mayores con
osteoporosisyelhechodehabersufridoalgunafracturadehuesos?

1. Determinarlashiptesisestadsticasyelnivelde
significancia.
2. Organizarlosdatosenunatabladecontingencia
3. Aplicacindelaecuacindelaprueba:2 =
4. Regladedecisin
5. Interpretacinderesultados
DETENER

1. Determinarlashiptesisestadsticasyelnivelde
significancia.

Ha:osteoporosisnofracturaosteoporosisfractura
Lafrecuenciadeadultosmayoresconosteoporosis,serdiferenteenlas
personasquesufrieronalgunafracturadelasquenotuvieronalguna
fractura,quelasvariablesqueseinvestigansonindependientes.

Ho:osteoporosisnofractura=
Lafrecuenciadeadultosmayoresconosteoporosis,serlamismaentre
laspersonasquesufrieronalgunafracturaono,quelasvariablesquese
investigansonindependientes.

2.Organizarlosdatosenunatabladecontingencia

S
No

13

11

36

47

18

42

60

Conosteoporosis

Confracturas

Conosteoporosis(o)
SNo

Conosteoporosis(e)
SNo
S

3.9

9.1

13

No

14.1

32.9

47

18

42

60


3. Aplicacin de la ecuacin de la prueba 2 =
a
=3.9

=2.5

=9.1

=14.1

=32.9

=1.1

=0.8

=0.4

4.

Regla de decisin

. 2 calculadoesde4.8yesmayoralvalorcrtico=3.84,esposible
rechazar
. laHodeindependenciayaceptarHaaunniveldesignificancia
p<0.05

5. Interpretacin de resultados
. Existeunarelacinestadsticamentesignificativaentrela
presenciadeosteoporosisenadultosmayoresyelhechodehaber
sufridoalgunafracturadehuesos.
. Sisecomparalaocurrenciadepresenciadeosteoporosisentrelosque
presentaronalgunafractura(7/18=0.39x100=39%)conladelosqueno
presentaron fractura(11/47=0.23x100=23%), se puede sugerir que la
frecuencia de sufrir osteoporosis, esta relacionada con el hecho de
presentarfracturasenloshuesos.

También podría gustarte