Está en la página 1de 27

http://eio.usc.

es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-
DPTO/MATERIALES/Mat_G2051108137_BioestadisticaTema9.pdf

DATOS CATEGORICOS CHI-CUADRADA

gepomachaguap@unac.edu.pe
Material de Clases © Germán Pomachagua Perez 15/07/2023
DATOS CATEGORICOS

El análisis de datos categóricos se ocupa del estudio de variables que no son


medibles (color, nacionalidad, enfermedades, sexo, afiliación política, etc.),
denominadas también atributos o caracteres cualitativos. Podemos distinguir
entre datos en escala nominal (sexo, estado civil...) y datos en escala ordinal
(nivel de estudios, nivel de satisfacción, ..), cuando podemos establecer un
determinado orden o rango entre las observaciones.

Datos categóricos representan atributos o categorías. Cuando se consideran dos


variables categóricas, entonces los datos se organizan en tablas llamadas tablas
de contingencia o tablas cruzada. Primero se discutirán la relación entre las
variables que definen las filas y las columnas de tablas de contingencia y luego se
estudian medidas que dan una idea del grado de asociación entre las dos
variables categóricas.

Material de Clases © Germán Pomachagua Perez 15/07/2023


Prueba de Independencia
La prueba de independencia Chi-cuadrado, nos permite determinar si existe una
relación entre dos variables categóricas (cualitativas). Es necesario resaltar que
esta prueba nos indica si existe o no una relación entre las variables, pero no
indica el grado o el tipo de relación; es decir, no indica el porcentaje de
influencia de una variable sobre la otra o la variable que causa la influencia.

Una prueba de independencia usa la pregunta de si la ocurrencia del evento X es


independiente a la ocurrencia del evento Y, por lo que el planteamiento de las
hipótesis para esta prueba de independencia es:

Ho: La ocurrencia del evento X es independiente del evento Y.


H1: La ocurrencia del evento X NO es independiente del evento Y.

Material de Clases © Germán Pomachagua Perez 15/07/2023


ESTADISTICA NO
PARAMETRICA

PRUEBA CHI-
CUADRADO

UNA DOS
VARIABLE VARIABLES

PRUEBA DE BONDAD DE PRUEBA DE PRUEBA DE


AJUSTE HOMOGENEIDAD INDEPENDENCIA

Material de Clases © Germán Pomachagua Perez 15/07/2023


CONDICION DE VALIDEZ DEL TEST
1) Ambas variables deben ser cualitativas.

2) Número de sujetos estudiados igual o superior a 40 (n>40).

3) Si n se esta entre 20 y 40 se usa el Chi2 en el caso que todas las frecuencias esperadas
sean ≥5 ( en ocasiones debemos agrupar varias categorias a fin de que se cumpla el
requisito).

4) Cuando la muestra es menor de 40, cuando algunas frecuencias esperadas son


menores que 5, o cuando el grado de libertad del estadístico de prueba es igual a 1,
es recomendable aplicar la corrección de Yates; con esta corrección, el estadístico de
prueba es el siguiente:

5) Es un test no dirigido (test de planteamiento bilateral), que nos indica si existe o no


relación entre dos variables cualitativas, pero no en qué sentido se produce tal, ni
cuantifica la intensidad de dicha asociación

Material de Clases © Germán Pomachagua Perez 15/07/2023


PRUEBA DE INDEPENDENCIA DE VARIABLES

Esta prueba se aplica para comprobar si dos variables son independientes


en las observaciones de una misma población.
Así, los datos de la muestra se clasifican a la vez en las “r” categorías de la
variable X, y en las “c” categorías de la variable Y.
De este modo los datos de la muestra se resumen de acuerdo la tabla de
contingencia siguiente:

Variable Y
Variable X Total Fila
Y1 Y2 ... Yc
X1 O 11 O 12 ... O 1c O 1*
X2 O 21 O 22 ... O 2c O 2*
... ... ... ... ... ...
Xr O r1 O r2 ... O rc O r*

Total Colu mn a O *1 O *2 ... O *c n


PRUEBA DE INDEPENDENCIA DE VARIABLES

La prueba se especifica de la siguiente forma: :


1. Formular las Hipótesis.
H0: Las variables son independientes.
H1: Las variables no son independientes
2. Fijar el nivel de significación: 
3. Calcular el estadístico de Prueba:
( ij ij ) donde: E = O* jOi*
2
r c O − E
2c =  ij
i =1 j =1 Eij n
4. Calcular el valor crítico: 2(gl; 1−), siendo gl=(r–1)(c–1), r el número de filas
y c el número de columnas.
5. Tomar la decisión de acuerdo a la siguiente regla de decisión: H0 se
rechaza si: 2c >2(gl; 1−), en caso contrario se acepta.
Nota:- Si alguna categoría tiene Eij<5, se deben agrupar la categoría(s)
hasta lograr que todas las frecuencias observadas sean mayores o
iguales que 5.
Caso1: Se podría afirmar que existe una relación entre la universidad y el
tiempo que el estudiante tarda en terminar su carrera de Ingeniería de
Sistemas
AÑOS
UNIVERSIDAD
<5 5-7 >7 TOTAL
A 300 150 50 500
B 110 125 90 325
C 325 350 100 775
TOTAL 735 625 240 1600

Ho. No hay relación entre la universidad y los años que tardan para
terminar su carrera
H1: Hay relación entre la universidad y los años que tardan para
terminar su carrera

Material de Clases © Germán Pomachagua Perez 15/07/2023


Material de Clases © Germán Pomachagua Perez 15/07/2023
EJEMPLO 1

1. Hipótesis.
H0: No hay relación entre la universidad y los años que tardan para terminar su carrera
H1: Hay relación entre la universidad y los años que tardan para terminar su carrera
2. Nivel de significación:  = 0,05
( )
2
r c O − E O* jOi*
2c = 98.002
3. Estadístico de Prueba:
c = 
ij ij
2
donde: Eij =
i =1 j =1 Eij n

4. Valor Crítico:

5. Reglas de Decisión:
 H0 se rechaza, si 2c =98.002> 2(4; 0,95),=9.488
 H0 se rechaza, si P-value ≤ ,
6. Decisión: H0 se rechaza
7. Conclusión: El tipo de universidad esta asociada a los años que tardan en terminar su
carrera
Ho. No existe relación entre la universidad y los años que tardan para terminar
su carrera
H1: Existe relación entre la universidad y los años que tardan para terminar su
carrera
REGLA
• Si 𝑝 = 𝑆𝑖𝑔 ≤ 𝛼 = 0.05 rechazamos H0 por lo tanto aceptamos H1
• Si 𝑝 = 𝑆𝑖𝑔 > 𝛼 = no rechazamos H0 sin embargo esto no significa que
debemos aceptarla, si no que simplemente no hemos podido rechazarla

Como 𝑝 = 0.000 ≤0.05 se rechaza 𝐻0 , y


se acepta 𝐻1 , es decir existe relación entre
la universidad y los años que tardan para
terminar su carrera
ERRORES DEL CHICUADRADO

Material de Clases © Germán Pomachagua Perez 15/07/2023


SPSS Minitab

Material de Clases © Germán Pomachagua Perez 15/07/2023


SOLUCION

Ho. No existe relación entre la universidad y los años que tardan para terminar su carrera
H1: Existe relación entre la universidad y los años que tardan para terminar su carrera

Como 𝑝 = 0.005 ≤ 𝛼 = 0.05


entonces se rechaza H0, es
decir existe relación entre el
sexo y la ansiedad

Material de Clases © Germán Pomachagua Perez 15/07/2023


Titulo: “Sistema de Gestión de Seguridad Informática basado en la norma NTP
ISO/IEC 27001 para mejorar la protección en la red de la Facultad de Ingeniería
Industrial y de Sistemas de la Universidad Nacional del Callao”

Proteción
Si No Total
Sistema de Gestion de Seguridad Si 100 50 150
No 50 50 100
Total 150 100 250

Ho: No hay relación entre el Sistema de Gestión de Seguridad Informática


basado en la norma NTP ISO/IEC 27001 para la mejorar la protección en la red
de Facultad de Ingeniería Industrial y Sistemas de la Universidad Nacional del
Callao.
H1: Hay relación entre el Sistema de Gestión de Seguridad Informática basado en
la norma NTP ISO/IEC 27001 para la mejorar la protección en la red de Facultad
de Ingeniería Industrial y Sistemas de la Universidad Nacional del Callao.

Material de Clases © Germán Pomachagua Perez 15/07/2023


Como 𝑝 = 0.008 ≤0.05 se rechaza 𝐻0 , y se acepta 𝐻1 , es decir hay relación entre el
Sistema de Gestión de Seguridad Informática basado en la norma NTP ISO/IEC 27001
para la mejorar la protección en la red de Facultad de Ingeniería Industrial y Sistemas de
la Universidad Nacional del Callao

Material de Clases © Germán Pomachagua Perez 15/07/2023


1) Ho: No hay relación entre el género y la elección de una AFP.
H1:Hay relación entre el género y la elección de una AFP.
2) 𝛼 = 0.06

3) Aplicar Chicuadrado

2c = 6.131

4) Puntos críticos
χ22−1 4−1 =7.815

4) Como 𝑝 = 0.105 >0.05 No se


rechaza 𝐻0 .
5) es decir no hay relación entre el
género y la elección de una AFP

Material de Clases © Germán Pomachagua Perez 15/07/2023


Medidas de Asociación

Material de Clases © Germán Pomachagua Perez 15/07/2023


Material de Clases © Germán Pomachagua Perez 15/07/2023
Material de Clases © Germán Pomachagua Perez 15/07/2023
Material de Clases © Germán Pomachagua Perez 15/07/2023
Material de Clases © Germán Pomachagua Perez 15/07/2023
SIMÉTRICO

Cuando sólo
queremos
medir cuál es
la intensidad
(fuerza) entre
dos variables
categóricas.
No hay
variable
dependiente

Material de Clases © Germán Pomachagua Perez 15/07/2023


Material de Clases © Germán Pomachagua Perez 15/07/2023
Material de Clases © Germán Pomachagua Perez 15/07/2023
Material de Clases © Germán Pomachagua Perez 15/07/2023
Material de Clases © Germán Pomachagua Perez 15/07/2023

También podría gustarte