Está en la página 1de 23

ESTADÍSTICA

Clase 3
TRATAMIENTO DE VARIABLES
CUALITATIVAS

Medidas de resumen
Frecuencias
Gráficos
Tablas de contingencia
Odds ratios (OR)
TRATAMIENTO DE UNA VARIABLE
Resumen y gráficos de variables
NOMINAL RESUMEN
Razón: Parte /Parte
dicotómica
Proporción : Parte/ Total
politónica Porcentaje : proporción *100
Tasa : proporción * k
Variables
En donde k = múltiplos de 10
Cualitativas
Ej: 10: 100; 1000; 100000; 1000000
FRECUENCIAS
GRÁFICOS:
ORDINAL
Gráficos de pastel: hasta 4 o 5 categorías u
TIPOS DE Politómicas opciones
VARIABLES con orden Gráficos de barras: más de 4 o 5 categorías
jerárquico

RESUMEN: mediana ± rango intercuartílico


DISCRETAS
GRÁFICO: gráficos de barras

Variables
Cuantitativas

CONTINUAS RESUMEN: media ± Desviación estándar


GRÁFCO: en histogramas, polígono de
intervalos
frecuencias
Medidas de resumen de
variables cualitativas

En el caso de las variables de tipo cualitativo la condensación de la información


suele hacerse con alguna de las siguientes tres medidas de resumen de uso
frecuente:

• Razones

• Proporciones

Porcentaje

• Tasas
Medidas de resumen de variables cualitativas
RAZON

Definición: Una razón es una medida de resumen para variables cualitativas que consiste
en la comparación, a través de una división, entre dos conjuntos.

Razón: comparación a través de cociente entre dos conjuntos


r = parte /parte
Ejemplo/ Parte=
Parte + 60
Variable de estudio: sexo de las personas M 35
Categorías: hombres, mujeres
H 25

En un curso existen 60 estudiantes, 5


deAMBATO
los cuales 35 son mujeres y 25 hombres

Razón hombres respecto a mujeres 10 QUITO


Razón de mujeres respecto a hombres
R = 25/35 = 0,71 5 LATACUNGA
R = 35/25 = 1,4
Existen 0,71 hombres por cada mujer Existen 1,41 mujeres por cada hombre
5 SATO DOMI
Ejemplo: Se desea condensar la siguiente información: en un hospital rural existen 18 médicos, de
los cuales 6 son mujeres que se encargan de la atención de 126 pacientes; (12 hombres)
Calcular la razón de médicos mujeres y la razón de médicos hombre
r = 6/12 = 0,5 médicos mujeres por cada hombre
R = 12/6 = 2 médicos hombres por cada médico mujer
Medidas de resumen de variables cualitativas
PROPORCIONES
Definición: Una proporción es una medida de resumen para variables cualitativas que
consiste en la comparación, a través de una división, entre un subconjunto y el conjunto al
que pertenece.

Proporción: comparación a través de cociente entre un subconjunto y el conjunto al cual


pertenece
25H + 35M = 60
P = parte / total
Variable de estudio: sexo de las personas
Categorías: hombres, mujeres

Ejemplo: En un curso existen 60 estudiantes, de los cuales 35 son mujeres y 25 hombres

La proporción de hombres es La proporción de mujeres es


P = 25/60 = 0,42 P = 35/60 = 0,58
En porcentaje = P*100 = 0,42+100 = 42% de En porcentaje = P*100 = 0,58*100 = 58% de
hombres mujeres

Ejemplo: Se desea condensar la información siguiente: en un país subdesarrollado ocurrieron 422,350


defunciones en total; de ellas 124,352 pertenecieron a niños que aún no cumplían el año de edad.
La proporción de defunciones de los niños es:
P = 124.352/ 422.350 = 0,29 en porcentaje indica que es un 29% de defunciones
Medidas de resumen de variables cualitativas
TASA
Definición: Una tasa es una medida de resumen para variables cualitativas que consiste en la comparación, a
través de una división, entre el número de veces que ocurre un cierto tipo de eventos y la población en la que
puede ocurrir dicho tipo de eventos. Usualmente el resultado de tal división consiste en una cifra fraccionaria
menor a uno; por ello, el resultado de la división suele ser multiplicado por alguna constante que sea múltiplo del
número 10.
Tasa: comparación a través de cociente entre un conjunto de eventos y la población en la que pueden ocurrir
tales eventos
tasa = Proporción x k
K: toma valores múltiplos de 10
Variable de estudio: sexo de las personas
Categorías: hombres, mujeres
Ejemplo: En un curso existen 60 estudiantes, de los cuales 35 son mujeres y 25 hombres

La tasa de hombres por k=1.000.000 es La tasa de mujeres por K= 1000.000 es


t = Pxk t = Pxk
P =25/60 = 0,42 t=0,58 x1000.000 = 580.000 mujeres por millón
T = 0,42*1000000 = 420.000 hombres por millón

Ejemplo: En una ciudad, a lo largo del año 1991, ocurrieron 345 defunciones por cáncer de próstata. Dicha
ciudad tenía una población total de 2' 453, 310 habitantes, de los cuales 1' 210, 425 son hombres. Calcule la
tasa por cada 100.000 habitantes, de las defunciones de hombres por cáncer de próstata.
En este caso el cáncer de próstata solo afecta a los hombres, por lo tanto la población se refiere a los 1' 210,
425 hombres
t = 345 x 100.000 = 28,5 = 29 hombres que fallecieron con cáncer de próstata por 100.000 hombres
1210425
Estadística

FREUENCIAS

Frecuencias pueden ser

Frecuencia absoluta: La frecuencia absoluta f(xi) se determina como el número de veces


que se repite un dato xi

: La frecuencia relativa hi : es el cociente hi =fi/N , en algunas ocasiones seFrecuencia


relativa
representa como ni/N, donde N es el número total de datos, corresponde a la suma de
todas la frecuencias individuales de cada clase, y ni o fi los datos en cada clase.

Frecuencia absoluta acumulada: La frecuencia absoluta acumulada Fi: Para un


determinado valor se considera como la frecuencia de cada dato xi mas la suma de los
valores anteriores a dicha suma.

La frecuencia relativa acumulada Hi : es la suma de los valores acumulados de la


frecuencia relativa

7
Estadística

FREUENCIAS

Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se


presenta una característica.

Variable Variable Variable Variable


Cuantitativa Cualitativa Cualitativa Cuantitativa

CONTINUA NOMINAL NOMINAL CONTINUA

DISCRETA ORDINAL ORDINAL DISCRETA

Frecuencia Absoluta (F) Frecuencia Relativa (f)


TIPO FRECUENCIA
Frecuencia Absoluta Frecuencia Relativa
Acumulada (FAA) Acumulada (fra)

8
Estadística

FREUENCIAS
DE VARIABLES CUALITATIVAS
Ejemplo
Una empresa farmacéutica, quiere averiguar que tinte de cabello es el que más utilizan las mujeres. Para
ello, selecciona un grupo de peluquerías femeninas que se encuentran ubicadas en tres ciudades diferentes,
se hace un seguimiento durante un mes, anotándose los tintes utilizados.
• Realice una tabla de frecuencias absolutas, relativas, porcentaje de frecuencia relativa, frecuencia
relativa acumulada, frecuencia absoluta acumulada
• Determine que tinte es el mas utilizado
• Determine que tinte es el más utilizado por ciudad

Ciudad 1 Ciudad 2 Ciudad 3


Semana 1 Semana 2 Semana 3 Semana 4 Semana 1 Semana 2 Semana 3 Semana 4 Semana 1 Semana 2 Semana 3 Semana 4
negro negro castaño castaño negro castaño castaño castaño castaño castaño castaño castaño
negro negro castaño castaño negro castaño castaño castaño castaño castaño castaño castaño
negro negro castaño rubio negro negro castaño rubio negro negro castaño rubio
negro negro rojo rubio negro negro rojo rubio negro negro rojo rubio
negro negro castaño rubio negro negro rubio rubio negro negro rubio rubio
rojo rojo rojo rubio rojo negro rubio rubio castaño rojo rubio rubio
rojo rojo rojo rubio rojo rojo rubio rubio castaño rojo rubio rubio
rubio rubio rubio rubio rojo rojo rubio rubio rojo rojo rubio castaño
rubio rubio rubio rubio rojo rojo rubio rubio rojo rojo rubio castaño
castaño castaño rubio rubio castaño castaño rubio rubio castaño castaño rubio castaño
9
Estadística

FREUENCIAS
DE VARIABLES CUALITATIVAS
Ciudad 1 Ciudad 2 Ciudad 3
Semana Semana Semana Semana Semana Semana Semana Semana Semana Semana Semana Semana
1 2 3 4 1 2 3 4 1 2 3 4
negro negro castaño castaño negro castaño castaño castaño castaño castaño castaño castaño
negro negro castaño castaño negro castaño castaño castaño castaño castaño castaño castaño
negro negro castaño rubio negro negro castaño rubio negro negro castaño rubio
negro negro rojo rubio negro negro rojo rubio negro negro rojo rubio
negro negro castaño rubio negro negro rubio rubio negro negro rubio rubio
rojo rojo rojo rubio rojo negro rubio rubio castaño rojo rubio rubio
rojo rojo rojo rubio rojo rojo rubio rubio castaño rojo rubio rubio
rubio rubio rubio rubio rojo rojo rubio rubio rojo rojo rubio castaño
rubio rubio rubio rubio rojo rojo rubio rubio rojo rojo rubio castaño
castaño castaño rubio rubio castaño castaño rubio rubio castaño castaño rubio castaño

fi
Ciudad 2 Ciudad 3
Color de Ciudad 1 (frecuencia
Variable fi (frecuencia absoluta) fi (frecuencia absoluta)
tinte fi (frecuencia absoluta) absoluta)
total
Negro 5 5 0 0 5 4 0 0 3 3 0 0 2525
Castaño 1 1 4 2 1 3 3 2 5 3 3 5 3033
Categorías
(Nominal; Rubio 2 2 3 8 0 0 6 8 0 0 6 5 4040
politómica) Rojo 2 2 3 0 4 3 1 0 2 4 1 0 2222
Estadística

FREUENCIAS
DE VARIABLES CUALITATIVAS
• Realice una tabla de frecuencias absolutas, relativas, porcentaje de frecuencia relativa,
frecuencia relativa acumulada, frecuencia absoluta acumulada
Porcentaje de
Porcentaje de HI FI
fi hi HI
hi (frecuencia (Frecuencia
Variable Color de tinte (frecuencia (frecuencia (frecuencia
(frecuencia relativa absoluta
absoluta) relativa) relativa
relativa) acumulada) acumulada)
acumulada)
Negro 25 0,208 20,80% 0,208 20,80% 25
Categorías
Castaño 33 0,275 27,50% 0,483 48,30% 58
(Nominal;
Rubio 40 0,333 33,30% 0,817 81,70% 98
politómica)
Rojo 22 0,183 18,30% 1 100,00% 120
Total 120 1 100%
• Determine que tinte es el más utilizado
El tinte rubio tiene una frecuencia absoluta (fi) del 40 y con porcentaje de uso (% hi) del 33,3%
• Determine que tinte es el más utilizado por ciudad
Ciudad 1 Ciudad 2 Ciudad 3
Variable Color de tinte fi %hi fi %hi fi %hi
Negro 10 25,0% 9 22,5% 6 15,0%
Categorías Castaño 8 20,0% 9 22,5% 16 40,0%
(Nominal; Rubio 15 37,5% 14 35,0% 11 27,5%
politómica) Rojo 7 17,5% 8 20,0% 7 17,5%
Total 40 1 40 1 40 1
Estadística
GRAFICOS
DE VARIABLES CUALITATIVAS
Las variables cualitativas generalmente se grafican en gráficos de PASTEL Y BARRAS, se representa las
frecuencias absolutas o porcentaje de frecuencias relativas .
-Cuando una variable es cuantitativa se la puede transformar en categorías y graficar este tipo de gráficos.
-Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para
describir el comportamiento de una variable en distintos grupos.

1. Gráfico de Pastel 2. Gráfico de Barras

Distribución de las unidades de análisis de Numero de unidades de análisis


acuerdo a variable 1 de acuerdo a variable 1

A 500
D
10% 20% 400

300

200

100
C B 0
40% 30%
A B C D

variable 1

12
TRATAMIENTO DE
DOS VARIABLES CUALITATIVAS

Tablas de contingencia
Tablas OR
Resumen de variables cualitativas
Con tablas de contingencia

Una tabla de contingencia se construye con el cruce de dos variables, en este caso dos
variables cualitativas, las cuales pueden ser:
• Nominal-Nominal ( dicotómicas o politómicas)
• Nominal- Ordinal: ( Nominal (dicotómicas o politómicas) : ordinales)
• Ordinal- Nominal ( Ordinal: Nominal (dicotómicas o politómicas)
• Ordinal – Ordinal: ( Ordinal: ordinal)
TABLA DE CONTINGENCIA Variable cualitativa
Nominal (dicotómica o politómica) o Ordinal

Categoría1 quito Categoría riobamba


Variable Categoría 1 fi (frecuencia fi (frecuencia absoluta) Subtotal
cualitativa cefé absoluta) fila
Nominal(dicotó Categoría 2 fi (frecuencia fi (frecuencia absoluta) Subtotal
mica o negros absoluta) fila
politómica);
Ordinal) Categoría 3
fi (frecuencia fi (frecuencia absoluta) Subtotal
verdes
absoluta) fila
Subtotal columna Subtotal Columna Total
Resumen de variables cualitativas
Con tablas de contingencia
TABLA DE Variable cualitativa nominal, dicotómica
CONTINGENCIA Deficiencia visual
Personas con lentes Personas sin lentes Total
Variable Hombres Fa =15 Fa = 18 33
cualitativa
Mujeres Fa =10 Fa = 20 30
nominal,
dicotómica Total 25 38 63
Sexo de las
personas

RAZÓN: Parte/Parte
Razón de personas con lentes/personas sin Razón hombres respecto a mujeres
lentes R = 33/30 = 1,1
R = 25/38 = 0,66 Existen 1,1 hombres por cada mujer
Existen 0,66 personas con lentes por cada persona sin
lentes

Razón de mujeres sin lentes respecto a mujeres Razón de mujeres respecto a hombres
con lentes
R = 30/33 = 0,91
R = 20/10 =2
Existen 0,91 mujeres por cada hombre
Existen 2 mujeres con lentes por cada mujer sin
lentes
Resumen de variables cualitativas

TABLA DE Variable cualitativa nominal, dicotómica


CONTINGENCIA
Personas con Personas sin Total
lentes lentes
Variable Hombres 15 18 33
cualitativa Mujeres 10 20 30
nominal,
dicotómica Total 25 38 63

PROPORCIÓN: Parte/Total

Proporción de personas con lentes Proporción de personas sin lentes


P = 25/63 = 0,40 P = 38/63 = 0,60
Porcentaje 0,60+100= 60%
0,40 *100 = 40%

Proporción de hombres Proporción de mujeres


R = 33/63 = 0,52 R = 30 / 63 = 0,48
Porcentaje
O,52*100= 52%
Resumen de variables cualitativas

TABLA DE Variable cualitativa nominal, dicotómica


CONTINGENCIA
Personas con Personas sin Total
lentes lentes
Variable Hombres 15 18 33
cualitativa Mujeres 10 20 30
nominal,
dicotómica Total 25 38 63

PORCENTAJE; Proporción x 100

Porcentaje de personas con lentes Porcentaje de personas sin lentes


P = 25/63 = 0,40 P = 38/63 = 0,60
% = 0,40*100 = 40% % = 0,60 x 100

Proporción de hombres Proporción de mujeres


R = 33/63 = 0,52 R = 30 / 63 = 0,48
% 0,52 x 100 = 52% % 0,48 x 100 = 48%
Resumen de variables cualitativas

TABLA DE Variable cualitativa nominal, dicotómica


CONTINGENCIA
Personas con Personas sin Total
lentes lentes
Variable Hombres 15 18 33
cualitativa Mujeres 10 20 30
nominal,
dicotómica Total 25 38 63

TASA; Proporción x k
En donde k es un número múltiplo de 10

Tasa de hombres por 1000000 Tasa de mujeres por 1000000


R = 33/63 = 0,52 R = 30 / 63 = 0,48
Tasa = 0,52 x1000000 = 520000 hombres por cada millón Tasa 0,48 x 1000000 = 480000 mujeres por cada millón
Odds y Ratio
Se aplica a una tabla de contingencia
Se construye con el cruce de dos variables cualitativas, las cuales deben tener 2 categorías
• Nominal-Nominal ( dicotómicas)

TABLA DE CONTINGENCIA Variable cualitativa


Nominal: (dicotómica )
Categoría 1 Categoría 2
Variable Categoría 1 a (frecuencia absoluta) b (frecuencia absoluta) Subtotal
cualitativa fila
Nominal: Categoría 2 c (frecuencia absoluta) d (frecuencia absoluta) Subtotal
(dicotómicas) fila

Subtotal columna Subtotal Columna Total


general

Odds se definidos como un cociente entre el número de eventos y el número de “no eventos”.
Odds = numero de eventos/ numero de no eventos
Por ejemplo si en el mes de junio tiene 30 días y en ese mes ha llovido 3 días, el odds ratio de la
posibilidad de lluvia en junio es el cociente entre los días de lluvia respecto al odds de lluvia =
número de días de lluvia / días de no lluvia = 3/27.
Odds Ratio
Odds se define como un cociente entre el número de eventos y el número de “no eventos”.
Odds = (a) numero de eventos / (b)numero de no eventos

Por ejemplo, si el mes de junio tiene 30 días y en ese mes ha llovido 12 días, el odds de la posibilidad
de lluvia en junio, es el cociente entre los días de lluvia respecto al número de días de no lluvia
Odss junio = 12/18

Odds Ratio (OR) se define como un cociente entre dos odds.

OR = Odds 1 / Odds 2
Ejemplo
Si en el mes de junio llovió 12 días y en el mes de noviembre llovió 3 días de los 30 días de cada mes..
De qué manera compararía la posibilidad de que llueva en junio versus noviembre.
Odds junio = 12/18
Odds noviembre = (3/27)

El OR corresponde al odds de que llueva en junio dividido por el odds de que llueva en noviembre, y
equivale a
OR = odss junio / Odss noviembre
OR = (12/18) / (3/27) = 6,0

Su interpretación es : “la razón de posibles días de lluvia versus “no lluvia” es 6 veces mayor en junio en
comparación a noviembre”.
Odds ratio
TABLA DE CONTINGENCIA Variable cualitativa
Nominal dicotómica
Categoría Categoría
Variable Categoría a b Subtotal fila
cualitativa Categoría c d Subtotal fila
Nominal
dicotómica Subtotal columna Subtotal Columna Total general
Odds ratio

Enfermos Triglicéridos > 150 No enfermos Triglicéridos < 150


Mujeres mayor a 20 años mg/dL (enfermo) mg/dL (No enfermo) Total
IMC >30 obesidad a = 161 b = 184 345
IMC<30 no obesidad c = 32 d = 73 105
Total 193 257 450
En donde
Ln = logaritmo natural
Li = Límite inferior
Ls= límite superior
e = 2,71828182845904
IC(95%) = Nivel de confianza al 95% = 1,96

Expresar
(OR ) ( Li ___Ls)

(2) ( 1,25 –OR- 3,18)


Interpretación
La razón de mujeres con enfermas triglicéridos mayor a
150 mg/dL, versus mujeres con triglicéridos no enfermas
menor a 150 mg/dL, es 2,0 veces mayor en mujeres con
IMC mayor a 30 kg/m2 , en comparación con mujeres con
IMC menor a 30 kg/m2
Videos tutoriales
Tratamiento de variables cualitativas
Medidas de resumen
https://www.youtube.com/watch?v=GkeS2RjcRfs

Tratamiento de variables cualitativas


Gráficos de variables cualitativas
https://www.youtube.com/watch?v=QAREEH131_M

Tratamiento de variables cualitativas


Tablas de contingencia
https://www.youtube.com/watch?v=CEWJZxFpC8w

Tratamiento de variables cualitativas


Odds ratios
https://www.youtube.com/watch?v=B2dUlAjkgYQ

También podría gustarte