Está en la página 1de 30

Estadística Descriptiva: tipos de datos, clasificación y

tabulación.
Variables cuantitativas y cualitativas.

TEMA 2.
LABORATORIO DE ESTADÍSTICA

Evelina Haroyan Darbinyan


Curso académico 2023-2024

1 | SlideSalad.com
Estadística Descriptiva: tipos de datos, clasificación y
tabulación
• Los datos de cualquier estudio se recogen, de acuerdo con un determinado protocolo,
mediante formularios o cuestionarios, que permiten registrar la información de cada uno de
los sujetos de forma estandarizada y estructurarla en forma de una matriz de datos.
• Se entiende por variable, cada uno de los caracteres o aspectos que se registran en los
sujetos del estudio y que pueden tomar distintos valores.

2 | SlideSalad.com
RECOGIDA Y ANÁLISIS DE DATOS
• VARIABLES: Son características o cualidades de una persona, animal u objeto, las cuales se
pueden medir o recoger en forma de dato. Por ejemplo: la edad, la estatura, nivel educativo,
grupo sanguíneo, el peso... ESTAS SON LAS VARIABLES OBJETO DE ESTUDIO.

• DATOS: son el resultado de observar una variable en un grupo de individuos elegidos al azar
de la población en estudio.

• Por ejemplo: al observar la VARIABLE EDAD de los alumnos de 1º de Odontología, se han


obtenido los siguientes DATOS: 18, 20, 52, 22, 21, 23 24, 17, 18, 19, 20…. etc.

Otros ejemplos:

Ej: Tras medir la VARIABLE PESO de los niños de 3 años Móstoles, se han recogido los
siguientes DATO: 10 kg, 12 kg, 15 kg, 23 kg, 14 kg, 12.5 kg, 13.7 kg, 17.2 kg…..

Ej: Tras realizar una analítica como donante de sangre en el Campus, se han registrado los
siguientes DATOS, DE LA VARIABLE GRUPO SANGUÍNEO:

Grupo A, Grupo 0, Grupo AB, Grupo 0, Grupo B, Grupo B…..

3 | SlideSalad.com
TIPOS DE VARIABLES
La información que recogemos puede ser de una variable cuantitativa o métricas (sí
se puede cuantificar) o de variable cualitativa no métrica, (NO se puede cuantificar
de forma numérica)

DISCRETAS

CUANTITATIVAS

CONTINUAS

VARIABLES
NOMINALES

CUALITATIVAS DICOTÓMICAS

ORDINALES
4 | SlideSalad.com
TIPOS DE VARIABLES

Variables cuantitativas o datos métricos

▪ Las variables cuantitativas proceden de una escala métrica: se


pueden cuantificar. Ejemplos: Temperatura, Edad, Peso, Talla, Fuerza
(N-cm), Hijos, Nº de cirugías….

▪ A su vez, se pueden clasificar en discretas o continuas

1. V. Cuantitativas Discretas: son recuentos, es decir, son números


enteros y no pueden decimales. Ej: número de hijos, nº divorcios, nº
de dientes, nº intervenciones… No puedes tener 1,5 hijos ni 2,7
dientes.

2. V. Cuantitativas Continuas: medidas o mediciones, que sí pueden


tener decimales. Ej: 62,5 kg, 174,56 cm, glucose de 123,5 mg….

5 | SlideSalad.com
TIPOS DE VARIABLES

Variables cualitativas o datos no métricos o variables categóricas

▪ Las variables cualitativas son aquellas que no pueden medirse en


términos númericos. Cualidades o características. A su vez, se pueden
clasificar en discretas o continuas

1. V. Categórica Nominal: los diferentes valores que puede coger la variable


no tienen ningún orden entre ellos.

Ej: Grupo Sanguíneo (A, B, AB, O); Ojos verdes, azules, marrones y grises.

2. V. Categórica Dicotómica: es aquella binaria, que solo puede coger dos


valores: Sí/NO; 1/0 ; Ausente/Presente ; Enfermo/Sano

3. V. Categórica Ordinal: aquella variable que coge valores con un orden. Ej:
HTA leve, moderada, severa; Diabetes inicial, moderada, grave; Clase baja,
media, alta; 0-1-2-3-4;
6 | SlideSalad.com
EJERCICIO ¿Qué tipo de variable es?

7 | SlideSalad.com
Además tendremos en una matriz otros datos que no son variables:

• ID: identificador de cada paciente/objeto. No es una variable desde el punto de


vista estadístico.

• FECHAS: la fecha NO ES UNA VARIABLE. Es un punto en el tiempo. A PARTIR


DE LA CUAL SE PUEDEN CALCULAR VARIABLES COMO LA EDAD. La variable
edad: será la diferencia entre la fecha del estudio y la fecha de nacimiento del
paciente.

8 | SlideSalad.com
CASO PARTICULAR DE LA VARIABLE TIEMPO TRANSCURRIDO
Tiempo transcurrido es una variable continua cuyo valor, en un sujeto determinado,
se puede registrar en tiempo cumplido (valor truncado) o en tiempo exacto.

Cuando se pregunta la edad a un sujeto siempre se registra en tiempo cumplido.

¿CUÁNTOS AÑOS TIENES? TENGO 62 AÑOS: Desde el día que cumple 62 hasta el
día antes de cumplir 62, el sujeto tiene esta edad.

Por lo tanto, recogida de esta manera, es EDAD EN TIEMPO CUMPLIDO. NO ES UNA


EDAD EN TIEMPO EXACTO.

9 | SlideSalad.com
CASO PARTICULAR DE LA VARIABLE TIEMPO TRANSCURRIDO

Si se pregunta la fecha de nacimiento, el cálculo proporciona la edad exacta


(en años, meses o semanas decimales).

Para calcular un tiempo transcurrido exacto se deben registrar las fechas de


inicio (Fi) y final (Ff) del periodo y proceder así:

PASO 1. Definir las unidades de medida del tiempo, ya que el año y el mes no
son unidades de medida del tiempo. En Ciencias de la salud se usa la
definición estadística:

1 año = 365.25 días (ya que cada 4 años 1 es bisiesto)


1 mes = 365.25 / 12 = 30.4375 días
1 semana = 7 días

PASO 2. Calcular el tiempo transcurrido en días :

Tiempo en DÍAS = Fecha fin − Fecha inicio

TIEMPO EN DÍAS = 19/09/2023 – 01/06/1990 = 12163


10 | SlideSalad.com
CASO PARTICULAR DE LA VARIABLE TIEMPO TRANSCURRIDO

PASO 3. Calcular el tiempo transcurrido en AÑOS

Tiempo en DÍAS = Fecha fin − Fecha inicio

TIEMPO EN DÍAS = 19/09/2023 – 01/06/1990 = 12163

12163/ 365.25= 33, 30 AÑOS exacttos

¿Cuánto sería esta edad exacta en edad truncada?

33 años cumplidos

11 | SlideSalad.com
EJERCICIO
Calcular el tiempo transcurrido en días y en años en Excel:

Fecha Fin- Fecha de nacimiento = tiempo transcurrido en días

(Fecha Fin – Fecha nacimiento ) / 365.25 = tiempo transcurrido en


años.

12 | SlideSalad.com
Soluciones

13 | SlideSalad.com
INDIVIDUO, MUESTRA Y POBLACIÓN
• El primer paso de todo investigador es definir LA POBLACIÓN de estudio.
• La población es el conjunto completo de individuos a los cuales se refieren las conclusions de
un estudio. Es el CONJUNTO O TOTALIDAD DE ELEMENTOS SOBRE LOS QUE SE INVESTIGA.
• Si estoy investigando si existe una asociación entre la píldora anticonceptiva y el cáncer de
mama: la POBLACIÓN, es el conjunto de mujeres con cáncer de mama del mundo.

• ¿Puedo estudiar a todas las mujeres del mundo con cancer de mama? NO. Las
poblaciónes que se quieren estudiar son muy extensas y es imposible abarcarlas de forma
completa.
14 | SlideSalad.com
INDIVIDUO, MUESTRA Y POBLACIÓN
• Por ello, se trabaja con una MUESTRA REPRESENTATIVA de la población, de tamaño
adecuado.
• La muestra es el conjunto de sujetos/objetos que se van a estudiar para obtener las
conclusiones del estudio. Es un subconjunto, una porción de la población que se utiliza con el
fin de obtener la información necesaria y poder generalizar a LA POBLACIÓN DE ESTUDIO.
• Los elementos que intengran la población o muesta, se denominan individuos. Aunque
frecuentemente los individuos son personas, pueden ser tambien animales (conejos, ratones,
perros), objetos (coronas, dientes, prótesis, implantes…).

15 | SlideSalad.com
TIPOS DE ANÁLISIS ESTADÍSTICOS
1. ESTADÍSTICA DESCRIPTIVA

▪ Permite describir los datos de una población mediante diferentes


ESTIMADORES O ESTADÍSTICOS (MEDIA, MEDIANA, MODA, DESVIACIÓN
ESTÁNDAR…).
▪ Es decir, los datos que recogemos hablan por sí mismos de la muestra
estudiada, dándonos una fotografía fija.
▪ Ej: la media de edad de esta clase es de 20 años +- 2 años (entre 18 y 20 años)

▪ ESTADÍSTICA DESCRIPTIVA: es el conjunto de procedimientos necesarios


para recoger, clasificar, resumir y representar el conjunto de datos que forman
una muestra obtenida de una población.
▪ Dependiendo del tipo de datos o variable, la técnica de Estadítica Descriptiva
varíará.

16 | SlideSalad.com
TIPOS DE ANÁLISIS ESTADÍSTICOS

2. ESTADÍSTICA INFERENCIAL

▪ Es la rama de la investigación/estadística que consiste en obtener


conclusiones (realizar inferencias) sobre una población a partir de la
información que se recoge de una muestra.
▪ Teniendo una muestra representativa de una población, podemos tener
suposiciones sobre la población en conjunto.

▪ Obtiene conclusiones válidas a partir de una información incompleta (de una


muestra).

▪ Transfiere conclusiones obtenidas en una parte de la población (muestra) a


toda ella (población).

17 | SlideSalad.com
TABULACIONES

18 | SlideSalad.com
Presentación Tabular de los Datos

Tenemos una muestra de 500 alumnos varones de un Universidad


en los que se desea estudiar el grupo sanguíneo (cualitativo), el
número de hermanos excluido él mismo (cuantitativo discreto) y el
peso (cuantitativo continuo).

Alumno nº Grupo Número Peso


Sanguíneo de Hermanos
1 A 0 70,502
2 B 3 67,231
- - - -
- - - -
- - - -
- - - -
500 AB 2 71,676
19 | SlideSalad.com
TABULACIÓN

• Después de recoger en la matriz de datos los valores de las


diferentes variables de cada sujeto, se han de organizar para
resumirlos.

• Ordenar los sujetos de acuerdo con los valores que presentan en la


variable que se quiere estudiar es el primer paso para obtener la
distribución de frecuencias y representarla gráficamente.

• Una distribución de frecuencias consiste en una serie de clases


predeterminadas (que pueden ser categorías, números o intervalos
de valores, según la escala de medida de la variable) con el número
total de sujetos incluidos en la clase.

• Distribución de frecuencias es clasificar a los sujetos en categorías


(si la variable es nominal u ordinal) o en intervalos de valores (si la
variable es métrica).
20 | SlideSalad.com
Grupo Frecuencia Frecuencia Porcentaje
Sanguíneo absoluta (fi) relativa (hi) (%)
A 150 0,30 30%
B 75 0,15 15%
AB 25 0,05 5%
O 250 0,50 50%
Total 500 1,00 100%

CLASES f1=150 H1=150/500 = 0,30 x 100


f2= 75 H2= 75/500 = 0,15 x 100
UN TOTAL f3= 25 H3= 25/500 = 0,05 x 100
DE 500
f4 = 250 H4 = 250/500 = 0,50 x100
ALUMNOS

21 | SlideSalad.com
Grupo Frecuencia Frecuencia Porcentaje
Sanguíneo absoluta (fi) relativa (hi) (%)
A 150 0,30 30%
B 75 0,15 15%
AB 25 0,05 5%
O 250 0,50 50%
Total 500 1,00 100%

Grupo sanguíneo: A, B, AB y O.

Clases: se denomina así a los distintos modos de presentarse un dato


cualitativo.

Frecuencia absoluta: número de individuos que presentan cada una de las


modalidades de grupo sanguíneo. Se representa con la letra f1,2,3….i
FRECUENCIA RELATIVA (hi=fi/n): cociente entre la frecuencia absoluta y el
22 tamaño
| SlideSalad.comde la muestra.
Tabulación de V. Categóricas
Para construir la distribución de frecuencias de una variable categórica se debe
clasificar a los sujetos según la categoría que les corresponde y presentar el
recuento expresado en proporciones o porcentajes.

Frecuencia absoluta de
cáncer de cada tipo (mama, Frecuencia relativa de
útero y ovarios). Número de cáncer de mama respecto al
individuos con ese cáncer total de cánceres.

Número total de cánceres EN CONJUNTO.


CLASE: tipo de cáncer
23estudiado
| SlideSalad.com
457 TUMORES CORRESPONDEN AL 100% DE
LOS TUMORES DEL ESTUDIO.
Tabulación de V. Cuantitativas Continuas
Al considerar el peso de los 500 alumnos (con una precisión
de gramos), es prácticamente imposible que dos individuos
tengan el mismo peso, con lo que la tabla contaría con miles
de valores con frecuencias 0 y 1.

Para evitarlo los datos se agrupan en grupos llamados


intervalos de clase.

Intervalos de 5, 10, 20…. (Años, kilos, cm, gr….) Ej: intervalo


de 10 a 15 kilos, 15-20, 20-25, 25-30, 30-35….

24 | SlideSalad.com
Frecuencia absoluta
Frecuencia relativa

Intervalo de Marca de
fi hi %
clase clase

x < 45 1 0,002 0,2 42,5


45 < x < 50 3 0,006 0,6 47,5
50 < x < 55 12 0,024 2,4 52,5
55 < x < 60 75 0,150 15 57,5
Límites 60 < x < 65 103 0,206 20,6 62,5
de clase
65 < x < 70 155 0,310 31,0 67,5
70 < x < 75 101 0,202 20,2 72,5
75 < x < 80 29 0,058 5,8 77,5
80 < x < 85 11 0,022 2,2 82,5
85 < x < 90 8 0,016 1,6 87,5
x > 90 2 0,004 0,4 92,5

Total 500 1,000 100,0 -


25 | SlideSalad.com
La amplitud de un intervalo de clase se define como la
diferencia entre sus límites.

La amplitud entre 45 y 50 kilos es de 5. La amplitud del intervalo


es de 5 kilos.

En la edad, se debe tener cuenta la siguiente excepción: el límite


superior del intervalo de 9 años, será de 10. Es decir, en edad
cumplica o truncada (dado que el sujeto tiene 9 años hasta el
día antes de cumplir 10).

Por ejemplo, la amplitud del intervalo que incluye las edades


entre 10 y 19 años es: 20−10 = 10 años. El límite superior
verdadero es 20.

La amplitud del intervalo que incluye las edades entre 0 y 9 es:


10-0= 10 años.
26 | SlideSalad.com
Estos intervalos tienen un límite inferior (li) y un límite superior (Ls).

LÍMITES DE CLASE: la tercera clase viene definida por el par de números


(50;55), denominados respectivamente:

fi : frecuencia absoluta de eventos en cada intervalo de clase. El número


de sujetos individuos con esa característca en ese intervalo de clase.

hi: frecuencia relativa de los eventos.

Marca de clase o centro de clase: es el centro de cada intervalo: la mitad


de cada intervalo. Es un representante de cada clase.

Si límite inferior es 40 y límite superior es 50: centro de clase= 45.

MARCA DE CLASE = Ls + Li
2
27 | SlideSalad.com
Condiciones de Tabla de Distribución de Frecuencias

• Deben llevar un enunciado que las explique totalmente


sin necesidad de recurrir al texto.

• Deben de indicar los totales de cada una de las


columnas numéricas.

• Deben indicar claramente las unidades de medida.

• Los límites deben ser autoexcluyentes. Si límite superior


de una clase es 20 años de edad, el límite inferior de la
clase siguiente NO puede ser 20.

• La amplitud de cada intervalo debería ser idealmente, la


misma en cada intervalo.
28 | SlideSalad.com
EJERCICIO
Se ha estudiado el fallecimiento por Leucemia de 66
pacientes con diferentes edades que se encuentran a
continuación.

Casos= número de fallecimientos.

Realizad la tabulación con intervalos de 10 años

29 | SlideSalad.com
SOLUCIÓN

30 | SlideSalad.com

También podría gustarte