Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1
Tema 1
Índice
1. Introducción 1
1.1. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. ¿Por qué resumir? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Variables Estadı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Sı́ntesis de datos unidimensionales . . . . . . . . . . . . . . . . . . . . . . . 6
2. Tablas de frecuencias 6
2.1. Variables Cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Variables Cuantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . 8
2.3. Variables Cuantitativas Continuas . . . . . . . . . . . . . . . . . . . . . . . 9
1. Introducción
1
2 Tema 1: Introducción a la Estadı́stica Descriptiva
¿Los datos observados sugieren algún tipo de relación entre el tipo de tratamiento
y la presión sistólica?
¿Qué porcentaje de los 60 pacientes en la muestra tiene una presión sistólica mayor
o igual que 143 mm Hg?
Tabla 1: Tipo de tratamiento y Presión sistólica (en mm Hg) en 60 pacientes con hiper-
tensión sistólica aislada
Sexo, Edad, Presión sistólica, Grupo sanguı́neo, Medidas biométricas (en una po-
blación de individuos)
1. Variables Cualitativas
1.1. Nominales
1.2. Ordinales
2. Variables Cuantitativas
2.1. Continuas
2.2. Discretas
Variables cualitativas nominales: son aquellas que toman valores para los cuales
sólo puede definirse una relación de igualdad–desigualdad, lo que tan sólo permite dilucidar
entre cada dos valores si son iguales o distintos.
Variables cualitativas ordinales: son aquellas que toman valores para los cuales
puede definirse, además de una relación de igualdad–desigualdad, otra relación de orden
(los posibles valores de la variable pueden ser ordenados).
Estadı́stica (Grado en Óptica) 5
Estado Definición
0 Paciente totalmente activo, capaz de desempeñarse sin restricción
en todas las actividades que realizaba antes de enfermar
Paciente con restricciones para desarrollar actividades fı́sicas
1 intensas pero ambulatorio y capaz de llevar a cabo trabajo
de naturaleza ligera o sedentaria
Paciente no encamado y capaz de atenderse a sı́ mismo, aunque
2 no apto para llevar a cabo actividades laborales; lúcido
y atento más de 50 % de las horas que pasa despierto
3 Paciente capaz de atenderse a sı́ mismo de forma limitada; confinado
a una cama o silla más del 50 % de las horas que pasa despierto
4 Paciente discapacitado por completo; incapaz de cuidarse a
sı́ mismo, confinado a una cama o una silla
Obsérvese que los diferentes valores que puede tomar una variable cualitativa también
se denominan modalidades o atributos o niveles o categorı́as. Las distintas modalidades
pueden representarse por letras, sı́mbolos especiales, e incluso números, pero en este último
caso los números carecerán de cualquier significación cardinal (para variables cualitativas
ordinales) y ordinal (para variables cualitativas nominales).
Las variables cuantitativas son aquellas que toman valores para los cuales, además
de poderse definir una relación de igualdad-desigualdad y otra relación de orden, tiene
sentido realizar cálculos y operaciones matemáticas. Dentro de las variables cuantitativas
se pueden distinguir dos tipos: Variables cuantitativas discretas, aquellas que sólo
pueden tomar valores aislados o discretos.
Y variables cuantitativas continuas, aquellas que pueden tomar cualquier valor dentro
de uno o varios intervalos.
2
ECOG: Eastern Cooperative Oncology Group. La clasificación ECOG la utilizan los oncólogos para
clasificar el estado de pacientes que se sometieron a pruebas clı́nicas (M.M. Oken et al.: Toxicity and
Response Criteria of the Eastern Cooperative Oncology Group, American Journal of Clinical Oncology,
5 (1982) 649–655.
6 Tema 1: Introducción a la Estadı́stica Descriptiva
Obsérvese que, aunque teóricamente los datos cuantitativos continuos pueden tomar
cualquier valor dentro de uno o varios intervalos, en la práctica por la limitación de la
precisión de los aparatos de medida, todos los datos continuos se convierten en discretos.
Ası́, la estatura de los individuos podrá determinarse hasta el milı́metro (por ejemplo),
en cuyo caso los valores posibles van “dando saltos” y un individuo medirá 171.2 cm o
171.3 cm pero no los valores intermedios que el aparato no es capaz de precisar (y que
redondea a uno de los anteriores). Sigue siendo útil, en cualquier caso, distinguir entre
datos cuantitativos continuos y discretos.
Medidas de posición
Medidas de dispersión
Medidas de forma
3. Representaciones gráficas.
2. Tablas de frecuencias
x1 , x2 , . . . , xn .
Una de las formas más simples de resumir la información de un conjunto de datos del
tipo mostrado en la Tabla 2, es mediante una distribución de frecuencias, que consiste
en calcular para cada valor o clase de valores de una variable el número (frecuencia) de
veces en que aparece. Antes de definir más rigurosamente la distribución de frecuencias
veamos los tipos de frecuencias que se pueden calcular a partir de un conjunto de datos
para una variable unidimensional.
En adelante supondremos que tenemos una variable estadı́stica X que puede tomar
valores en un conjunto E y denotaremos por {E1 , . . . , Ek } una partición3 de E.
Para cualquier i ∈ {1, . . . , k}, se define:
3
{E1 , . . . , Ek } es una partición de E si E1 ∪ . . . ∪ Ek = E y Ei ∩ Ej = ∅ para todo i, j = 1, . . . , k, i 6= j.
Estadı́stica (Grado en Óptica) 7
Para las variables cualitativas, las clases Ei corresponden usualmente a las diferentes
modalidades que puede tomar la variable. Suponiendo que una variable cualitativa toma
(en la muestra) k modalidades, entonces la tabla de frecuencia toma la forma:
Para variables cuantitativas discretas, sus clases Ei corresponden usualmente a los di-
ferentes valores aislados que puede tomar dicha variable, y se muestran en orden creciente
en la tabla de frecuencias. En este caso, a diferencia de lo que sucedı́a con las variables
cualitativas, es aconsejable añadir a la tabla las frecuencias acumuladas (relativas y/o
absolutas) que se definen a continuación para cada i ∈ {1, . . . , k}.
Si suponemos que E1 , . . . , Ek son los posibles valores ordenados que puede tomar
una variable cuantitativa discreta X en una muestra de tamaño n, entonces la tabla de
frecuencias es como la dada en la Tabla 6.
Estadı́stica (Grado en Óptica) 9
ai + b i
ci = .
2
Las marcas de clase, definidas como punto medio de cada intervalo Ei , actuan como
represenantes de dichos intervalos. Como veremos después, las marcas de clase permiten
el cálculo aproximado de algunos coeficientes a partir de una distribución de frecuencias.
4
Para una descripción más detallada de las reglas generales para agrupar los datos en clases ver: J.S.
Milton (2001) Estadı́stica para Biologı́a y Ciencias de la Salud, 3a edición, p. 22
10 Tema 1: Introducción a la Estadı́stica Descriptiva
Intervalo Marca Fr. absoluta Fr. absoluta Fr. relativa Fr. relativa
de clase acumulada acumulada
E1 c1 n1 N1 f1 F1
E2 c2 n2 N2 f2 F2
... ... ... ... ... ...
Ek ck nk Nk fk Fk
Totales n 1
Presión Marca Fr. absoluta Fr. absoluta Fr. relativa Fr. relativa
sistólica de clase acumulada acumulada
[140,60, 143,26) 141,93 13 13 0,2167 0,2167
[143,26, 145,92) 144,59 6 19 0,1000 0,3167
[145,92, 148,58) 147,25 16 35 0,2666 0,5833
[148,58, 151,24) 149,91 12 47 0,2000 0,7833
[151,24, 153,90] 152,27 13 60 0,2167 1,0000
Total 60 1
(b) ¿Qué porcentaje de pacientes en la muestra tiene Presión sistólica (en mm Hg) entre
143,26 (incluido) y 148,58 (excluido)?
Un (0,1000+0,2666)·100 = 36,66 % de pacientes en la muestra tiene Presión sistólica
(en mm Hg) entre 143,26 (incluido) y 148,58 (excluido).
(c) ¿Qué porcentaje de pacientes en la muestra tiene una Presión sistólica menor de
151,24 mm Hg?
Un 78,33 % de pacientes en la muestra tiene una Presión sistólica menor de 151,24
mm Hg.
de intervalos k a tomar, o la longitud de los mismos (se recomienda que siempre tengan
la misma amplitud si es posible), es algo arbitrario que debe decidir el experimentador
en función del número de observaciones, n, de la dispersı́on de los datos y de criterios de
comparabilidad con experimentos anteriores o futuros. No hay un criterio universal para
determinar ese número de intervalos k. Se recomienda un número √ de intervalos entre 5 y
20. Otra regla posible es definir k como el entero más próximo a n, si n ≤ 400, o k = 20
si n > 400.
Si una variable cuantitativa discreta toma un número “muy elevado” de valores ais-
lados es aconsejable agrupar los valores en clases y construir una tabla de frecuencias
del tipo descrito para variables cuantitativas continuas.
1. %(X ≤ b)
2. %(X < b)
3. %(a ≤ X ≤ b)
4. %(a < X ≤ b)
5. %(a ≤ X < b)
7. %(a ≤ X)
8. %(a < X)