Está en la página 1de 8

Unidad 2: Bioestadística Descriptiva

Profesor: Carlos Villalobos Aguilera


Fecha: 06/05/2023
Contenidos:
- Conceptos generales
- Tabla de distribución de frecuencias
- Frecuencia absoluta y relativa
- Frecuencias acumuladas
- Representaciones gráficas

1.- Conceptos previos:

Población: Son los objetos de estudio, un grupo de elementos por los cuales se
tiene cierto interés en un momento dado. En Ciencias de la Salud se identificará
frecuentemente como un conjunto de individuos, por ejemplo: personas, animales,
plantas o células. Sin embargo el concepto es más abstracto, ya que también se
entiende por población a todos los posibles resultados de una medición de un
fenómeno, como por ejemplo: Si se tiene interés por el peso de todos los niños
inscritos en un determinado sistema escolar municipal, la población consta de todos
estos pesos, si el interés se centra sólo en el peso de los alumnos de primer año
del sistema escolar municipal, la población sólo incluye a los pesos de los alumnos
del primer año. Es por eso que la población se determina de acuerdo al interés que
se tenga en ellas. Pueden ser finitas o infinitas.

Muestra: Una muestra puede definirse simplemente como una parte de una
población. Suponga que una población consta de los niveles de glucosa en sangre
extraída a niños en una determinada ciudad. Si para el análisis sólo se utilizan 100
de estos datos, es una muestra de la población, o sea una fracción del total de datos.
La población se denota comúnmente con C, mientras que la muestra se denota con
n, que en todo caso es el tamaño de la muestra. En el ejemplo presentado
anteriormente, n es igual a 100.

Estadística Descriptiva: Se dedica a la descripción de la estadística, se entiende


por descripción la clasificación, representación gráfica y resumen de un conjunto de
n datos. Esos n datos constituyen una muestra de tamaño n extraída de una
población y la descripción de dicha muestra ha de completarse posteriormente como
una inferencia o generalización al total de la población.

2.- Tabla de distribución de frecuencias:

La recopilación de datos de un estudio estadístico se presenta mediante la tabla de


distribución de frecuencias, en ellas se representan los valores de los datos
asociados a su frecuencia absoluta, frecuencia acumulada y frecuencia relativa.

Datos no agrupados:

Si la variedad de los datos no es muy amplia en relación a la cantidad de datos, o


estos se repiten o se repiten demasiado, se puede elaborar una tabla de
frecuencias, que muestre cada dato sin agrupar.

Ejemplo : Variable cuantitativa discreta

Las edades en años en un grupo de n = 25 estudiantes universitarios son las


siguientes:

Edades: 23, 21, 18, 19, 20, 18, 23, 21, 18, 20, 19, 22, 18, 19, 19, 18, 23, 22, 19,
22, 21, 18, 24, 24, 20.
Si los datos no se ordenan, se reciben y se numeran como están. Éstos se denotan
con x. Así, el primer dato es x1 = 23; el segundo dato x2 = 21 ; hasta el último dato,
x25 = 20.

Si los datos son ordenados, se hace de menor a mayor, como 18 es el dato menor,
corresponde a x1, hasta el valor de x25 = 24.

Para organizar esta información, es posible representarla en una tabla, en donde


los datos se ordenan de menor a mayor, representados por xi. Así el primer dato,
en nuestro ejemplo igual a 18, se representa como x1.

La frecuencia o frecuencia absoluta del dato en la muestra, denotada por fi, es el


número de veces en que el dato se repite, entonces, la frecuencia del primer dato
en el ejemplo, corresponde a 6, ya que el dato 18 se repite 6 veces. De este modo
f1 = 6.
El segundo dato x2 corresponde a 19, como se repite 5 veces, su frecuencia es f2 =
5.
La frecuencia relativa, denotada por pi , corresponde a la frecuencia del dato,
dividida en el total de datos de la muestra.

𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 (𝑓𝑖)


𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 (𝑝𝑖) =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 (𝑛)
La frecuencia absoluta acumulada, denotada por Fi, es la frecuencia del intervalo
sumada con las frecuencias de todos los datos menores, así esta frecuencia va en
constante aumento, y su último valor corresponde al total de datos.
Así mismo, la frecuencia relativa acumulada, denotada por Hi, es la frecuencia
relativa del intervalo sumada con las frecuencias relativas de todos los datos
menores, esta frecuencia va en constante aumento, y su último valor corresponde
siempre a 1.

También es posible encontrar Hi = Fi / n

Representación gráfica:

Gráfico de barras:

El gráfico de barras es adecuado para representar datos no agrupados, que se


repiten y que no varían demasiado en relación al número de datos. En el eje X, se
muestran los datos, mientras que en el eje Y, se muestran las frecuencias.

Ejemplo: Gráfico de barras de ejemplo anterior.


Ejemplo (2): Variable Cualitativa

Estudio sobre el grupo sanguíneo realizado con n = 6313 individuos.

Representación gráfica:

Gráfico de sectores o gráfico circular:

Tipo de gráfico adecuado para variables cualitativas.


Datos agrupados:

Si la variedad de los datos es muy amplia en relación al número de datos, y estos


no se repiten demasiado, conviene agrupar los datos en grupos, llamados
intervalos de clase, para lograr un mayor poder de síntesis. Uno de los primeros
puntos a considerar, cuando se van a agrupar datos, es cuántos intervalos van a
incluirse. A modo de guía, es posible utilizar la regla de Sturges, en esta fórmula k
representa el número de intervalos, y n el número de valores en el conjunto de datos
bajo consideración.

𝑘 = 1 + 3,322 log 𝑛

Si la cantidad de datos n = 35, k = 5,12, o aproximadamente 5. Por lo que es una


cantidad ideal de intervalos para hacer la agrupación.

Es importante también considerar la amplitud de los intervalos de clase, es decir, la


diferencia entre el límite inferior y el límite superior del intervalo. Para esto podemos
utilizar una regla que sirve de guía:

𝑅
𝑤=
𝑘

Donde w es el valor de la amplitud de cada intervalo, k es el valor de la cantidad de


intervalos, y R representa la diferencia entre el dato mayor y el dato menor.

Ejemplo (3): Variable cuantitativa continua


La exposición aguda al cadmio produce dolores respiratorios, daños en los riñones
y el hígado y puede ocasionar la muerte. Por esta razón se controla el nivel de polvo
de cadmio y de humo de óxido de cadmio en el aire. Este nivel se mide en
miligramos de cadmio por metro cúbico de aire. Una muestra de 35 lecturas arroja
estos datos:

Para la cantidad de datos n = 35, la cantidad adecuada de intervalos es k = 5.


Además, como la diferencia entre el dato mayor es 0,07 – 0,020 = 0,05, según la
regla de la amplitud de los intervalos, esta debería ser de w = 0,01.

Frecuencia
Intervalo de Frecuencia Frecuencia
Frecuencia Relativa
clase Relativa Acumulada
Acumulada
[0,02 – 0,03[ 3 0,09 3 0,09
[0,03 – 0,04[ 4 0,11 7 0,20
[0,04 – 0,05[ 9 0,26 16 0,46
[0,05 – 0,06[ 12 0,34 28 0,80
[0,06 – 0,07] 7 0,2 35 1

Representación gráfica:

Histograma:
Tipo de gráfico adecuado para resumir información de variables cuantitativas
continuas. En este gráfico, en el eje X o eje de las abcisas se distribuyen los límites
de los intervalos de clase. En el eje Y o eje de las ordenadas se distribuyen las
frecuencias o frecuencias relativas según se requiera.

También podría gustarte