Está en la página 1de 12

Bioestadística

TEMA 1: CONCEPTOS BÁSICOS DE ESTADÍSTICA

BIOESTADÍSTICA DESCRIPTIVA Y ANALÍTICA

La bioestadística se divide en:

1- Descriptiva: pretende sintetizar y resumir la información contenida en unos datos


- Misión: recoger, clasificar y resumir datos
- Índices estadísticos: números que resumen de modo sencillo la información obtenida de
datos reales
- Métodos gráficos
2- Analítica o inferencial: pretende demostrar asociaciones o relaciones entre las características
observadas
- Misión: extraer consecuencias científicas a partir de unos datos
- Contrastes de hipótesis: confronta los resultados conseguidos empíricamente mediante
una recogida de datos contra una hipótesis de la que se partía y toma una decisión sobre si
los datos apoyan o no apoyan esa hipótesis
- Intervalos de confianza: da un rango de valores creíbles para un determinado parámetro

POBLACIONES Y MUESTRAS

DEFINICIONES:
1- Muestra: subconjunto de una población de mayor tamaño (la cual pretende que sirva como
representación de la población)
2- Población: conjunto de todos los individuos o elementos que cumplen ciertas características
3- Universo: total de la población (sin que cumplan alguna característica)
4- Parámetro: pronostico numérico que reúne cierta información de la población (inaccesible). Se
representa con letras griegas (las letras romanas se emplean para representar un valor
estadístico)

Parámetro Valor estadístico


σ: desviación típica poblacional s: desviación típica muestral
ρ: correlación r: coeficiente de correlación muestral
μ: media poblacional m: media muestral
π: proporción p: proporción

5- Estadístico: función matemática obtenida a partir de los datos provenientes de la muestra, que
nos permite hablar de los parámetros
6- Carácter: propiedad o característica que tienen los elementos de una población. Pueden ser:
a. Cualitativos: no se les puede asignar un valor numérico (color de pelo)
b. Cuantitativos: se les puede asignar un número. Se divide en:
i. Discretos: solo pueden tomar valores concretos. Entre dos valores no existen
más valores (solo los números naturales)
ii. Continuos: entre dos posibles valores existen infinitos (en todos los números
reales)

Como se entiende que no se puede estudiar el universo de la población, se emplean muestras y se


extraen conclusiones de ella, que posteriormente se probarán y generalizarán al resto de la población.

- muestreo: proceso de extracción de una muestra partir de una población


Bioestadística

- inferencia: interpretación del tratamiento estadístico de unos datos que acaban


generalizándose a toda la población
Bioestadística

TEMA 2: PROCEDIMIENTOS DESCRIPTIVOS

TIPOS DE VARIABLES Y ESCALAS DE MEDIDAS

Variables: sistema para representar los caracteres. El tipo de variable se elige según el tipo de carácter
que representa. Pueden ser:

1. cualitativas: se les puede asignar un número, pero no tiene valor numérico (color de pelo)
a. nominales: permite realizar operaciones de igualdad y desigualdad (ser rubio no es
igual que ser moreno)
i. dicotómicas: solo pueden adoptar dos valores (¿¿¿¿vivo o muerto????)
ii. politómicas: pueden tomar más de dos valores (color de pelo)
b. ordinales: pueden establecer relaciones de superioridad, pero sin asignar un número.
Permiten hacer operaciones de igualdad y desigualdad, y de ordenación (posición de
los hijos)
2. cuantitativas: se les puede asignar un número y tiene significado
a. discretas: solo puede tomar valores concretos. Entre dos valores no existen más
valores (número de hijos)
b. continuas: entre dos posibles valores existen infinitos (números reales)

CARACTERÍSTICAS DE LAS VARIABLES

- los posibles valores de una variable suelen denominarse modalidades


- estas modalidades pueden agruparse en clases (intervalos)
- las modalidades deben formar un sistema exhaustivo (no se puede olvidar ningún posible
valor de la variable) y excluyente (nadie puede presentar 2 valores simultáneos de la
variable)

TIPO DE VARIABLE UTILIDAD


Nominal Clasificar
Cualitativas
Ordinal Jerarquizar
Discreta Contar
Cuantitativas
Continua Medir

ESTADISTICOS ESTADÍSTICOS
ESCALA DE
OP. MATEMÁTICA OP. LÓGICAS DESCRIPTIVOS ASOCIACIÓN
MEDIDA
APLICABLES APLICABLES
Establecer
-Frecuencias Coeficiente de
Nominal Clasificación igualdad o
-Moda contingencia
desigualdad
Determinar lo
-Mediana
Ordinal Ordenación mayor, menor, o Correlación lineal
-Percentiles
igual
Igualdad o Determinar la
desigualdad de igualdad o -Media aritmética
De intervalo Correlación lineal
las distancias diferencia de -Desviación típica
entre valores intervalo
Establecimiento
-Media aritmética
de proporciones o Establecer
De razón o -Media
de razones entre igualdad de Correlación lineal
proporción geométrica
los valores de la razones
-Media armónica
variable
Bioestadística

DATOS TRUNCADOS

Aproximación por truncamiento: se eliminan las cifras que están a la derecha de la unidad a la que
debemos truncar. Al aproximar de esta manera los datos no serán exactos.

Truncar por la décima: 84,5732 --- 84,5 (perdemos 0,0732)

REPRESENTACIONES GRÁFICAS

GRÁFICOS DE SECTORES (PIE CHART):

- establecen las frecuencias como una proporción de un círculo que sería el total.
La frecuencia es directamente proporcional al área. Se usa para variables
cualitativas nominales.
- No se puede utilizar para variables ordinales porque en su representación se
pierde el orden de las categorías

DIAGRAMAS DE BARRAS: 6
4
- Se levantan columnas de altura proporcional a la frecuencia sobre un eje
2
horizontal en el que se indican las distintas categorías 0
- Es el gráfico indicado para variables cualitativas ordinales y para Serie 1 Serie 2
cuantitativas discretas Columna1

HISTOGRAMA:
- Representación de la frecuencia que aparecen una variable en un grupo
- No tiene barras ni huecos, aquí los rectángulos se encuentran solapados
debido a que representa variables cuantitativas continuas

POLÍGONOS DE FRECUENCIAS: 3

- Refleja la frecuencia de cada variable y las une con una línea 2


- Refleja variables cualitativas ordinales, aunque puede tener otros usos 1

Serie 1
GRÁFICO DE TALLO Y HOJA:

- Combina la representación gráfica con la información directa


proporcionada por las cifras
- Así podemos saber simultáneamente cada dato y la frecuencia de cierta
variable (la altura de una persona)

GRÁFICOS DE CAJAS (BOX-PLOT, CAJAS-BIGOTES)

- Representación que refleja una gran cantidad de información descriptiva


- Se divide en la “caja” y las prolongaciones verticales o “bigotes”
Bioestadística

- Puede tener puntos periféricos

- Elementos:
o Rectángulo o caja:
 Anchura: la que se desee
 Altura: siendo el primer cuartil la base y el tercer cuartil la superficie
o La línea horizontal de dentro de la caja es la mediana (valor que deja a la mitad de
los individuos por encima y a la otra mitad por abajo)
o Bigote superior: prolongación de la caja que termina en valor absoluto que sea
igual o inferior al tercer cuartil más dos veces el rango intercuartílico
 Rango intercuartílico: cuartil 3º - cuartil 1º
rango intercuartílico: 40 – 15 = 25

25 x 1,5 veces = 37,5

Valor máximo posible para el bigote superior: 40 + 37,5 = 77,5

o Bigote inferior: termina con el valor absoluto que sea igual o superior al primer
cuartil menos 1,5 veces el rango intercuartílico
 Mínimo valor posible para el bigote inferior: 15 – 37,5 = -22,5
 Como no es posible en este ejemplo fumar una cantidad negativa de
cigarros al día, se elige al individuo inmediatamente superior (8 cigarros
al día)
o Los periféricos o outliers son aquellos valores que quedan más allá de los
extremos de los bigotes. Puede deberse a un error o corresponder a un individuo
con un valor realmente raro.
6
GRÁFICO DE PARETO 5
4
3
- Organiza datos de tal forma que estos queden en orden
2
descendente (izquierda a derecha) y separados por barras 1
- Permite asignar un orden de prioridades 0
Categoría Categoría Categoría Categoría
- Las barras marcan la frecuencia absoluta y las líneas son las 1 2 3 4
frecuencias acumuladas Serie 1 Serie 2 Serie 3

GRAFICO DE DISPERSIÓN (SACATTER-PLOT)

- Enfrenta dos variables (generalmente continuas) entre sí


- Por ejemplo: representar el peso corporal frente a la altura
Bioestadística

GRÁFICOS CUANTIL-CUANTIL (Q-Q PLOT) 3.5


3
- Distribución que refleja cada uno de los datos 2.5
2
- Si la distribución es normal, estos datos deben seguir una línea 1.5
recta en mi gráfico 1
- Si se despegan de la línea es que datos no siguen una distribución 0.5
0
normal 0.5 1 1.5 2 2.5 3
- El círculo es donde cae el dato realmente y la línea donde debería
caer si fuera perfecta (no es de dispersión)

GRÁFICO DE PARETO

- Gráfica para organizar los datos de forma que estos queden en


orden descendente de izquierda a derecha y separados por
barras
- Permite asignar un orden de prioridades
- Las barras marcan la frecuencia absoluta y las líneas son las
frecuencias acumuladas

MEDIDAS DE TENDENCIA CENTRAL

Estiman cual es el valor más típico o representativo de una muestra. Son el elemento indispensable de
cualquier estadística descriptiva.

MEDIA ARITMÉTICA

- Suma de todos los valores (Xi) dividida por el número de observaciones (n)
- En la población se expresa como µ, y en la muestra como X
- Desventaja: muy sensible a los valores extremos (especialmente si la muestra no es
grande)

media=
∑ xi
n
MEDIA GEOMÉTRICA

- Es la raíz enésima (siendo n el número de observaciones) del producto obtenido al


multiplicar uno por otro todos los valores de la variable
- Es menos sensible a los valores extremos

media geométrica= √ X 1 x X 2 x X 3 x Xn
n

MEDIA ARMÓNICA

- Se calcula dividiendo el número de observaciones por la suma del inverso de cada valor
- Se utiliza mucho en farmacología
- Se dice que tanto la media geométrica como la armónica son estimadores de tendencia
central más robustos que la media aritmética, esto significa que se dejan influir menos por
los valores raros o extremos

n
media armónica=
1
∑ ( xi )
Bioestadística

MEDIA PONDERADA

- Se calcula al valorar de distinto modo cada uno de los datos, dando más valor a unos que
otros

media ponderada=
∑ (wi x xi)
∑ ( wi)
MEDIANA

- Valor central del conjunto ordenado de observaciones (el valor que deja a la mitad de las
observaciones por debajo y a la mitad por encima)
- Ventaja: no es demasiado sensible a los valores extremos
- Inconveniente: no se usan todos los valores observados para calcularla sino solo el valor
central o los valores centrales

MODA

- El valor que más veces aparece. La distribución según este puede ser:
o Unimodal: tiene un solo valor más frecuente
o Bimodal: tiene dos valores más frecuentes
o Multimodal: tiene más de dos valores que presentan la frecuencia máxima

MEDIDAS DE DISPERSIÓN

VARIANZA

- Mide la dispersión de los datos: en qué medida están juntos o separados del valor central.
Tiene la siguiente expresión para las muestras:

s2=
∑ (Xi−X )2
n−1
o En vez de usar n como denominador, usamos n-1
o Este denominador se denomina grado de libertad (¿??)
o Para la población se sustituye s2 por σ2

σ
2
=
∑ (Xi−μ)
2

N
- La varianza no es muy adecuada para describir cual es la variabilidad de unos datos: ya que
se encuentra expresada en otras unidades que los datos originales.
- La varianza está en unidades al cuadrado y esto dificulta su interpretación directa
- Por este motivo se debe buscar otro estadístico de dispersión que este en las mismas
unidades que la media: esa es la desviación estándar

DESVIACIÓN TÍPICA O ESTÁNDAR

- Es la variación esperada con respecto a la media aritmética


- Se calcula a partir de la raíz cuadrada de la varianza para reducir su error: al estar la
desviación elevada al cuadrado quedaba en unas unidades distintas a la media
- La fórmula es:
Bioestadística

s(muestral)=
√ ∑ (Xi−media)2
n−1

σ ( poblacional )=√ ∑ ¿ ¿ ¿ ¿

- Si se suma o se resta una cantidad constante a todos los datos, la media se incrementará o
disminuirá en esa cantidad: pero la desviación estándar no cambiará

- La desviación estándar tiene las mismas unidades de medida que los datos originales

- Cuando los datos observados en una variable siguen una distribución que se parece a la
normal, podemos asumir que el 95% de los valores se situaran en el espacio comprendido
por la media +/- dos veces la desviación estándar

COEFICIENTE DE VARIACIÓN DE PEARSON

- Para juzgar si una variable es más dispersa que otra, sería equivocado comparar
directamente la desviación típica de ambas
- No es adecuado porque el resultado dependerá de las unidades de medida de cada
variable: por eso para comparar la dispersión de diversas variables se usa el coeficiente de
variación
o Coef de variación = desviación típica/media x 100 = s / x x 100
- Es una variable que no puede tomar valores negativos, intuiremos que su distribución es
asimétrica (asimetría positiva) cuando el coeficiente de variación sea superior de 50%
¿???????

ERROR ESTÁNDAR

- Es la desviación estándar de la distribución


- Mide el grado de dispersión de los parámetros
- Tipos:
S
o Error estándar de la media: EEM =
√n
o Error estándar de la proporción: EEP =
√ p(1− p)
n
=
√pq
n

RANGO O AMPLITUD

- ¿¿¿¿¿Consiste en restar los valores mayor y valor????? que se observen


- Cuando la distribución de los datos es fuertemente asimétrica (se aleja mucho de la forma
de campana) suele ser preferible como medida de tendencia central usar la mediana en
vez de la media y como medida de dispersión usar el rango, o simplemente presentar dos
percentiles

RANGO INTERCUARTÍLICO (IQR O RANGO INTERCUARTIL)

- Estimación estadística de la dispersión de una distribución de datos


- Consiste en la diferencia entre el tercer y primer cuartil: RQ = Q3-Q1
- Mediante esta medida se eliminan los valores extremadamente alejados
Bioestadística

- El rango intercuartílico es altamente recomendable cuando la medida de tendencia central


utilizada es la mediana (ya que esta es insensible a posibles irregularidades en los
extremos)
- Se usa para construir los diagramas de caja y bigote (box-plots) que sirven para visualizar
la variabilidad de una variable y comparar distribuciones de la misma variable: además de
ubicar valores extremos

MEDIDAS DE FORMA

Indican la forma de la distribución

ASIMETRÍA

Expresa lo distante de la media que cada observación en unidades de desviación estándar. Sus valores
óptimos en una función normal son pequeños o nulos. Las distribuciones pueden ser:

1. Simétricas: su coeficiente de asimetría es igual a 0


2. Asimétricas positivas: presentan una cola a la derecha, por lo que su coeficiente de asimetría es
positivo (coef de asimetría > 0)
3. Asimétricas negativas: su cola izquierda es más prolongada, por lo que su coeficiente de
asimetría será negativo (coef de asimetría < 0)

CURTOSIS O APUNTAMIENTO
Bioestadística

Indica como de apuntada está una distribución. Para que la distribución sea normal no debe ser
grande. Se divide en:

1. Mesocúrticas: tienen un apuntamiento “normal”, ni muy plano ni demasiado


apuntado, por lo que su curtosis es k=0
2. Leptocúrticas: son muy apuntadas, lo que quiere decir que k>0
3. Platicúrticas: son muy aplanadas, lo que se traduce en k<0

MEDIDAS DE POSICIÓN: CUANTILES, PERCENTILES

CUANTILES

Son medidas de posición que indican que puesto tiene un determinado valor de una variable, ya que
dividen el conjunto ordenado de los datos en grupos con la misma cantidad de individuos.

Pueden ser:

1. Percentiles:
- Expresa la proporción de los datos que queda por debajo del valor que nos interesa
- Asi si decimos que un niño esta en el 80 de peso para su edad: significa que el 80% de los
niños de su edad pesan menos
- Para expresar pesos y edad se emplean mucho
- Tiene 99 cortes
- La mediana coincide con el 2º, 5º, y 50º percentil
- Se calcula:

Nº de orden = (percentil x (n-1)) / 100

2. Tertiles:
- Son los puntos de la distribución que dividen está en 3 iguales (2 cortes)
3. Cuartiles:
- Son los puntos de la distribución que dividen esta en cuatro partes iguales
- Los cuartiles coinciden con los 25, 50, 75 y 100
- Tiene tres cortes
4. Deciles:
- Son los puntos que dividen la distribución en 10 partes
- Tiene 9 cortes

Se utilizan en los nomogramas, que muestran la posición de la población.


Lo interesante que nos marca esta medida, es que nos marca esta medida,
es que el sujeto debe seguir la línea que marca el percentil si no la siguiera
podría mostrar cierta patología.
Bioestadística

DEFINICIONES

PROPORCIÓN: una razón en la cual los elementos del numerador están incluidos en el denominador.
Se utiliza como estimación de la probabilidad de la probabilidad de un evento. El rango es de 0 a 1.

RAZÓN: es un cociente entre una variable y otra. Por ejemplo, la razón de masculinidad seria “x”
hombres por cada “x” mujeres: hombres/mujeres

ODD: cociente entre las veces que se da una circunstancia y las que no se da (p.ej: probabilidad de sacar
un 1 al tirar un dado entre la probabilidad de no obtenerlo)

CONCEPTO DE PREVALENCIA: proporción de sujetos que tienen una determinada característica en un


momento del tiempo determinado

INCIDENCIA: proporción de sujetos que enferman dentro de un grupo de sujetos que no estaba
enfermo al principio de la observación

Descriptivos
- Media: aritmética,
geométrica, y
Tendencia Decentiles
armónica Posición: n-tiles
central Percentiles
- Moda
- Mediana
- desviación media
Asimetría
- desviación típica
Dispersión Forma Curtosis o
- rango o amplitud
apuntamiento
- rango intercuántico

Frecuencias y tipos de frecuencias

- La frecuencia: describe cuantas veces aparece un determinado valor para una variable
- Distinguimos varios tipos:
o Frecuencia simple: frecuencia del grupo del cual hablamos
 Frecuencia absoluta (ni): contabiliza el número de individuos para cada
modalidad
 Frecuencia relativa (fi): calcula el numero de individuos de cada
modalidad y lo divide por el total de individuos
o Frecuencia acumulada: suma los valores de cada modalidad
 Frecuencia absoluta acumulada (Ni): se trata de la suma de los valores de
la frecuencia absoluta
 Frecuencia relativa acumulada (Fi): se entiende como la frecuencia
absoluta acumulada dividida por el total de individuos
o Frecuencia válida: es aquella que solo tiene en cuenta aquellos elementos de los
que tenemos datos válidos (no tiene en cuenta los missing data)
Bioestadística

TEMA 3: PROCEDIMIENTOS DESCRIPTIVOS

También podría gustarte