Está en la página 1de 25

Tema 1.

- Conceptos básicos
de bioestadística
1.1.a.- Concepto de Bioestadística

• No es sino la estadística aplicada a las ciencias de la salud


• La Bioestadística permite abordar con el rigor de la ciencia
matemática los fenómenos de la vida, que se caracterizan por su
variabilidad
• La Bioestadística permite obtener conclusiones con un grado de
confianza fijado de antemano
• Los grandes avances en el software estadístico han permitido que
pruebas complejas sean de aplicación por cualquier profesional de la
salud interesado en la investigación
1.1.b.- Usos de la bioestadística

• Descripción y resumen de los datos de una investigación


• Análisis de las relaciones entre las variables estadísticas
• Valoración de resultados en la población en base a los datos
encontrados en una muestra
• Contraste de hipótesis o contraste entre los datos observados y las
hipótesis
• Efectuar predicciones sobre el comportamiento de las variables en
base a los resultados en la muestra
• Controlar los fenómenos biológicos
1.2.a.- Población diana y población accesible

• Normalmente, no es posible estudiar a todas las personas que pertenecen a una


población (p.ej., todos los obesos de Oceanía)
• Los estudios se realizan sobre poblaciones reducidas y su objetivo es poder
aplicar sus resultados a grandes poblaciones
• Se entiende por “población diana” a un subgrupo de la población general cuyos
componentes tienen las características que se quieren estudiar (p.ej., pacientes
diabéticos de una Zona de Salud). Suele venir definida en la pregunta de
investigación
• La población accesible es la fracción de la población diana con la que se puede
“físicamente” contactar
• De esa “población diana” (o de la población accesible) se extrae una muestra
sobre la cual se desarrolla el estudio
1.2.b.- Población general, población diana, muestra

POBLACIÓN GENERAL
Diabéticos de España
4.000.000 ¿INFERENCIA
ESTADÍSTICA?

INFERENCIA
MUESTRA ESTADÍSTICA
300
1.3.a.- Estadísticos y parámetros

• Un estadístico (o estimador) es una función de los valores de una


muestra. Para representarlos se utilizan caracteres latinos. Son la
media muestral “ 𝑥 “ , la desviación estándar muestral “s”, la
proporción muestral “p”

• Un parámetro es una función de los valores de una población. Para


representarlos se utilizan caracteres griegos. Son la media poblacional
“μ”, la desviación estándar poblacional “σ”, la proporción “π”
1.4.a.- Muestra representativas y no representativas

Población Población

A A A A A A A A
A A A A Muestra
A A A A Muestra

ABC ABB
B B B B SÍ BCA
CAB
B B B B NO ABB
CCA
B B B B B B B B
C C C C C C C C
C C C C C C C C
1.4.b.- Muestreo

• Para poder realizar la inferencia estadística es necesario que la muestra sea


representativa
• Por muestreo se entiende el procedimiento que se utiliza para obtener una
muestra
• Hay dos tipos básicos de muestreo
 Probabilístico: Es aquél en el que todos los individuos tienen las mismas oportunidades
para pertenecer a la muestra
 No probabilístico: Es aquél en el que unos individuos tienen más probabilidades que otros
para pertenecer a la muestra
• Es más fácil que el muestreo sea representativo cuando es de tipo probabilístico
que cuando no lo es
1.4.c.- Tipos de muestreo probabilístico

• Sistemático: Se numera la población. Se divide el nº de individuos de la población por el


nº de individuos de la muestra. Se seleccionan individuos de la población numerada de
acuerdo con el número resultante de la división
• Aleatorio simple: Se numera la población y se escogen los elementos por un
procedimiento aleatorio, al azar, hasta alcanzar el tamaño de la muestra
• Aleatorio estratificado: Tiene en cuenta determinadas características de la población. Si
hay un 75% de mujeres, interesará que en la muestra haya también un 75% de mujeres.
Debe dividirse la población en subgrupos en cada uno de los cuales (con distinto nº de
individuos) se aplica un muestreo aleatorio simple
• Por conglomerados: Válido para estudios sobre grandes poblaciones. Ejemplo: Selección
aleatoria de ciudades Selección aleatoria de municipios Selección
aleatoria de escuelas Selección aleatoria de clases de 5º de primaria.
La unidad de selección es un grupo de personas
1.4.d.- Tipos de muestreo no probabilístico

• Muestreo de conveniencia: Los individuos se eligen de acuerdo con


circunstancias fijadas por quien realiza el muestreo (lugar correcto en el
momento adecuado)

• Muestreo intencional o por juicio: El investigador escoge a los individuos que van
a constituir la muestra

• Muestreo en bola de nieve: Consiste en la explotación de contactos una vez


escogido un individuo. Suele utilizarse en colectivos de difícil acceso
1.4.e.- Muestras representativas vs. no representativas

• El que la muestra no sea representativa es especialmente grave en estudios


descriptivos en los que no se comparan datos entre poblaciones
• Cuando el estudio es analítico, la representatividad del muestreo es algo menos
importante, ya que no se pretende describir poblaciones, sino comparar con
método científico una serie de datos entre ellas
• En algunos estudios (ensayos clínicos por ejemplo) la población de estudio es
completamente artificial porque tienen unos criterios de selección muy
excluyentes
• Son muchos los estudios que con poblaciones no representativas han marcado
hitos de aplicación general
1.5.a.- Importancia del tamaño de la muestra

• El tamaño de la muestra es determinante para la validez externa de


cualquier estudio
• Un número excesivamente grande de sujetos encarece y dificulta el
estudio
• Un número excesivamente pequeño de sujetos conduce a
estimaciones poco precisas que dificultan la obtención de diferencias
entre los grupos
• Cada diseño de estudio tiene su fórmula para calcular el tamaño de la
muestra
1.6.a.- Criterios de inclusión y de exclusión

• Los criterios de inclusión y de exclusión son características esenciales


que deben cumplir los sujetos para poder ser elegibles para un
estudio
• Los criterios de inclusión son características que se deben cumplir
para poder formar parte de la población diana. Por ejemplo, mayor
de 18 años, con TAD>100, sin hijos, con IMC>36, etc.
• Los criterios de exclusión son características que hacen que un
individuo no pueda formar parte de al población diana. Por ejemplo,
tener alteraciones cognitivas, haber sido sometido a IQ previa, tener
HbA1c <7.5, no conocer el idioma, etc.
1.6.b.- Criterios de inclusión y de exclusión

Criterios de inclusión
 Mujeres con diagnóstico de cáncer de mama estadio temprano
diagnosticadas entre los años 2004 – 2015.
 Pacientes que recibieron intervención quirúrgica (tumorectomía o
Criterios de inclusión: pacientes de 75 años o más con mastectomía radical) en el Hospital Nuestra Señora de Sonsoles.
diabetes mellitus tipo 2 no institucionalizados que hayan  Pacientes que dispongan de al menos una muestra anatomo-
sido diagnosticados de diabetes con 65 años o más. patológica del tumor primario (sin tratamiento quimioterápico
previo) almacenada en parafina. En caso de existir un único
Criterios de exclusión: pacientes de menos de 75 años, bloque tumoral se informará a la paciente que si se realiza el
institucionalización, presencia de trastorno mental que estudio en ese bloque dejará de tener material biológico de su
imposibilitara el consentimiento informado para ser incluido tumor primario para otros estudios.
en el estudio y/o negativa del paciente y/o tutor legal a
participar. Criterios de exclusión

 Pacientes con diagnóstico previo de otra neoplasia


 Pacientes con enfermedad autoinmune
 Pacientes en tratamiento inmunosupresor
1.7.a.- Cegado o técnicas de enmascaramiento

• Son un conjunto de medidas que se toman a fin de que el paciente y/o el


investigador y/o el evaluador no conozca el grupo al que pertenece cada
individuo
• Su objetivo es conseguir la máxima neutralidad en la obtención de los
datos
• Cuando un individuo sabe que está siendo investigado, la expresión de los
síntomas puede ser involuntariamente distinta (efecto Hawthorne)
• La evaluación también puede ser distinta de la que sería si no se supiera a
qué grupo pertenece (sesgo del observador)
• Es fundamental en los ensayos clínicos
1.7.b.- Tipos de enmascaramiento

• Estudios abiertos: no hay técnicas de ciego


• Ciego simple: El individuo desconoce qué tipo de intervención recibe
• Ciego doble: Tanto el individuo como el investigador desconocen qué
tipo de intervención se recibe
• Ciego triple: Tanto el individuo como el investigador como los
encargados de analizar los resultados desconocen que tipo de
intervención se recibe
• Evaluador ciego: Los encargados de analizar los resultados de la
investigación desconocen el grupo el tipo de intervención que se
recibe
1.7.c.- Tipos de enmascaramiento
1.8.a.- Variables y escalas de medida

• En las ciencias de la naturaleza la variabilidad no es la excepción, sino


la norma
• Lo que se estudia sobre cada individuo de la muestra se denomina
variable
• Una variable cuantitativa es susceptible de medirse con números:
“nº de hijos”, “velocidad”, “índice de masa corporal”, “talla”, “peso”
• Una variable cualitativa, en cambio, no se puede medir con números:
“color de los ojos”, “estado civil”, “profesión”, “estado de fumador”,
“grado de obesidad”, “sexo”
1.8.b.- Variables

• Una variable cuantitativa se puede transformar siempre en una variable


cualitativa. Una variable cualitativa nunca podrá convertirse en cuantitativa
• Podemos identificar a las personas por su “EDAD” (cuantitativa) o por su
“TRAMO” de edad (cualitativa). Establecemos las categorías “Joven” para las
personas menores de 18 años, “Adulto” para las que tienen entre 18 y 65 años y
“Mayor” para los que tienen más de 65 años

EDAD TRAMO EDAD TRAMO EDAD TRAMO EDAD TRAMO


47 Adulto 76 Mayor 66 Mayor 46 Adulto
32 Adulto 12 Joven 28 Adulto 52 Adulto
55 Adulto 95 Mayor 5 Joven 11 Joven
28 Adulto 84 Mayor 18 Adulto 30 Adulto
1.8.c.- Variables
• Las variables cualitativas pueden clasificarse sin ningún orden (por ejemplo “color de los
ojos”, con categorías “azules”, “marrones” y “verdes”) o bien clasificarse de un modo
ordenado o jerárquico (por ejemplo, “grado de gravedad de una enfermedad” con
categorías “leve”, “grave” y “muy grave”)
• En el primer caso hablamos de variables cualitativas nominales y en el segundo caso de
variables cualitativas ordinales
• Una variable cualitativa que solamente admite dos opciones se denomina variable
dicotómica. Por ejemplo “sexo”, “situación vital” (vivo/muerto), “fumador” (sí/no)
• Las variables cuantitativas pueden admitir valores intermedios o no. Si los admiten
hablamos de variables cuantitativas continuas. Si no los admiten, hablamos de variables
cuantitativas discretas
• Son discretas “número de hijos”, “número de cesáreas” o “medallas olímpicas”. Son
continuas “peso”, “talla”, “velocidad” o “glucemia basal”
1.8.d.- Escalas

• Las variables cualitativas se miden según una escala nominal (sin


jerarquía) u ordinal (con jerarquía u ordenadas)

• Las variables cuantitativas pueden medirse según una escala de


intervalo o una escala de razón (o proporción)
 Escala de intervalo: Las distancia entre sus valores es la misma. El valor “cero”
no significa carencia o ausencia de lo que se mide. Por ejemplo, temperatura
(Cº) o talla de una prenda (0, 1, 2)
 Escala de razón: Se pueden hacer razones (divisiones). El cero indica carencia
de lo que se está midiendo. Por ejemplo ingresos mensuales, altura de un
edificio
1.8.e.- Variables y Escalas

Variables

Cualitativas Cuantitativas

Nominales Ordinales Discretas Continuas

Escala Escala de Escala de


Escala ordinal
nominal Intervalo razón
1.9.a.- Generación de Tablas de frecuencias

• Es un modo idóneo de ordenar la información


• Caracteres cuantitativos: Edad de 20 individuos
25 28 28 25 32 32 30 29 29 27 26 26 28 31 31 28 25 29 30 28

x1=25; x2=28; x3=28; x4=25;………; x20=28; n=20

xi fi frel Fi Facum
En el caso de caracteres cualitativos
xi = elemento de orden i
25 3 0.15 3 0.15 fi = Frecuencia absoluta
26 2 0.10 5 0.25 frel = Frecuencia relativa Color de ojos fi frel Fi Facum
27 1 0.05 6 0.30 Fi = Frecuencia absoluta acumulada
Facum = Frecuencia relativa acumulada Marrones 51 0,51 51 0,51
28 5 0.25 11 0.55
k = categorías de la variable = 8
29 3 0.15 14 0.70 Azules 31 0,31 82 0,82
30 2 0.10 16 0.80 𝑘 𝑘
31 2 0.10 18 0.90 𝑓𝑖 = 𝑛; 𝑓𝑟𝑒𝑙 = 1 Verdes 18 0,18 100 1
32 2 0.10 20 1 𝑖=1 𝑖=1
20 1 100 1
1.9.b.- Generación de Tablas de frecuencias

• Cuando hay muchos datos es necesario agrupar los datos en


intervalos y establecer los puntos medios de cada intervalo o marcas
de clase.
• Se suponen 400 determinaciones de colesterol plasmático que oscilan
de 70 mg/dl a 440 mg/dl
Marca de
Intervalo
clase
fi frel Fi Facum fi = Frecuencia absoluta
< 100 75 1 0.0025 1 0.0025 frel = Frecuencia relativa
100-150 125 15 0.0375 16 0.040
151-200 175 102 0.255 118 0.295
Fi = Frecuencia absoluta acumulada
201-250 225 170 0.425 288 0.720 Facum = Frecuencia relativa acumulada
251-300 275 64 0.160 352 0.880
301-350 325 36 0.090 388 0.970
351-400 375 10 0.025 398 0.995
>400 425 2 0.005 400 1
400 1
1.9.c.- Tablas de frecuencias. Nº de intervalos

• Hay que establecer un número de intervalos que esté de acuerdo con el número
de los datos. Si hay muy pocos intervalos se pierde información, y si son
demasiados se pierde claridad
• El número de intervalos es elegido por el investigador, pero existen unas fórmulas
que sugieren un número concreto de intervalos:
1. Regla de la raíz cuadrada: 𝑘 = 𝑛 (20)

2. Regla de Sturges: 𝑘 = [1 + log 2 𝑛 ] (7)


1
max 𝑥 −min(𝑥) − (17)
3. Regla de Scott: 𝑘 = , 𝑑𝑜𝑛𝑑𝑒 𝐴𝑠 = 3.5 · 𝑠 · 𝑛 3
𝐴𝑠
1
max 𝑥 −min(𝑥) −3
4. Regla de Freedman-Diaconis: 𝑘 = , 𝑑𝑜𝑛𝑑𝑒 𝐴𝐹𝐷 = 2 𝑄3 − 𝑄1 · 𝑛
𝐴𝐹𝐷
(7)

También podría gustarte