Está en la página 1de 12

qué es la bioestadística

La Bioestadística estudia los métodos estadísticos para el análisis de datos en la investigación de


problemas relacionados con las Ciencias de la Vida.

Los estudios en Ciencias de la Salud se basan en el método inductivo (extensión de las conclusiones
obtenidas en una parte al todo), siendo la Bioestadística la herramienta fundamental para validarlo,
en consideración de las siguientes razones:

Naturaleza cuantitativa, variabilidad biológica, perspectiva colectiva, investigación, medicina


basada en la evidencia y naturaleza del trabajo clínico.

Podemos establecer dos grupos de ciencias atendiendo a si su objeto de conocimiento guarda o no


alguna relación con la realidad (física o social). De allí surge la dicotomía entre Ciencias Factuales o
Empíricas, cuyo objeto de conocimiento es algún segmento de la realidad, y las Ciencias Formales,
cuyo campo de actividad son entes formales, ideas, pero en ningún caso cosas o procesos reales.

Estadística:

• la estadística permite sacar conclusiones de la información numérica, manejar la


incertidumbre, muestrear la población, analizar asociaciones, explicar hechos, predecir,
tomar decisiones en entornos de incertidumbre, entre muchas cosas.
• La Estadística como una ciencia –RAMA DEL METODO CIENTIFICO que busca establecer los
límites de la incertidumbre, y no como una rama de las matemáticas.
• el estudio de la propia toma de decisiones en situaciones de incertidumbre.

Incertidumbre: consecuencia directa de la información incompleta que puede provenir de errores


de medición, de inaccesibilidad a la información completa o de la práctica imposibilidad de
determinar cuáles son los factores relevantes que intervienen en cada problema.

El concepto que posibilita la medición de la incertidumbre es la probabilidad, permite pasar de la


descripción a la inferencia al dar una medida de la incertidumbre, pudiendo así fundamentar las
decisiones que se toman.

la Estadística es una ciencia, fundamentada en la Teoría Matemática de la Probabilidad, que se


ocupa de elaborar teorías y técnicas destinadas a la recogida, transformación y clasificación de
información, y a la toma de decisiones en situaciones de desconocimiento o incertidumbre.

Variable

es una característica o atributo que se observa en las unidades de una población, que es susceptible
de medición o clasificación y que presenta diferentes estados o valores.

Variables Aleatorias y Determinísticas

Aleatoria o probabilística: si sus valores son diferentes cuando se mide u observa bajo las mismas
condiciones, (casualidad).

Determinística o no probabilística: si sus valores son similares cuando se mide u observa bajo las
mismas condiciones, (causalidad).

Según su naturaleza una variable se clasifica en cualitativa y cuantitativa


Cualitativa: Llamada también categórica, expresa una modalidad o característica en la unidad
observada en término de una cualidad ejemplo: sexo, estado de salud. pueden ser dicotómica o
politómica.

Dicotómica (o Binaria): si solo puede tomar dos valores posibles, por ejemplo, el estado de salud,:
viva y muerta o el sexo: hombre y mujer.

Politómica (o Multinomial): si admite más de dos valores ejemplo el estado civil: soltero, casado,
unión libre, divorciado, separado y viudo.

NOTA : para propósitos de análisis podemos asignar números a las categorías de la variable, esto es
conocido como variable dummy, en donde se asigna el numero 1 a una categoría y 0 a otra.

Cuantitativa:

Denominada también numérica o de escala, describe una característica en términos de una


cantidad. Por ejemplo: talla. pueden ser discreta o continua:

Discreta: cuando el conjunto de valores que puede asumir la variable es finito o infinito contable,
generado por proceso de conteo no admite fracción ej: número de pacientes que llega a urgencias al
Hospital.

Continua: cuando el conjunto de valores que puede tomar la variable está dentro de un rango
infinito de puntos. Se genera mediante un proceso de medición, admite fracción ej: presión
sanguínea, nivel de colesterol, temperatura.

Escala de medición de las variables:

Según la escala de medición una variable puede ser nominal, ordinal, de intervalo o razón.

Nominal: cuando los valores de la variable denotan presencia o ausencia de una cualidad, ejemplo el
sexo.

Ordinal: cuando los valores de la variable denotan un orden , jerarquía o nivel, ejemplo el nivel de
escolaridad.

Intervalo: de naturaleza cuantitativa, cero es relativo, ejemplo la temperatura medida en grados


centígrados

Razón (o proporción): de naturaleza cuantitativa, cero es absoluto, ejemplo el número de hijos en


una familia.

Variables Dependientes e Independientes

Según la relación que guardan las variables en un estudio una variable puede ser dependiente,
independiente o interviniente.

Dependiente: sus variaciones dependen de las variaciones de otra(s) variable(s). Variable respuesta,
explicada o efecto en un experimento

Independiente: sus valores en un estudio específico no están influ´ıdos por los cambios de otra(s)
variable(s) relacionada(s) en el mismo. Variable explicativa, factor o control en un experimento.
Interviniente: variable que afecta a la variable dependiente de manera indirecta, no se controla en
el experimento o se la puede controlar manteniéndola constante.

Generalmente la variable independiente antecede en el tiempo a la dependiente.


Transformación de variables

Categorización de una variable cuantitativa: Una variable cuantitativa se puede categorizar


agrupándola por categorías o intervalos, así por ejemplo, la variable edad se puede categorizar por
grupos de edad o grupos etarios (0 a 4, 5 a 9 etc.).

Cuantificación de una variable categórica: se puede cuantificar utilizando las llamadas variables
Indicadoras o Dummy. para ello son necesarias k-1 variables que indican presencia (1) o ausencia (0)
de una categoría, siendo k el número de categorías de la variable transformada. Si la variable es
politómica, por ejemplo, el Estado Civil, con 6 categorías se requieren 5 variables indicadoras: Z1 = 1
soltero(a), 0 en otro caso; Z2 = 1 casado(a), 0 en otro caso; Z3 = 1 viudo(a), 0 en otro caso; Z4 = 1
unión libre, 0 en otro caso; Z5 = 1 separado(a), 0 en otro caso. El valor de 0 para las variables
anteriores será el indicador de la presencia de la categoría divorciado(a).

Toda variable debe cumplir dos reglas de clasificación:

Exhaustividad: Todas las unidades de la población deben tomar algún valor o modalidad, Incluya a
todos.

Exclusividad: Ninguna unidad puede asumir simultáneamente dos o más valores o modalidades

Métodos estadísticos

Según el objeto de análisis podemos diferencias los métodos estadísticos en descriptivos e


inferenciales.

Los métodos descriptivos tienen como objeto la presentación, organización y resumen de los datos.
Dentro de estos métodos se tiene dos técnicas, graficas y numéricas.

Variables Categóricas: Diagrama de Barras Simple y Compuesto, Diagrama Circular

Variables Cuantitativas: Histograma, Polígono de Frecuencia, Curva de Frecuencias, Diagramas de:


Tallos y Hojas, Cajas, Puntos y Medias.

Mediante las técnicas numéricas: Se resumen los datos con medidas estadísticas.

Medidas de Localización (Centralización): Media, Mediana, Moda, Cuantiles.

Medidas de Dispersión: Rango, Rango Intercuartílico, Varianza, Desviación Estándar y Coeficiente de


Dispersión.

Medidas de Distribución (Forma): Coeficientes de: Asimetría y Curtosis.

Medidas de Asociación: Coeficientes de Asociación.


Los métodos inferenciales tienen como objeto establecer conclusiones generales en relación con
una población a partir de los resultados observados en una muestra aleatoria, apoyado en la teoría
de probabilidades. Estos métodos incluyen la estimación y las pruebas de hipótesis.

La estimación permite determinar el valor aproximado del parámetro de una población, con un nivel
de precisión fijado en términos de probabilidad, a través de un intervalo de valores, denominado
este último el intervalo de confianza, obtenido con la información (estadísticos) de una muestra
aleatoria.

Intervalo de confianza grande =menor precisión

Parámetro: característica que describe a una población


Estadístico: característica que describe a una muestra

Una prueba de hipótesis estadística: consiste en determinar probabilidad de que el resultado que
se observa en la muestra o uno aun más extremo es atribuible al azar (nivel de significación) y
establecer si esta probabilidad es tan pequeña (a lo más 5 %) que podemos considerar como válida
la extrapolación de los datos de la muestra a la población objeto de estudio, es decir reportar un
resultado estadísticamente significativo. Pruebas t, F, Chi cuadrado.

Extrapolación : Aplicar a un ámbito determinado conclusiones obtenidas en otro

Nivel de significancia: Los resultados son o no producto del azar

Pvalor= <=0.05

A MAYOR TAMAÑO DE LA MUESTRA MAYOR SIGNIFICANCIA P VALOR MENOR A 0.05

Pvalor= <=0.05 se rechaza la hipótesis nula

Según el número de variables que simultáneamente se incluyan en el análisis de los datos los
métodos pueden ser univariados bivariados o multivariados

Los métodos univariados se utilizan para caracterizar las variables que son objeto de análisis,
interpretándolas de manera individual.

Los métodos bivariados están encaminados a establecer la asociación entre dos variables a partir
de las técnicas descriptivas e inferenciales.

Los métodos multivariados son apropiados para establecer la dependencia o interdependencia


entre más de dos variables, a través de modelos estadísticos.

Métodos Paramétricos y No Paramétricos

Paramétricas: exigen ciertas propiedades en los datos analizados (independencia, normalidad y


homocedasticidad) y solo son aplicables a variables cuantitativas como: Z,T de student F de snedor
Anova

No paramétricas: no exige normalidad y homocedasticidad, existen pruebas para variables


cuantitativas y cualitativas.como: Chi cuadrado,Mann Whitney,Wilcoxon, Kiuskall Wallis

Homocedasticidad: distribución homogénea de los datos.

- Población Objetivo (Universo): total de unidades -

-Población de Muestreo: unidades susceptibles de medición o clasificación

- Población Estadística: Conjunto de mediciones

CENSO: proceso mediante el cual se miden o clasifican todas las unidades de una población.

ESTADIGRAFO=estadístico : Valor que caracteriza a una muestra. Se utiliza como estimador del
parámetro correspondiente a la población

SIGNIFICANCION ESTADISTICA: probabilidad de que la diferencia o asociación observada en una


muestra aleatoria sean atribuible al azar (falso positivo).

CONFIABILIDAD: mide la probabilidad de que los resultados obtenidos en la muestra estén dentro
del margen de error que se asume en un estudio.
POTENCIA DE UNA PRUEBA: es la capacidad de una prueba estadística para detectar en un estudio
verdaderas diferencias o asociaciones (verdadero positivo).

EXACTITUD: diferencia entre el parámetro de la población y el estadígrafo correspondiente obtenido


en la muestra (error estándar).

PRECISION: está determinada por la variabilidad que presentan las mediciones de una misma
variable en diferentes unidades (coeficiente de variación).

PROCESAMIENTO CUANTITATIVO DE LOS DATOS

En el campo de las ciencias sociales se puede considerar como muy apropiado el sofware SPSS
(Statistical Package for the Social Sciences) este programa facilita la entrada y archivo de los datos
obtenidos y el análisis estadístico de los mismos.

Desde el momento que se comienza a estudiar el planteamiento de un problema de investigación


hay que planear dentro del diseño operacional, el proceso de sistematización de los datos. El
procesamiento de la información obtenida en el trabajo de campo requiere de un plan adecuado de
manipulación de los datos y para tal efecto se deben realizar las siguientes actividades:

Plan de análisis de los datos: De acuerdo a los objetivos del estudio se debe previamente diseñar un
plan adecuado de manipulación de los datos.

El proceso de codificación de la información obtenida: A partir de la información obtenida y una


vez diseñado el cuestionario con las preguntas, se debe realizar la llamada prueba piloto para validar
el instrumento de recolección de información. Probado el instrumento se debe proceder al proceso
de recolección de información. Una vez validados los datos recogidos, se deben clasificar las
respuestas individuales obtenidas. Esta etapa se denomina codificación y es de gran importancia ya
que la traducción de todas las respuestas a códigos exige no solo de un conocimiento del tema sino
también de los objetivos del estudio. El proceso de codificación consiste en la asignación de un
código numérico a las diferentes categorías de respuestas a cada pregunta del cuestionario. El
instrumento para transformar las respuestas en datos estadísticos es el libro de codificación.

Diseño del libro de codificación: Se recomienda diseñarlo de tal forma que aquellos que realicen el
trabajo de codificación tengan una guía precisa de como asignar un código a cada uno de los valores
de las categorías de respuesta de cada pregunta (variable). El libro permite traducir cada categoría
de respuesta a un número preestablecido (código numérico), el cual es vertido en la hoja de
codificación.

se habla de métodos estadísticos descriptivos, cuando se pretende mirar la tendencia de los datos y
describir las características de las variables que intervienen en la investigación. De métodos
estadísticos inferenciales, cuando su objeto es extrapolar o generalizar a una población de estudio,
los resultados obtenidos en una muestra probabilística seleccionada de la misma.

ANALISIS DESCRIPTIVO Y EXPLORATORIO DE LOS DATOS

el análisis de los datos depende de una serie de elementos, entre los cuales, los más importantes a
considerar son:

• Los objetivos del estudio

• La hipótesis de investigación

• La naturaleza o nivel de medición de las variables


la primera tarea del investigador es, a partir de una información confiable y válida, hacer una
descripción de las características de las unidades de análisis, una segunda tarea, si es el caso, hace
referencia a la comparación de subgrupos en relación con una o más características que son
importantes en los objetivos formulados por el investigador. Esta secuencia de tareas en el campo
del análisis de los datos tiene como objetivo encontrar:

• Aspectos que caractericen, en términos cuantitativos, a los colectivos o procesos, en los cuales se
han definido, problemas de investigación –descripción de variables-.

• Clasificaciones, comparaciones, topologías o diferencias entre ellos.

• Relaciones entre las variables de estudio.

mucha de la información contenida en los datos, esencial para realizar un buen análisis estadístico,
no queda bien reflejada si, tan sólo, nos quedamos con la que nos aporta la estadística descriptiva es
así que se debe conjugar con el análisis exploratorio, el cual implica una actitud curiosa que está
motivada por la premisa de que cuanto mejor conozca el investigador los datos que tiene, más
eficientemente se pueden usar para desarrollar y refinar la teoría.

El análisis exploratorio de datos es previo a la aplicación de pruebas estadísticas paramétricas y de


técnicas multivariadas, pues permite verificar las premisas o supuestos que deben cumplir los datos
para la aplicación de esas técnicas.

Así una tarea del análisis exploratorio y que debe llevarse a cabo antes de aplicar cualquier técnica
multivariante es el análisis de los datos ausentes y la detección de datos atípicos

Otra tarea importante que realiza el análisis exploratorio de datos es la comprobación de los
supuestos subyacentes en los métodos paramétricos y multivariantes. Estos supuestos suelen ser el
contraste de la normalidad de todas y cada una de las variables que forman parte del estudio, el
testeo de la linealidad de las relaciones entre las variables que intervienen en el estudio (la relación
entre la posible variable dependiente y las variables independientes que la explican ha de ser una
ecuación lineal), la comprobación de la homocedasticidad de los datos que consiste en ver que la
variación de la variable dependiente que se intenta explicar a través de las variables independientes
no se concentra en un pequeño grupo de valores independientes (se tratara por tanto de ver la
igualdad de varianzas para los datos agrupados según valores similares de la variable dependiente) y
la comprobación de la multicolinealidad o existencia de relaciones entre las variables
independientes. A veces también es necesario contrastar la ausencia de correlación serial de los
residuos o autocorrelación, que consiste en asegurar que cualquiera de los errores de predicción no
está correlacionado con el resto.

ANALISIS INFERENCIAL LOS DATOS

El objetivo de una investigación no se reduce al trabajo descriptivo solamente, en muchos casos, lo


que se pretende es generalizar los resultados obtenidos a partir de una muestra de la población.

La estadística inferencial se utiliza fundamentalmente en dos procesos: estimación de parámetros


poblacionales y pruebas de hipótesis.

Los procedimientos estadísticos a utilizar dependerán, obviamente, del nivel de medición de las
variables independiente y dependiente. Cuando las dos variables son nominales u ordinales,
generalmente se utilizan las llamadas tablas de contingencia. Si una es nominal u ordinal y la otra de
intervalos o proporcional, los test de diferencias de medias o de análisis de varianza son las técnicas
preferidas. Y cuando ambas variables son de intervalo o proporción, el análisis de regresión o
correlación son los más adecuados.

En los procesos de medición de relaciones entre variables y prueba de hipótesis hay cinco preguntas
que deben ser tenidas en cuenta: ¿Hay relación entre las variables independiente y dependiente?
¿Cual es la dirección o forma de la relación? ¿Cuan fuerte es la relación? ¿Es la relación
estadísticamente significativa? ¿Es la relación de tipo causal?

El procedimiento para la comprobación de hipótesis comprende las siguientes etapas:

• Planteamiento de una hipótesis nula (H0) o hipótesis a contrastar.

• Formulación de una hipótesis alternativa de investigación (H1).

• Elección del riesgo o nivel de significancia que prácticamente es el complemento de lo que se llama
nivel de confianza. Normalmente = 0,05 ´o 0,01.

• Contraste de hipótesis. Comparar el valor encontrado del estadístico de prueba obtenido con el
valor crítico o el valor p de significación estadística (valor que suministran los paquetes estadísticos)
y se toma la decisión de aceptar o rechazar la hipótesis nula.

la hipótesis de investigación o alterna, que señala la posible existencia o relación entre dos hechos.
La otra, es la hipótesis nula, que se define para que el investigador evalué su hipótesis de trabajo o
investigación.

En la investigación social existe la convención de aceptar como porcentaje de confianza valido el


nivel de significancia del 0,05, el cual significa que el analista tiene el 95 % de seguridad para
generalizar sin equivocarse
METODOS ESTADISTICOS MULTIVARIADOS

Al observar muchas variables sobre una muestra es presumible que una parte de la información
recogida pueda ser redundante o excesiva, en cuyo caso los métodos multivariados de reducción de
la dimensión tratan de eliminarla.

Por otra parte, el investigador tendrá que considerar si asigna a todas sus variables una importancia
equivalente, es decir, si ninguna variable destaca como dependiente principal en el objetivo de la
investigación, en ese caso se creado los métodos multivariados de interdependencia. Si es así,
porque maneja simplemente un conjunto de diversos aspectos observados y coleccionados en su
muestra, puede acudir para su tratamiento en bloque a lo que podría llamarse técnicas
multivariadas descriptivas.

colección de variables sin ninguna destacada en dependencia, sería la de clasificar sus individuos en
grupos más o menos homogéneos en relación al perfil que en aquellas presenten, SE USA
METODOS MULTIVARIADOS DE INTERDEPENDENCIA.
Si no fuera aceptable una importancia equivalente en las variables, porque alguna variable se
destaca como dependiente principal, habrá de utilizarse métodos multivariadas de dependencia,
considerando la variable dependiente como explicada por las demás variables independientes
explicativas, y tratando de relacionar todas las variables por medio de una posible ecuación o
modelo maten ático que las ligue.

El Método científico se utiliza para decidir sobre las hipótesis con base a las observaciones
Cualquier sistema en las Ciencias Sociales y de la Salud es estocástico Estos Sistemas no son
completamente predecibles, incluyen procesos aleatorios que añaden algún grado de variabilidad y,
en consecuencia, de incertidumbre en sus resultados.

Probabilidad: Es la frecuencia (relativa) esperada con la que ocurre un evento Midiendo la


probabilidad

P(A) = # resultados favorables a A / # total de resultados

Si no hubiese incertidumbre en el resultado no haría falta ni la probabilidad ni la Inferencia


Estadística

P(Rechazar Ho / Ho verdadero) = P(error tipo I) = Nivel significación = α

P(Rechazar Ho / Ho falsa) = P(No cometer error tipo II) = Potencia de la prueba = 1 – β


El rechazo de H0 NO implica total certeza de que H1 sea verdadero (sugiere que H1 puede ser
verdadero con un grado de certeza).

Nivel de significación p valor ≤ 0,05 (Nivel de confianza 95%)

Poder o potencia estadística: 1 – β ≥ 0,80

Potencia estadística 1- β aumenta si seleccionamos un nivel de significación α mayor: Pero elegir un


α mayor implica un mayor riesgo de cometer error Tipo I.

Cuatro métricas son importantes en la inferencia estadística: Significancia (α) Potencia (1 - β)


Tamaño de la muestra (n) Tamaño del efecto (f)

Tamaño del efecto: Es la magnitud mínima de la diferencia o asociación que se considera relevante.
Es una medida estandarizada del “grado de diferencia” o del “grado de relación” que desea detectar
el investigador. No depende del tamaño de la muestra.

Los modelos son herramientas para evaluar las hipótesis

La prevalencia cuantifica la proporción de individuos que poseen un factor de exposición o evento


(independientemente de cuándo la hayan adquirido) en una población y en un punto específico de
tiempo. Nos proporciona una estimación de la situación que presenta una población en relación con
el factor de exposición o evento en ese período de tiempo.

INCIDENCIA En contraste con la prevalencia, la incidencia cuantifica el número de nuevos casos con
un evento en una población de individuos en riesgo (sujetos que no tienen el evento) durante un
período específico de tiempo. La distinción entre prevalencia e incidencia es que en la segunda se
incluyen sólo los nuevos casos como numerador y sólo la población en riesgo en el denominador.
Esto significa que los sujetos que ya tienen el evento de interés quedan excluidos del denominador.

INCIDENCIA RIESGO La incidencia puede calcularse como riesgo o como tasa. La incidencia calculada
como riesgo (incidence risk) es la probabilidad que tiene una persona libre de enfermedad de
desarrollarla en algún período de tiempo y generalmente se la expresa como porcentaje.

INCIDENCIA TASA Cuando la incidencia se calcula como tasa (incidence rate) el número de casos
nuevos no está relacionado con el total de individuos en riesgo al comienzo del período de
observación, sino con el número de personas/años en riesgo (person/year at risk) observadas
durante el período de estudio.

el supuesto de la estadística es que, hasta que se pruebe lo contrario, todos los eventos ocurren por
azar, dadas ciertas condiciones, y el deber de las pruebas estadísticas es probarlo a través del cálculo
de la probabilidad de ocurrencia de un evento o valor p.

¿Qué significa cuando la hipótesis nula es cierta? Quiere decir que asumimos como verdadero que
no hay diferencias entre estos dos porcentajes
En Estadística, cuando el valor p es grande (alta probabilidad de que un evento ocurra por azar) no
decimos que no hay diferencias estadísticas; decimos que no tenemos evidencia para demostrar lo
contrario y, hasta que no la tengamos, debemos asumir que ambos valores fueron obtenidos por
azar.

Si vamos a decidir que los eventos no son por azar en base a un valor de p debemos, por convención,
fijar un valor a partir del cual estemos todos de acuerdo en que tenemos la evidencia suficiente para
probarlo. Este valor es el que se reporta en los estudios como p < 0,05, que significa que, cuando la
probabilidad es de 5 en 100 (5%) o menor, asumimos que es suficiente evidencia para rechazar la
hipótesis nula, y aceptar que el evento no ocurrió por azar.

a media es muy sensible a valores extremos, por lo que en muestras cuya variabilidad esté desviada
hacia algún lado de la media (muestras asimétricas o no normales) esta medida de posición no
refleja el valor central de la muestra sino un valor que está desviado hacia el lado donde hay valores
más extremos.

Por lo tanto, dependiendo de la variabilidad que presente la muestra, puede ser más apropiado
presentar la mediana, que no se ve influenciada por valores extremos

Una forma simple de observar la variabilidad de los datos es construyendo un histograma.

RANGO: Es la forma más simple de describir la dispersión de los datos. Lo que se reporta son los
valores mínimo y máximo de una muestra de datos cuantitativos. La desventaja del rango es que
sólo tiene en cuenta los valores extremos, que probablemente sean los más atípicos o menos
frecuentes, sin describir cómo se distribuyen los valores intermedios

Los percentilos más frecuentemente reportados son los 25 y 75, llamados cuartilos, y nos permiten
dividir a la muestra en 4 partes iguales, cada una de las cuales contiene un 25% de la muestra total.
La diferencia numérica entre el cuartilo 25 y el 75 es el rango intercuartilo

El desvío estándar es la distancia desde un valor x hasta su media, en una muestra de datos
cuantitativos

La varianza muestral es el desvio estandar elevado al cuadrado

También podría gustarte