Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Documento 56
Documento 56
Los estudios en Ciencias de la Salud se basan en el método inductivo (extensión de las conclusiones
obtenidas en una parte al todo), siendo la Bioestadística la herramienta fundamental para validarlo,
en consideración de las siguientes razones:
Estadística:
Variable
es una característica o atributo que se observa en las unidades de una población, que es susceptible
de medición o clasificación y que presenta diferentes estados o valores.
Aleatoria o probabilística: si sus valores son diferentes cuando se mide u observa bajo las mismas
condiciones, (casualidad).
Determinística o no probabilística: si sus valores son similares cuando se mide u observa bajo las
mismas condiciones, (causalidad).
Dicotómica (o Binaria): si solo puede tomar dos valores posibles, por ejemplo, el estado de salud,:
viva y muerta o el sexo: hombre y mujer.
Politómica (o Multinomial): si admite más de dos valores ejemplo el estado civil: soltero, casado,
unión libre, divorciado, separado y viudo.
NOTA : para propósitos de análisis podemos asignar números a las categorías de la variable, esto es
conocido como variable dummy, en donde se asigna el numero 1 a una categoría y 0 a otra.
Cuantitativa:
Discreta: cuando el conjunto de valores que puede asumir la variable es finito o infinito contable,
generado por proceso de conteo no admite fracción ej: número de pacientes que llega a urgencias al
Hospital.
Continua: cuando el conjunto de valores que puede tomar la variable está dentro de un rango
infinito de puntos. Se genera mediante un proceso de medición, admite fracción ej: presión
sanguínea, nivel de colesterol, temperatura.
Según la escala de medición una variable puede ser nominal, ordinal, de intervalo o razón.
Nominal: cuando los valores de la variable denotan presencia o ausencia de una cualidad, ejemplo el
sexo.
Ordinal: cuando los valores de la variable denotan un orden , jerarquía o nivel, ejemplo el nivel de
escolaridad.
Según la relación que guardan las variables en un estudio una variable puede ser dependiente,
independiente o interviniente.
Dependiente: sus variaciones dependen de las variaciones de otra(s) variable(s). Variable respuesta,
explicada o efecto en un experimento
Independiente: sus valores en un estudio específico no están influ´ıdos por los cambios de otra(s)
variable(s) relacionada(s) en el mismo. Variable explicativa, factor o control en un experimento.
Interviniente: variable que afecta a la variable dependiente de manera indirecta, no se controla en
el experimento o se la puede controlar manteniéndola constante.
Cuantificación de una variable categórica: se puede cuantificar utilizando las llamadas variables
Indicadoras o Dummy. para ello son necesarias k-1 variables que indican presencia (1) o ausencia (0)
de una categoría, siendo k el número de categorías de la variable transformada. Si la variable es
politómica, por ejemplo, el Estado Civil, con 6 categorías se requieren 5 variables indicadoras: Z1 = 1
soltero(a), 0 en otro caso; Z2 = 1 casado(a), 0 en otro caso; Z3 = 1 viudo(a), 0 en otro caso; Z4 = 1
unión libre, 0 en otro caso; Z5 = 1 separado(a), 0 en otro caso. El valor de 0 para las variables
anteriores será el indicador de la presencia de la categoría divorciado(a).
Exhaustividad: Todas las unidades de la población deben tomar algún valor o modalidad, Incluya a
todos.
Exclusividad: Ninguna unidad puede asumir simultáneamente dos o más valores o modalidades
Métodos estadísticos
Los métodos descriptivos tienen como objeto la presentación, organización y resumen de los datos.
Dentro de estos métodos se tiene dos técnicas, graficas y numéricas.
Mediante las técnicas numéricas: Se resumen los datos con medidas estadísticas.
La estimación permite determinar el valor aproximado del parámetro de una población, con un nivel
de precisión fijado en términos de probabilidad, a través de un intervalo de valores, denominado
este último el intervalo de confianza, obtenido con la información (estadísticos) de una muestra
aleatoria.
Una prueba de hipótesis estadística: consiste en determinar probabilidad de que el resultado que
se observa en la muestra o uno aun más extremo es atribuible al azar (nivel de significación) y
establecer si esta probabilidad es tan pequeña (a lo más 5 %) que podemos considerar como válida
la extrapolación de los datos de la muestra a la población objeto de estudio, es decir reportar un
resultado estadísticamente significativo. Pruebas t, F, Chi cuadrado.
Pvalor= <=0.05
Según el número de variables que simultáneamente se incluyan en el análisis de los datos los
métodos pueden ser univariados bivariados o multivariados
Los métodos univariados se utilizan para caracterizar las variables que son objeto de análisis,
interpretándolas de manera individual.
Los métodos bivariados están encaminados a establecer la asociación entre dos variables a partir
de las técnicas descriptivas e inferenciales.
CENSO: proceso mediante el cual se miden o clasifican todas las unidades de una población.
ESTADIGRAFO=estadístico : Valor que caracteriza a una muestra. Se utiliza como estimador del
parámetro correspondiente a la población
CONFIABILIDAD: mide la probabilidad de que los resultados obtenidos en la muestra estén dentro
del margen de error que se asume en un estudio.
POTENCIA DE UNA PRUEBA: es la capacidad de una prueba estadística para detectar en un estudio
verdaderas diferencias o asociaciones (verdadero positivo).
PRECISION: está determinada por la variabilidad que presentan las mediciones de una misma
variable en diferentes unidades (coeficiente de variación).
En el campo de las ciencias sociales se puede considerar como muy apropiado el sofware SPSS
(Statistical Package for the Social Sciences) este programa facilita la entrada y archivo de los datos
obtenidos y el análisis estadístico de los mismos.
Plan de análisis de los datos: De acuerdo a los objetivos del estudio se debe previamente diseñar un
plan adecuado de manipulación de los datos.
Diseño del libro de codificación: Se recomienda diseñarlo de tal forma que aquellos que realicen el
trabajo de codificación tengan una guía precisa de como asignar un código a cada uno de los valores
de las categorías de respuesta de cada pregunta (variable). El libro permite traducir cada categoría
de respuesta a un número preestablecido (código numérico), el cual es vertido en la hoja de
codificación.
se habla de métodos estadísticos descriptivos, cuando se pretende mirar la tendencia de los datos y
describir las características de las variables que intervienen en la investigación. De métodos
estadísticos inferenciales, cuando su objeto es extrapolar o generalizar a una población de estudio,
los resultados obtenidos en una muestra probabilística seleccionada de la misma.
el análisis de los datos depende de una serie de elementos, entre los cuales, los más importantes a
considerar son:
• La hipótesis de investigación
• Aspectos que caractericen, en términos cuantitativos, a los colectivos o procesos, en los cuales se
han definido, problemas de investigación –descripción de variables-.
mucha de la información contenida en los datos, esencial para realizar un buen análisis estadístico,
no queda bien reflejada si, tan sólo, nos quedamos con la que nos aporta la estadística descriptiva es
así que se debe conjugar con el análisis exploratorio, el cual implica una actitud curiosa que está
motivada por la premisa de que cuanto mejor conozca el investigador los datos que tiene, más
eficientemente se pueden usar para desarrollar y refinar la teoría.
Así una tarea del análisis exploratorio y que debe llevarse a cabo antes de aplicar cualquier técnica
multivariante es el análisis de los datos ausentes y la detección de datos atípicos
Otra tarea importante que realiza el análisis exploratorio de datos es la comprobación de los
supuestos subyacentes en los métodos paramétricos y multivariantes. Estos supuestos suelen ser el
contraste de la normalidad de todas y cada una de las variables que forman parte del estudio, el
testeo de la linealidad de las relaciones entre las variables que intervienen en el estudio (la relación
entre la posible variable dependiente y las variables independientes que la explican ha de ser una
ecuación lineal), la comprobación de la homocedasticidad de los datos que consiste en ver que la
variación de la variable dependiente que se intenta explicar a través de las variables independientes
no se concentra en un pequeño grupo de valores independientes (se tratara por tanto de ver la
igualdad de varianzas para los datos agrupados según valores similares de la variable dependiente) y
la comprobación de la multicolinealidad o existencia de relaciones entre las variables
independientes. A veces también es necesario contrastar la ausencia de correlación serial de los
residuos o autocorrelación, que consiste en asegurar que cualquiera de los errores de predicción no
está correlacionado con el resto.
Los procedimientos estadísticos a utilizar dependerán, obviamente, del nivel de medición de las
variables independiente y dependiente. Cuando las dos variables son nominales u ordinales,
generalmente se utilizan las llamadas tablas de contingencia. Si una es nominal u ordinal y la otra de
intervalos o proporcional, los test de diferencias de medias o de análisis de varianza son las técnicas
preferidas. Y cuando ambas variables son de intervalo o proporción, el análisis de regresión o
correlación son los más adecuados.
En los procesos de medición de relaciones entre variables y prueba de hipótesis hay cinco preguntas
que deben ser tenidas en cuenta: ¿Hay relación entre las variables independiente y dependiente?
¿Cual es la dirección o forma de la relación? ¿Cuan fuerte es la relación? ¿Es la relación
estadísticamente significativa? ¿Es la relación de tipo causal?
• Elección del riesgo o nivel de significancia que prácticamente es el complemento de lo que se llama
nivel de confianza. Normalmente = 0,05 ´o 0,01.
• Contraste de hipótesis. Comparar el valor encontrado del estadístico de prueba obtenido con el
valor crítico o el valor p de significación estadística (valor que suministran los paquetes estadísticos)
y se toma la decisión de aceptar o rechazar la hipótesis nula.
la hipótesis de investigación o alterna, que señala la posible existencia o relación entre dos hechos.
La otra, es la hipótesis nula, que se define para que el investigador evalué su hipótesis de trabajo o
investigación.
Al observar muchas variables sobre una muestra es presumible que una parte de la información
recogida pueda ser redundante o excesiva, en cuyo caso los métodos multivariados de reducción de
la dimensión tratan de eliminarla.
Por otra parte, el investigador tendrá que considerar si asigna a todas sus variables una importancia
equivalente, es decir, si ninguna variable destaca como dependiente principal en el objetivo de la
investigación, en ese caso se creado los métodos multivariados de interdependencia. Si es así,
porque maneja simplemente un conjunto de diversos aspectos observados y coleccionados en su
muestra, puede acudir para su tratamiento en bloque a lo que podría llamarse técnicas
multivariadas descriptivas.
colección de variables sin ninguna destacada en dependencia, sería la de clasificar sus individuos en
grupos más o menos homogéneos en relación al perfil que en aquellas presenten, SE USA
METODOS MULTIVARIADOS DE INTERDEPENDENCIA.
Si no fuera aceptable una importancia equivalente en las variables, porque alguna variable se
destaca como dependiente principal, habrá de utilizarse métodos multivariadas de dependencia,
considerando la variable dependiente como explicada por las demás variables independientes
explicativas, y tratando de relacionar todas las variables por medio de una posible ecuación o
modelo maten ático que las ligue.
El Método científico se utiliza para decidir sobre las hipótesis con base a las observaciones
Cualquier sistema en las Ciencias Sociales y de la Salud es estocástico Estos Sistemas no son
completamente predecibles, incluyen procesos aleatorios que añaden algún grado de variabilidad y,
en consecuencia, de incertidumbre en sus resultados.
Tamaño del efecto: Es la magnitud mínima de la diferencia o asociación que se considera relevante.
Es una medida estandarizada del “grado de diferencia” o del “grado de relación” que desea detectar
el investigador. No depende del tamaño de la muestra.
INCIDENCIA En contraste con la prevalencia, la incidencia cuantifica el número de nuevos casos con
un evento en una población de individuos en riesgo (sujetos que no tienen el evento) durante un
período específico de tiempo. La distinción entre prevalencia e incidencia es que en la segunda se
incluyen sólo los nuevos casos como numerador y sólo la población en riesgo en el denominador.
Esto significa que los sujetos que ya tienen el evento de interés quedan excluidos del denominador.
INCIDENCIA RIESGO La incidencia puede calcularse como riesgo o como tasa. La incidencia calculada
como riesgo (incidence risk) es la probabilidad que tiene una persona libre de enfermedad de
desarrollarla en algún período de tiempo y generalmente se la expresa como porcentaje.
INCIDENCIA TASA Cuando la incidencia se calcula como tasa (incidence rate) el número de casos
nuevos no está relacionado con el total de individuos en riesgo al comienzo del período de
observación, sino con el número de personas/años en riesgo (person/year at risk) observadas
durante el período de estudio.
el supuesto de la estadística es que, hasta que se pruebe lo contrario, todos los eventos ocurren por
azar, dadas ciertas condiciones, y el deber de las pruebas estadísticas es probarlo a través del cálculo
de la probabilidad de ocurrencia de un evento o valor p.
¿Qué significa cuando la hipótesis nula es cierta? Quiere decir que asumimos como verdadero que
no hay diferencias entre estos dos porcentajes
En Estadística, cuando el valor p es grande (alta probabilidad de que un evento ocurra por azar) no
decimos que no hay diferencias estadísticas; decimos que no tenemos evidencia para demostrar lo
contrario y, hasta que no la tengamos, debemos asumir que ambos valores fueron obtenidos por
azar.
Si vamos a decidir que los eventos no son por azar en base a un valor de p debemos, por convención,
fijar un valor a partir del cual estemos todos de acuerdo en que tenemos la evidencia suficiente para
probarlo. Este valor es el que se reporta en los estudios como p < 0,05, que significa que, cuando la
probabilidad es de 5 en 100 (5%) o menor, asumimos que es suficiente evidencia para rechazar la
hipótesis nula, y aceptar que el evento no ocurrió por azar.
a media es muy sensible a valores extremos, por lo que en muestras cuya variabilidad esté desviada
hacia algún lado de la media (muestras asimétricas o no normales) esta medida de posición no
refleja el valor central de la muestra sino un valor que está desviado hacia el lado donde hay valores
más extremos.
Por lo tanto, dependiendo de la variabilidad que presente la muestra, puede ser más apropiado
presentar la mediana, que no se ve influenciada por valores extremos
RANGO: Es la forma más simple de describir la dispersión de los datos. Lo que se reporta son los
valores mínimo y máximo de una muestra de datos cuantitativos. La desventaja del rango es que
sólo tiene en cuenta los valores extremos, que probablemente sean los más atípicos o menos
frecuentes, sin describir cómo se distribuyen los valores intermedios
Los percentilos más frecuentemente reportados son los 25 y 75, llamados cuartilos, y nos permiten
dividir a la muestra en 4 partes iguales, cada una de las cuales contiene un 25% de la muestra total.
La diferencia numérica entre el cuartilo 25 y el 75 es el rango intercuartilo
El desvío estándar es la distancia desde un valor x hasta su media, en una muestra de datos
cuantitativos