Está en la página 1de 4

Traducido del inglés al español - www.onlinedoctranslator.

com

Rincón de las estadísticas

Tipos de variables biológicas

Shreemathi S. Mayya, Ashma D Monteiro, Sachit Ganapathy

Departamento de Estadística, Universidad de Manipal, Manipal-576104, Karnataka, India

Correspondencia a:Dr. Shreemathi S. Mayya, Profesor Asociado (Escala Sr.). Departamento Karnataka, de Estadística. Universidad de Manipal, Manipal-576104,

India. Correo electrónico: shreemathi.mayya@manipal.edu.

Resumen:La identificación y descripción de las variables utilizadas en cualquier estudio es un componente necesario en
la investigación biomédica. Los análisis estadísticos dependen del tipo de variables que intervienen en el estudio. En
este breve artículo, presentamos los diferentes tipos de variables biológicas. Un investigador tiene que estar
familiarizado con el tipo de variable que está tratando en su investigación para decidir sobre gráficos/diagramas
apropiados, medidas de resumen y análisis estadístico.

Palabras clave:Variables biológicas; variables discretas; Variables continuas; variables categóricas

Recibido el 19 de abril de 2017. Aceptado para su publicación el 9 de mayo de 2017.

doi: 10.21037/jtd.2017.05.75

Ver este artículo en:http://dx.doi.org/10.21037/jtd.2017.05.75

Introducción infinitos valores en un rango dado. Esto significa que, siempre


podemos encontrar un valor intermedio entre dos valores
La pregunta de investigación es el paso inicial e integral en cualquier
cualesquiera, por muy cerca que estén. Por ejemplo, en un
trabajo de investigación. Dependiendo de las preguntas de investigación
rango dado de 5 a 10 cm de longitud, se pueden escribir
a responder y de los datos disponibles, los investigadores deciden sobre
infinitos valores como 5, 5,1, 5,12, 5,01, 5,003 cm, etc., según el
los métodos estadísticos que se utilizarán para el análisis. Los
grado de precisión que decida el investigador. La altura de una
investigadores deben estar familiarizados con la variedad de variables
persona, el peso, la edad, la longitud del brazo, la presión
involucradas en su estudio para elegir diagramas/gráficos apropiados y
arterial, la temperatura, el nivel de glucosa son algunos de los
medidas de resumen para la presentación, y pruebas estadísticas válidas
ejemplos de variable continua. Aquí las medidas obtenidas
para el análisis de datos.
pueden tomar cualquier valor en un rango dado.
La información recopilada sobre una muestra de sujetos (a
La variable discreta (variable discontinua) puede tomar solo un
menudo pacientes) comprende características que varían entre los número específico de valores en un rango dado. Por ejemplo, el
sujetos. Cualquier característica que varía de un individuo a otro se número de hijos por familia en un rango dado de 0 a 5 puede ser 0,
denomina variable (1). Las características como edad, sexo, altura, 1, 2, 3, 4 y 5. No se pueden escribir más valores en este rango.
peso, índice de masa corporal (IMC), grupo sanguíneo, temperatura Número de visitas al hospital en un año, número de niños en una
corporal, nivel de glucosa en sangre, presión arterial, frecuencia familia, número de pacientes ingresados en una sala de hospital,
cardíaca, número de dientes, gravedad de la enfermedad (leve, número de dientes perdidos, etc. son algunos de los ejemplos de
moderada, grave), etc. son algunos de los ejemplos de variables variables discretas. Las variables discretas suelen ser recuentos.
biológicas en la investigación. Una distinción básica en la naturaleza
entre estas variables es su medición cuantitativa o cualitativa
(categórica) (1,2).
Variables cualitativas

Las variables cualitativas (categóricas) son aquellas características


Variables cuantitativas
que no se pueden medir numéricamente. Estas variables son
Las variables cuantitativas son aquellas características que se nominales (sin ordenación natural) u ordinales (categorías
pueden contar o medir numéricamente. Pueden ser continuos o ordenadas). Por lo general, con el propósito de ingresar y analizar
discretos. Teóricamente, la variable continua puede tomar datos usando software, las categorías se codifican asignando

© Revista de enfermedades torácicas. Reservados todos los derechos. jtd.amegroups.com Enfermedad torácica J2017;9(6):1730-1733
Journal of Thoracic Disease, Vol 9, No 6 Junio 2017 1731

valores numéricos. Manejo de datos tipo Likert


Las variables nominales solo permiten la clasificación o
La escala de Likert se desarrolla con el principio de medir las actitudes
categorización en función de alguna característica distintivamente
pidiendo a las personas que respondan a una serie de afirmaciones sobre
diferente, pero no podemos ordenar esas categorías. Los ejemplos
un tema, en términos de la medida en que están de acuerdo con ellas (4).
típicos de variables nominales son el sexo, la religión, el grupo
Una declaración (elemento de Likert) como: "Es importante que todos los
sanguíneo, los síntomas de la enfermedad, la causa de la muerte,
biólogos aprendan estadística" se puede pedir que se califique como 1 =
etc. Los valores numéricos asignados a las diferentes categorías son
totalmente en desacuerdo, 2 = en desacuerdo, 3 = ni de acuerdo ni en
útiles únicamente con fines de identificación (p. ej., 1= masculino, 2=
desacuerdo, 4 = de acuerdo o 5 = totalmente de acuerdo o, a veces, en
femenino). Cuando una variable cualitativa tiene solo dos categorías
siete valores en lugar de cinco, incluidos "muy en desacuerdo" y "muy de
(vivo/muerto, hombre/mujer, diabético/no diabético), se denomina
acuerdo". Las variables medidas en el ítem de Likert son un tipo de
variable binaria o dicotómica. Las variables nominales se resumen
variables ordinales. La escala de Likert es el resultado de sumar las
contando (frecuencia) y expresando la proporción de cada categoría
puntuaciones de varios ítems de Likert. La escala de Likert puede tratarse
(porcentaje).
como una variable continua. Las estadísticas descriptivas e inferenciales
Las variables ordinales nos permiten clasificar las categorías dependen de la distribución de puntajes, simétrica o sesgada.
en términos de qué categoría tiene menos y qué categoría tiene
más de la calidad representada por la variable, pero no se
conocen las distancias entre las categorías. Un ejemplo típico de
una variable ordinal en medicina son las etapas de una presentación de datos
enfermedad (etapa I a etapa IV). Por ejemplo, sabemos que la Variables cualitativas
"etapa I" es menos grave que la "etapa II" de una enfermedad,
Los datos cualitativos (variable nominal u ordinal) pueden
pero no podemos decir la diferencia exacta entre las dos etapas.
presentarse en forma de tablas de frecuencia. Contamos el número
El estado socioeconómico de las familias (estado
de sujetos/unidades en cada categoría de la variable junto con el
socioeconómico bajo, medio y alto), la categoría de IMC (bajo
porcentaje y presentamos los números y porcentajes en una tabla.
peso, normal, sobrepeso, obeso), la condición de la enfermedad
Por ejemplo, resumimos la distribución del grupo sanguíneo de 100
(deteriorada, igual, mejorada), la puntuación del dolor, etc. son
sujetos en forma de una tabla que muestra el grupo sanguíneo y la
algunos ejemplos de variables ordinales. Los valores numéricos
frecuencia correspondiente junto con los porcentajes. Si tenemos los
asignados para varias categorías son útiles para la
datos de dos variables categóricas, los datos se pueden presentar en
identificación, así como para ordenar por rango (p. ej., 1= bajo,
forma de una tabla de contingencia que muestre la frecuencia y los
2= grupo de ingresos medios y 3= altos). Las variables
porcentajes.
ordinales se resumen contando (frecuencia) y expresando la
Como las variables ordinales también son variables categóricas
proporción de cada categoría (porcentaje).
con un orden predeterminado, las medidas descriptivas como la
frecuencia y el porcentaje deben informarse cuando el número de

Categorizar una variable continua categorías es bajo. Además, la mediana, el rango intercuartílico
junto con el valor máximo y mínimo se consideran apropiados para
Las variables cuantitativas a menudo se convierten en categóricas resumir las variables ordinales.
utilizando "puntos de corte". En lugar de presentar el nivel medio de Los datos nominales y los datos ordinales con un número limitado de
glucosa en ayunas de sujetos masculinos y femeninos, se puede categorías también se pueden presentar en forma de diagrama, como un
preferir presentar la proporción de diabéticos en la población gráfico de barras y un gráfico circular. En un gráfico de barras, la longitud
masculina y femenina utilizando un nivel de glucosa en ayunas de de las barras representa la frecuencia o frecuencia relativa de cada
110 mg/dl como punto de corte para categorizar a los sujetos como categoría de la variable. Por lo general, las barras tienen el mismo ancho
diabéticos/ no diabética. Sin embargo, categorizar una variable y hay un espacio entre ellas. Un gráfico circular es esencialmente un
continua conduce a la pérdida de información (3). Por ejemplo, círculo dividido en segmentos con el área de cada uno proporcional a la
durante la categorización, los sujetos con un nivel de glucosa en frecuencia observada en cada categoría de la variable. El área total
ayunas de 85 y 109 mg/dl se tratan como iguales y se clasifican representa la frecuencia total.
como no diabéticos. Del mismo modo, los sujetos con un nivel de
glucosa de 111 y 150 mg/dL se clasifican como diabéticos. La
Variables cuantitativas
diferencia en los valores no se notará al presentar solo el número de
casos diabéticos y no diabéticos. La media y la desviación estándar son un resumen apropiado

© Revista de enfermedades torácicas. Reservados todos los derechos. jtd.amegroups.com Enfermedad torácica J2017;9(6):1730-1733
1732 Mayya et al. Tipos de variables

medidas para variables continuas con distribuciones simétricas. valor port-prueba en comparación con la prueba de chi-cuadrado. Un
Se calcularán la mediana y el rango intercuartílico para resumir mensaje importante que tratamos de transmitir aquí es que las pruebas
las variables cuantitativas con distribuciones sesgadas. El rango estadísticas tendrán más poder para una variable continua que las
es informativo si se usa como complemento de la desviación correspondientes variables nominales u ordinales (2). En otras palabras,
estándar o el rango intercuartílico. Las variables discretas para lograr el mismo poder que el de una prueba paramétrica, las
pueden resumirse y analizarse como una variable continua o pruebas no paramétricas requieren un tamaño de muestra mayor que
como una variable ordinal dependiendo del número de valores una prueba paramétrica. Por lo tanto, se pueden categorizar los datos
distintos. con fines de presentación (p. ej., hipertensos/normales), pero no para el
Los datos cuantitativos se pueden representar gráficamente mediante análisis estadístico (3).
un histograma. El histograma es útil para decidir sobre la forma de la La discusión detallada de varias pruebas está fuera del alcance de
distribución, simétrica o sesgada. Pero, con muestras pequeñas, el este artículo. Campbell & Swinscow (2) han resumido las pruebas
histograma puede no ser útil para identificar la forma. Como regla adecuadas para varios tipos de variables en una sola tabla. Para el
general, si la media es menor que el doble de la desviación estándar, es procedimiento de cálculo y más detalles sobre varias pruebas
probable que los datos estén sesgados para la variable con valores paramétricas, los investigadores pueden consultar algunos libros de
positivos (5). Los datos cuantitativos también se pueden mostrar como texto estándar (1,3,8). Para una buena discusión de una serie de
diagramas de tallo y hojas, diagramas de puntos, diagramas de caja y pruebas no paramétricas, los lectores pueden consultar a Siegel y
bigotes y diagramas de dispersión, según la situación (6). Castellan (9) y Conover (10).

Análisis de los datos Conclusiones

El tipo de las variables decide el tipo de análisis estadístico a realizar, El tipo de medidas descriptivas y analíticas que se utilizarán en el
paramétrico o no paramétrico. Métodos paramétricos, comotLas resumen y análisis de datos, todo depende del tipo de variables. Por
pruebas, ANOVA, la correlación de Pearson y la regresión requieren lo tanto, para obtener las medidas relevantes para el conjunto de
la suposición de que los datos siguen una distribución normal y que datos en cuestión, recomendamos que los investigadores estudien
las varianzas de las distribuciones son iguales. Los métodos no las características de los datos (categóricos, cuantitativos) y la forma
paramétricos utilizados con frecuencia son la prueba de suma de de la distribución de frecuencias (simétrica en forma de campana,
rangos de Mann-Whitney o Wilcoxon, la prueba de rangos con sesgada) antes de decidir sobre las medidas descriptivas, gráficos y
signos de Wilcoxon y la correlación de rangos. Métodos no diagramas. y pruebas estadísticas adecuadas para la presentación y
paramétricos, no hacen suposiciones sobre la distribución de los análisis de datos.
datos; utilizan el orden de rango de las observaciones en lugar de las
medidas reales (7). La prueba de chi-cuadrado (o la prueba exacta de
Agradecimientos
Fisher si los números son muy pequeños) es el método más utilizado
para comparar datos categóricos. No prestar atención a las Ninguna.

suposiciones y sus implicaciones puede conducir a un aumento de


los errores de tipo I o tipo II.
Nota
Analizamos datos de estudios similares, de manera
completamente diferente según el tipo de variable involucrada. Por Conflictos de interés:Los autores no tienen ningún conflicto de intereses que
ejemplo, digamos que nuestra población objetivo es un grupo de declarar.

edad de más de 50 años en una determinada población y hemos


medido la variable presión arterial sistólica en una muestra de 40
Referencias
sujetos masculinos y 40 femeninos, y nuestra hipótesis nula es "La
población masculina y femenina tiene la misma presión arterial 1. Daniel WW. editor. Bioestadística: una base para el análisis en las
sistólica”. Compararíamos la presión arterial media en hombres y ciencias de la salud. 6ª ed. Nueva York: John Wiley &
mujeres con dos muestrast-test (prueba paramétrica). Si la variable Hijos, 1995.
se convierte a estado de hipertensión (hipertenso/normal), es una 2. Campbell MJ, Swinscow TD. editores Estadísticas en Square
variable nominal, y compararíamos las frecuencias de hipertensión One. 11ª ed. Oxford: Wiley-Blackwell, 2009.
en hombres y mujeres con una prueba de Chi-cuadrado (prueba no 3. Altman DG, Bland JM. El costo de dicotomizar
paramétrica). Encontramos P más pequeño variables continuas. BMJ 2006;332:1080.

© Revista de enfermedades torácicas. Reservados todos los derechos. jtd.amegroups.com Enfermedad torácica J2017;9(6):1730-1733
Journal of Thoracic Disease, Vol 9, No 6 Junio 2017 1733

4. McDonald JH. editor. Manual de estadísticas biológicas. 8. Bland M. editor. Introducción a la estadística médica. 3ra ed. Prensa de
Baltimore, MD: Sparky House Publishing, 2009. la Universidad de Oxford; 2000.
5. Altman DG, Bland JM. Detección de asimetría a partir de 9. Siegel S, Castellano NJ. editores Estadísticas no paramétricas
información resumida. BMJ 1996;313:1200. para las ciencias de la conducta. 2ª ed. Nueva York: McGraw-
6. Freeman JV, Walters SJ, Campbell MJ. editores Cómo Hill, 1988.
mostrar datos. Oxford: Blackwell, 2008. 10. Conover WJ. editor. Estadística práctica no paramétrica. 3ra ed.
7. Altman DG, Bland JM. Métodos paramétricos vs no paramétricos Nueva York: John Wiley, 1998.
para el análisis de datos. BMJ 2009;338:a3167.

Citar este artículo como:Mayya SS, Monteiro AD, Ganapathy S.


Tipos de variables biológicas. J Thorac Dis 2017;9(6):1730- 1733.
doi: 10.21037/jtd.2017.05.75

© Revista de enfermedades torácicas. Reservados todos los derechos. jtd.amegroups.com Enfermedad torácica J2017;9(6):1730-1733

También podría gustarte