Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentación
El título de este manual es engañoso, porque en realidad sí se requiere para su
entendimiento de conocimientos matemáticos: saber sumar, restar, multiplicar y
dividir (además de saber picar algunos botones de la calculadora de mano). La
verdad es que el pensamiento crítico, el sentido común y las matemáticas que
requiere la medicina basada en evidencias (MBE) son sencillos y su complejidad
radica en el entendimiento de los procesos lógicos de algunos análisis. Por ejemplo,
la prueba de Chi cuadrado (o Ji al cuadrado para los puristas del lenguaje) puede
ser intimidante por su nombre, pero en realidad solo compara si las proporciones
vistas en los grupos son semejantes o diferentes; quizá la dificultad radica más en
entender los conceptos básicos de probabilidad y la filosofía que hay detrás de las
pruebas estadísticas.
Este manual no pretende ser un compendio o sustituto de los excelentes libros que
ya existen. Pretende ser un prontuario para auxiliar en el entendimiento de los
conceptos detrás de la MBE y las herramientas matemáticas que emplea.
Procuramos, sin embargo, cubrir todos los aspectos esenciales que debe dominar
quien se ostente como partidario de la MBE.
1
ÍNDICE
1. Conceptos de Medicina Basada en Evidencias
2. Introducción a la Bioestadística
3. Anatomía del Protocolo de Investigación
4. Diseño: Los Distintos Tipos de Estudio
5. Universo, Población y Muestra
6. Probabilidad: Conceptos Básicos y sus Reglas
7. Distribuciones de Probabilidad
8. Datos y Variables
9. Estadística Descriptiva
10. Estimaciones Puntuales y Límites de Confianza
11. Estadística Inferencial: Contraste de Hipótesis y Significancia
Estadística
12. Riesgos y Momios: Tamaño del efecto
13. Correlación y Regresión
14. Análisis Multivariado y Otras Técnicas Especiales (logística, múltiple)
15. Pruebas de Diagnóstico
16. Análisis de Bayes
17. Sobrevida
18. Mediciones de Significancia Clínica
19. Ética en Investigación
20. Redacción del Escrito Científico
21. Lectura Crítica
22. Presentaciones en Congresos
2
Capítulo 1. Conceptos de Medicina Basada en
Evidencias.
La medicina basada en evidencias (MBE) es la práctica de la medicina que usa la
mejor evidencia disponible como guía para tomar decisiones. Es importante aclarar
que la MBE no exige que todas las decisiones se tomen sobre la base de evidencias
puesto que, en ocasiones, las evidencias simplemente no existen y debemos actuar
con la lógica. Por ejemplo, si un matador de toros sufre un desgarro de la arteria
femoral con la consecuente hemorragia, la lógica nos dicta detenerla de inmediato
y difícilmente encontraremos un estudio aleatorizado al respecto. En otras
ocasiones, dependemos para empezar de que un concepto tenga al menos
plausibilidad biológica; beber orina para curar enfermedades, por ejemplo, carece
de todo sustento farmacológico y eso es suficiente para no intentarlo. Estos
principios no evitan que surjan argumentos en contra que sugieran que al no ser
dañino un procedimiento deba usarse por ese solo hecho; hay que recordar que la
ausencia de evidencia no es evidencia de ausencia.
3
4. Muchos clínicos, incluso aquellos con buena reputación, no practican la
medicina de acuerdo con la mejor evidencia disponible debido a errores
conceptuales que pretenden que la MBE se opone a los valores tradicionales
de la medicina como el humanismo, el valor de la experiencia, el principio de
beneficencia y el principio de autonomía de los pacientes. Nada es más falso
que eso: la MBE sostiene los valores tradicionales de la medicina y acepta el
valor de la experiencia de los profesionales.
Los elementos básicos del proceso de construcción y uso de la evidencia incluyen:
● Formular una pregunta clínica
● Encontrar o construir la mejor evidencia disponible
● Evaluar la calidad de la evidencia sobre la base de su plausibilidad biológica, el
tipo de estudios que la sustentan y el control de los posibles sesgos o prejuicios
● Aplicar la evidencia en la práctica, junto con la experiencia clínica y las
preferencias de los pacientes.
4
Entonces, la MBE integra la experiencia del profesional con la mejor evidencia
científica disponible y los valores tradicionales de la medicina. Es un movimiento
que tiene como objetivo aumentar el uso de investigación clínica de alta calidad en
la toma de decisiones clínicas. La MBE requiere nuevas habilidades del clínico,
incluida la búsqueda eficiente de la literatura y su lectura crítica para que pueda
usarla con eficiencia. La práctica de la MBE es un proceso de aprendizaje de por
vida, auto dirigido y basado en la solución de los problemas, en el que cuidar a los
pacientes crea la necesidad de información clínicamente importante para optimizar
el beneficio de las decisiones.
Podemos concluir que los buenos médicos utilizan tanto su experiencia clínica como
la mejor evidencia disponible. Sin experiencia clínica, la práctica corre el riesgo de
ser tiranizada por la evidencia externa, ya que incluso una excelente evidencia
externa puede ser inaplicable o riesgosa en manos inexpertas. Por otro lado, sin la
mejor evidencia externa actual, la práctica corre el riesgo de quedar obsoleta
rápidamente en detrimento de los pacientes.
En fin, aunque no tenemos evidencia absoluta de que la MBE sea siempre la mejor,
aceptamos que, al menos, es lo mejor que tenemos. Es por ello que han quedado
obsoletas designaciones como “medicina alopática”. La medicina debe ser solo una:
la que se sustenta en la mejor evidencia disponible. Lo demás, son diversas
“terapias” que puedan resultar en franco perjuicio, en mínimo beneficio, o en el mejor
de los casos, en efecto placebo.
5
Capítulo 2. Introducción a la Bioestadística.
La estadística es una rama de las matemáticas encargada, entre otras cosas, de
analizar datos, describirlos, agruparlos, contrastarlos con leyes de probabilidad,
hacer inferencias y bajo ciertas condiciones, hacer predicciones. Cuando los
fenómenos que se analizan son de naturaleza biológica, donde la incertidumbre es
la regla, entonces se le denomina bioestadística.
Para que no te abrumes, es mejor que veas la bioestadística como una caja de
herramientas. Recuerda que las herramientas tienen la función de facilitar la
ejecución del trabajo, pero debes escoger la herramienta adecuada para poder
realizar la tarea que requieres; es decir, si necesitas quitar un tornillo de una tabla,
la herramienta que debes usar es un destornillador, no un serrucho. Así, conviene
tener claras las tareas que quieres realizar para que utilices la herramienta
adecuada. De manera burda, las tareas que puedes realizar con la bioestadística
son: analizar, describir y agrupar datos biológicos (edad, sexo, peso, talla,
frecuencia cardiaca, etc.); además, puedes comparar estos y otros datos entre dos
o más poblaciones, grupos de pacientes, etc. Se considera que con el manejo de
leyes de probabilidad y el análisis de los datos, puedes hacer predicciones basado
en patrones repetitivos de algunos fenómenos biológicos (por ejemplo, algunas
epidemias).
6
estadística puede contarlos y determinar su proporción en porcentajes o hacer unas
sencillas operaciones matemáticas y calcular la media y la desviación estándar,
entre otras mediciones. La media ya la sabes calcular (cuando sacas un promedio
de calificaciones, costos, etc.); la desviación estándar puede ser un concepto más
intimidante, pero solo señala la variación de los datos.
Por otra parte, en el caso de que las variables se expresen como números, se dice
que pueden ser cuantificadas (cuantitativas); así, la comparación entre grupos se
basa en pruebas que comparen elementos como la media o la varianza. Las
pruebas estadísticas más empleadas para hacer inferencias al comparar variables
cuantitativas entre dos o más grupos son la prueba t de Student o el análisis de
varianza. Cabe señalar que estas pruebas se denominan paramétricas y para poder
realizarlas, los datos a comparar deben tener distribución de normalidad (es decir,
que se parezcan a la campana de Gauss). Si los datos no tienen distribución de
normalidad, se comparan las variables cuantitativas con pruebas denominadas no
paramétricas, tales como la prueba U de Mann-Whitney, la prueba de los rangos
con signo de Wilcoxon o la prueba de Kruskal-Wallis, entre otras. Los nombres de
las pruebas hacen homenaje a quienes las diseñaron, pero como suenan muy
complejos, hay quienes disfrutan con enunciarlas para buscar un efecto dramático
en presentaciones académicas.
7
la otra). Además de la relación se obtiene una fórmula en la que sustituyes valores
conocidos y puedes “predecir” el valor de lo desconocido; por ejemplo, cuando
determinas el peso que debería tener un niño si conoces solo la edad mediante la
fórmula: peso = edad en años x 2 + 8. En capítulos específicos, se verán con detalle
estas pruebas.
8
estudios debieran ser solamente publicados si los análisis señalan que el valor P es
menor a 0.005; esto ha merecido críticas, toda vez que para alcanzar esos niveles
los estudios tendrían tamaños de muestra descomunales. Por la otra parte, hay
quienes proponen abandonar de una vez por todas el valor P y buscar otras medidas
de análisis, tal y como el modelo Bayesiano, pues permite darle un sentido más
intuitivo a la información e integra en la práctica los resultados de una manera más
directa. El debate recién comienza, habrá que ver hacia donde evoluciona.
9
Capítulo 3. Anatomía del Protocolo de
Investigación.
Iniciar con la redacción de un protocolo de investigación es una actividad retadora,
pues se tiene que vencer el miedo a la página en blanco. Tener ideas de
investigación en la cabeza es sencillo, pero plasmarlas en escrito es ya una
actividad superior, que por desgracia practican pocos clínicos. Independientemente
de las técnicas de escritura que se abordarán más adelante, conviene tener clara la
estructura del documento y adelantar que el lenguaje debe ser simple y directo.
10
tamaño de muestra requerida. Redacta los criterios de elegibilidad (inclusión,
no inclusión, exclusión y eliminación). Anota, describe y define las variables
del estudio. Haz una descripción detallada de los procedimientos y métodos
que se emplearán. Describe cómo se realizará el análisis estadístico de la
información. Como habrás notado, esta sección la deberás escribir en futuro.
8. Aspectos éticos. Esta sección tiene particular relevancia, debes dejar claro
que el estudio se fundamenta sobre la legislación nacional e internacional en
materia de investigación. También señala cuál es el nivel de riesgo al que los
participantes estarán sometidos y en caso de ser necesario solicitarás la
firma del consentimiento informado.
9. Referencias bibliográficas. En esta parte escribe, en el orden de aparición en
el texto del protocolo, todas las referencias empleadas con un estilo
uniformado. Aunque hay varios formatos para escribirlas, para los protocolos
del área médica se recomienda el método Vancouver.
10. Cronograma de actividades. En un gráfico, que puede ser el diagrama de
Gantt simplificado, debes señalar todas las tareas y actividades con el
protocolo y el tiempo estimado de su ejecución. Es una guía que permite ver
tanto a los investigadores como a las autoridades regulatorias el avance del
proyecto.
11. Desglose de recursos humanos, materiales y financieros.
Independientemente de si vas a solicitar financiamiento o no, se recomienda
que tengas un listado y estimado de costos al respecto de insumos,
materiales, reactivos, prestadores de servicios, etc.
12. Anexos. En esta sección agregarás íntegramente documentos
complementarios para el protocolo, tales como escalas, formatos de captura
o registro de datos, insertos de reactivos, instructivos de equipo, etc.
Análisis FINER
Como se mencionó anteriormente en el punto 4 de la lista anterior, la
pregunta de investigación es parte fundamental de cualquier trabajo de
investigación. Para esto puedes utilizar los criterios FINER:
• Factibilidad: básicamente que cuentes con todos los recursos
necesarios de manera adecuada para llevar a cabo la investigación;
número de personas, experiencia técnica, recursos financieros,
materiales, etc.
• Interés: se refiere a que la investigación sea de interés para la
sociedad, institución patrocinadora o el investigador.
• Novedad: hace referencia a la originalidad del proyecto, que
proporcione nuevos conocimientos o aplique instrumentos y
estrategias innovadoras.
• Ética: respeta los principios éticos de investigación.
• Relevancia: ya sea para el conocimiento científico, líneas de
investigación a futuro o política educativa y de salud.
11
Capítulo 6. Probabilidad: Conceptos Básicos y sus
Reglas.
El estudio de la probabilidad es una rama de la matemática que se ocupa de calcular
la ocurrencia o presentación de un evento. Se expresa como un número que solo
puede ser entre 0 y 1. Un evento con una probabilidad de 1 puede considerarse una
certeza mientras que uno con la probabilidad de 0 puede considerarse una
imposibilidad. La probabilidad 1 significaría el 100%. Por cierto, las probabilidades
de 0 y 1 son muy poco comunes en bioestadística.
Para que entiendas la probabilidad debes saber que existen los eventos
mutuamente excluyentes y los no mutuamente excluyentes. Los primeros son
aquellos que al sumarse dan el total de 1, esto quiere decir que mientras uno sucede
el otro no puede suceder. Por ejemplo, si se realizara una encuesta de grupos
sanguíneo tendremos que el 60% son tipo 0, el 20% son tipo A, el 15% son tipo B,
y el 5% son tipo AB; al juntarlos, tendríamos la muestra total original (0.6 + 0.20 +
0.15 + 0.05 = 1) y son mutuamente excluyentes ya que no se puede ser de grupo
sanguíneo A y O al mismo tiempo. Con este principio, si se investigara en el mismo
grupo también el sexo de los participantes y se tiene que el 50% son hombres y
50% mujeres, estos serán datos no mutuamente excluyentes pues sin importar el
sexo, puede variar el tipo sanguíneo. Por lo tanto, los datos no mutuamente
excluyentes son aquellos que pueden ocurrir simultáneamente.
En los cálculos, debes asignar a la probabilidad con la letra “P” y generalmente se
agrega un subíndice para señalar de qué probabilidad se trata. Por ejemplo, si
quisieras determinar cuál es la probabilidad de que dos personas del grupo anterior,
escogidas al azar, tengan el grupo sanguíneo “A”, podríamos escribirlo como P AA.
12
Regla de la Multiplicación
Regla de la Suma
Esta regla expresa la suma de eventos que son mutuamente excluyentes. Por
ejemplo, del grupo anterior, si quieres saber cuál es la probabilidad de que una
persona elegida al azar tenga el grupo sanguíneo B o AB, aplicas la regla de la
suma:
13
Existe también una probabilidad “condicionada” para situaciones en las que la
ocurrencia de una depende de la ocurrencia previa de la otra. Por ejemplo, la
probabilidad de que llueva hoy se incrementa si amaneció nublado. Esta
probabilidad “bayesiana” es objeto de un capítulo aparte, dada su aplicación en el
método clínico.
14
Capítulo 7. Distribuciones de probabilidad.
Distribución normal
Se llama distribución normal aquella manera en que se presentan las frecuencias
de los datos de una variable; además, al graficarse forma una campana simétrica
que se conoce como la campana de Gauss. En condiciones ideales, el eje de
simetría coincide con el valor del promedio, la mediana y la moda de la variable
estudiada. Las desviaciones estándar (DE) a la derecha e izquierda del eje de
simetría delimitan un porcentaje del área bajo la curva, es decir, señalan cuánta
población está incluida bajo ciertos criterios de variabilidad. Así, el rango delimitado
entre -1 DE y +1 DE señala aproximadamente el 68% de las observaciones,
mientras que el rango de -/+2 DE incluye al 95% y el rango de -/+ 3 DE incluye al
99.7% de la muestra cómo puede observarse en la figura.
La desviación estándar es un modelo importante pues de él parten los principios
que permiten sacar conclusiones en las pruebas de estadística inferencial que verás
más delante.
Fig.7-1. Muestra una gráfica de distribución normal, con los rangos de desviaciones
en las que caen las observaciones.
Las características de la distribución normal ideal son las siguientes: ·
1. Es simétrica
2. Es asintótica (los extremos de la campana se aproximan cada vez más al eje
horizontal pero nunca lo tocan, porque siempre hay individuos en los
extremos)
3. La media, la mediana y la moda se encontrarán en el eje de simetría de la
campana, es decir tienden a ser iguales.
4. El área bajo la curva indica el 100% de los valores de una muestra, pero
como lo mencionamos anteriormente, el porcentaje del área bajo la curva
depende de los límites establecidos dentro de las desviaciones estándar.
Errores Tipo 1 y 2 (Alfa y Beta)
15
Prueba de Hipótesis
En investigación, es común que partas de una hipótesis que quieras probar para
que al final, la aceptes como verdadera o la rechaces como falsa. Este es un
proceso que suena sencillo pero que requiere de gran formalidad, pues te obliga al
uso de herramientas que se conocen como estadística inferencial. La hipótesis a
probar generalmente se expresa en términos de nulidad; por ejemplo, si quieres
saber si un nuevo medicamento es mejor que un placebo, la expresas como: “El
nuevo medicamento X es semejante al placebo”. Si al enfrentar los resultados del
estudio observas que el nuevo medicamento fue significativamente mejor que el
placebo, rechazas la hipótesis de nulidad y aceptas la alternativa: “El nuevo
medicamento X es mejor que un placebo”. Si tu conclusión corresponde a la
realidad, habrás acertado. Si, por el contrario, tu conclusión es errónea, habrás
cometido un error. Los errores en la inferencia son de dos tipos: tipo I o II qué difícil,
¿verdad?
Errores
Como ya viste, existen dos tipos de errores que pueden ocurrir en el procedimiento
de prueba de hipótesis. Rechazar la hipótesis nula cuando ésta es verdadera se le
conoce como error de tipo I (falso positivo). Esto ocurre cuando un investigador
concluye que un medicamento es mejor que un placebo, pero en realidad no es así.
La causa del error tipo I suele ser un diseño de estudio inapropiado. Por el otro lado,
sostener la hipótesis nula cuando ésta es falsa recibe el nombre de error de tipo II
(falso negativo). Esto ocurre cuando el investigador concluye que el medicamento
es igual que el placebo, pero en realidad era mejor. La causa del error tipo II suele
ser un número suficiente de sujetos en la muestra de estudio; por ello, es importante
el cálculo de un tamaño mínimo de muestra cuando se plantea un protocolo.
A pesar de que el concepto es sencillo, puede tener sus dificultades para entenderlo,
por ello acompáñame a ver esta triste historia, donde con unos ejemplos sencillos
pretenderemos explicártelo: si concluyes que tu pareja te engaña, pero en realidad
te es fiel, estás cometiendo un error de tipo I (en este caso, celos, muy mal por ti).
Por otra parte, si concluyes que tu pareja te es fiel, pero en realidad ya tiene
intereses en otra persona; déjame decirte mi amiga/o, que estás en un error de tipo
II (cuernos), amiga/o date cuenta...
16
Figura 7-2. Errores tipo I y II.
17
El proceso de inferencia
La probabilidad de que el resultado sea a consecuencia del azar (un chiripazo), pone
en duda la hipótesis nula. Para fines de investigación se usa un nivel de probabilidad
P de 0.05 (5 %) o menor, para rechazar la hipótesis de nulidad y aceptar la alterna.
Dicho de otra forma, si repitiéramos el experimento muchas veces, por cada 100
repeticiones observaríamos que en menos de 5 de ellos se sostendría la hipótesis
nula. Por ejemplo, si al probar un nuevo medicamento el análisis estadístico
concluye que es mejor que un placebo y la probabilidad del azar es de 0.03 (3%),
rechazamos formalmente la hipótesis de nulidad e inferimos que el nuevo
medicamento es mejor que el placebo. Por el contrario, si la probabilidad del azar
fue de 0.06 (6%) concluimos que, aunque el nuevo medicamento parece mejor, el
análisis estadístico encontró que la diferencia no fue significativa y mantenemos la
hipótesis de nulidad.
Figura 7-3. La gráfica muestra la representación clásica del error tipo I y II. En
donde se toma como ejemplo un test de significancia estadística, donde la
hipótesis nula (H0) es un punto de partida donde la media y mediana de una
población son iguales. Mientras que en la hipótesis alterna (H1) la media y
mediana de una población es diferente. Tomando como riesgo de rechazo de
hipótesis valores de .05 a .01. Esto quiere decir que cuanto mayor sea el riesgo de
cometer un error tipo II, menor será el riesgo de cometer un error tipo I (tienen una
relación inversamente proporcional).
18
Capítulo 8. Datos y Variables.
La información que obtienes en la investigación médica debes procesarla para
realizar un análisis matemático y así identificar patrones, hacer comparaciones e
incluso poder hacer algunas predicciones. Toda esta información se denomina
“datos” y su análisis es una actividad fundamental en la bioestadística y la medicina
basada en evidencias. Los datos que obtienes de revisar pacientes, expedientes,
etc. pueden ser números (numéricos) o cualidades (cualitativos). Los datos pueden
provenir de una característica que siempre tiene el mismo valor (constante) o de
una característica que cambia (variable); por ejemplo, en un estudio sobre cáncer
de próstata, el sexo es un dato constante; por otro lado, en un estudio sobre un
medicamento para la diabetes, el sexo es un dato variable. En un estudio de
investigación es muy importante que determines las variables que vas a analizar,
pues entre la variación de los datos debes buscar identificar patrones o tendencias
que sean útiles para el conocimiento.
Para concluir y sintetizar lo anterior, hay que recalcar que un dato es la
representación numérica o alfanumérica de una variable. Una variable es una
característica cuyo valor puede cambiar y es susceptible de ser medido o calificado.
Para quienes realizan investigación es un dolor de cabeza identificar y clasificar las
variables de un estudio. Para facilitar su comprensión hay que tener clara la
naturaleza de las variables.
Se denomina variable numérica a aquella que puede medirse y de la medición se
obtiene un número. De igual manera, si la variable numérica puede ser cuantificada
(determinar su cantidad en cada sujeto, paciente, etc.) la variable se denomina
cuantitativa (porque mide su cantidad).
Se conocen como variables no numéricas las que no se pueden representar con un
número sino por nombres o categorías.
19
A continuación, te describimos la naturaleza de las variables:
• Según su operatividad
o Cualitativas. Existencia o ausencia de una característica concreta.
(sexo, nacionalidad).
▪ Cualitativas dicotómicas. Solo existen o se contemplan 2
opciones posibles. (Vivo o muerto, mujer u hombre).
▪ Cualitativas politómicas. Múltiples valores, pero solo se permite
la identificación de uno y éste excluye al resto. (Color, tipo de
sangre)
o Cuasi-cuantitativas. Expresan una cualidad que se puede organizar y
establecer un orden o jerarquía, pero no existe una constancia entre
una categoría y la que le precede o la que le sigue (Último grado de
estudios).
o Cuantitativas. Permiten la operativización de sus valores.
▪ Continuas. Decimales. (Temperatura).
▪ Discretas. Enteros. (Número de hijos).
• Ambas pueden ser
o De intervalo. (Cero relativo: Escalas Celsius y
Fahrenheit)
o De razón. (Cero absoluto: Escala Kelvin)
• Según su relación con otras variables
o Independientes. De ella se parte para observar los efectos que
determina cualidad, característica o situación que puede tener sobre
diferentes elementos.
o Dependientes. Escogida y generada a partir de la independiente.
o Moderadoras. Alteran la relación existente entre las anteriores.
o Extrañas. No se han tenido en cuenta, pero tienen efecto sobre los
resultados obtenidos en la investigación. Pueden llevarnos a
conclusiones erróneas.
• Según escala. Nota que cada una tiene las características de la anterior.
o Nominal. Los valores que puede alcanzar permiten distinguir la
existencia de una cualidad concreta, sin permitir ordenar o realizar
operaciones matemáticas con estos valores.
o Ordinal. Permiten ordenar los valores, pero no establecer relaciones
matemáticas.
o De intervalo. Permiten establecer relaciones numéricas. No hay un
cero absoluto definido. Rangos más que valores concretos.
o De razón. Es posible su total operativización, diversas
transformaciones a los resultados y estableciendo relaciones
numéricas complejas entre sí. Existe un cero absoluto.
20
Capítulo 9. Estadística descriptiva.
La estadística descriptiva es el conjunto de técnicas y procedimientos que te ayudan
a describir y sintetizar la información de un conjunto de datos. El objetivo es que
describas las características y el comportamiento de los datos mediante el uso de
números, gráficas y tablas. Los datos que vas a analizar provienen de variables que
pueden ser tanto cualitativas como cuantitativas, tal y como se describe en el
capítulo 8. Brevemente, para describir datos de variables cualitativas entre las
herramientas con las que cuentas está el reporte de proporciones, porcentajes o
tasas; de igual manera puedes emplear gráficos que muestren distribución o
tendencias en estos datos. Por otra parte, para las variables cuantitativas, toda vez
que son números, empleas las medidas de tendencia central y de dispersión para
señalar en una serie de datos ordenados de menor a mayor, cuáles son los valores
del “centro” y cuánto “varían” entre sí. Las medidas de tendencia central son la
media, mediana y moda. Las de dispersión son rango, varianza y desviación
estándar.
Moda. Es el valor que más se repite dentro de una serie de datos numéricos. Puede
haber más de una moda, pero no debes promediarla como se hace con la mediana.
El símbolo de este valor es Mo.
21
Medidas de dispersión
Varianza. Mide la dispersión de los datos del conjunto con respecto a la media y se
expresa en unidades cuadradas. Se calcula al realizar las desviaciones medias de
cada uno de los datos, elevarlas al cuadrado para evitar su cancelación aritmética
y finalmente se divide entre el número de observaciones realizadas. Si la varianza
se determina a partir de una muestra de la población, la división se realiza entre el
número de observaciones realizadas menos uno (n-1). Su símbolo es 𝛔2 y S2 y la
fórmula es la siguiente:
22
Diseño de gráficos <3
Un gráfico es la representación visual de un conjunto de información organizada
bajo ciertos criterios. Su función es expresar la información de manera sencilla, para
que a golpe de vista un lector pueda identificar grupos, tendencias, tamaños, etc. A
continuación, te mostramos algunas de las gráficas más comunes.
23
Figura 9-2. Histograma suavizado.
24
Gráfica de Pastel. Es un “gráfico de sectores” que representa de forma circular las
frecuencias relativas de una variable cualitativa. Sirve para representar porcentajes
y proporciones. Es muy empleado y conviene evitar su abuso, por ejemplo, cuando
se utiliza para representar variables dicotómicas (únicamente dos categorías). Para
realizarlo se deben de seguir los siguientes pasos:
1. Se deben de reunir todos los valores numéricos de mayor a menor
2. Se suman todos los valores numéricos
3. Se realiza una división individual de cada valor entre el valor total de la suma,
de tal manera que dé un valor decimal el cual será representado por un
porcentaje.
4. El valor decimal dado de la división de cada valor individualmente se
multiplicará por 360, debido a que es el número de grados dentro de un
círculo. El resultado de estas multiplicaciones indica un número de grados
que ocupará ese grupo.
5. Finalmente se grafica con apoyo de un compás y transportador los grupos
con su valor correspondiente en grados dentro de la gráfica circular.
Figura 9-2. Gráfica de pastel en la cual se observan los porcentajes de las distintas
categorías de una variable. El tamaño del porcentaje abarca cierta cantidad de
grados de un círculo. Así, el tamaño de la porción o “rebanada” del pastel refleja el
porcentaje que ocupa la categoría.
25
Diagrama de caja y bigote. Son gráficos que describen varias características al
mismo tiempo. Se trazan sobre la base de la dispersión y simetría de los datos. Es
una caja en forma de rectángulo, donde los lados más largos muestran el recorrido
intercuartílico. La primer división muestra la mediana y por lo tanto su relación con
los cuartiles primero y tercero, recordando que el segundo siempre representa la
mediana. La caja se ubica dentro de una recta que tiene como extremos los valores
de las percentilas 25 y 75 (primer y tercer cuartil). A las líneas que sobresalen les
llamamos “bigotes” y sus extremos señalan los valores mínimo y máximo de la
variable.
Los pasos para hacer un gráfico de caja y bigotes son los siguientes:
1. Se ordenan todos los valores de mayor a menor.
2. Se calcula el primer cuartil, el valor que representa el 25% de los valores
ordenados. Así, en una muestra de 20 valores ordenados, se divide 20/4 para
obtener el lugar donde se localiza el primer cuarto, el cual en este ejemplo
sería la posición número 5.
3. El segundo cuartil indica la mediana de la distribución (50%). Por lo anterior,
dividiremos entre 2 el número de valores; en nuestro ejemplo, dicho valor
sería el que ocupe la posición 10.
4. El tercer cuartil indica el valor que está en el 75% de los datos ordenados.
En nuestro ejemplo, sería el valor que ocupa la posición 15.
5. Finalmente, los bigotes se trazan desde los extremos de las cajas hasta
donde se delimiten los valores mínimo y máximo.
26
Diagrama de dispersión
El diagrama de dispersión tiene como finalidad estudiar las relaciones entre dos
conjuntos de datos. Cada par formado por esta relación forma un punto. En un
conjunto de varias observaciones los datos se representan como una nube de
puntos. Una relación positiva entre las variables representadas en el eje horizontal
y el vertical se determina al encontrar una nube de puntos creciente. Una relación
negativa significa que la nube decrece. En caso de que ambas variables sean
independientes entre sí, se afirmará que no existe correlación. La fuerza de cada
relación se puede medir según sea la distribución y puede ser fuerte o débil. En la
gráfica, una relación fuerte sería una nube de datos con proximidad pequeña entre
sí, mientras que en la débil los puntos se verán más dispersos. Esto puede ser
analizado de una manera más precisa mediante el coeficiente de correlación y el de
determinación, como se verá en el capítulo correspondiente. Los pasos a seguir
para realizarlo son los siguientes:
27
Figura 9-4.- Diagrama de dispersión
En este capítulo se señalan las instrucciones o pasos a seguir para realizar los
gráficos de manera manual; pero si se quiere dejar de sufrir, existen programas de
cómputo que realizan este trabajo de manera sencilla y rápida.
28