Documentos de Académico
Documentos de Profesional
Documentos de Cultura
METODOLOGÍA
CIENTÍFICA
MÓDULO 3
MÓDULO 3
INTRODUCCIÓN A LA
BIOESTADÍSTICA
• Sobre fines del siglo XIX Sir Francis Galton, ideo el método conocido por Correlación,
quien retomo sus estudios, y creo el concepto de coeficiente de correlación fue Karl
Pearson.
• Pearson es considerado el fundador del a Bioestadistica, pues creo el primer departamento
de Estadística en la Universidad de Londres, y fundo la revista Biometrik, una de las mas
importantes en el campo de la Estadística.
Estadística:
Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y
analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los
mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones.
Etimología:
La palabra estadística (ciencia que recoge y clasifica datos) es un término popularizado por el
profesor y economista alemán Gottfried Aschenwall (S. XVI).
Este creó la palabra statistik (en alemán) inspirándose en el latín statisticus, formado de status
(estado) y el sufijo icus (relativo a).
Por lo tanto la estadística revela el sentido cuantitativo de las más variadas situaciones.
BIOESTADÍSTICA
Es el conjunto de métodos y técnicas estadísticas aplicables al estudio y análisis de fenómenos
biológicos.
Los seres vivos varían entre sí, esa variabilidad impediría toda generalización de no ser porque la
Estadística proporciona métodos que permiten medirla, partiendo del supuesto de que dichas
variaciones entre los seres vivos se deben al azar.
Clasificación de bioestadística:
Descriptiva: Cuando los resultados del análisis no pretenden ir más allá del conjunto de datos
• Recolecta, presenta y resume datos.
• Describe, analiza y representa un grupo de datos
• Utiliza métodos numéricos y gráficos
• Resumen y presentan la información contenida en un grupo de datos
Inferencial: El objetivo del estudio es derivar conclusiones obtenidas a un conjunto de datos más
amplio. A través de la información de una muestra, toma decisiones, estima y o predice a cerca de
una población.
• Efectúa estimaciones, decisiones, predicciones u otras generalizaciones.
• Utiliza el cálculo de probabilidades en datos muestrales.
• Sobre un conjunto mayor de datos.
MÓDULO 3
POBLACIÓN:
• Conjunto de individuos o elementos que cumplen ciertas propiedades comunes.
• Puede ser finita o infinita (en estadística una muestra grande es considerada infinita)
MUESTRA:
• Subconjunto representativo de una población.
PARÁMETRO:
ESTADÍSTICO:
EJEMPLO:
Tipos de Variables:
CUALITATIVAS;
Expresan cualidad. Se llaman Categórica o Atributo.
Ej:
Sexo, etnia, grupo sanguíneo, etnia, fenotipos, grupos de bacterias, estado civil, ocupación, etc
CUANTITATIVAS:
Se cuantifican, mide la cantidad de la propiedad que se está estudiando
Ej:
• Discretas: N° de hijos, N° de pacientes, N° de camas, N° de bacterias encontradas en un
cultivo, pulsaciones por minuto, etc
• Continuas: peso, estatura, tiempo de reacción a un estímulo, temperatura corporal, etc
Se pueden clasificar en:
CONTINUA DISCRETA
Entre dos valores posibles existen infinitos Entre dos valores posibles no existen
valores valores intermedios
MÓDULO 3
Escalas de Medida:
• Los distintos tipos de variable pueden medirse en distintas escalas o niveles de medida de
acuerdo al valor que tomen.
• Las distintas escalas se clasifican en orden de precisión creciente.
TIPOS:
• Nominal
• Ordinal
• Intervalo
• Razón
ESCALA NOMINAL:
• Es el nivel más elemental de medición
• Característica principal: clasificar los objetos de estudio
• Escala que nombra
• Los valores numéricos que puede tomar la variable están únicamente identificados.
• A cada categoría se le asignan atributos diferentes
• Las operaciones matemáticas que tienen sentido en esta escala porcentaje, moda.
• Ejemplos:
Género
Etnia
Número en la camiseta de futbolista
Grupos sanguíneos
Etc.
ESCALA ORDINAL:
• Además de clasificar, esta escala ordena los objetos, individuos, o hechos en forma
jerárquica
• Organiza datos a través de relaciones de igualdad, mayor o menor
• No proporciona información sobre la magnitud de las diferencias entre los casos así
clasificados, no se refleja distancia entre una categoría y otra.
• Se ordena según una magnitud relativa
• Ejemplos:
Estadios de una enfermedad: se observa que quien está en el estadio I está menos grave que aquel
que está en el estadio II.
Si bien hay una relación entre las categorías quien está en el estadio II no está dos veces más
enfermo que quien está en el estadio I
Calidad de los alimentos.
Condición corporal.
Las operaciones matemáticas que tienen sentido en esta escala son porcentaje en cada estadio,
moda.
MÓDULO 3
ESCALA DE INTERVALO:
Posee valores numéricos en la cual distancias numéricas iguales representan distancias iguales con
respecto a la propiedad que se mide
Clasifica y ordena
Tiene unidad de medida y un cero arbitrario (relativo)
Permite las operaciones matemáticas de suma y resta.
Ejemplos:
• Temperatura en °C y °F
• Año civil
• Medida de inteligencia
• Si consideramos la variable temperatura en °C,
La distancia entre 20°C y 30°C = 30°C y 40°C
Pero esto no indica que 40° sean “2 veces más caliente que 20°C”.
No hay una medida que indique ausencia de la característica, ya que en la escala de
intervalo no existe 0 absoluto. En esta escala el 0 es relativo
ESCALA DE RAZÓN:
Constituye el nivel más alto de medición
Posee las características de una escala de intervalo y además 0 absoluto
Permite todas las operaciones matemáticas
El 0 representa la ausencia de la característica estudiada
Se pueden establecer proporciones o razones entre los valores de la variable
Ejemplos:
• Longitud
• Peso, quien pesa 60kg, pesa el doble de quien pesa 30kg.
• Edad
• N° de estudiantes
• Glicemia
• Temperatura en °K
RESUMEN:
Al estudiar una variable debemos definir claramente en que tipo de escala será medida, ya que esto
influirá en el tratamiento estadístico posterior de los datos.
Lo mas recomendable es medir las variables al mayor nivel posible.
MÓDULO 3
REPRESENTACIONES TABULARES
Tabulación
Las tablas son herramientas estadísticas cuya finalidad es la representación en forma resumida,
organizada y fácil de comprender un conjunto de datos (cuanti y cualitativos). (Misa, 2015)
• Representación de valores, magnitudes, conceptos, etc., por medio de tablas.
• Implica: ordenar, clasificar y contar.
1-El Título:
• Habitualmente el titulo se ubica en la parte superior de la tabla.
• Breve y conciso
• Claro y completo
• Autoexplicativo
• Se coloca el número correspondiente a la tabla presentada para ordenar y ubicar cada tabla
cuando se referencia en un texto.
• Debe contener:
-Población en estudio
-Variables
-Lugar
-Fecha
• ¿Qué? Se recomienda comenzar por “Distribución de…” Estudiantes, Pacientes, Consultas,
etc.
• ¿Cómo? Según que Variable/s Grupos de Edad, Sexo, Motivo de Consulta
• ¿Dónde? Lugar Uruguay, Barrio, Hospital de Clínicas
• ¿Cuándo? Fecha
TIPOS DE TABLAS:
Distribución de Frecuencias o Simples-
Una sola Variable Cuanti o Cualitativa
De Doble Entrada, Asociación o Contingencia : Dos o más variables. Se presentan Marginales
Totales
Ordenar:
• Implica colocar la magnitud en orden creciente o decreciente.
• Arreglo Ordenado (rol estadístico)
• Es el primer paso para la organización de los datos.
• Es un listado de los valores de una colección datos (de una población o muestra) ordenada
de menor a mayor o mayor a menor.
Clasificar:
Proceso para agrupar las observaciones en clases
CLASES O INTERVALO:
Definiciones que permiten agrupar las unidades de observación en conjuntos homogéneos
mutuamente excluyentes y exhaustivos, es decir, cada observación debe pertenecer a una y sólo
una de las clases.
Contar o Recuento:
Operación mediante la cual se determina la cantidad de unidades de observación (frecuencia
absoluta simple f) que corresponde a cada clase.
Frecuencia (f):
Cantidad de veces que se repite el mismo valor de la variable.
Distribución de Frecuencias:
Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias
correspondientes a cada una de ellas.
Tabla estadística:
Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias.
Tipos de Clases:
• Ejemplo: Alturas de 12 personas en metros.
• Datos ORDENADOS: 1,55; 1,57; 1,57; 1,57; 1,59; 1,60; 1,60; 1,61; 1,61; 1,61; 1,61; 1,64
Tipos de Frecuencia:
Dado un conjunto de “n” datos podemos definir 4 tipo de frecuencia:
Amplitud del intervalo de clase: Diferencia entre los límites de clase. (no necesariamente todos
tienen el mismo tamaño).
NÚMEROS DE CLASES:
Número de clases entre 5 y 15 (con pocos intervalos se pierde información y con muchos no se
resume lo suficiente).
EJ 1: Completar la tabla
EJ 2: Completar la Tabla
Alturas de 20 estudiantes de la EUTM en metros:
1,55; 1,55; 1,57; 1,58; 1,59; 1,59; 1,59; 1,60; 1,60; 1,60; 1,60; 1,61; 1,62; 1,62; 1,64; 1,64; 1,65;
1,66; 1,68; 1,70
MÓDULO 3
MEDIDAS DE RESUMEN
Tipos:
MODA:
• Es el valor de la variable con mayor frecuencia
• Es la única MTC que se puede utilizar con datos en todas las escalas de medida
• Útiles para medidas nominales y ordinales
• No se afecta por valores externos
• Se puede utilizar con clases abiertas
• Puede no existir o no ser única
• Datos SIN AGRUPAR
• Rol estadístico
• Determinar cual es el Valor que más se repite
1 Moda: Unimodal
2 Modas: Bimodal
3 o + Modas: Multimodal
MEDIA:
• μ ó x̅
• Es el promedio aritmético de una distribución y es la MTC más utilizada
• Es la suma de todos los valores de la variable dividido el número total de las observaciones
Ejemplo:
MEDIANA
• La Mn es una MTC que se puede aplicar en datos medidos en escala ordinal.
• Ordenar los datos es muy importante
• Mejor MTC que la media cuando las distribuciones son asimétricas y es menos sensible a
valores extremos.
La varianza para un conjunto de datos obtenidos al medir una variable X se define como el
promedio de las distancias al cuadrado entre los datos y su media.
MÓDULO 3
CUANTILES O SEPARATRICES:
• CUANTIL:es el valor de la variable bajo el cual se encuentra una determinada proporción
de la distribución.
• PERCENTIL (P): Se obtienen cuando dividimos nuestra muestra o población en 100 partes
iguales. Por ejemplo: El percentil 30 deja por debajo de el al 30% de las observaciones, y
por encima el restante 70%.
• DECIL (D): Se obtiene cuando dividimos nuestra muestra o población en 10 partes iguales.
• Por ejemplo: el Decil 3 deja por debajo de el al 30% de las observaciones, y por encima el
restante 70%. El Decil 3 coincide con el Percentil 30.
• CUARTIL(Q): Se obtiene cuando dividimos nuestra muestra o población en 4 partes
iguales.
• Por ejemplo el Q2 deja por debajo de el al 50% de las observaciones y por encima el
restante 50%. El Q2 coincide con el P50, con el D5 y con la Mediana
MÓDULO 3
EQUIVALENCIAS:
Primer cuartil (Q1) = Percentil 25 (P25) = Cuantil 0,25
Segundo cuartil (Q2) = Percentil 50 (P50)= Cuantil 0,5 = Mn
Tercer cuartil (Q3) = Percentil 75 (P75)= cuantil 0,75
Semirrecorrido intercuartílico Q:
• Es la desviación cuartil
• Esto lo hace una buena medida de dispersión para distribuciones sesgadas
• Es la mitad de la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o
percentil 25)
• Se utiliza para cuantificar la variabilidad de un conjunto de datos medidos con escala ordinal
o de una distribución de una variable cuantitativa marcadamente asimétrica.
• Delimita el 50% de las observaciones centrales , dejando fuera los datos extremos ya sea por
ser muy pequeños o muy grandes.
• Es la medida de Dispersión más usada en relación con la Mediana.
MÓDULO 3
BIMODAL: MULTIMUDAL:
Forma de la Distribución:
MÓDULO 3
GRÁFICOS PARTE I Y II
Recordatorio:
TABLA: resume y analiza de una forma más sistemática.
Para darnos cuenta de un sólo vistazo de las características de la población resulta aún más
esclarecedor el uso de GRÁFICOS.
GRÁFICO: Definición:
• Dibujo que permite a través de la impresión visual, presentar datos estadísticos ya
ordenados facilitando la comunicación y comprensión de los hechos.
• “Su objetivo es mostrar el fenómeno a través de lo visual, su variación según las variables,
las relaciones entre las diferentes cantidades, su evolución o tendencia en el tiempo”
• En general más fácil de leer que las tablas, pero proporcionan menos detalles.
• “En un trabajo científico, no son obligatorios, no deben sustituir a las Tablas, sino que
deben acompañarlas.”
• Constituyen uno de los medios más difundidos para la presentación y análisis de
información estadística
a) DIAGRAMA DE BARRAS:
BARRAS SIMPLES
Cada categoría se representa por una barra cuya altura indica la presencia o número de unidades de
observación de la misma frecuencia absoluta simple (f) o frecuencia relativa simple (fr)
Gráfico de Barras
En las abscisas no hay un verdadero eje sino una línea de apoyo.
Normas de diseño:
• Todas las barras deben tener el mismo ancho.
• Las barras no deben ir pegadas
• Los espacio entre barra y barra deben ser de la misma longitud.
• La primera barra no debe ir pegada al eje de las ordenadas.
Ejemplo barras simples:
Registro del estado nutricional de 100 estudiantes de la EUTM mediante IMC.
• Las barras se pueden ordenar de mayor a menor frecuencia o al revés, excepto si la variable
es Cualitativa, medida en escala Ordinal.
BARRAS PROPORCIONALES
• Se utiliza para representar y comparar diversos atributos en una población o diversas
poblaciones con respecto a un atributo
• Se aplican las mismas normas de diseño de las barras simples.
EJEMPLO:
A los 100 estudiantes de la EUTM que se les realizó el cálculo de IMC también se les consultó si
realizaban algún tipo de actividad física o eran sedentarios. Obteniéndose la siguiente tabla de
datos:
Estado
BARRAS AGRUPADAS
Muestra la relación entre 2 o más hechos en forma diferente a las barras proporcionales.
Ejemplo barras agrupadas:
➔ A los 100 estudiantes de la EUTM que se les realizó el cálculo de IMC también se les
consultó si realizaban algún tipo de actividad física o eran sedentarios.
➔ Obteniéndose la siguiente tabla de datos
Ejemplo gráfico
barras
agrupadas:
MÓDULO 3
b) DIAGRAMA DE SECTORES:
Útiles para representar distribuciones de frecuencias relativas. Los ángulos son proporcionales a las
frecuencias. Se utilizan fundamentalmente para variables cualitativas.
No se recomienda cuando:
• La variable tiene mas de 5 categorías.
• Si alguna de las categorías tiene pocas observaciones.
• De preferencia usar %.
• Cada 1% = 3,6°.
Ejemplo diagrama de sectores:
Registro del estado nutricional de 100 estudiantes de la EUTM mediante IMC
VARIABLES DISCRETAS:
• Diagrama de barras ó bastones
• Diagrama en escalera
VARIABLES CONTINUAS:
• Histograma
• Polígono de frecuencias
• Polígono de frecuencias acumuladas
PARA AMBAS VARIABLES CUANTITATIVAS:
Diagrama de caja y bigote (box and Diagrama de caja y bigote (box and whisker plot)
xx
MÓDULO 3
Tabla de Datos:
MÓDULO 3
Tabla de Frecuencias:
Polígono
de
INTERPRETACIÓN:
• RECORRIDO INTERCUARTILICO: Q3-Q1 es el largo de la caja.
• La comparación visual del largo de los bigotes permite tener idea del sesgo: si una es más
larga hacia ahí estará el sesgo.
Los valores fuera del límite de las líneas se consideran OUTLIERS (valores atípicos),
con las siguientes explicaciones:
• Error de medida
• Esa medida pertenece a una población diferente del resto de la muestra
• Es correcta, pertenece a la población y representa un evento raro. Explicación que es
aceptada cuando se rechazan las otras 2.
Comparación de notas de 172 estudiantes de la EUTM en los tres parciales del año 2017: