Está en la página 1de 43

MÓDULO 3

METODOLOGÍA
CIENTÍFICA
MÓDULO 3
MÓDULO 3

INTRODUCCIÓN A LA
BIOESTADÍSTICA

Reseña histórica de la estadística


• Los primeros datos estadísticos se remontan al año 3050 A.C., referidos a la población y a
las riquezas de Egipto.
• El Faraón Ramsés II realizo el primer Censo, con la finalidad de registrar las tierras.
• En la Biblia también encontramos numerosos registros estadísticos, por ejemplo en el libro
de los Números, donde se alude a recuentos de la población Hebrea.
• Otra cita histórica fue brindada por los Chinos, los cuales realizaron numerosos Censos.
• Los Griegos, utilizaron la estadística para realizar mas de 60 Censos, para calcular
impuestos, votantes, estimar recursos y hombres disponibles para la guerra.
• Sin duda los que supieron sacar mayor provecho de la estadística fueron los Romanos.
Realizaban Censos quinquenales, cuyos responsables eran funcionarios públicos.
• Se registraban nacimientos, defunciones, matrimonios, recuento de ganado y riquezas de las
tierras.
• Fueron además registros estadísticos destacados los recopilados por Pipino el Breve (758
D.C.) y por su hijo Carlomagno (762 D.C.).
• El primer compendio estadístico se le adjudica a Guillermo el Conquistador, en Inglaterra de
1086. El mismo contenía datos sobre propiedades, extensión y valor de las tierras Inglesas.
• En los siglos XV, XVI y XVII brillantes personalidades como: Leonardo da Vinci, Nicolás
Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, realizaron
grandes aportes al Método Científico.
• Luego de que surgieron los Estados y el Comercio Internacional se contó con la estadística
como un método capaz de aplicarse a la economía.
• En 1532, por indicación de rey Enrique VII, se comenzaron a registrar en Inglaterra todas
las defunciones, pues estaba instalada en la región la peste.
• Por esa época en Francia se registraban nacimientos, bautismos, matrimonios y defunciones
por parte de los clérigos.
• En Inglaterra se continuó con la costumbre, para eso se creó el libro Cuentas de Mortalidad,
que contenía nacimientos y fallecimientos, clasificados según sexo.
• En 1662 John Graunt uso datos de esos documentos para realizar predicciones referidas a
muertes por determinadas enfermedades y proporciones de nacimientos según sexo.
• En 1691 el Clérigo y Profesor Alemán Gaspar Neumann uso la estadística con otros fines:
desechar la creencia popular que en los años que finalizaban con el numero 7 fallecían mas
personas que en otros años.
• Para eso recurrió a los archivos de la Iglesia. Quien retomo sus estudios fue el astrónomo
Ingles Halley.
• Esos cálculos fueron base para tablas de mortalidad que se utilizan hasta hoy en día por las
compañía de seguros.
• Excepcionales matemáticos como Bernoulli, Maseres, Lagrange, Laplace y de Moivre
desarrollaron en el siglos XVII y XVIII la Teoría de las Probabilidades. El uso de esta se
vio limitado en principio a los juegos de azar. Más tarde se comenzó a aplicar a los grandes
problemas científicos.
MÓDULO 3

• Jacques Quetelect es quien aplica la estadística a las Ciencias Sociales, utilizando el


principio de los promedios y de la variabilidad de los fenómenos sociales.
Entre 1800 y 1820 se desarrollaron dos conceptos matemáticos fundamentales para la Teoría de la
estadística:
1. La Teoría de los Errores de Observación (Laplace y Gauss)
2. La Teoría de los Mínimos Cuadrados (Laplace, Gauss, Legendre).

• Sobre fines del siglo XIX Sir Francis Galton, ideo el método conocido por Correlación,
quien retomo sus estudios, y creo el concepto de coeficiente de correlación fue Karl
Pearson.
• Pearson es considerado el fundador del a Bioestadistica, pues creo el primer departamento
de Estadística en la Universidad de Londres, y fundo la revista Biometrik, una de las mas
importantes en el campo de la Estadística.

En resumen: ¿Qué es la estadística?


• La raíz de la palabra viene del término latino status que significa estado o situación: por lo
tanto la Estadística revela el sentido cuantitativo de la VARIABILIDAD de infinidad de
situaciones.
• Es el único instrumento adecuado para analizar datos de fenómenos cuya característica
fundamental es la VARIABILIDAD.

EJ: Profesora, ¿cuánto le lleva a un alumno realizar el examen de forma virtual?


MÓDULO 3

Estadística:
Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y
analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los
mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones.

Etimología:
La palabra estadística (ciencia que recoge y clasifica datos) es un término popularizado por el
profesor y economista alemán Gottfried Aschenwall (S. XVI).
Este creó la palabra statistik (en alemán) inspirándose en el latín statisticus, formado de status
(estado) y el sufijo icus (relativo a).
Por lo tanto la estadística revela el sentido cuantitativo de las más variadas situaciones.

BIOESTADÍSTICA
Es el conjunto de métodos y técnicas estadísticas aplicables al estudio y análisis de fenómenos
biológicos.
Los seres vivos varían entre sí, esa variabilidad impediría toda generalización de no ser porque la
Estadística proporciona métodos que permiten medirla, partiendo del supuesto de que dichas
variaciones entre los seres vivos se deben al azar.

Clasificación de bioestadística:
Descriptiva: Cuando los resultados del análisis no pretenden ir más allá del conjunto de datos
• Recolecta, presenta y resume datos.
• Describe, analiza y representa un grupo de datos
• Utiliza métodos numéricos y gráficos
• Resumen y presentan la información contenida en un grupo de datos

Inferencial: El objetivo del estudio es derivar conclusiones obtenidas a un conjunto de datos más
amplio. A través de la información de una muestra, toma decisiones, estima y o predice a cerca de
una población.
• Efectúa estimaciones, decisiones, predicciones u otras generalizaciones.
• Utiliza el cálculo de probabilidades en datos muestrales.
• Sobre un conjunto mayor de datos.
MÓDULO 3

Algunos conceptos importantes:


INDIVIDUOS O ELEMENTOS:
• Personas u objetos que contienen cierta información que se desea estudiar.

POBLACIÓN:
• Conjunto de individuos o elementos que cumplen ciertas propiedades comunes.
• Puede ser finita o infinita (en estadística una muestra grande es considerada infinita)

MUESTRA:
• Subconjunto representativo de una población.

PARÁMETRO:

ESTADÍSTICO:

• “ EL CONOCIMIENTO ESTADÍSTICO SERA ALGÚN DÍA TAN NECESARIO PARA


SER UN BUEN Y EFICIENTE CIUDADANO, COMO LA APTITUD DE PODER LEER
Y ESCRIBIR”
• ADEMÁS PARA UNA TOMA ACERTADA DE DECISIONES EN DIVERSOS
ASPECTOS DE LAS ACTIVIDADES PROFESIONALES ( en situación de incertidumbre),
BASADAS EN EVIDENCIAS ESTADÍSTICAS.
MÓDULO 3

Tipos de Variable y Escalas de Medida:


DEFINICIÓN DE VARIABLE:
• Es una característica medible, que puede asumir distintos valores en los elementos
(individuos, objetos o eventos) de una población o muestra.
• Varían de un elemento a otro o de un momento a otro en el mismo elemento.
• El conjunto de valores que puede asumir la variable se llama dominio

EJEMPLO:

Tipos de Variables:
CUALITATIVAS;
Expresan cualidad. Se llaman Categórica o Atributo.
Ej:
Sexo, etnia, grupo sanguíneo, etnia, fenotipos, grupos de bacterias, estado civil, ocupación, etc

CUANTITATIVAS:
Se cuantifican, mide la cantidad de la propiedad que se está estudiando
Ej:
• Discretas: N° de hijos, N° de pacientes, N° de camas, N° de bacterias encontradas en un
cultivo, pulsaciones por minuto, etc
• Continuas: peso, estatura, tiempo de reacción a un estímulo, temperatura corporal, etc
Se pueden clasificar en:
CONTINUA DISCRETA
Entre dos valores posibles existen infinitos Entre dos valores posibles no existen
valores valores intermedios
MÓDULO 3

Escalas de Medida:
• Los distintos tipos de variable pueden medirse en distintas escalas o niveles de medida de
acuerdo al valor que tomen.
• Las distintas escalas se clasifican en orden de precisión creciente.
TIPOS:
• Nominal
• Ordinal
• Intervalo
• Razón

ESCALA NOMINAL:
• Es el nivel más elemental de medición
• Característica principal: clasificar los objetos de estudio
• Escala que nombra
• Los valores numéricos que puede tomar la variable están únicamente identificados.
• A cada categoría se le asignan atributos diferentes
• Las operaciones matemáticas que tienen sentido en esta escala porcentaje, moda.
• Ejemplos:
Género
Etnia
Número en la camiseta de futbolista
Grupos sanguíneos
Etc.

ESCALA ORDINAL:
• Además de clasificar, esta escala ordena los objetos, individuos, o hechos en forma
jerárquica
• Organiza datos a través de relaciones de igualdad, mayor o menor
• No proporciona información sobre la magnitud de las diferencias entre los casos así
clasificados, no se refleja distancia entre una categoría y otra.
• Se ordena según una magnitud relativa
• Ejemplos:
Estadios de una enfermedad: se observa que quien está en el estadio I está menos grave que aquel
que está en el estadio II.
Si bien hay una relación entre las categorías quien está en el estadio II no está dos veces más
enfermo que quien está en el estadio I
Calidad de los alimentos.
Condición corporal.
Las operaciones matemáticas que tienen sentido en esta escala son porcentaje en cada estadio,
moda.
MÓDULO 3

ESCALA DE INTERVALO:
Posee valores numéricos en la cual distancias numéricas iguales representan distancias iguales con
respecto a la propiedad que se mide
Clasifica y ordena
Tiene unidad de medida y un cero arbitrario (relativo)
Permite las operaciones matemáticas de suma y resta.
Ejemplos:
• Temperatura en °C y °F
• Año civil
• Medida de inteligencia
• Si consideramos la variable temperatura en °C,
La distancia entre 20°C y 30°C = 30°C y 40°C
Pero esto no indica que 40° sean “2 veces más caliente que 20°C”.
No hay una medida que indique ausencia de la característica, ya que en la escala de
intervalo no existe 0 absoluto. En esta escala el 0 es relativo

ESCALA DE RAZÓN:
Constituye el nivel más alto de medición
Posee las características de una escala de intervalo y además 0 absoluto
Permite todas las operaciones matemáticas
El 0 representa la ausencia de la característica estudiada
Se pueden establecer proporciones o razones entre los valores de la variable
Ejemplos:
• Longitud
• Peso, quien pesa 60kg, pesa el doble de quien pesa 30kg.
• Edad
• N° de estudiantes
• Glicemia
• Temperatura en °K

Características de las escalas de medición:


MÓDULO 3

Nivel jerárquico de las escalas:


1. Razón
2. Intervalo
3. Ordinal
4. Nominal

RESUMEN:
Al estudiar una variable debemos definir claramente en que tipo de escala será medida, ya que esto
influirá en el tratamiento estadístico posterior de los datos.
Lo mas recomendable es medir las variables al mayor nivel posible.
MÓDULO 3

REPRESENTACIONES TABULARES
Tabulación
Las tablas son herramientas estadísticas cuya finalidad es la representación en forma resumida,
organizada y fácil de comprender un conjunto de datos (cuanti y cualitativos). (Misa, 2015)
• Representación de valores, magnitudes, conceptos, etc., por medio de tablas.
• Implica: ordenar, clasificar y contar.

DISEÑO DE LAS TABLAS:


1. El título
2. La tabla: esqueleto y contenido
3. Notas explicativas y fuentes

1-El Título:
• Habitualmente el titulo se ubica en la parte superior de la tabla.
• Breve y conciso
• Claro y completo
• Autoexplicativo
• Se coloca el número correspondiente a la tabla presentada para ordenar y ubicar cada tabla
cuando se referencia en un texto.
• Debe contener:
-Población en estudio
-Variables
-Lugar
-Fecha
• ¿Qué? Se recomienda comenzar por “Distribución de…” Estudiantes, Pacientes, Consultas,
etc.
• ¿Cómo? Según que Variable/s Grupos de Edad, Sexo, Motivo de Consulta
• ¿Dónde? Lugar Uruguay, Barrio, Hospital de Clínicas
• ¿Cuándo? Fecha

2-La Tabla – Esqueleto y Contenido:


La Tabla se compone de un Esqueleto:
• Intersección de filas y columnas resulta un conjunto de celdas
• La primera columna (vertical) se llama Matriz, las demás son Accesorias.
• La primera fila (horizontal) se llama
Encabezamientos. El Contenido de la tabla son los datos procesados.
MÓDULO 3

3-Notas explicativas y Fuentes:


Al pie de la Tabla se pueden encontrar:
-Fuente de datos
-Notas explicativas: Las Aclaraciones de Titulo como de Celdas se utilizando letras, mientras que
las de Encabezados o Columna Matriz se referencian con números.

TIPOS DE TABLAS:
Distribución de Frecuencias o Simples-
Una sola Variable Cuanti o Cualitativa
De Doble Entrada, Asociación o Contingencia : Dos o más variables. Se presentan Marginales
Totales

DISTRIBUCIÓN DE FRECUENCIAS SIMPLES

TABLAS DE DOBLE ENTRADA/ASOCIACIÓN/CONTINGENCIA:


MÓDULO 3

Ordenar:
• Implica colocar la magnitud en orden creciente o decreciente.
• Arreglo Ordenado (rol estadístico)
• Es el primer paso para la organización de los datos.
• Es un listado de los valores de una colección datos (de una población o muestra) ordenada
de menor a mayor o mayor a menor.

Clasificar:
Proceso para agrupar las observaciones en clases
CLASES O INTERVALO:
Definiciones que permiten agrupar las unidades de observación en conjuntos homogéneos
mutuamente excluyentes y exhaustivos, es decir, cada observación debe pertenecer a una y sólo
una de las clases.

Contar o Recuento:
Operación mediante la cual se determina la cantidad de unidades de observación (frecuencia
absoluta simple f) que corresponde a cada clase.

Frecuencia (f):
Cantidad de veces que se repite el mismo valor de la variable.

Distribución de Frecuencias:
Llamaremos distribución de frecuencias al conjunto de clases junto a las frecuencias
correspondientes a cada una de ellas.

Tabla estadística:
Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias.

Tablas o distribuciones de frecuencia DATOS SIN


AGRUPAR:
• Ordenación tabular de los datos con sus respectivas frecuencias.
• Ejemplo: Alturas de 12 personas en metros.
• Datos ORDENADOS:
1,55; 1,57; 1,57; 1,57; 1,59; 1,60; 1,60; 1,61; 1,61; 1,61; 1,61; 1,64
MÓDULO 3

Tabla o Distribuciones de frecuencia DATOS


AGRUPADOS:
Es una ordenación tabular de los datos en clases con sus correspondientes frecuencias.

Tipos de Clases:
• Ejemplo: Alturas de 12 personas en metros.
• Datos ORDENADOS: 1,55; 1,57; 1,57; 1,57; 1,59; 1,60; 1,60; 1,61; 1,61; 1,61; 1,61; 1,64

• 0 – 2 ó ≤ 2: símbolos que representan a cada clase en que se dividió la variable.


• A cada símbolo se le llama: Intervalo de Clase (IC).
• Ejemplo de clase semiabierta:

• f: representa la frecuencia absoluta simple de cada clase.


• Para este curso se va a trabajar con IC cerrados (variables discretas) ó IC semiabiertos
(variables continuas). No se trabajará con IC abiertos.
MÓDULO 3

Tipos de Frecuencia:
Dado un conjunto de “n” datos podemos definir 4 tipo de frecuencia:

• Las frecuencias relativas también se pueden representar como porcentajes %

Algunas definiciones importantes


Amplitud total o rango: Diferencia entre los límites superior e inferior del conjunto total de datos.

Amplitud del intervalo de clase: Diferencia entre los límites de clase. (no necesariamente todos
tienen el mismo tamaño).

Marca de clase X: Es el punto medio del intervalo de clase

Cómo elaborar clases:


MÓDULO 3

NÚMEROS DE CLASES:
Número de clases entre 5 y 15 (con pocos intervalos se pierde información y con muchos no se
resume lo suficiente).

AMPLITUD DE CADA IC:

EJ 1: Completar la tabla

EJ 2: Completar la Tabla
Alturas de 20 estudiantes de la EUTM en metros:
1,55; 1,55; 1,57; 1,58; 1,59; 1,59; 1,59; 1,60; 1,60; 1,60; 1,60; 1,61; 1,62; 1,62; 1,64; 1,64; 1,65;
1,66; 1,68; 1,70
MÓDULO 3

MEDIDAS DE RESUMEN
Tipos:

MEDIDAS DE TENDENCIA CENTRAL (MTC)


Son los valores medios o centrales de una distribución.
Describen la disposición de la distribución de frecuencias en torno a un valor central.

Significados que puede tener la tendencia central de una distribución:


• Puede referirse a un valor que corresponde a un pico de la distribución de frecuencias
• Concepto análogo al concepto físico de centro de gravedad (media aritmética)
• Posición central en una distribución

MEDIDAS DE TENDENCIA CULTURAL


 Moda
 Media
 Mediana
MÓDULO 3

MODA:
• Es el valor de la variable con mayor frecuencia
• Es la única MTC que se puede utilizar con datos en todas las escalas de medida
• Útiles para medidas nominales y ordinales
• No se afecta por valores externos
• Se puede utilizar con clases abiertas
• Puede no existir o no ser única
• Datos SIN AGRUPAR
• Rol estadístico
• Determinar cual es el Valor que más se repite
1 Moda: Unimodal
2 Modas: Bimodal
3 o + Modas: Multimodal

Ejemplo-Cálculo de la moda para datos agrupados


MÓDULO 3

FORMA GRÁFICA DE DETERMINAR LA MODA:

MEDIA:
• μ ó x̅
• Es el promedio aritmético de una distribución y es la MTC más utilizada
• Es la suma de todos los valores de la variable dividido el número total de las observaciones

• Para datos agrupados

• Donde ẋ es la marca de clase y Fi la frecuencia absoluta de la clase


• MTC adecuada para datos medidos en escala de razón o intervalo
• Concepto análogo al concepto físico de centro de gravedad
• MTC relativamente estable
• ⍐n⍐ Estabilidad
• Hasta alcanzar un valor constante μ (valor esperado o media poblacional)
• Es una MTC muy sensible a valores extremos
• Cuando la distribución es simétrica y unimodal es la mejor MTC (mas estable que Mn)
MEDIANA:
MÓDULO 3

• Es el valor de la variable que divide las observaciones en dos partes iguales


• Es una MTC propia de los niveles de medición ordinal, intervalos y de razón
• Única para un conjunto dado de datos
• No es influenciada por valores extremos

Si el número de observaciones es impar:

Si el número de observaciones es par:

Ejemplo:

CÁLCULO DE MEDIANA: Datos sin agrupar

CÁLCULO DE MEDIANA: Datos Agrupados


MÓDULO 3

EJEMPLO DE CÁLCULO DE MEDIANA PARA DATOS AGRUPADOS:

MEDIANA
• La Mn es una MTC que se puede aplicar en datos medidos en escala ordinal.
• Ordenar los datos es muy importante
• Mejor MTC que la media cuando las distribuciones son asimétricas y es menos sensible a
valores extremos.

Método Gráfico para hallar la MEDIANA:


MÓDULO 3

Medidas de Dispersión o Variabilidad:


• En general describen cuan grande es la variabilidad de un fenómeno con relación a su
comportamiento promedio.
• Gran importancia en biología y medicina.
• Útil en estadística inferencial
• La información que aporta un estadístico acerca de un parámetro poblacional es
inversamente proporcional a su variabilidad.

La varianza para un conjunto de datos obtenidos al medir una variable X se define como el
promedio de las distancias al cuadrado entre los datos y su media.
MÓDULO 3

• Es una media de cuadrados de los desvíos


• Es sensible a valores extremos.
• Su unidad es el cuadrado de las variables.
MÓDULO 3

Coeficiente de Variación CV:


• Medida relativa de variabilidad respecto a la media
• El CV para un conjunto de datos expresa la variación como un
% de la media
• El CV es adimensional
• Dice qué tamaño tiene la desviación estándar respecto a la media
• Se suele expresar en porcentaje %
• No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una
cantidad fijada arbitrariamente.
Es el cociente entre la desviación típica y la media.
Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”
Es frecuente indicarla en porcentajes
• Si la media es 80 y la desviación típica 20 entonces CV =20/80
• = 0,25 = 25% (variabilidad relativa)
Es adimensional. Interesante para comparar la variabilidad de diferentes variables.
• Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión
en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad
fijada arbitrariamente
• Por ejemplo 0ºC ≠ 0ºF

Amplitud total A o Rango:


Es la diferencia entre la mayor y la menor observación
Ej: si tenemos el siguiente conjunto de datos:
➔ 10, 11, 12, 13, 14
➔ A= 14-10
➔ A= 4

CUANTILES O SEPARATRICES:
• CUANTIL:es el valor de la variable bajo el cual se encuentra una determinada proporción
de la distribución.
• PERCENTIL (P): Se obtienen cuando dividimos nuestra muestra o población en 100 partes
iguales. Por ejemplo: El percentil 30 deja por debajo de el al 30% de las observaciones, y
por encima el restante 70%.
• DECIL (D): Se obtiene cuando dividimos nuestra muestra o población en 10 partes iguales.
• Por ejemplo: el Decil 3 deja por debajo de el al 30% de las observaciones, y por encima el
restante 70%. El Decil 3 coincide con el Percentil 30.
• CUARTIL(Q): Se obtiene cuando dividimos nuestra muestra o población en 4 partes
iguales.
• Por ejemplo el Q2 deja por debajo de el al 50% de las observaciones y por encima el
restante 50%. El Q2 coincide con el P50, con el D5 y con la Mediana
MÓDULO 3

EQUIVALENCIAS:
Primer cuartil (Q1) = Percentil 25 (P25) = Cuantil 0,25
Segundo cuartil (Q2) = Percentil 50 (P50)= Cuantil 0,5 = Mn
Tercer cuartil (Q3) = Percentil 75 (P75)= cuantil 0,75

CÁLCULO DE PERCENTIL “N”: Datos sin agrupar

I= 61+1 x 0,25= 15,5 El Q1 se encontrará entre la posición 15 y 16.


Posición 15 = valor 132 Posición 16= valor 133
El Q1= 132 + 133/ 2= 132,5
I= 61+1x 0,50= 31 El Q1 se encontrará entre la posición 31 Posición 31= valor 149
El Q2= 149 (MEDIANA)
I= 61+1 x 0,75= 46, 5 El Q3 se encontrará entre la posición 46 y 47.
MÓDULO 3

Posición 46 = valor 158 Posición 47= valor 160


El Q3= 158 + 160/2= 159

Mo= 138 ; 154 Bimodal

CÁLCULO DE PERCENTIL “N”: Datos Agrupados

Ejemplo de cálculo de percentil 15 para datos agrupados:


MÓDULO 3

Semirrecorrido intercuartílico Q:
• Es la desviación cuartil
• Esto lo hace una buena medida de dispersión para distribuciones sesgadas
• Es la mitad de la diferencia entre el tercer cuartil (o percentil 75) y el primer cuartil (o
percentil 25)
• Se utiliza para cuantificar la variabilidad de un conjunto de datos medidos con escala ordinal
o de una distribución de una variable cuantitativa marcadamente asimétrica.

• Delimita el 50% de las observaciones centrales , dejando fuera los datos extremos ya sea por
ser muy pequeños o muy grandes.
• Es la medida de Dispersión más usada en relación con la Mediana.
MÓDULO 3

QUÉ MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN


UTILIZAR:

MEDIDAS DE FORMA As:


Coeficiente de asimetría es:
MÓDULO 3

Tipos de curvas As:


Simétrica: las observaciones estan a la misma distancia del máximo central y tienen la misma
frecuencia Coinciden la Media, Moda y Mediana en su valor.. As= 0
Asimétrica: La “cola” más larga determina la dirección del sesgo. No coinciden la Media, Moda y
la Mediana.
As= + (valor) As= - (valor)

BIMODAL: MULTIMUDAL:

Forma de la Distribución:
MÓDULO 3

En Azul la distribución normal (de referencia)


Distribución mesocurtica
MÓDULO 3

GRÁFICOS PARTE I Y II
Recordatorio:
TABLA: resume y analiza de una forma más sistemática.
Para darnos cuenta de un sólo vistazo de las características de la población resulta aún más
esclarecedor el uso de GRÁFICOS.

GRÁFICO: Definición:
• Dibujo que permite a través de la impresión visual, presentar datos estadísticos ya
ordenados facilitando la comunicación y comprensión de los hechos.
• “Su objetivo es mostrar el fenómeno a través de lo visual, su variación según las variables,
las relaciones entre las diferentes cantidades, su evolución o tendencia en el tiempo”
• En general más fácil de leer que las tablas, pero proporcionan menos detalles.
• “En un trabajo científico, no son obligatorios, no deben sustituir a las Tablas, sino que
deben acompañarlas.”
• Constituyen uno de los medios más difundidos para la presentación y análisis de
información estadística

Grafico 1. Distribución de vendedores por Volumen de ventas en pesos, en Directv,


Montevideo. Enero 2020.
El titulo del grafico debe responder: ¿Qué?, ¿Cómo?, ¿Dónde?, ¿Cuándo?
MÓDULO 3

Cuadrante superior derecho(valores positivos) del sistema de coordenadas cartesianas.

Eje de las ordenadas, “y”.


Va la frecuencia del fenómeno que se
esta representando

Eje de las abscisas, “x”, van , ya sea las categorías los


valores individuales o intervalos de clase.

GRÁFICOS para variables CUALITATIVAS (categóricas o atributo)


a) Diagrama de barras
• 🞄 Barras Simples
• 🞄 Barras Proporcionales
• 🞄 Barras Agrupadas
b) Diagrama de sectores

a) DIAGRAMA DE BARRAS:

BARRAS SIMPLES
Cada categoría se representa por una barra cuya altura indica la presencia o número de unidades de
observación de la misma frecuencia absoluta simple (f) o frecuencia relativa simple (fr)

Gráfico de Barras
En las abscisas no hay un verdadero eje sino una línea de apoyo.
Normas de diseño:
• Todas las barras deben tener el mismo ancho.
• Las barras no deben ir pegadas
• Los espacio entre barra y barra deben ser de la misma longitud.
• La primera barra no debe ir pegada al eje de las ordenadas.
Ejemplo barras simples:
Registro del estado nutricional de 100 estudiantes de la EUTM mediante IMC.

Realizar gráfico de barras


MÓDULO 3

• Las barras se pueden ordenar de mayor a menor frecuencia o al revés, excepto si la variable
es Cualitativa, medida en escala Ordinal.

BARRAS PROPORCIONALES
• Se utiliza para representar y comparar diversos atributos en una población o diversas
poblaciones con respecto a un atributo
• Se aplican las mismas normas de diseño de las barras simples.
EJEMPLO:
A los 100 estudiantes de la EUTM que se les realizó el cálculo de IMC también se les consultó si
realizaban algún tipo de actividad física o eran sedentarios. Obteniéndose la siguiente tabla de
datos:

Estado

nutricional mediante cálculo de IMC en estudiantes de EUTM según actividad física,


setiembre 2016:

BARRAS AGRUPADAS
Muestra la relación entre 2 o más hechos en forma diferente a las barras proporcionales.
Ejemplo barras agrupadas:
➔ A los 100 estudiantes de la EUTM que se les realizó el cálculo de IMC también se les
consultó si realizaban algún tipo de actividad física o eran sedentarios.
➔ Obteniéndose la siguiente tabla de datos

Ejemplo gráfico
barras
agrupadas:
MÓDULO 3

b) DIAGRAMA DE SECTORES:
Útiles para representar distribuciones de frecuencias relativas. Los ángulos son proporcionales a las
frecuencias. Se utilizan fundamentalmente para variables cualitativas.
No se recomienda cuando:
• La variable tiene mas de 5 categorías.
• Si alguna de las categorías tiene pocas observaciones.
• De preferencia usar %.
• Cada 1% = 3,6°.
Ejemplo diagrama de sectores:
Registro del estado nutricional de 100 estudiantes de la EUTM mediante IMC

Estado nutricional mediante cálculo de IMC en estudiantes de la EUTM durante setiembre


2016

GRÁFICOS para Variables Cuantitativas


MÓDULO 3

VARIABLES DISCRETAS:
• Diagrama de barras ó bastones
• Diagrama en escalera
VARIABLES CONTINUAS:
• Histograma
• Polígono de frecuencias
• Polígono de frecuencias acumuladas
PARA AMBAS VARIABLES CUANTITATIVAS:
Diagrama de caja y bigote (box and Diagrama de caja y bigote (box and whisker plot)

Variables Discretas : Diagrama de barras o bastones


• El gráfico de barras, como su nombre lo indica, son barras del ancho que se desee, y de
altura, la frecuencia absoluta o relativa.
• En el eje de las abscisas (eje “X”), se representa los valores unitarios o clases.
• En el eje de las ordenadas, o eje “Y”, se representa la frecuencia del número de
observaciones de cada una de las clases, es decir, se coloca la frecuencia absoluta o relativa
correspondiente de las clases representadas.
Ejemplo diagrama de bastones variable discreta:
Se desea estudiar el numero de cuentas bancarias que poseen los senadores fuera del Uruguay.

xx
MÓDULO 3

Variable Discreta : Diagrama en Escalera


• Es el gráfico que representa la distribución de frecuencias acumuladas para variables
discretas.
• Su construcción se realiza a partir de un eje de coordenadas, sobre el cual se trazan líneas
horizontales para cada uno de los valores de la variable, cada una de estas líneas tendrá
como altura la frecuencia acumulada hasta el valor el cual representan
• Al finalizar se obtendrá un conjunto de líneas horizontales cada vez a mayor altura
apreciándose la típica imagen en escalera que da el nombre a este gráfico
Ejemplo: Diagrama en escalera
Variable: Consultas previas en pacientes con anemia

Variables Continuas : Histograma


MÓDULO 3

• El histograma es un diagrama de barras pegadas, en el que el área de cada barra es


proporcional a la cantidad de observaciones (frecuencia de la clase).
• El área total de este gráfico es igual a 1 o es lo mismo decir al 100%
• Formado por una serie de rectángulos unidos entre si para mostrar la continuidad de la
variable.
• Es conveniente usar amplitud de intervalos (h) iguales.
• Eje de abscisas: valores de la variables, con sus intervalos de clase.
• Eje de ordenadas: frecuencia absoluta, relativa simple o porcentual.
• Es necesario agrupar los datos en clases (intervalos)
Ejemplo – datos para la confección de un histograma
Presión arterial sistólica de 40 estudiantes del curso de metodología científica en el ingreso 2018
DATOS:110; 110; 115; 115; 118; 120; 120; 120; 120; 122; 123;124; 124; 125; 125;125; 125; 127;
127; 128; 129; 130;130; 130;130; 130; 133; 133; 137; 137; 138; 138; 139; 139; 139; 140; 140; 141;
145;150
PROCEDIMIENTO:

Tabla de Datos:
MÓDULO 3

Histograma de PAS en 40 estudiantes del curso de MC en el ingreso 2018

Diferencia entre Gráfico de Barras e Histograma:


GRÁFICO DE BARRAS HISTOGRAMA
Para variables cualitativas Para variables cuantitativas
Barras Rectángulos
Separadas entre sí Unidos entre sí
Fenómeno representado por la altura de la Fenómeno representado por el área del
barra rectángulo

Variables Continuas : Polígono de Frecuencias


• Gráfico de líneas
• Ventaja frente al histograma: se pueden comparar más de una distribución de frecuencias.
• En un mismo par de ejes se pueden graficar más de un polígono.
• Para construir este gráfico se puede usar en el eje de las ordenadas: frecuencia absoluta o
relativa simple, así como la porcentual.

CONSTRUCCIÓN DE UN POLÍGONO DE FRECUENCIAS SIMPLES:


1. Se destacan las Marcas de Clase (punto medio de cada intervalo). Para luego marcar puntos
en las intersecciones de las marcas de clase con sus correspondientes frecuencias.
2. Se unen entre sí estos puntos por medio de líneas rectas
3. Cerrar el polígono siempre al eje de las x en intervalos teóricos
MÓDULO 3

Tabla de Frecuencias:

Polígono
de

Frecuencias de PAS en 40 estudiantes del curso de MC en el ingreso 2018:

Dos Polígonos de Frecuencias en un mismo cuadrante de forma comparativa


MÓDULO 3

NIVEL DE PROTECCIÓN DE ANTICUERPOS PARA FIEBRE SEGÚN EDAD DE NIÑOS EN


PARAGUAY 1999.

No confundir estos gráficos. Un error muy frecuente es construirlos superpuestos:


MÓDULO 3

Variables Continuas : Polígono de Frecuencias Acumuladas u Ojiva


• Utilidad: análisis de información de frecuencias acumuladas
• N° de observaciones o fracción de las mismas que se encuentra en o por debajo de
determinado valor de la variable

CONSTRUCCIÓN DEL POLÍGONO DE FRECUENCIAS ACUMULADAS:


1. Eje de abscisas: limite superior de cada intervalo.
2. Eje de ordenadas: frecuencias relativas acumuladas (es lo más conveniente)
3. En el límite superior de cada intervalo se marca un punto que tiene como altura la Fr hasta
ese intervalo.
4. Se unen estos puntos entre sí por medio de líneas rectas.

Polígono de Frecuencias Acumuladas de PAS en 40 estudiantes del curso de MC en el ingreso


2018:

OTRAS UTILIDADES DEL POLÍGONO:


• Comparación de distribuciones
• Localización de la mediana
• Hallar medidas de posición (percentiles, deciles y cuartiles)
• Se puede obtener valiosa información para el análisis de datos

Datos necesarios para la realización de un diagrama de caja:


MÓDULO 3

CONSTRUCCIÓN DEL BOX PLOT:

Ejemplo - Resultado de 60 parciales de Metodología Científica del año 2017:


MÓDULO 3

INTERPRETACIÓN:
• RECORRIDO INTERCUARTILICO: Q3-Q1 es el largo de la caja.
• La comparación visual del largo de los bigotes permite tener idea del sesgo: si una es más
larga hacia ahí estará el sesgo.

Interpretación Outliers o Valores Atípicos:


Q3 – Q1= 80-55 = 25 = IQ
Valores extremos:
Q1 – 1,5 X IQ= 55 – (1,5 x 25) = 17,5
Q3 + 1,5 X IQ= 80 + (1,5 x 25) = 117,5
MÓDULO 3

Los valores fuera del límite de las líneas se consideran OUTLIERS (valores atípicos),
con las siguientes explicaciones:
• Error de medida
• Esa medida pertenece a una población diferente del resto de la muestra
• Es correcta, pertenece a la población y representa un evento raro. Explicación que es
aceptada cuando se rechazan las otras 2.

Interpretación del Box-Plot:


• Sesgo: tendencia de los datos de concentrase hacia valores extremos.
• Si el lado superior de la Caja está mas alejado de la Mediana que el inferior decimos que el
Sesgo es Positivo.
• Si el lado Inferior de la Caja está más alejado de la Mediana, el Sesgo es Negativo.

Comparación de notas de 172 estudiantes de la EUTM en los tres parciales del año 2017:

También podría gustarte