Está en la página 1de 169

UNIVERSIDAD DE GUAYAQUIL

SEMANA 1

Bioestadística
FUNDAMENTOS DE BIOESTADÍSTICA
Definiciones e Ideas Básicas

Ing. Freddy Burgos Robalino 1


Estadística

• La estadística deriva su nombre


del hecho de haber sido aplicada
en primer lugar a la recolecciòn de
datos que permitieran la
administración de los estados, con
propósitos militares e impositivos.

Ing. Freddy Burgos Robalino 2


Estadística
• La estadística es una ciencia y una
rama de las matemáticas a través
de la cual se recolecta, analiza,
describe y estudia una serie de
datos a fin de establecer
comparaciones o variabilidades que
permitan comprender un fenómeno
en particular.
• La estadística se vale, en gran
medida, de la observación para la
recolección de datos que
posteriormente serán analizados y
comparados a fin de obtener un
resultado.

Ing. Freddy Burgos Robalino 3


Estadística
• La Estadística estudia los métodos y procedimientos para
recoger, clasificar, resumir, hallar regularidades y analizar los
datos, siempre y cuando la variabilidad e incertidumbre sean
una causa intrínseca de los mismos; así como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la
toma de decisiones y en su caso formular predicciones.

Ing. Freddy Burgos Robalino 4


Transversalidad de la
Estadística
• Una de las características fundamentales de la estadística es
su transversalidad. Su metodología es aplicable al estudio de
diversas disciplinas tales como: biología, física, economía,
sociología, etc.
• La estadística ayuda a obtener conclusiones relevantes para el
estudio de todo tipo de agentes como: humanos, animales,
plantas, etc.

Ing. Freddy Burgos Robalino 5


Ramas de la Estadística

Estadística Estadística
descriptiva inferencial

Se refiere a los métodos de


recolección,organización, resumen y Se trata de un paso más allá de la mera
presentación de un conjunto de descripción.
datos. Se refiere a los métodos utilizados para
Se trata principalmente de describir poder hacer predicciones,
las características fundamentales de generalizaciones y obtener conclusiones
los datos y para ellos se suelen a partir de los datos analizados teniendo
utilizar indicadores, gráficos y en cuenta el grado de incertidumbre
tablas. existente.

Ing. Freddy Burgos Robalino 6


Diseño de Experimentos
• ¿Qué es un experimento?
• Es el cambio en las condiciones de operación de
un sistema o proceso, que se hace con el
objetivo de medir el efecto del cambio en una o
varias variables del producto. Ello nos permite
aumentar el conocimiento acerca del sistema o
del proceso.
• ¿Qué es un diseño de experimento?
• Es la planificación de un conjunto de pruebas
experimentales, de forma que los datos
generados puedan analizarse estadísticamente
para obtener conclusiones válidas y objetivas
acerca del problema establecido.
• Diseño de experimentos (DOE, Design of
Experiments) es el estudio simultáneo de varias
variables del proceso. Combinando varias
variables en un estudio en vez de estudiarlas por
separado.

Ing. Freddy Burgos Robalino 7


Razones para realizar un experimento

Determinar las principales causas de la variación en una


respuesta medida.

Para encontrar las condiciones que dan lugar a un máximo


o mínimo de respuesta

Ing. Freddy Burgos Robalino 8


Razones para realizar un experimento

Para comparar las respuestas logradas con diferentes


ajustes de variables controlables.

Para obtener un modelo matemático que permita predecir


respuestas futuras.

Ing. Freddy Burgos Robalino 9


Estadística Descriptiva
• La estadística descriptiva es una disciplina que se encarga de recoger,
almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos
sobre el conjunto de datos.
• La estadística descriptiva es la rama de las Matemáticas que recolecta,
presenta y caracteriza un conjunto de datos (por ejemplo, edad de una
población, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc.) con el fin de describir apropiadamente las diversas
características de ese conjunto.
La estadística descriptiva proporciona los métodos
para recabar información acerca de una determinada
población que se desea conocer o investigar con fines
específicos, entonces es importante obtener muestras
adecuadas que permitan inferir el comportamiento de
dicha población Ing. Freddy Burgos Robalino 10
Metodología

Selección y determinación de la muestra.

Obtención de los datos.

Clasificación y organización de los datos.

Análisis descriptivo de los datos.

Representación gráfica de los datos.

Contraste de hipótesis, si procede.

Conclusiones

Ing. Freddy Burgos Robalino 11


Tablas y gráficos en la Estadística Descriptiva

Histogramas

Gráficos de Barras

Gráficos de Sectores

Tablas de probabilidad

Tablas bidimensionales

Gráficos de cajas

Ing. Freddy Burgos Robalino 12


Inferencia Estadística
• La inferencia estadística es el
conjunto de métodos que
permiten inducir, a través de una
muestra estadística, el
comportamiento de una
determinada población.
• La inferencia estadística, estudia
entonces como, a través de la
aplicación de dichos métodos
sobre los datos de una muestra, se
pueden extraer conclusiones sobre
los parámetros de la población de
datos. De la misma manera
estudia también el grado de
fiabilidad de los resultados
extraídos del estudio.
Ing. Freddy Burgos Robalino 13
Para entender el concepto es necesario
conocer:

Inferencia Población Muestra estadística

Extraer juicios o
conclusiones a partir de Una población de datos, es
ciertos supuestos, sean el conjunto total de datos Una muestra es una parte de la
estos generales o que existen sobre un población de datos.
particulares. variable.

Ing. Freddy Burgos Robalino 14


Bioestadística
• La bioestadística es una disciplina científica que se encarga de
la aplicación del análisis estadístico a diferentes cuestiones vinculadas
a la biología, a las ciencias de la naturaleza, entre las que se
encuentran todas las ciencias de la salud. Puede decirse que la
bioestadística es un área o una especialización de la estadística, la
ciencia dedicada al estudio cuantitativo de todo tipo de variables.

• La Bioestadística envuelve el desarrollo y aplicación de técnicas


estadísticas a la investigación en campos relacionados a la salud
incluyendo medicina, epidemiología, salud pública y también en áreas de
estudios ambientales, investigación agrícola y biología.

Ing. Freddy Burgos Robalino 15


Componente práctico
de la Bioestadística
Siendo una rama de la estadística, la
Bioestadística abarca diferentes aspectos
relacionados con el diseño de
experimentos, la recogida de datos, y el
análisis e interpretación de los mismos.
En la fase de diseño de una investigación,
la Bioestadística juega un papel
importante a la hora de determinar el
número de sujetos u observaciones que se
deben incluir en el estudio, cómo van a
seleccionarse los participantes y, si
procede, la forma en la que estos deben
ser asignados a los diferentes tratamientos
o condiciones que van a investigarse.
La Bioestadística proporciona las
herramientas de análisis necesarias para
describir y resumir los datos obtenidos y
representarlos gráficamente.
Ing. Freddy Burgos Robalino 16
Componente teórico
de la Bioestadística
La Bioestadística tiene además un
componente teórico. En los últimos años
se ha producido un gran auge de la
investigación en Bioestadística, mediante
el desarrollo de nuevos métodos de
análisis específicamente orientados a la
resolución de problemas prácticos
relacionados con las ciencias de la vida.

Esto ha contribuido a mejorar la capacidad


de extraer inferencias válidas a partir de
los datos observados y avanzar así en una
investigación de calidad en estos campos.

Ing. Freddy Burgos Robalino 17


Aplicaciones de la Bioestadística
• El campo de aplicación de la Bioestadística es muy extenso. Los
tratamientos médicos actuales se seleccionan en base a los resultados de
ensayos clínicos que son diseñados y analizados de acuerdo con
principios de la Bioestadística.
• En el campo de la medicina, el análisis bioestadístico de estudios
observacionales puede también ayudar a identificar factores de riesgo
relacionados con el desarrollo de diferentes enfermedades, o a
determinar la validez y fiabilidad de las pruebas utilizadas para el
diagnóstico de diversas patologías.
• La Bioestadística también se utiliza en la investigación de riesgos
medioambientales, y ha sido empleada en el campo de la agricultura
para mejorar los cultivos y la cría de animales.
Ing. Freddy Burgos Robalino 18
Población
• Es el conjunto de todos los elementos o individuos cuyas
propiedades o características (variables de estudio) se
van a estudiar

• Una población es un conjunto de todos los elementos que


estamos estudiando, acerca de los cuales intentamos
sacar conclusiones". Levin & Rubin (1996).

• "Una población es un conjunto de elementos que


presentan una característica común". Cadenas (1974).

Ing. Freddy Burgos Robalino 19


Tipos de Población

POBLACIÓN POBLACIÓN POBLACIÓN


DIANA FINITA INFINITA
Esta definida Cuando se Cuando no se
por los conoce el conoce el
objetivos de tamaño de la tamaño de la
estudio población población

Ing. Freddy Burgos Robalino


Muestra
• Es un subconjunto de casos o individuos de la población de
estudio; es el grupo de personas que realmente se estudiaran.
• Debe ser representativa de la población y para lograr esto se
tiene que tener bien definido los criterios de inclusión y
exclusión así como la realización de una buena técnica de
muestreo.
• Una muestra representativa indica que reúne
aproximadamente las características de la población que son
importantes para la investigación.

Ing. Freddy Burgos Robalino 21


Porque y cuando calcular el tamaño de la
Muestra
¿Por qué calcular el tamaño de la ¿Cuándo calcular el tamaño de la
muestra? muestra?
• Una muestra puede • Cuando no se puede estudiar
estudiarse con mayor rapidez toda la población
que una población. • Cuando se quieren estudiar
• El estudio de una muestra es dos o mas grupos y
menos costoso. establecer diferencias.
• Toma menos tiempo el • Cuando se quieren estimar
estudio a realizar. parámetros, prevalencia,
• Los resultados son mas promedio, porcentajes y
precisos. tasas.

Ing. Freddy Burgos Robalino


Muestreo
• El muestreo es el proceso
mediante el cual el investigador
podrá seleccionar a los pacientes
o a los sujetos de estudio a partir
de la muestra calculada
previamente.
• Es la técnica empleada para la
selección de elementos (unidades
de análisis o de investigación)
representativos de la población de
estudio que conformarán una
muestra y que será utilizada para
hacer inferencias (generalización)
a la población de estudio.
Ing. Freddy Burgos Robalino
Tipos de Muestreo

• Probabilístico (Aleatorio)
• No probabilístico

Ing. Freddy Burgos Robalino


Muestreo Probabilístico
• Su principal característica es que todos los sujetos de
la población de estudio tienen la misma probabilidad
de ser seleccionados para formar parte de la muestra.

Muestreo No Probabilístico
• En este tipo de muestreo hay uno o mas criterios de
selección por parte del investigador, para que uno o
mas sujetos pueda formar parte del estudio. No todos
los sujetos tienen la misma posibilidad para ser
elegidos.

Ing. Freddy Burgos Robalino


Variables
• El término variable refiere a cosas que son
susceptibles de ser modificadas
(de variar), de cambiar en función de algún
motivo determinado o indeterminado.
Fuente: https://concepto.de/variable/#ixzz6RN4eKBMB

• En estadística, es una característica o


cualidad de un individuo que está
propensa a adquirir diferentes
valores. (Estos valores, se caracterizan por
poder medirse).
• Por ejemplo, el color de pelo, las notas de
un examen, el sexo o la estatura de una
persona, son variables estadísticas

Ing. Freddy Burgos Robalino 26


Variables estadísticas
• Una variable estadística es el conjunto de valores que puede
tomar cierta característica de la población sobre la que se
realiza el estudio estadístico y sobre la que es posible su
medición.

• Las variables estadísticas son fundamentales para lograr


estudiar eventos y circunstancias que tienen a oscilar en
diferentes resultados o soluciones

Ing. Freddy Burgos Robalino 27


Clasificación de las Variables Estadísticas
• Cualitativas: Serán
cualitativas aquellas que
expresen características o
cualidades diferentes;
• Cuantitativas: Serán
cuantitativas cuando
expresen argumentos
numéricos
Fuente: https://concepto.de/variable/#ixzz6RNUaF5GQ
• Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC

Ing. Freddy Burgos Robalino 28


UNIVERSIDAD DE GUAYAQUIL SEMANA 2

Bioestadística
FUNDAMENTOS DE BIOESTADÍSTICA
Definiciones e Ideas Básicas

Ing. Freddy Burgos Robalino 29


Variables

• El término variable refiere a cosas que son susceptibles


de ser modificadas (de variar), de cambiar en función de
algún motivo determinado o indeterminado.
Fuente: https://concepto.de/variable/#ixzz6RN4eKBMB
• En estadística, es una característica o cualidad de un
individuo que está propensa a adquirir diferentes
valores. (Estos valores, se caracterizan por poder
medirse).
• Por ejemplo, el color de pelo, las notas de un examen, el
sexo o la estatura de una persona, son variables
estadísticas
Ing. Freddy Burgos Robalino 30
Variables estadísticas

• Una variable estadística es el conjunto de valores que puede tomar


cierta característica de la población sobre la que se realiza el estudio
estadístico y sobre la que es posible su medición.

• Las variables estadísticas son fundamentales para lograr estudiar


eventos y circunstancias que tienen a oscilar en diferentes resultados
o soluciones

Ing. Freddy Burgos Robalino 31


Clasificación de las Variables Estadísticas

• Cualitativas: Serán cualitativas


aquellas que expresen
características o cualidades
diferentes;
• Cuantitativas: Serán
cuantitativas cuando expresen
argumentos numéricos
• Fuente: https://concepto.de/vari
Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
able/#ixzz6RNUaF5GQ

Ing. Freddy Burgos Robalino 32


Variables Cualitativas

• Son aquellas que expresan características, cualidades o atributos, y no


pueden ser medidas con números. Pueden ser ordinales o nominales.
• Ejemplos de Variables cualitativas:
• Red social preferida por los millenials.
• El color de ojos de los actores de una película.
• Posición en la que llega un corredor en la prueba de 100 metros
planos.
• El curso favorito de tus amigos.
• Series de Netflix más vistas en tu país.
• La tienda de ropa preferida por los habitantes de una ciudad.
Ing. Freddy Burgos Robalino 33
Variables Cuantitativas

• Son aquellas que se expresan mediante un número, por tanto, se puede


realizar operaciones aritméticas con ellas. Puede ser discretas o continuas.
• Ejemplos de Variables cuantitativas:
• El peso de las vacas de una granja.
• Estatura de los habitantes de una ciudad.
• El número de hijos en una familia.
• Número de clientes atendidos en una tienda.
• Velocidad a la que avanza un tren.
• Número de personas que visitan el campus virtual de la UG en un día.
• Cantidad de goles anotados en un partido de fútbol.

Ing. Freddy Burgos Robalino 34


Método Descriptivo

• El método descriptivo es uno de los métodos cualitativos que se


utilizan en investigaciones que tienen el objetivo de evaluar algunas
características de una población o situación particular.

• En la investigación descriptiva, el objetivo es describir el


comportamiento o estado de un número de variables. El método
descriptivo orienta al investigador en el método científico.

Ing. Freddy Burgos Robalino 35


Características

• Suele atender a un método cualitativo


• Es un primer abordaje al objeto que
se esta estudiando y funciona como
un catalizador de nuevas
investigaciones
• Hace posible la consecución de
muchos datos sobre el objeto que se
estudia
• Implica una observación atenta y hay
un registro fiel de lo que se observa
• No implica generalizaciones ni
proyecciones

Ing. Freddy Burgos Robalino 36


Escalas de Medición en Estadística

• Escalas de medición: son una


sucesión de medidas que permiten
organizar datos en orden
jerárquico.
• Las escalas de medición, pueden
ser clasificadas de acuerdo a una
degradación de las características
de las variables.
• Las escalas de medición ofrecen
información sobre la clasificación
de variables discretas o continuas,
también más conocidas como
escalas grandes o pequeñas.
Ing. Freddy Burgos Robalino 37
Escalas de Medición en Estadística

• La medición es un proceso inherente y consustancial a toda investigación,


sea esta cualitativa y cuantitativa.
• Se mide principalmente variables considerando tres elementos básicos:
El instrumento de medición

La escala de medición

El sistema de unidades de medición

• La validez, consistencia y confiabilidad de los datos medidos dependen, en


buena parte, de la escala de medición que se adopte.
Ing. Freddy Burgos Robalino 38
Nivel de Escala o medición

• La medición puede definirse como la asignación de numerales a


objetos o sucesos siguiendo ciertas reglas, Stevens (1946). El autor
de esta definición desarrolló un método para clasificar los diferentes
resultados de las mediciones en lo que llamó niveles de medición.

• Un nivel de medición es la escala que representa una jerarquía de


precisión dentro de la cual una variable puede evaluarse, en función
de las características que rigen las escalas.

Ing. Freddy Burgos Robalino 39


Escalas de Medición

Variables Cualitativas o Variables Cuantitativas o


Categóricas Numéricas

Ordinal Nominal Intervalo Razón

Los datos pueden usarse para Los datos son etiquetas o Los datos tienen las propiedades de Posee un cero absoluto (es
jerarquizar u ordenar las categorías que se usan para los datos ordinales, pero a su vez la indispensable que exista) y
observaciones definir un atributo de un separación entre las variables tiene determina la igualdad de
elemento sentido. relaciones o proporciones.
El valor cero no indica la ausencia de
la propiedad

Ing. Freddy Burgos Robalino 40


Por ejemplo, la variable estatura puede analizarse en
diferentes niveles de medida
• Un conjunto de personas pueden clasificarse en altos y bajos, A y B,
creando dos grupos. Para ello no es necesario recurrir a ninguna
cinta métrica, simplemente basta observar quienes destacan sobre
los demás (el grupo de altos) y el resto completarán el grupo de
bajos. El nivel de medición que corresponde a esta forma de medir
es nominal.

• También podrían alinearse a los sujetos y ordenarlos según


su altura, el primero sería el más alto y el último el más bajo,
de forma que cada persona tuviese delante a uno más alto y
detrás a uno más bajo. El nivel de medición en este caso es
ordinal. Hasta el momento no es posible decir cuánto es una
persona más alta que otra.

Ing. Freddy Burgos Robalino


Por ejemplo, la variable estatura puede analizarse en
diferentes niveles de medida
• A través del número de personas que hay entre dos sujetos, por ejemplo,
Andrea y Juan en la fila ordenada anteriormente. En este caso además
del orden se conoce la magnitud de la altura. Si en lugar de utilizar el
número de personas se recurre a una regla se puede ofrecer otra
medida de la altura. Esta forma de medir es propia del nivel de
intervalos, que permite saber la magnitud de los elementos
comparando unos con otros.

• La cuarta posibilidad es utilizar un metro que sitúa el cero en


el mismo suelo y, por lo tanto, la altura se define en función
de la distancia desde la cabeza al suelo (valor cero absoluto
donde se sitúa la ausencia de altura). Una característica de
esta clasificación es que las propiedades de una escala se
cumplen en el nivel superior.

Ing. Freddy Burgos Robalino


Ejemplos:
Escala Nominal

• El sexo de una persona es un Sexo:


dato nominal no numérico. Masculino ( 1 )
Femenino ( 2 )
• El numero de seguro de salud de
una persona es un dato nominal
numérico.
Tipos de Pacientes:
Consulta externa (40)
Emergencia (15)
Internados (60)

Ing. Freddy Burgos Robalino 43


Ejemplos:
Escala Ordinal

Estado de Salud
• El estado de salud de un
5
paciente son datos ordinales no Muy Saludable

4
numéricos. Medianamente saludable

Saludable
X 3

Poco Saludable 2

No Saludable 1

Ing. Freddy Burgos Robalino 44


Ejemplos:
Escala Intervalo
• La temperatura (en grados centígrados)
media de una ciudad.
• En esta escala, los número mayores
corresponden a temperaturas mayores.
Es decir, el orden importa, pero a la vez
la diferencias entre las temperaturas
importa.

Ing. Freddy Burgos Robalino 45


Ejemplos:
Escala Razón
• Variables como la edad, la
distancia, la altura, el peso y
el tiempo se miden con una
escala de razón.

Ing. Freddy Burgos Robalino 46


Datos Cualitativos

• Datos que se expresan en forma de palabras o


textos que ayudan a comprender ciertas acciones
y actitudes de los encuestados que no son
cuantificables, por lo que su uso es muy
importante para fundamentar cualquier
investigación seria.
• Este tipo de datos tienen como principal
característica que no se pueden medir, ni
expresarse con número, deben ser interpretados.
• Los datos cualitativos son utilizados
principalmente como el primer acercamiento al
problema, ya que nos aporta información acerca
de la existencia de una realidad en la que están
involucrados nuestros participantes.

Ing. Freddy Burgos Robalino 47


Datos Cualitativos: Variables politómicas
• Ejemplo:
• Son aquellos que no se pueden
expresa numéricamente. Médicos según
UCI
Cirugía
Servicios
• Representan una cualidad o atributo Consulta Externa

que clasifica a cada sujeto en una de


varias categorías. Lavado de manos
Medidas de Mascarillas
• Los valores para grupos de aislamiento Uso de guantes
individuos generalmente se tabulan
utilizando tablas de contingencia:

Ing. Freddy Burgos Robalino 48


Datos Cualitativos: Variables dicotómicas
• Son aquellos que no se pueden expresar • Ejemplo:
numéricamente.
Este es el ejemplo más claro (por lo
• Representan una cualidad o atributo Vivo/ Muerto
menos no se conocen muchos casos
de estados intermedios entre la vida
que clasifica a cada sujeto en una de y la muerte).
varias categorías.
Requiere una definición para la
Sano/ Enfermo condición de enfermo.

Ing. Freddy Burgos Robalino 49


Datos Cuantitativos

• El concepto “datos cuantitativos” hace


referencia a la información tangible, la que
es obtenida mediante algún método de
investigación. La manera de cuantificar los
datos obtenidos en nuestro estudio nos
dará la pauta de hacia qué rumbo dirigirse,
de ahí la importancia de su correcto análisis
para poder demostrar si estamos en lo
correcto o no, en la hipótesis planteada.
• Hay dos tipos de datos cuantitativos, que
también se conocen como datos numéricos:
continuo y discreto. Como regla general, los
recuentos son discretos y las mediciones
son continuas.

Ing. Freddy Burgos Robalino 50


Datos Cuantitativos: Datos Continuos

• Se refiere al flujo constante de valores • Ejemplo:


posibles de la variable, estos datos no
se restringen a valores enteros (aunque Medir la altura en metros,
normalmente son reducidos a valores Medir la altura centímetros y hasta dar una
medida en milímetros, es decir, los
de una persona
enteros por aproximación). datos son continuos

• Los datos continuos se miden en lugar


de contarse. Además tienen entre sus Edad Definir una edad en años, meses y
características que pueden dividirse. hasta día

• Son aquellos datos que pueden tomar


cualquier valor (dentro de un rango)
• Los datos continuos pueden tomar un
número infinito de valores y no tiene
categorías naturales.
Ing. Freddy Burgos Robalino 51
Datos Cuantitativos: Datos Discretos

• Ejemplo:
• Los datos discretos tiene un número
finito de categorías naturales. Número de hijos, Son datos discretos, porque se
adultos o mascotas cuentan por números
• Prácticamente hablamos de números en su familia. indivisibles: no se puede tener
enteros, por valores completos. 2,5 hijos, o 1,3 mascotas.

• Se cuentan, no se miden.

Cantidad de Son datos discretos, porque se


empleados que cuentan por números
trabajan en una indivisibles: no se puede tener
tienda. 20,5 empleados.

Ing. Freddy Burgos Robalino 52


SEMANA 3
UNIVERSIDAD DE GUAYAQUIL

Bioestadística
DISTRIBUCIONES
Generalidades

FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA


UNIVERSIDAD DE GUAYAQUIL

DISTRIBUCIÓN DE FRECUENCIA
Generalidades
Generalidades
La organización de los datos constituye la primera
etapa de su tratamiento, puesto que facilita los
cálculos posteriores y evita posibles confusiones.
Cuando no existían los computadores, o ni siquiera
calculadoras, era necesario que los datos tuvieran
alguna estructura que permitiera resumirlos y
comprenderlos de una forma más o menos
sencilla.
La organización va a depender del número de
observaciones distintas que se tengan y de las
veces que se repitan cada una de ellas. En base a lo
anterior, se pueden estructurar los datos de
maneras diferentes.
Generalidades…
Las distribuciones de frecuencias son tablas en que
se dispone las modalidades de la variable por filas.
En las columnas se dispone el número de
ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que
contienen los datos
En estadística y por consiguiente en bioestadística,
se le llama distribución de frecuencias a la
agrupación de datos en categorías mutuamente
excluyentes que indican el número de observaciones
en cada categoría. Esto proporciona un valor
añadido a la agrupación de datos.
Recordemos: Variables en Estadística

Variable Discreta
Una variable discreta es aquella que no puede tomar algunos valores dentro
de un mínimo conjunto numerable, quiere decir, no acepta cualquier valor,
únicamente aquellos que pertenecen al conjunto.
Ejemplos: número de empleados de una fábrica; número de hijos;
Variable Continua
Una variable continua es aquella que puede adoptar cualquier valor en el
marco de un intervalo que ya está predeterminado.
Ejemplos: temperaturas registradas en un observatorio; tiempo en recorrer
una distancia en una carrera; contenido de alcohol en un cuba-libre; estatura
Tipos de Frecuencia
Una de los primeros pasos que se realizan en
cualquier estudio estadístico es la tabulación
de resultados, es decir, recoger la información
de la muestra resumida en una tabla en la que
a cada valor de la variable se le asocian
determinados números que representan el
número de veces que ha aparecido, su
proporción con respecto a otros valores de la
variable, etc. Estos números se denominan
frecuencias.
Tipos de Frecuencia…

FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA

Cuantas veces
se repite un
evento ( fi )
Frecuencia Absoluta
La frecuencia absoluta es una medida
estadística que nos da información
acerca de la cantidad de veces que se
repite un suceso al realizar un número
determinado de experimentos
aleatorios. Esta se representa mediante
las letras fi.
La letra f se refiere a la palabra
frecuencia y la letra i se refiere a la
realización i-ésima del experimento
aleatorio. (En otros textos las
encontraran como ni)
Ejemplo de Frecuencia Absoluta (Variable Discreta)
Supongamos que tenemos el número de Xi fi
miembros de una familia y los datos son los 1 1
siguientes: 2 2
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10. 3 1
Xi = Variable aleatoria estadística, número de 4 1
miembros de una familia. 5 4
6 2
N = 20
7 2
fi = Frecuencia absoluta = Número de veces que 8 3
se repite el suceso (en este caso, el número de 9 1
miembros de cada familia). 10 3
∑ 20
Ejemplo de Frecuencia Absoluta (Variable continua)
Supongamos que la altura de 15 personas que se presentan a los
postulantes del cuerpo de policía nacional son las siguientes: Xi fi
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75,
1,77, 1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de [1,70 , 1,80) 5
menor a mayor, pero en este caso dado que la variable es continua
y podría tomar cualquier valor de un espacio continuo infinitesimal,
hay que agrupar las variables por intervalos. [1,80 , 1,90) 4
Por tanto tendremos:
Xi = Variable aleatoria estadística, altura de los postulantes al
cuerpo de policía nacional. [1,90 , 2,00) 3
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso [2,00 , 2,10) 3
(en este caso, las alturas que se encuentran dentro de un
determinado intervalo).
∑ 15
Frecuencia Relativa

La frecuencia relativa es una medida estadística


que se calcula como el cociente de la frecuencia
absoluta de algún valor de la población/muestra
(fi) entre el total de valores que componen la
población/muestra (N)
Para calcular la frecuencia relativa es necesario Donde N = Tamaño de la muestra
antes calcular la frecuencia absoluta. Sin ella no
podríamos obtener la frecuencia relativa. La
frecuencia relativa se representa con las letras hi
y su fórmula de cálculo es la siguiente:
Para calcular la Frecuencia Relativa…
hi = Frecuencia relativa de la observación i-ésima
fi = Frecuencia absoluta de la observación i-ésima
N = Número total de observaciones de la muestra
De la fórmula de cálculo de la frecuencia relativa se desprenden dos conclusiones:
La frecuencia relativa va a estar acotada entre 0 y 1, debido a que la frecuencia de los valores de la
muestra, siempre va a ser menor al tamaño de la muestra.
La suma de todas las frecuencias relativas va a ser 1 si se mide en tanto por 1, o 100 si se mide en tanto
por ciento.
Por consiguiente la frecuencia relativa nos informa acerca de la proporción o el
peso que tiene algún valor u observación en la muestra. Esto la hace de especial
utilidad, dado que a diferencia de la frecuencia absoluta, la frecuencia relativa nos
va a permitir hacer comparaciones entre muestras de tamaños distintos. Esta se
puede expresar como un valor decimal, como fracción o como porcentaje.
Ejemplo de Frecuencia Relativa (Variable Discreta)
Supongamos que tenemos el número de miembros Xi fi hi
de una familia y los datos son los siguientes: 1 1 5%
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.
2 2 10%
Xi = Variable aleatoria estadística, número de 3 1 5%
miembros de una familia. 4 1 5%
N = 20 5 4 20%
fi = Frecuencia absoluta = Número de veces que se 6 2 10%
repite el suceso (en este caso, el número de 7 2 10%
miembros de una familia). 8 3 15%
hi = Frecuencia relativa (proporción que representa 9 1 5%
el valor i-ésimo en la muestra). 10 3 15%
∑ 20 100%
Ejemplo de Frecuencia Relativa (Variable continua)
Supongamos que la altura de 15 personas que se presentan a las oposiciones
del cuerpo de policía nacional son las siguientes:
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77,
1,95, 1,73. Xi fi hi
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a
mayor, pero en este caso dado que la variable es continua y podría tomar [1,70 , 1,80) 5 33%
cualquier valor de un espacio continuo infinitesimal, hay que agrupar las
variables por intervalos. [1,80 , 1,90) 4 27%
Por tanto tendremos:
[1,90 , 2,00) 3 20%
Xi = Variable aleatoria estadística, altura de los opositores al cuerpo de
policía nacional.
[2,00 , 2,10) 3 20%
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este ∑ 15 100%
caso, las alturas que se encuentran dentro de un determinado intervalo).
hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la
muestra)
Ejemplo

Personas Número
Activas Familias
Xi fi fi/N hi
1 16 16/50 32%

2 20 20/50 40%

3 9 9/50 18%

4 5 5/50 10%

Total 50 100%
APLICACIONES INFORMÁTICAS PARA OBTENER LA TABLA DE
FRECUENCIAS

USO DE FÓRMULAS DE USO DE ANÁLISIS DE DATOS


EXCEL
Práctica 1
Práctica 2
UNIVERSIDAD DE GUAYAQUIL SEMANA 4

Bioestadística
DISTRIBUCIONES

Ing. Freddy Burgos Robalino, MDGPT 72


Generalidades

FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA


ACUMULADA ACUMULADA

Ing. Freddy Burgos Robalino, MDGPT 73


DISTRIBUCIÓN DE FRECUENCIA
ACUMULADA
Generalidades

Ing. Freddy Burgos Robalino, MDGPT 74


Tipos de Frecuencia Acumulada

FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
ACUMULADA ACUMULADA

Sumatoria de la
Sumatoria del número proporción que
de veces que se repite representa el valor i-
el suceso (Fi) ésimo en la muestra
(Hi)
Ing. Freddy Burgos Robalino, MDGPT 75
Frecuencia Acumulada

La frecuencia acumulada es el
resultado de sumar
sucesivamente las frecuencias
absolutas o relativas, desde el
menor al mayor de sus valores

Ing. Freddy Burgos Robalino, MDGPT 76


Frecuencia Absoluta Acumulada
La frecuencia absoluta acumulada es el
resultado de ir sumando las frecuencias
absolutas de las observaciones o valores de una
población o muestra. Esta se representa por las
siglas Fi.
Para calcular la frecuencia absoluta acumulada,
hay que calcular primero la frecuencia absoluta
(fi) de la población o muestra. Para ello, los
datos se ordenan de menor a mayor y se
colocan en una tabla.
Una vez hecho esto, la frecuencia absoluta
acumulada se obtiene de ir sumando las
frecuencias absolutas de una clase o grupo de la
muestra con la anterior (primer grupo +
segundo grupo, primer grupo + segundo grupo +
tercer grupo y así sucesivamente hasta llegar a
acumular del primer grupo al último).

Ing. Freddy Burgos Robalino, MDGPT 77


Ejemplo de Frecuencia Absoluta Acumulada
(Variable Discreta)
Supongamos que tenemos el número de Xi fi Fi
miembros de una familia y los datos son los
siguientes: 1 1 1
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 2 2 3 (1+2)
10.
3 1 4 (3+1)
Xi = Variable aleatoria estadística, miembros
de una familia. 4 1 5 (4+1)
N = 20 5 4 9 (5+4)
fi = Frecuencia absoluta = Número de veces 6 2 11 (9+2)
que se repite el suceso (en este caso, los 7 2 13 (11+2)
miembros de la familia).
8 3 16 (13+3)
Fi= Frecuencia absoluta acumulada
(sumatorio del número de veces que se 9 1 17 (16+1)
repite el suceso, en este caso miembros de 10 3 20 (17+3)
una familia)
∑ 20
Ing. Freddy Burgos Robalino, MDGPT 78
Ejemplo de Frecuencia Absoluta Acumulada
(Variable continua)
Supongamos que la altura de 15 personas que se presentan a las
postulaciones del cuerpo de policía nacional son las siguientes: Xi fi Fi
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77,
1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a [1,70 , 1,80) 5 5
mayor, pero en este caso dado que la variable es continua y podría
tomar cualquier valor de un espacio continuo infinitesimal, hay que
agrupar las variables por intervalos.
[1,80 , 1,90) 4 9 (5+4)
Por tanto tenemos:
Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de
policía nacional. [1,90 , 2,00) 3 12 (9+3)
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en
este caso, las alturas que se encuentran dentro de un determinado [2,00 , 2,10) 3 15 (12+3)
intervalo).
Fi = Sumatorio del número de veces que se repite el suceso (en este
caso, las alturas que se encuentran dentro de un determinado ∑ 15
intervalo).

Ing. Freddy Burgos Robalino, MDGPT 79


Frecuencia Relativa Acumulada
La frecuencia relativa acumulada es el resultado
de ir sumando las frecuencias relativas de las
observaciones o valores de una población o
muestra. Esta se representa por las siglas Hi.
Para calcular la frecuencia relativa acumulada,
hay que calcular primero la frecuencia absoluta
(fi) y la frecuencia relativa (hi) de los valores de
la población o muestra
Para ello, los datos se ordenan de menor a
mayor y se colocan en una tabla. Una vez hecho
esto, la frecuencia relativa acumulada se
obtiene de ir sumando las frecuencias relativas
de una clase o grupo de la muestra con la
anterior (primer grupo + segundo grupo, primer
grupo + segundo grupo + tercer grupo y así
sucesivamente hasta llegar a acumular del
primer grupo al último).

Ing. Freddy Burgos Robalino, MDGPT 80


Ejemplo de Frecuencia Relativa Acumulada
(Variable Discreta)
Supongamos que tenemos el número de Xi fi hi Hi
miembros de una familia y los datos son los
siguientes : 1 1 5% 5%
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.
2 2 10% 15%(5+10)
Xi = Variable aleatoria estadística, miembros de
una familia. 3 1 5% 20%(15+5)
N = 20 4 1 5% 25%(20+5)
fi = Frecuencia absoluta = Número de veces que se 5 4 20% 45%(25+20)
repite el suceso (en este caso, miembros de una 6 2 10% 55%(45+10)
familia).
7 2 10% 65%(55+10)
hi = Frecuencia relativa (proporción que
representa el valor i-ésimo en la muestra). 8 3 15% 80%(65+15)
Hi = Frecuencia relativa acumulada (Sumatorio de 9 1 5% 85%(80+5)
la proporción que representa el valor i-ésimo en la
muestra) 10 3 15% 100%(85+15)
∑ 20 100%
Ing. Freddy Burgos Robalino, MDGPT 81
Ejemplo de Frecuencia Relativa Acumulada
(Variable continua)
Supongamos que la altura de 15 personas que se presentan a las
postulaciones del cuerpo de policía nacional son las siguientes: f
Xi hi Hi
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77, i
1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a [1,70 , 1,80) 5 33% 33%
mayor, pero en este caso dado que la variable es continua y podría tomar
cualquier valor de un espacio continuo infinitesimal, hay que agrupar las
variables por intervalos.
Por tanto tenemos: [1,80 , 1,90) 4 27% 60%(33+27)
Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de
policía nacional.
N = 15 [1,90 , 2,00) 3 20% 80%(50+20)
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este
caso, las alturas que se encuentran dentro de un determinado intervalo).
hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la [2,00 , 2,10) 3 20% 100%(80+20)
muestra).
Hi = Sumatorio de la proporción que representa el valor i-ésimo en la ∑ 15 100%
muestra.

Ing. Freddy Burgos Robalino, MDGPT 82


Ejemplo:

Personas Número
Activas Familias
Xi fi fi/N hi Fi Fi/N Hi
1 16 16/50 32% 16 16/50 32%

2 20 20/50 40% 36 36/50 72%

3 9 9/50 18% 45 45/50 90%

4 5 5/50 10% 50 50/50 100%

Total 50 100%

Ing. Freddy Burgos Robalino, MDGPT 83


Distribución de frecuencias agrupadas

O tabla con datos agrupados se


emplea si las variables toman un
número grande de valores o la
variable es continua. Se agrupan
los valores en intervalos que
tengan la misma amplitud
denominados clases. A cada clase
se le asigna su frecuencia
correspondiente.

Ing. Freddy Burgos Robalino, MDGPT 84


Distribución de frecuencias agrupadas…

No existen normas establecidas para


determinar cuándo es apropiado utilizar
datos agrupados o datos no agrupados;
se sugiere cuando el número total datos
(N) es igual o superior de 50 e y además
el rango o recorrido de la serie de datos
es mayor de 20, entonces se utilizará la
distribución de frecuencias para datos
agrupados, también se utilizara este
tipo de distribución cuando se requiera
elaborar gráficos lineales como el
histograma, el polígono de frecuencia o
la ojiva.

Ing. Freddy Burgos Robalino, MDGPT 85


Distribución de frecuencias agrupadas…

La razón fundamental para utilizar


la distribución de frecuencias de
clases es proporcionar mejor
comunicación acerca del patrón
establecido en los datos y facilitar
la manipulación de los mismos.
Los datos se agrupan en clases
con el fin de sintetizar, resumir,
considerar o hacer que la
información obtenida de una
investigación sea manejable con
mayor facilidad.

Ing. Freddy Burgos Robalino, MDGPT 86


Clase y Determinación del número de clases.

Concepto: Es el número de subconjuntos en que se han agrupado los datos.


Cada clase se puede denominar mediante una letra, un número o alguna
característica del subconjunto.
El número de clases en que se agrupan los datos se determina con la raíz
cuadrada del número de datos cuando este es menor de 200.
Número de clases = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Para muestras con 200 o más datos el número de clases se determina con la
raíz cúbica del número de datos.
3
Número de clases = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Límites de la clase. Cada clase está delimitada por el límite inferior de la clase
y el límite superior de la clase.

Ing. Freddy Burgos Robalino, MDGPT 87


Fórmula de Sturges

Este es otra forma para calcular el


intervalo de la clase:
La fórmula de Sturges, determina
un número aproximado de
intervalos "k".
Aunque ésta no siempre resulta
muy adecuada, es una relación
muy utilizada: k = 1 + 3.322 log
(n).
Donde: n es el número de datos a
condensar en la tabla.

Ing. Freddy Burgos Robalino, MDGPT 88


Intervalo de clase y Cómo calcular el intervalo de clase

Concepto: Es un conjunto de elementos que forman a una clase,


conteniendo un límite inferior y un límite superior.
Como calcular el intervalo de la clase:
Calcular el rango de datos. El rango es la diferencia entre los puntos de datos
más altos y más bajos.
Determinar el número de clases del tamaño de la muestra. Como regla
general, se utilizan de cinco a siete clases para un tamaño de la muestra de
hasta 50, de ocho a 10 clases para un tamaño de la muestra entre 50 y 100,
10 a 15 clases para un tamaño de la muestra entre 100 y 250 y de 15 a 20
clases para un tamaño de la muestra mayor a 250.
Calcula el intervalo de clase utilizando la siguiente fórmula:
intervalo de clase = rango/número de clases.
Ing. Freddy Burgos Robalino, MDGPT 89
Tamaño de clase y Cálculo del tamaño de clase.

Concepto: Es la diferencia entre dos límites inferiores o superiores de


clases sucesivas.
Para determinar el tamaño de clase es necesario conocer el rango de la
muestra, que se obtiene con la diferencia entre el dato mayor y el dato
menor de la muestra y se representa con la letra R.
R = dato mayor - dato menor
El tamaño de clase se obtiene al dividir el rango entre el número de
clases, y se representa con la letra c.
Tamaño de clase = rango /número de clases
c= R/ 𝑛𝑢𝑚𝑒𝑟𝑜𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Ing. Freddy Burgos Robalino, MDGPT 90
Amplitud y Marca de Clase

La amplitud de la clase es la diferencia entre el límite superior e inferior


de la clase (tamaño de la clase)
La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros.

Ing. Freddy Burgos Robalino, MDGPT 91


Elaboración de intervalos.

El tamaño de clase indica el número de datos que conforman a cada


intervalo, considerando los valores extremos llamados límites. En cada
intervalo aparece un límite inferior (LI) y un límite superior (LS).
Cada intervalo se forma sumando al límite inferior (LI) un número
menos que el tamaño de clase para obtener el límite superior (LS)

Ing. Freddy Burgos Robalino, MDGPT 92


APLICACIONES INFORMÁTICAS PARA
OBTENER LA TABLA DE FRECUENCIAS

USO DE FÓRMULAS DE USO DE ANÁLISIS DE


EXCEL DATOS

Ing. Freddy Burgos Robalino, MDGPT 93


SEMANA 5

Bioestadística
GRÁFICOS

Ing. Freddy Burgos Robalino, MDGPT


¿Qué es un gráfico?

Generalidades:
Un grafico es la representación de datos, generalmente numéricos ,
mediante líneas, superficies o símbolos, para ver la relación que esos datos
guardan entre si y facilitar su interpretación. La utilización de gráficos hace
mas sencilla e inmediata la interpretación de los datos.
La calidad de un gráfico estadístico consiste en comunicar ideas complejas
con precisión, claridad y eficiencia, de tal manera que:
• Induzca a pensar en el contenido más que en la apariencia.
• No distorsione la información proporcionada por los datos.
• Presente mucha información (números) en poco espacio.
• Favorezca la comparación de diferentes grupos de datos o de relaciones
entre los mismos (por ejemplo una secuencia temporal)

Ing. Freddy Burgos Robalino, MDGPT


Elementos de un gráfico

Series de datos: Son los puntos


de datos relacionados entre sí
trazados en un gráfico. Cada
Área del gráfico: Área que se serie de datos tiene un color
Título del gráfico: Texto
encuentra definida por el exclusivo. Un gráfico puede
descriptivo del gráfico que se
marco del gráfico y que incluye tener una o más series de
coloca en la parte superior.
todas sus partes. datos a excepción de los
gráficos circulares que
solamente pueden tener una
serie de datos.

Ejes: Línea que sirve como


referencia de medida. El eje Y
Líneas de división: Son líneas
es conocido como el eje Título de eje: Texto descriptivo
opcionales que extienden los Leyenda: Recuadro que ayuda
vertical y generalmente que se alinea
valores de los ejes de manera a identificar los colores
contiene datos. El eje X es automáticamente al eje
que faciliten su lectura e asignados a las series de datos.
conocido también como el eje correspondiente.
interpretación.
horizontal y suele contener las
categorías del gráfico.

Ing. Freddy Burgos Robalino, MDGPT


Elementos de un gráfico

Ing. Freddy Burgos Robalino, MDGPT


Elementos de un gráfico

Ing. Freddy Burgos Robalino, MDGPT


Representaciones gráficas de datos cualitativos

En cuanto a la representación gráfica de las variables cualitativas


destacamos dos tipos de gráfico por ser los que se utilizan con mayor
frecuencia.
• Diagrama de sectores.
• Gráfico de barras.

Ing. Freddy Burgos Robalino, MDGPT


Generalidades

1.4.1 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5


Gráfico de Gráfico de Histograma Polígonos Gráfico de Diagrama
Sectores barras. s tallo y de caja.
hojas.

Ing. Freddy Burgos Robalino, MDGPT 100


DIAGRAMA DE SECTORES

• El diagrama de sectores, se utiliza para visualizar de forma sencilla


las frecuencias relativas de las variables.
• En los gráficos de sectores se divide una figura, habitualmente de
forma circular, de forma que el área correspondiente a cada posible
respuesta de la variable será proporcional a la frecuencia relativa de
la variable.

Ing. Freddy Burgos Robalino, MDGPT


DIAGRAMA DE SECTORES

Ejemplo: Se ha encuestado a 30 personas sobre el color


de sus ojos, obteniendo los siguientes resultados.

Marrón Verde Verde Azul Marrón Azul Marrón Marrón Azul Marrón

Azul Marrón Verde Verde Marrón Azul Verde Marrón Marrón Azul

Marrón Verde Marrón Verde Verde Marrón Marrón Marrón Azul Marrón

Ing. Freddy Burgos Robalino, MDGPT 102


DIAGRAMA DE SECTORES

Diagrama de sectores: Color de ojos

CATEGORIA fi hi Grados

Azul
0,23
Marrón 15 0.50 180 23%
Marrón
30 --> 360° 0,50
Verde 50%
Verde 8 0.27 96
0,27
27%
Azul 7 0.23 84

N 30 1.00 360
Marrón Verde Azul

Ing. Freddy Burgos Robalino, MDGPT


Generalidades

1.4.1 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5


Gráfico de Gráfico de Histograma Polígonos Gráfico de Diagrama
Sectores barras. s tallo y de caja.
hojas.

Ing. Freddy Burgos Robalino, MDGPT 104


GRÁFICO DE BARRAS

En este tipo de gráfico se Diagrama de barras: Color de


representa una barra vertical u ojos - fi
horizontal para cada una de las 16 15

categorías de la variable de altura 14

proporcional a su frecuencia 12

absoluta o relativa. 10

8
8 7
6

Marrón Verde Azul

Ing. Freddy Burgos Robalino, MDGPT


Representaciones gráficas de datos cuantitativos

Estas representaciones nos ayudarán a visualizar los datos y a


conocer sus principales características.
Entre las principales representaciones gráficas tenemos:
• Gráfico de barras
• Histograma
• Polígonos de frecuencia
• Diagrama de tallos y hojas
• Diagrama de cajas

Ing. Freddy Burgos Robalino, MDGPT


GRÁFICO DE BARRAS

Se usan también Xi fi
para representar la GRÁFICO DE BARRAS: NOTAS
1 1 DE EXÁMES - FI
distribución de 2 2 4,5
4
frecuencias de 3 1 4

variables discretas. 4 1
3,5

CANTIDAD DE ESTUDIANTES
3 3
3
Cada categoría se 5 4
2,5
6 2 2 2 2
representa por una 7 2
2

barra cuyo largo 8 3


1,5

1
1 1 1 1

indica la frecuencia 9 1 0,5

de observaciones 10 3 0
1 2 3 4 5 6 7 8 9 10
de dicha categoría. ∑ 20 NOTAS

Ing. Freddy Burgos Robalino, MDGPT


Gráficos estadísticos: Variables cuantitativas continuas

Generalidades:
• Cuando las variables son continuas, utilizamos como diagramas
diferenciales los histogramas y los polígonos de frecuencias.
• Un histograma se construye a partir de la tabla estadística,
representando sobre cada intervalo, un rectángulo que tiene a este
segmento como base

Ing. Freddy Burgos Robalino, MDGPT


Generalidades

1.4.1 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5


Gráfico de Gráfico de Histograma Polígonos Gráfico de Diagrama
Sectores barras. s tallo y de caja.
hojas.

Ing. Freddy Burgos Robalino, MDGPT 109


HISTOGRAMA

Cuando las variables son continuas, utilizamos como diagramas


diferenciales los histogramas y los polígonos de frecuencias.
Un histograma se construye a partir de la tabla estadística,
representando sobre cada intervalo, un rectángulo que tiene a este
segmento como base
Xi fi

[1,70 , 1,80) 5
[1,80 , 1,90) 4
[1,90 , 2,00) 3
[2,00 , 2,10) 3
∑ 15
Ing. Freddy Burgos Robalino, MDGPT
Generalidades

1.4.1 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5


Gráfico de Gráfico de Histograma Polígonos Gráfico de Diagrama
Sectores barras. s tallo y de caja.
hojas.

Ing. Freddy Burgos Robalino, MDGPT 111


POLÍGONOS DE FRECUENCIA

Son diagramas de línea que se obtienen al unir los puntos medios del
lado superior de cada rectángulo del histograma correspondiente.
El histograma y el polígono de frecuencias son gráficos que se utilizan
para representar distribuciones de frecuencias para datos agrupados.
Marca de
Xi fi
clase
[1,70 , 1,80) 1,75 5
[1,80 , 1,90) 1,85 4
[1,90 , 2,00) 1,95 3
[2,00 , 2,10) 2,05 3
∑ 15

Ing. Freddy Burgos Robalino, MDGPT


Generalidades

1.4.1 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5


Gráfico de Gráfico de Histograma Polígonos Gráfico de Diagrama
Sectores barras. s tallo y de caja.
hojas.

Ing. Freddy Burgos Robalino, MDGPT 113


DIAGRAMA DE TALLOS Y HOJAS

El diagrama "tallo y hojas permite obtener simultáneamente una


distribución de frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último dígito de la
derecha (que constituye la hoja) del bloque de cifras restantes (que
formará el tallo).

Ing. Freddy Burgos Robalino, MDGPT


DIAGRAMA DE TALLOS Y HOJAS

Se tiene los siguientes datos edad correspondiente a 20


personas, construir el diagrama de tallos y hojas.

36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

Ing. Freddy Burgos Robalino, MDGPT


DIAGRAMA DE TALLOS Y HOJAS

Se tiene los siguientes datos edad correspondiente a 20 personas,


construir el diagrama de tallos y hojas.

Ing. Freddy Burgos Robalino, MDGPT


Generalidades

1.4.1 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5


Gráfico de Gráfico de Histograma Polígonos Gráfico de Diagrama
Sectores barras. s tallo y de caja.
hojas.

Ing. Freddy Burgos Robalino, MDGPT 117


DIAGRAMA DE CAJAS

Los diagramas de Caja-Bigotes son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo
de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero(recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman
bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier
dato o caso que no se encuentre dentro de este rango es marcado e identificado
individualmente

Ing. Freddy Burgos Robalino, MDGPT


DIAGRAMA DE CAJAS

Se tiene los siguientes datos edad correspondiente a 20 personas,


construir el diagrama de tallos y hojas.

Ing. Freddy Burgos Robalino, MDGPT


DIAGRAMA DE CAJAS

Ing. Freddy Burgos Robalino, MDGPT


DIAGRAMA DE CAJAS

Ing. Freddy Burgos Robalino, MDGPT


SEMANA 6

Bioestadística
ESTADÍSTICA DESCRIPTIVA
Medidas de tendencia central:
Media, mediana y moda

Ing. Freddy Burgos Robalino, MDGPT.


Generalidades

LA MEDIA ARITMÉTICA LA MEDIANA LA MODA

Ing. Freddy Burgos Robalino, MDGPT. 123


Unidades
Experimentales
(Muestra)
Es una porción de la
información a analizar.
Ejemplo: muestra
compuesta por ocho
personas.

Ing. Freddy Burgos Robalino, MDGPT.


Media (promedio)

La media es la suma de todas las observaciones


dividida entre el número de observaciones.
Por ejemplo, el tiempo de espera (en minutos) de
cinco clientes de un banco es: 3, 2, 4, 1 y 2. El
tiempo medio de espera es:

En promedio, un cliente espera 2.4 minutos para ser


atendido en el banco.

Ing. Freddy Burgos Robalino, MDGPT.


Media Aritmética

La media aritmética es el valor promedio de las muestras y es


independiente de las amplitudes de los intervalos.
La media aritmética es el valor que se obtiene al sumar todos los datos
que tenemos y dividir el resultado entre el número total de esos datos
es el símbolo de la media aritmética.

Ing. Freddy Burgos Robalino, MDGPT.


Ejemplo de datos no agrupados

Los pesos de seis amigos son


84, 91, 72, 68, 87 y 78 kg.
Hallar el peso medio

Ing. Freddy Burgos Robalino, MDGPT.


Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión


de la media es:

Ing. Freddy Burgos Robalino, MDGPT.


Ejercicio de media aritmética

En un test realizado a un grupo de xi fi


42 personas se han obtenido las
puntuaciones que muestra la [10, 20) 15 1
tabla. [20, 30) 25 8
Calcule la puntuación media [30,40) 35 10
[40, 50) 45 9
[50, 60 55 8
[60,70) 65 4
[70, 80) 75 2
Ing. Freddy Burgos Robalino, MDGPT.
Ejercicio…

En primer lugar vamos a calcular la xi fi xi · fi


[10, 20) 15 1 15
sumatoria de xi · fi, crearemos una [20, 30) 25 8 200
nueva columna para los productos [30,40) 35 10 350
de la variable por su frecuencia [40, 50) 45 9 405
absoluta y lo sumaremos todo [50, 60 55 8 440
[60,70) 65 4 260
También tenemos que calcular N [70, 80) 75 2 150
que es la sumatoria de las  42 1820
frecuencias absolutas

Ing. Freddy Burgos Robalino, MDGPT.


Media Geométrica

La media geométrica es un tipo de media que se


calcula como la raíz del producto de un conjunto
de números estrictamente positivos.
La media geométrica se calcula como un
producto conjunto. Es decir, que todos los valores
se multiplican entre sí. De modo que si uno de
ellos fuera cero, el producto total sería cero.
(verificar números que sean únicamente
positivos.)
La media geométrica se utiliza con más
frecuencia para calcular la tasa de crecimiento
porcentual promedio de algunas series dadas, a
través del tiempo.
Ing. Freddy Burgos Robalino, MDGPT.
Fórmula de la media geométrica

Donde.
N: Se trata del número total de observaciones. Por ejemplo, si tenemos el
crecimiento de los beneficios de una empresa durante 4 periodos, N será 4.
x: La variable X es sobre la que calculamos la media geométrica. Siguiendo el
ejemplo anterior, el crecimiento de los beneficios estará expresado en porcentaje y
será la variable X.
i: Representa la posición de cada observación. En este ejemplo, podríamos ponerle
un número cada periodo. Un 1, al periodo 1, un 2 al periodo 2, etc. De manera que
x1 es el crecimiento de los beneficios en el periodo 1, x2 el crecimiento de los
beneficios en el periodo 2, x3 el crecimiento de los beneficios en el periodo 3 y x4
el crecimiento de los beneficios en el periodo 4.
Ing. Freddy Burgos Robalino, MDGPT. 132
Fórmula de la media geométrica…

Se hace énfasis en que este tipo de media es adecuada para calcular


variables en porcentaje o índices. Una de sus principales ventajas es
que es menos sensible a valores extremos (muy grandes o muy
pequeños) que podrían alterar la media de una muestra estadística. Por
el contrario, su principal desventaja es que no puede utilizarse con
números negativos.

Ing. Freddy Burgos Robalino, MDGPT. 133


Ejemplo de media geométrica

Supongamos los resultados de una


empresa. La empresa ha generado
un 20% de rentabilidad el primer
año, un 15% el segundo año, un 33%
el tercer año y un 25% el cuarto año.
Lo fácil, en este caso sería sumar las
cantidades y dividir entre cuatro. Sin
embargo esto no es correcto.
Para calcular la media de varios
porcentajes debemos hacer uso de la
media geométrica. Aplicado al caso
anterior, tendríamos lo siguiente:
Ing. Freddy Burgos Robalino, MDGPT. 134
Resultado del Ejemplo:

El resultado es 1,23, que NOTA: Si las rentabilidades fueran


expresado en porcentaje es un negativas, no se pondrían números
negativos. Si la rentabilidad es del -
23%. Lo que quiere decir que en 20%, el número a multiplicar sería
promedio, cada año la empresa 0,80. Si la rentabilidad es del -5%, el
ha ganado un 23%. Dicho de número a multiplicar sería 0,95. En
otra forma, si cada año hubiese conclusión si las rentabilidades son
ganado un 23%, hubiera ganado positivas, a uno le sumamos el
porcentaje en tanto por uno.
lo mismo que ganando un 20% Mientras que, si las rentabilidades o
el primer año, un 15% el porcentajes son negativos, a 1 le
segundo, un 33% el tercero y un restamos el porcentaje en tanto por
25% el último año. uno.
Tomado de https://economipedia.com/definiciones/media-geometrica.html
Ing. Freddy Burgos Robalino, MDGPT. 135
Mediana

La mediana es el valor que cumple que la mitad de los valores de la


variable son inferiores a él y la otra mitad son superiores. Si el número
de datos en la muestra es impar será el valor central de la muestra
ordenada (muestra en la que las unidades experimentales aparecen
ordenadas según el valor que toman). Si el número de datos es par la
mediana se define como la media de los dos valores centrales de la
muestra ordenada.

Ing. Freddy Burgos Robalino, MDGPT.


Mediana

Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los


valores es menor que o igual a 13 y el 50% de los valores es mayor que
o igual a 13.
Si se ordenan todos los datos, de menor a mayor, la mediana es el
valor que ocupa la posición central. Si el número de datos es par, la
mediana es la media aritmética de los dos centrales

Ing. Freddy Burgos Robalino, MDGPT.


Mediana para Datos no agrupados

Sean x1, x2, x3,…, xn los datos de una muestra ordenada en orden
creciente y designando la mediana como Me, distinguimos dos casos:
Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una
vez que los datos han sido ordenados (en orden creciente o
decreciente), porque este es el valor central. Es decir: Me= x(n+1)/2.
Por ejemplo, si tenemos 5 datos, que ordenados son: x1=3, x2=6,
x3=7, x4=8, x5=9 => El valor central es el tercero: x(5+1)/2= x3=7. Este
valor, que es la mediana de ese conjunto de datos, deja dos datos por
debajo x1, x2 y otros dos por encima de él x4, x5.

Ing. Freddy Burgos Robalino, MDGPT.


Mediana para Datos no agrupados…

Sean x1, x2, x3,…, xn los datos de una muestra ordenada en orden
creciente y designando la mediana como Me, distinguimos dos casos:
b. Si n es par, la mediana es la media aritmética de los dos valores
centrales. Cuando n es par, los dos datos que están en el centro de
la muestra ocupan las posiciones n/2 y (n/2)+1. Es decir: Me=((x
n/2)+(x n/2+1)/2.
Por ejemplo, si tenemos 6 datos, que ordenados son: x1=3, x2=6, x3=7,
x4=8, x5=9, x6=10. Aquí dos valores que están por debajo del
x6/2=x3=7 y otros dos que quedan por encima del siguiente dato
x(6/2+1)=x4=8. Por tanto, la mediana de este grupo de datos es la
media aritmética de estos dos datos: Me=)x3+x4)/2=(7+8)/2=7,5.
Ing. Freddy Burgos Robalino, MDGPT.
Fórmula y cálculo de la mediana para datos agrupados

La mediana se encuentra en el Li es el límite inferior de la clase


intervalo donde la frecuencia donde se encuentra la mediana
acumulada llega hasta la mitad de N/2 es la semisuma de las
la suma de las frecuencias frecuencias absolutas
absolutas.
fi es la frecuencia absoluta de la
Es decir tenemos que buscar el clase mediana
intervalo en el que se encuentre.
Fi - 1 es la frecuencia acumulada
𝑁
anterior a la clase mediana
− 𝐹𝑖 −1 ai es la amplitud de la clase
2
𝑀𝑒 = 𝐿𝑖 + . 𝑎𝑖
𝑓𝑖 La mediana es independiente de
las amplitudes de los intervalos
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de cálculo de la mediana para distribución
estadística
Calcular la mediana de una distribución
estadística que viene dada por la siguiente fi Fi
tabla
[60 , 63) 5 5
En primer lugar crearemos una nueva
columna con los valores de la frecuencia [63 , 66) 18 23
acumulada:
[66 , 69) 42 65
En la primera casilla colocamos la primera
frecuencia absoluta. En la segunda casilla [69 , 72) 27 92
sumamos el valor de la frecuencia [72 , 75) 8 100
acumulada anterior más la frecuencia
absoluta correspondiente y así  100
sucesivamente hasta la última, que tiene que
se igual a N(100)
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de cálculo de la mediana para distribución estadística

Buscamos el intervalo donde se encuentra fi Fi


la mediana, para ello dividimos la N por 2 [60 , 63) 5 5
porque la mediana es el valor central
[63 , 66) 18 23
100/2 = 50. Buscamos en la columna de
las frecuencias acumuladas Fi el intervalo [66 , 69) 42 65
que contiene a 50 [69 , 72) 27 92
Clase de la mediana: [66 , 69) [72 , 75) 8 100
Aplicaremos la fórmula para el cálculo de  100
la mediana para datos agrupados,
extrayendo los siguientes datos:

Ing. Freddy Burgos Robalino, MDGPT. 142


Ejemplo de cálculo de la mediana para distribución estadística

Li = 66 fi Fi
N/2 = 100/2 = 50 [60 , 63) 5 5
fi = 42 [63 , 66) 18 23
Fi - 1 = 23 [66 , 69) 42 65

ai = 3 [69 , 72) 27 92

Me = 66 + ((100/2 - 23) / 42) * 3 [72 , 75) 8 100

Me = 67,92  100
𝑁
− 𝐹𝑖 −1
2
𝑀𝑒 = 𝐿𝑖 + . 𝑎𝑖
𝑓𝑖
Ing. Freddy Burgos Robalino, MDGPT. 143
Moda

La moda es el valor que ocurre con más frecuencia en un conjunto de


observaciones. Mientras que la media y la mediana requieren un
cálculo, la moda se obtiene simplemente contando el número de veces
que cada valor ocurre en un conjunto de datos.
La moda puede ser única o no.

Ing. Freddy Burgos Robalino, MDGPT.


Unimodal

La calificaciones de los alumnos


de quinto año son:
2, 9, 5, 8, 9, 7, 3, 7, 6, 7.
Hallar la moda.
• Para resolver el problema
contamos cuántas veces se
repite cada valor.

Ing. Freddy Burgos Robalino, MDGPT.


Bimodal

La calificaciones de los alumnos


de sexto año son:
4, 9, 5, 8, 9, 7, 9, 7, 6, 7
Hallar la moda.

Ing. Freddy Burgos Robalino, MDGPT.


Gráficas de media, mediana y moda

En distribuciones simétricas la media aritmética, mediana y moda


coinciden.

Ing. Freddy Burgos Robalino, MDGPT.


Graficas de media, mediana y moda

Las distribuciones asimétricas pueden ser:


Asimétrica hacia la izquierda. Asimétrica hacia la derecha.

Ing. Freddy Burgos Robalino, MDGPT.


Moda de datos agrupados

Se calcula considerando la siguiente fórmula:

𝑓𝑖 − 𝑓𝑖 −1
𝑀𝑜 = 𝐿𝑖 + . 𝑎𝑖
(𝑓𝑖 −𝑓𝑖−1 )+(𝑓𝑖 −𝑓𝑖+1 )
donde:
Li es el límite inferior
fi es la frecuencia del iésimo valor
fi+1 es la frecuencia del iésimo valor más uno, es decir, el siguiente
fi-1 es la frecuencia del iésimo valor menos uno, es decir, el anterior
ai es la amplitud de ese intervalo
Nota: Se debe tomar en la frecuencia absoluta el número más mayor.

Ing. Freddy Burgos Robalino, MDGPT. 149


Relación empírica entre Media, Mediana y Moda

En las estadísticas, existe una relación entre la media, la mediana y el moda


que se basa empíricamente. Las observaciones de innumerables conjuntos
de datos han demostrado que la mayoría de las veces la diferencia entre la
media y la moda es tres veces mayor que la diferencia entre la media y la
mediana. Esta relación en forma de ecuación es:
Fórmula:
Media – Moda = 3(Media-Mediana)
Se puede despejar de la siguiente forma:
Moda = Media – 3(Media – Mediana)
El contraste con lo teórico es la forma empírica de adquirir conocimiento.

Ing. Freddy Burgos Robalino, MDGPT. 150


Ejemplo:

En un Banco se tomo la muestra de 40 personas que realizan sus


diferentes movimientos, para el banco es de gran importancia atender
a sus clientes lo más pronto posible. Desean saber aproximadamente
cuanto tiempo se tardan en realizar sus operaciones los resultados son
los siguientes que se presentan a continuación comprueba la relación
empírica.

Ing. Freddy Burgos Robalino, MDGPT. 151


SEMANA 6

Bioestadística
ESTADÍSTICA DESCRIPTIVA
Medidas de posición:
Cuartiles, Percentiles, Deciles

Ing. Freddy Burgos Robalino, MDGPT


GENERALIDADES

4.1. LOS CUARTILES 4.2 LOS DECILES 4.3 LOS PERCENTILES

Ing. Freddy Burgos Robalino, MDGPT


Cuartil
Los cuartiles son los tres valores de la
variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al
75% de los datos. dividen al conjunto de
datos ordenados en cuatro partes
porcentualmente iguales.
Q2 coincide con la mediana
El primer cuartil, es el valor en el cual o por
debajo del cual queda un cuarto (25%) de
todos los valores de la sucesión (ordenada);
el tercer cuartil, es el valor en el cual o por
debajo del cual quedan las tres cuartas
partes (75%) de los datos.

Ing. Freddy Burgos Robalino, MDGPT


Cuartil Para Datos No Agrupados

• Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:
• Para el primer cuartil:
• Cuando n es par:
• Cuando n es impar:

• Para el tercer cuartil


• Cuando n es par:
• Cuando n es impar:
Ing. Freddy Burgos Robalino, MDGPT
Para Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos


un número grande de datos y tenemos en cuenta que en estos casos
generalmente los datos son resumidos en una tabla de frecuencia. La
fórmula para el cálculo de los cuartiles cuando se trata de datos
agrupados es la siguiente:
K = 1, 2, 3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Ing. Freddy Burgos Robalino, MDGPT
Si se desea calcular cada cuartil individualmente, mediante otra
fórmula se tiene lo siguiente:

El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de
los datos; es decir, aquel valor de la variable que supera 25% de las
observaciones y es superado por el 75% de las observaciones.
Fórmula de Q1, para series de Datos agrupados:

Donde:
Li = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase

Ing. Freddy Burgos Robalino, MDGPT


Para Q2:

El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md),


es el menor valor que es mayor que la mitad de los datos, es decir el 50% de
las observaciones son mayores que la mediana y el 50% son menores.
Fórmula de Q2, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase

Ing. Freddy Burgos Robalino, MDGPT


Para Q3:

El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes
de los datos, es decir aquel valor de la variable que supera al 75% y es
superado por el 25% de las observaciones.
Fórmula de Q3, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.

Ing. Freddy Burgos Robalino, MDGPT


DECILES

Los deciles son ciertos números que dividen la sucesión de datos


ordenados en diez partes porcentualmente iguales. Son los nueve
valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles. Los deciles
se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para
fijar el aprovechamiento académico. En estadística descriptiva, un decil
es cualquiera de los nueve valores que dividen a un grupo de datos
ordenados en diez partes iguales, de manera que cada parte representa
1/10 de la muestra o población.

Ing. Freddy Burgos Robalino, MDGPT


DECILES

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:

• Cuando n es par:

• Cuando n es impar:

Siendo A el número del decil.

Ing. Freddy Burgos Robalino, MDGPT


Datos Agrupados

Para datos agrupados los deciles se calculan mediante la fórmula.

k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil
k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Ing. Freddy Burgos Robalino, MDGPT
Otra fórmula para calcular los deciles:

El cuarto decil, es aquel valor de la variable que supera al 40%, de las


observaciones y es superado por el 60% de las observaciones.

El quinto decil corresponde a la mediana.

Donde (para todos):


L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.

Ing. Freddy Burgos Robalino, MDGPT


PERCENTIL

Los percentiles son los 99 valores que dividen la serie


de datos en 100 partes iguales. Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de los datos.

P50 coincide con la mediana.

Ing. Freddy Burgos Robalino, MDGPT


Percentil
Son usadas por los pediatras para
para valorar el desarrollo de los
niños en función de unos valores
de referencia admitidos de
antemano como normales para
niños de una misma edad, sexo y
raza.
Las tablas se dividen en curvas de
crecimiento para niños de 0 a 2
años y de 2 a 14 años y son
diferentes para niños y para niñas.
Ing. Freddy Burgos Robalino, MDGPT
Percentil Datos Agrupados

Cuando los datos están agrupados en una tabla de frecuencias, se calculan


mediante la fórmula:

k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

Ing. Freddy Burgos Robalino, MDGPT


EJEMPLO: Determinación del primer cuartil, el séptimo decil y el
30 percentil, de la siguiente tabla:

Como son datos agrupados, se utiliza la fórmula


Salarios No. De Fa
(I. De Clases) Empleados (fi)

200-300 85 85
• Siendo, La posición del primer
300-400 90 175
cuartil.
400-500 120 295
• La posición del 7 decil.
500-600 70 365
600-700 62 427
• La posición del percentil 30.
700-800 36 463

Ing. Freddy Burgos Robalino, MDGPT


EJEMPLO:

Entonces,
El primer cuartil:
463
115.75 – 85 = 30.75 = 115,75
4

Li = 300, Ic = 100 , fi = 90

Ing. Freddy Burgos Robalino, MDGPT


EJEMPLO:

El 7 decil:
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70

El percentil 30
Posición:
138.9 – 85 = 53.9
Li= 300, fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $
334; que bajo 541.57 gana el 70% de los empleados y sobre $359.88, gana el 70% de los
empleados.

Ing. Freddy Burgos Robalino, MDGPT

También podría gustarte