Está en la página 1de 101

BIOESTADISTICA 1

INTRODUCCION Y
CONCEPTOS GENERALES
DEFINICION
La Estadística en Medicina, nace por la necesidad de “MEDIR” y
conocer el comportamiento de la Población en relación a aspectos
relacionados con la salud y la enfermedad.
Es la matemática aplicada a las ciencias de la salud.

Funciones:
- Recolección de datos.
- Organización datos.
- Procesamiento y análisis de datos.
- Interpretar resultados

Para la toma de decisiones.

 Sus fines son describir al conjunto de datos obtenidos y tomar


decisiones o realizar generalizaciones acerca de las características de
todas las observaciones bajo consideración.
TIPOS DE ESTADISTICA
LA APLICACIÓN DE LA BIOESTADISTICA EN LA
MEDICINA ASISTENCIAL Y LA SALUD PUBLICA
LAS FUNCIONES DE LA BIOESTADISTICA

1. Primer Acto : Recopilar datos

2. Segundo Acto : Organizar los datos

3. Tercer Acto : Procesar los datos

4. Cuarto Acto : Interpretar resultados


1. RECOPILAR DATOS (RECOGER / RECOLECTAR)
FUENTE PRIMARIA

Cuando se registran
características mediante la
medición, observación y
conteo, para lo cual utiliza
FUENTE SECUNDARIA
Fuentes primarias o
secundarias.
 Una vez que se
ha realizado la
recolección de
los datos, se
obtienen datos
en bruto, los
cuales rara vez
son
significativos
sin una
organización y
tabulación.
2. ORGANIZAR DATOS (ORDENAR)
Cuando se ordenan para una mejor comprensión y
facilitar sus análisis.(tablas, gráficos y figuras)

Tabla de Distribución Diagrama Circular

Edad N° Pacientes

30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
3. PROCESAR DATOS (ANALISIS)

E. DESCRIPTIVA
Cuando se calculan promedios
y medidas de variabilidad
entres otros cálculos.

E. ANALITICA
cuando se establecen
relaciones entre las
variables (regresión y
correlación).
4. INTERPRETAR RESULTADOS

Cuando se le otorga un
sentido práctico a los
resultados obtenidos en el
análisis
CONCEPTOS BASICOS
1. ¿Qué es un DATO?

Toda unidad Estructura a partir de la cual


de el investigador genera sus
Información estudios e indagaciones

Las tres partes del “dato”:


• La unidad de análisis.

• La variable o variables

• El valor o magnitud.
LA UNIDAD DE ANALISIS (individuo)
 Es el elemento mínimo de estudio, observable o medible en relación
con un conjunto de elementos que son de su mismo tipo.
 Se denomina también INDIVIDUO, UNIDAD ELEMENTAL o
ESTADISTICA.

Es la persona, animal o cosa de la que se quiere


conocer algo.
Ejemplos
• En ciencia sociales: la familia, el obrero, la empresa, los grupos, las naciones,
etc.
LA VARIABLE (característica a estudiar)
 Es una dimensión o característica de la unidad de análisis, que
permite su clasificación.
 propiedad, atributo, rasgos o cualidades de las Unidades de
Análisis (individuos), que es materia de interés del estudio.

Es lo que se quiere conocer de la unidad de análisis.


Ejemplo
En la familia: numero de componentes, ingresos, el grado de educación, gastos
mensuales, etc.
TALLA COLOR
EDAD
Lo importante en una PESO
PISOS
MIEMBROS
variable es:
VENTANAS
a. Que se derive siempre de COLOR DE
CABELLO
PROFESION

una unidad de análisis. AREA

b. Que admita un rango IDIOMA

mínimo de variación
PRESION
ARTERIAL
VALOR
Un valor es la magnitud, rango o atributo a través del cual se
expresa la variable.
La variable edad puede tomar los
Cada uno de estos siguientes valores:
 1 a 10 años
rangos son valores de
la variable  11 a 20 años
 21 a 30 años
 31 a 40 años

La variable sexo admite dos valores


• Hombre
• Mujer

La variable educación puede ser construida mediante


tres valores
• Educación alta
• Educación media
• Educación Baja
Ejemplo de dato:

Características (Variable) Valor Unidad de medida

Peso 75 Kg.
Estatura 1,80 mts.
Profesión Médico ----

INDIVIDUO

Si el DATO es útil para tomar decisiones se convierte en


INFORMACIÓN.
2. POBLACION Y MUESTRA
La POBLACION o Universo, es un concepto estadístico que hace referencia al
conjunto total de elementos a estudiar, el cual es inaccesible e inabordable de
manera directa, por lo tanto, se recomienda trabajar con una parte de ella , es
decir, la MUESTRA.

ESTADÍSTICA
MUESTRA DESCRIPTIVA
POBLACIÓN

INFERENCIA ESTADÍSTICA
Aleatoriedad de Población y Muestra
 Muestra aleatoria: se considera aleatoria siempre y cuando cada
observación, medición o individuo de la población tenga la misma
probabilidad de ser seleccionado (azar).
 Cuando se escoge una muestra aleatoriamente, se busca
representatividad
3. MARCO POBLACIONAL Y POBLACION
ESTADISTICA
MARCO POBLACIONAL: Es el conjunto total de individuos, elementos o unidades
de análisis.

TODAS las Unidades de análisis


(Individuos)

POBLACION (UNIVERSO): Es el conjunto total de VARIABLES (características) de


interés del estudio que se encuentran en un marco poblacional.

Cada población tiene el mismo número de VARIABLES que número de INDIVIDUOS


tiene el marco poblacional.
De cada Marco Poblacional se podrán extraer tantas poblaciones como características
de interés se deseen investigar.
4. MARCO MUESTRAL Y MUESTRA
ESTADISTICA
MARCO MUESTRAL: subconjunto de individuos extraído de un marco poblacional.

Sub conjunto de Unidades de análisis


(Individuos)

MUESTRA: subconjunto de variables, extraído del marco muestral.


•Una muestra tiene el mismo número de variables que número de individuos tiene el
marco muestral.
•De cada marco muestral se podrán extraer tantas muestras como características se
deseen investigar.
Ejemplo: Unidad de análisis: Paciente del hospital

MARCO POBLACIONAL
Unidad de Análisis (1200 pacientes de un Hospìtal)

Enfer.
Característica Edad Peso Anteriores Estado Civil

Población Población Población


Registro de la
característica
P1 P2 P3 ... Pn
(1200 datos) (1200 datos)
Marco Poblacional Técnicas Marco Muestral
1200 pacientes de un hospital de muestreo 75 pacientes de un hospìtal

Característica Edad Peso Énf. Ant. Estado civil

Edad Peso Enf. Ant. Estado civil


MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

75 datos

Registro
de la POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN

carac-
terística.

P1 P2 P3 ... Pn
RESUMEN
MARCO POBLACIONAL POBLACION VALORES

CONJUNTO TOTAL DE 2 años, 12 años, 14 años, 23


CARACTERÌSTICAS DE años, 16 años, 17 años, 34
INTERES DEL ESTUDIO años, 45 años, 56 años, 25
Por ejemplo: años
EDADES

100 individuos 100 edades 100 valores

MARCO MUESTRAL MUESTRA MAGNITUDES


Y MUESTRA

Por ejemplo: 2 años, 12 años, 14 años, 23


EDAD años

30 individuos 30 edades 30 valores

INDIVIDUO o UNIDAD DE ANALISIS VARIABLE o CARACTERISTICA VALOR O MODALIDAD

DATO o INFORMACION
5. Parámetros y estadísticos
 Parámetro: Valor representativo de una población. Se simboliza por
letras griegas. Sólo hay un parámetro en cada población.

 Media poblacional
2 Varianza poblacional
 Desviación estándar poblacional
 Proporción poblacional

 Estadístico: Valor representativo de una muestra. Se simboliza por


letras latinas. Existen tantos estimadores como muestras se extraigan
de una población. Sinónimo: Estimador-

x Media muestral.
s2 Varianza muestra.
s Desviación estándar muestral.
p Proporción muestral.
RELACION ENTRE PARAMETRO Y ESTIMADOR

POBLACION MUESTRAS
n1
x1 Promedio de peso = 55 Kg.

n2
Todas los pesos x2 Promedio de peso = 65 Kg.
de los alumnos n3
de USAMEDIC x3 Promedio de peso = 62 Kg.
. .
. .
nm
x m Promedio de peso = 58 Kg.

PARÁMETRO ESTIMADORES
Promedio del peso= 60 Kg Varios promedios
6. TIPOS DE DATOS (INFORMACION)

¬ DATO CONSTANTE: Si el registro de la


característica toma un sólo valor en todas las
unidades elementales.

Ejemplo:

• Sexo de las alumnas de la Escuela de


Enfermeras

• Profesión de los integrantes del Colegio


Médico del Perú

Las constantes no son de mayor interés en Estadística.


6. TIPOS DE DATOS O INFORMACION

- DATO VARIABLE: Si el registro de la


característica toma diversos valores en las
unidades elementales.

Ejemplo:

• Edad de los pacientes.


• Profesión de los profesores de la
Universidad Daniel Alcides Carrión

Los datos variables son los de mayor interés en Estadística.


A estos se les denomina comúnmente “VARIABLES”.
7. CLASIFICACIÓN DE VARIABLES

  CONTÍNUAS
 
 NUMÉRICAS 
 cuantitativas 
  DISCRETAS

VARIABLES 


 DICOTOMICAS
 
 CATEGORICAS  ORDINALES
 cualitativas 
  NOMINALES
CLASIFICACIÓN DE VARIABLES
1.- Variables Numéricas o Cuantitativas : Aquellas variables que
se expresan por números los que se obtienen a través de un
conteo o una medición. Las operaciones posibles entre estas
variables son los promedios y las medidas de dispersión,
entre otras. Se reconocen porque tienen unidades de
medida.

Las variables cuantitativas pueden ser:

- DISCRETA : Cuando la variable sólo puede tomar valores enteros


dentro de una escala de valores. Proviene de un conteo.
Ejemplo: Número de emergencias médicas por día.

- CONTINUA : Cuando la variable puede tomar cualquier valor


(entero fracción), dentro de una escala de valores. Provienen de
una medición.
Ejemplo: Tiempo de permanencia de un paciente en un consultorio
externo
CLASIFICACIÓN DE VARIABLES
2.-Variables Cualitativas : Aquellas variables que no se pueden
expresar por números sino por cualidades o categorías que
representen sus atributos. Solo se pueden registrar
mediante el conteo.

Las operaciones posibles son: la tasa porcentual,


proporciones y la moda. No tienen unidades de medida.
Ejemplo:

Profesión de los participantes a un curso.


• 80% son médicos (tasa porcentual).
• 8 de cada 10 participantes son médicos (proporción).

Las variables cualitativas pueden ser:

a) Dicotómicas o Binarias (si o no)


b) Ordinales (orden creciente o decreciente)
c) Nominales (Profesiones, Estado Civil, etc.)
8. MEDICIÓN / REGISTRO
• Se pueden medir variables físicas (cuantitativas) y
variables conceptuales (categóricas).
• Para las físicas existen patrones universalmente
definidos y aceptados.
• Para las conceptuales no existen unidades ni
escalas especificas de medida por lo cual se deben
construir o adaptar a las necesidades especificas.

La medición se define como la asignación de un símbolo


generalmente numérico, a una característica de un objeto o evento
de acuerdo con reglas establecidas.
9. ESCALAS DE MEDIDA O MEDICION:

DEFINICION
Una escala es un patrón
convencional de medición, y
básicamente consiste en un
instrumento capaz de representar
con gran fidelidad verbal, gráfica o
simbólica, el estado de una variable
10. Tipos de escalas de medición

a) Escala Nominal o Intensiva: variables cualitativas nominales

b) Escala Ordinal: variables cualitativas ordinales

c) Escala de Intervalo

d) Escala de Proporción o Razón


a) Escala Nominal:
(variables cualitativas nominales)

 La escala de medida nominal, consiste en la asignación arbitraria


de números o símbolos a cada una de las diferentes categorías en
las cuales podemos dividir el carácter que observamos, sin que
puedan establecerse relaciones entre dichas categorías.
 consiste en clasificar los objetos de estudio según las categorías
de una variable. El alcance de esta escala es el conteo.

Ejemplo

Sexo 1:Masculino 2:Femenino

Especialidad 1:Clínico 2:Cirugía


b) Escala Ordinal:
(variables cualitativas ordinales y cuantitativas)

 En caso de que puedan detectarse diversos grados de un atributo,


la medida ordinal es la indicada, puesto que puede recurrirse a la
propiedad de "orden" de los números asignándolo a los objetos en
estudio de modo que, si la cifra asignada al objeto A es mayor que
la de B, puede inferirse que A posee un mayor grado que B.
 Hay variables cuantitativas que se pueden convertir a la escala
ordinal por ejemplo, la glicemia se puede expresar en:
Hipoglicemia, Normoglicemia e Hiperglicemia.

Ejemplo:
 Calificación : A,B,C,D A>B
 Lugar : 1º , 2º , 3º 1º > 2º
 Grado de deshidratación : I, II, III, IV I>II
 APGAR, Silverman, Glasgow.
 Escala del dolor
 Satisfacción de usuarios
c) Escalas de intervalos iguales:
(variables cuantitativas)

 Se basa en la afirmación de la existencia de un continuo, seccionable


en partes iguales, en donde cada parte seccionada contiene la
misma cantidad de unidades que cualquier otra sección.
 Es importante destacar que el punto cero en las escalas de
intervalos iguales es arbitrario, y no refleja en ningún momento
ausencia de la magnitud que estamos midiendo.
 Esta escala, además de poseer las características de la escala
ordinal, encontramos que la asignación de los números a los
elemento es tan precisa que podemos determinar la magnitud de los
intervalos (distancia) entre todos los elementos de la escala.

Ejemplo:
Año 0
Hora 00:00
Temperatura 0ºC
d) Escala de coeficientes o Razones:
(Variables cuantitativas)

 El nivel de medida más elevado es el de coeficientes o razones, y


se diferencia de las escalas de intervalos iguales únicamente por
poseer un punto cero propio como origen; es decir que el valor
cero de esta escala significa ausencia de la magnitud que se mide.

 Además, siendo que cero ya no es arbitrario, sino un valor


absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.

Ejemplo:
Ingreso mensual : S/.00.
Nº de hijos : 0
Procesos deficientes : 0
Ejercicio Aplicativo 1
En un programa para la detección de hipertensión en un marco muestral
de 30 hombres en edades entre 30 y 40 años, la distribución de la presión
diastólica (mínima) en mm Hg fue la siguiente:

70 85 85 75 65 90 110 95 90 70

60 75 80 120 85 95 90 70 100 65

80 90 95 90 95 110 100 85 80 75

Cual es el Marco Poblacional:


Cual es la Población:
Cual es el Marco Muestral:
Cual es la Muestra:
Cual es el individuo o unidad de análisis
Cual es un valor
Que tipo de variable es:
Cual es la Unidad de Media..
Ejercicio Aplicativo 2

En un Centro Médico se desea estimar el


número promedio diario de procesos que no
cumplen las normas de calidad. Con este fin
se elige por sorteo 10 días laborales del
último mes. En uno de los días elegidos se
registraron 32 procesos médicos
deficientes.
En esta situación, identifique:

La característica : Número de procesos deficientes por día.

La unidad elemental : Un día (laboral).

El marco poblacional : Número de días (laborales) que


viene funcionando el Centro Médico.

La población : Registro diario de procesos médicos


deficientes en todo el tiempo que
viene funcionando el Centro Médico.

El marco muestral : Diez días laborales (elegidos al azar)


La muestra : Registro diario de procesos
deficientes durante los 10 días
elegidos al azar.

Tipo de dato : Variable cuantitativa discreta

Un valor registrado : 32

La unidad de medida : Procesos

El estimador : Media aritmética muestral ( x)


El parámetro : Media aritmética poblacional (µ)
GRACIAS…
BIOESTADISTICA 2

PRESENTACION DE
DATOS
Tabulación y Graficación

 Todo análisis estadístico es una estrategia para traducir la


cantidad de información obtenida en la recolección de datos, a
índices o formas que sean interpretables y que representen
alguna dimensión del comportamiento de las variables

 La estrategia más sencilla es mostrar la información en un


formato visual (gráficos) o en un esquema sintetizado (tablas)
45

TABLAS (tabulación)

 Las tablas deben incluir todos los puntajes registrados

 Deben respetar las características de la variable

 Llevan un título representativo del contenido (sobre la


tabla, numerado)
PARTES DE UNA TABLA

 TITULO
 TALON
 CUERPO
 NOTAS EXPLICATIVAS (Fuente)
TITULO

TALON

CUERPO

NOTAS EXPLICATIVAS
TABLAS ESTADISTICAS (de frecuencia)
 Exponen la información recogida en la muestra:

 La forma más sencilla de presentar la información obtenida en un


estudio es contabilizar el número de veces que aparece cada
VARIABLE. Este indicador se conoce como la frecuencia de
aparición da cada respuesta.
 Cuando presentamos una variable indicando la frecuencia de
aparición de cada uno de sus valores, tenemos una tabla de
frecuencia.

 Frecuencias absolutas: Contabilizan el número de variables de cada


modalidad o clase (intervalo).

 Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido


por el total, normalizadas.

 Frecuencias acumuladas absolutas y relativas: Acumulan las


frecuencias absolutas y relativas. Son especialmente útiles para
calcular cuantiles (como veremos más adelante).
Ejercicio Aplicativo para la elaboración de tablas

Ordenamos los datos en forma creciente:


60 65 65 70 70 70 75 75 75 80

80 80 85 85 85 85 90 90 90 90

90 95 95 95 95 100 100 110 110 120

La amplitud total : A = 120 – 60 = 60

Número de clases Intervalos: K = 30 = 5.48 Aprox. 6 clases (+ 1)

Extensión del intervalo : H = A/ K = 60/6 = 10

En este caso , entonces, la tabla de frecuencias tendrá aprox. 6 clases de amplitud 10 unidades en
cada clase.
TABLA DE FRECUENCIAS
Frecuencia Frecuencia Frecuencia
Variable Frecuencia
Normalizada acumulada acumuada normalizada
(relativa) (relativa)
x f fr F Fr
60 - 69 3 0.1 3 0.1

70 - 79 6 0.2 9 0.3

80 - 89 7 0.23 16 0.53

90 - 99 9 0.3 25 0.83

100 - 109 2 0.07 27 0.90

110 - 119 2 0.07 29 0.97

120 - 129 1 0.03 30 1.00

total 30 1.0
Ejemplo de Tabla para variables cualitativas nominales

Ejemplo de Tabla para variables cuantitativas discretas

OJO: Todo tipo de variables (cuanti y cuali) se pueden tabular.


51

GRAFICOS (graficación)

 Son complementos a la tabulación

 Representan la distribución de la variable

 Deben ser fáciles de interpretar

 Deben llevar un título representativo (bajo el gráfico y


numerado)
Tipos de Gráficos

Gráficos de barra CARGO

OPERARIO GENERAL
OPERADOR DE MAQUINA

Se utilizan para representar la frecuencia de variables AUTOMATICA


DESPACHADOR DE PRODUCTO
TERMINADO LOCAL
de tipo cualitativa, por lo general de nivel nominal. OPERADOR DE DOBLE FILO
OPERARIO GENERAL
OPERADOR DE DOBLE FILO

CARGO Frec

Para graficarla, la variable debe haberse resumido OPERARIO GENERAL


OPERADOR DE M AQUINA
145

10

previamente en una tabla de frecuencias... AUTOM ATICA


DESPACHADOR DE PRODUCTO
TERM INADO LOCAL
8

OPERADOR DE DOBLE FILO 4


OPERADOR DE M AQUINA ST 12
OPERADOR DE SERVICIOS
1
GENERALES
OPERADOR GRAL. ALM ACEN
M ATERIA PRIM A Y PRODUCTOS 5
203 operarios clasificados en TERM INADOS

160
145
140

120
Número de operarios

100

80

60

40

20 10 8 12
4 1 5
0
OPERARIO GENERAL OPERADOR DE MAQ UINA DESPACHAD OR DE OPERADOR DE DOBLE OPERADOR DE MAQ UINA OPERADOR DE OPERADOR GR AL.
AUTOMATICA PRODUCT O TERMINAD O FILO ST SERVICIOS G ENERALES ALMACEN MAT ERIA
LOCAL PRIMA Y PRO DUCTO S
TERMINAD OS

Tipo de ope rario

Las barras están separadas entre si, y el ancho de las mismas no es representativo
Gráfico o Diagrama de Pareto

Se trata de una variante del gráfico de barras, en el que la tabla de


frecuencias está ordenada de mayor a menor ...

• Este gráfico
permite identificar
80% aquellas causas
que explican el
80% de los efectos,
por lo que también
se le conoce como
un gráfico de
PRIORIZACION.
• Para su
elaboración se
requiere de la
frecuencia
acumulada relativa
(porcentual).
Gráficos circulares (tortas, sectores, pie)

Al igual que los gráficos de barra, se utilizan para representar variables


de tipo cualitativa, generalmente para representar distribuciones
porcentuales respecto a una clasificación.

203 operadores según tipo

2% 1%
OPERARIO GENERAL
3%
4%
5% OPERADOR DE MAQUINA ST

7% OPERADOR DE MAQUINA AUTOMATICA

DESPACHADOR DE PRODUCTO TERMINADO


LOCAL

OPERADOR GRAL. ALMACEN MATERIA


PRIMA Y PRODUCTOS TERMINADOS

OPERADOR DE DOBLE FILO


78%

OPERADOR DE SERVICIOS GENERALES


Otros gráficos para variables cualitativas

Pictogramas

 Fáciles de entender.
 Cada modalidad debe
ser proporcional a la
frecuencia.
Gráficos para variables cuantitativas

VARIABLES CUANTITATIVAS DISCRETAS

GRAFICO DE BARRAS GRAFICO INTEGRAL


(diferencial)
VARIABLES CUANTITATIVAS CONTINUAS

Histograma
Se utilizan para representar un conjunto de datos cuantitativos continuos. En
general se requiere previamente el cálculo de una tabla de frecuencia, y su
posterior representación.

Resultado Evaluación

70
60
Operadores

50
40
30
20
10
0
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20
Salarios en miles
Histograma

 Es una gráfica de barras de una distribución de frecuencias.

Clase
Curva de frecuencia
fx
Frecuencia

Tipos de
Clases
Clases
Limite superior de clase

Limite inferior de Clase


Polígonos de frecuencia

Están vinculados al histograma porque trabajan con la misma


información.

Resultado Evaluación Con dos pequeños


cambios se puede
60
convertir un
50
histograma en este
Operadores

40
polígono.
30
20
10 No es un gráfico muy
0 difundido a pesar
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 de sus ventajas
Salarios en miles sobre el histograma.

Permite comparar varios conjunto de datos cuantitativos continuos


Ojiva

También se vincula a los histogramas, ya que usa la información de la


tabla de frecuencia (frecuencia acumulativa) para generar un gráfico
muy usado para hacer estimaciones y generar respuestas

Ojiva
Resultado Evaluación

1,2
1
Operadores

0,8
0,6
0,4
0,2
0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.

Asimismo permite comparar varios conjunto de datos


Otros tipos de Gráficos

Gráficos de cajas
(Diagrama de Tuckey)
 Son gráficos muy simples que ayudan, entre otras cosas, a comparar la
dispersión de dos o mas grupos de datos.
 Se utilizan principalmente para variable cuantitativas, excepcionalmente
cualitativas ordinales.

Cuartil 1 Cuartil 3

máximo

mínimo

Mediana
(Cuartil 2)
Diagramas de dispersión

 Son gráficos muy simples que sirven para comparar la relación


que existe entre variables cuantitativas.
Diagrama de Tallos y Hojas

Es un diagrama donde cada


valor de datos es dividido en
una “hoja” (normalmente el
último dígito) y un “tallo”
(los otros dígitos). Por
ejemplo el valor 32 seria
dividido en “3” (tallo) y “2”
(hoja).

Se aplica para variables


cuantitativas discretas.
Gráficos temporales

Se utilizan para representar series de datos donde el eje horizontal


está representado por el tiempo, es decir la variable evoluciona en el
tiempo.

Energía Consumida Mensual

8.000
7.500
7.000
GWh

6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses

Estos gráficos son útiles para explorar datos donde no


hay relaciones causales conocidas con otras variables
Diagrama máximo – mínimo

Útil para visualizar movimientos en el valor de cierta variable, dentro de un


periodo de tiempo establecido

Ejemplo: Variación en el número de emergencias diarias por semana. Julio


1998
100
90
80
70
60
50
40
30
20
10
0
1ra. Semana 2da. Semana 3ra. Semana 4ta. Semana

Fuente: Hoja de registro, julio 1998


RESUMEN DE GRAFICAS
ESTADISTICAS
GRACIAS…
ESTADISTICA DESCRIPTIVA I
ESTADISTICA SUMARIA O DE RESUMEN
 Centralización (Tendencia central)
◦ Indican valores con respecto a los que los datos parecen agruparse.
 Media, mediana y moda

 Posición
◦ Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
 Cuantiles, percentiles, cuartiles, deciles,...

 Dispersión
◦ Indican la mayor o menor concentración de los datos con respecto a
las medidas de centralización.
 Desviación típica, coeficiente de variación, rango, varianza

 Forma
◦ Asimetría
◦ Apuntamiento o curtosis
 Son medidas estadísticas que se usan para describir como se
puede resumir la localización de los datos.
 Ubican e identifican el punto alrededor del cual se centran los
datos. Las medidas de tendencia central nos indican hacia donde se
inclinan o se agrupan más los datos.
 Las más utilizadas son: la media, la mediana y la moda.
 Es un valor de resumen que pretende “representar” a los valores
del conjunto.
. .
. . .
. . .
.
. .
. .
.
..
.

.
. .
. . .

. .
.
.. .
.. .
..
.

. . .
.
.
.
.

.
.
.
.. . . . MTC . .
. .
. .... . .
MEDIDAS DE TENDENCIA CENTRAL

MEDIA

MEDIANA

MODA

PERCENTILES

CUARTILES
 La media o media aritmética, usualmente se le llama promedio.
 Se obtiene sumando todos los valores de los datos y dividiendo
el resultado entre la cantidad de datos.
 Si los datos proceden de una muestra, el promedio se representa
con X. Si los datos proceden de la población, se utiliza la letra
griega µ.
 Este valor “depende” de las magnitudes de cada dato del
conjunto.
Calculo de la media o promedio
 La fórmula matemática para calcular la media o
promedio es la siguiente:
x
x
donde; N
X = promedio
 = signo de sumatoria
N = numero de datos

Otro Ejemplo:

La siguiente tabla muestra el número de reclamos y quejas presentadas por pacientes de una clínica a lo
largo de una semana. Calcule e interprete la media.

Día/Semana Lun Mar Mier Jue Vier Sab


Reclamos/día 8 10 5 12 10 15

8  10  5  12  10  15 60
Media aritmética = 
6 6

x = 10 reclamos

Interpretación: si elige al azar un día de la semana, se


espera que los pacientes de esta clínica
realicen 10 reclamos por día (función de representación).
La media aritmética ponderada ( xp )
Ejemplo: El Hospital del Callao atiende 2,800 consultas diarias, cobrando
tres tipos de tarifas: social, diferenciada y por convenio. El número de
pacientes y el valor de cada nivel tarifario se muestra a continuación.
Calcule e interprete la tarifa media por consulta.

Tipo de Tarifa Pacientes


Tarifa S/.
Social 5 60%
Diferenciada 15 30%
Por convenio 40 10%
5(0,60)  15(0,30)  40(0,10)
xp 
0,60  0,30  0,10

x p  11,5  S / .11,50
1,0
La media geométrica ( xg )
se usa para encontrar el promedio de porcentajes, razones, índices o tasas, como la tasa
media de crecimiento poblacional, la tasa media de inflación mensual, la tasa media de
mortalidad, entre otros.

a) Obtención: se obtiene extrayendo la raíz enésima del producto de los n valores de una
serie.

xg  n X1  X2  X3  ...  Xn

xh
Se utiliza para calcular variables como productividades, velocidades, rendimiento, aceleración
media, cambios o variaciones como el tiempo medio para realizar un proceso médico.

a) Obtención: se obtiene calculando el inverso de la media aritmética de los inversos de una


serie.
1
xh 
n 1

i 1
X
i
n
Ventajas y desventajas de la media aritmética

Ventajas:

ä Concepto familiar para muchas personas

ä Es única para cada conjunto de datos

ä Es posible comparar medias de diferentes muestras

Desventajas

ä Se ve afectada por los datos extremos


ä Si la muestra es grande y los datos no están

agrupados, su cálculo es tedioso

ä Si los datos están agrupados en clases con extremos


abiertos, no es posible calcular la media.
 La segunda medida de tendencia central que
analizaremos es la mediana, en ocasiones se le
llama media posicional, porque queda
exactamente en la mitad de un grupo de datos,
luego de que los datos se han colocado de
forma ordenada.

 En este caso la mitad (50%) de los datos estará


por encima de la mediana y la otra mitad
(50%) estará por debajo de ella.

 La mediana es el valor intermedio cuando los


valores de los datos se han ordenado.

 Se puede aplicar para variables cuantitativas y


cualitativas ordinales.
Calculo de la mediana
Obtención: Se obtiene ordenando la serie de datos (en forma
ascendente o descendente) y ubicando el dato central.

Ejemplo:
Los siguientes datos se refieren al número de niños atendidos durante
los últimos 11 días en un Servicio de Emergencia Pedriáticas del
Hospital de Huacho. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16


Primero se ordenan los datos:

5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17


5 datos menores 5 datos mayores

mediana

Interpretación: Durante 5 días iempo)(50% del se atendieron a menos de


11 pacientes por día, y durante 5 días se atendieron a más de 11 pacientes
por día.
Reglas

1º Si la serie es impar, la mediana ocupa el lugar central de la


serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

2º Si la serie es par, la mediana se obtiene de la semisuma de los dos


valores centrales de la serie previamente ordenada.

Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18  23
mediana   20,5
2
 n  1
3º Sea la serie par o impar, la mediana ocupa el lugar, 
 2 
de la serie previamente ordenada.
• Ejemplo:
Los salarios de siete empleados fueron Supongamos que se agrega al grupo el
los siguientes (en 1000s) : Salario de un empleado más ($31,000).
28, 60, 26, 32, 30, 26, 29. ¿Cuál es la mediana?
¿Cuál es la mediana?

Nro. de observaciones es impar Nro. de observaciones es par


Primero, ordenar los salarios. Primero, ordenar los salarios.
Luego, localizar el valor en el medio. Luego, localizar el valor en el medio.

26,26,28,29,30,32,60 26,26,28,29,29.530,31,
26,26,28,29, 32,60
,30,31,32,60
83
Hay dos valores en el medio!
Ventajas y desventajas de la mediana

Ventajas:

ä Los valores extremos no afectan a la mediana como en el caso de la media

aritmética.

ä Es fácil de calcular, interpretar y entender.

ä Se puede determinar para datos cualitativos.

Desventajas:
ä Como valor central, se debe ordenar primero la serie de datos.

ä Para una serie amplia de datos no agrupados, el proceso de ordenamiento


de los datos demanda tiempo y usualmente provoca equivocaciones.

Altura mediana
 La moda es el dato que más se repite o el
dato que ocurre con mayor frecuencia.

 Un grupo de datos puede tener más de


una moda.

 Se puede aplicar para variables


cuantitativas y cualitativas nominales.

 Veamos el siguiente ejemplo: se tiene una


muestra con valores 20, 23, 20, 24, 25,
25, 26 y 30. El 20 y 25 son la moda
entonces, se dice que es bimodal.
Calculo de la moda
Obtención: se obtiene organizando la serie de datos y seleccionando el
o los datos que más se repiten.
Ejemplo:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38

El modo
Cuando la muestra
es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal
Ventajas y desventajas de la moda.
Ventajas:
ä Se puede utilizar tanto para datos cualitativos como
cuantitativos.
ä No se ve afectada por los valores extremos
ä Se puede calcular, a pesar de que existan una o más clases
abiertas.
Desventajas:
ä No tiene un uso tan frecuente como la media.
ä Muchas veces no existe moda (distribución amodal).
ä En otros casos la distribución tiene varias modas, lo que
dificulta su interpretación.
 Si una distribución es simétrica, la media,
mediana y modo coinciden

• Si una distribución no es simétrica, las tres medidas


difieren.
Asimetría hacia la derecha Asimetría hacia la izquierda
(asimetría positiva) (asimetría negativa)

Media Media Modo


Modo
Mediana Mediana
MEDIDAS DE POSICION
(fractiles, cuantiles)

MEDIA

MEDIANA

MODA

PERCENTILES

CUARTILES
DEFINICIONES Y EQUIVALENCIAS

 Las medidas de posición nos permiten Equivalencias


dividir a una distribución en 2 o mas Como todas las medidas se refieren
partes iguales. al mismo grupo de datos, se pueden
 Según el número de partes, éstas hacer equivalentes entre sí
divisiones tendrán distintos nombres:

◦ Percentiles: Cuando dividimos una


distribución en100 partes.
50% M 50%

◦ Deciles: Cuando dividimos una


distribución en 10 partes. 25% Q1 25% Q2 25% Q3 25%

◦ Cuartiles : Cuando dividimos una


distribución en 4 partes. 20% 20% 20% 20% 20%

◦ Mediana: Cuando dividimos una 10 10 10 10 10 10 10 10 10 10


distribución en 2 partes. % % % % % D5 % % % % %

 Se aplica para Variables cuantitativas,


excepcionalmente cualitativas ordinales.
P25 P50 P75
 Los percentiles dividen a los datos en cien partes iguales, cada una de
ellas contiene el 1% de los elementos del conjunto.
 Más o menos el (p) por ciento de los datos tienen valores menores que
el percentil y aproximadamente (100-p) por ciento de los datos tienen
valores mayores que el percentil.
 Un percentil nos provee información de como se distribuyen los
valores de los datos desde el menor hasta el mayor.

Un percentil divide en dos partes las observaciones. Por ejemplo, el


percentil 20, P20, es el valor que deja por debajo un 20% y por encima un
80% de las observaciones

20% 80%
Mínimo Máximo
Percentil 20
P20
 Para calcular el percentil (la posición), debe seguir los siguientes pasos:
Paso 1. Ordene los datos de manera ascendente.

Paso 2. Calcule un índice (i) que indica la


posición del percentil que se busca  P 
i n
en la serie de datos ordenados.  100 
en donde (p) es el percentil de interés y (n) es el número de datos u
observaciones del conjunto o serie.

Paso 3.
a) Si (i) no es entero, utilizando las reglas de redondeo, se lleva al próximo
numero entero. El valor entero inmediato mayor que (i) indica la posición
donde se encuentra el percentil. Esto significa que si (i) = 3.5, el percentil
se encuentra en la posición 4 de los datos.

b) Si (i) es entero, la posición del percentil es el promedio de los valores de


los datos ubicados en los lugares i e (i + 1). Veamos como se aplica
 Como ejemplo de este procedimiento, determina el percentil 75
de los datos sobre las edades del siguiente un grupo de
ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.

Paso 1. Ordene los datos en orden ascendente:

19 20 21 22 23 25 26 27 28 30

Paso 2. Calcule el índice (i):


 P   75 
i n i 10  7.5
 100   100 
Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o sea, el
lugar 8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es el valor del dato
ubicado en la posición número 8, que en este caso es 27.

19 20 21 22 23 25 26 27 28 30

Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el
percentil que estamos buscando.

 Significa que el 75% de las edades son menores de 27


años y el 25% restante (100-p) es mayor de 27 años.
 Los cuartiles dividen los datos en cuatro partes iguales.
 Cada una de las partes representa una cuarta parte, o el 25% de las observaciones.
 Los cuartiles son percentiles específicos; por consiguiente, los pasos para calcular
los percentiles los podemos emplear para calcular los cuartiles.
 El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima
75% de las observaciones (equivale al P 25). El Q2 es la mediana (50%)
(equivale al P50) y Q3 deja por debajo 75% y por encima 25% de las
observaciones (equivale al P75)

75% 25%
25% 75%

25% 25% 25% 25%

Cuartil 1 Mediana Cuartil 3 Máximo


Mínimo Cuartil 2
Q1 Q3
Q2
 A continuación se presenta un conjunto de datos con los siguientes
valores;
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.

¿ Cómo identificamos los cuartiles en este ejemplo?


Utilizarás los mismos pasos para identificar los percentiles:

Primero, ordenamos los datos

5 8 11 12 14 15 18 20 25 30

Segundo, determinamos (i) para cada cuartil:

Q1 = primer cuartil, o percentil 25


Q2 = segundo cuartil, o percentil 50 (también la mediana)
Q3 = tercer cuartil, o percentil 75
 Primer cuartil:
Q1 = primer cuartil, o percentil 25
 25 
i 10 = 2.5
 100 
Como(i) no es un número entero, se redondea al próximo entero mayor que 2.5, o sea
3. Al referirnos a los datos vemos que el primer cuartil está ubicado en la posición 3
de los datos que este caso es 11. El primer cuartil en los datos se divide de la siguiente
forma:
5 8 11 12 14 15 18 20 25 30
Q1=11

 Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (también la mediana)
 50 
i 10 = 5
 100 
Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los
datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:

5 8 11 12 14 15 18 20 25 30
Q1=11 ; Q2=14.5
 Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

 75 
i 10 = 7.5
 100 
Como (i) no es un número entero, se redondea al próximo entero mayor que
7.5, o sea 8. Al referirnos a los datos , vemos que el tercer cuartil está ubicado
en posición 8 de los datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:

5 8 11 12 14 15 18 20 25 30

Q1=11 Q2=14.5 Q3=20


Ejemplos
En el Hospital Dos de Mayo los pesos de RN durante el año 2009 variaron
entre los 1500 gr hasta los 4,500 gr. Diga usted que porcentaje de niños
tuvieron un peso mayor de 3000 gr si se sabe que este peso corresponde
al percentil 80 de la serie total de RN durante el 2009?

p80

1500 gr 4500 gr
3000 gr
Ejercicios
• El 5% de los recién nacidos tiene un peso demasiado bajo. ¿En que
percentil se encuentra el peso por debajo del cual se considera
“demasiado bajo”?

◦ ¿En que percentil se encuentra el peso que es superado sólo por el


25% de los recién nacidos?

◦ El colesterol se distribuye simétricamente en la población. Si se


consideran patológicos los valores extremos. El 90% de los
individuos son normales ¿Entre qué percentiles se encuentran los
valores que incluyen a los individuos normales?

◦ ¿Entre qué percentiles se encuentran los valores en los que está la


mitad de los individuos “más normales” de una población?
Resuelve los siguientes ejercicios:

Se ha obtenido una muestra del salario de los Bomberos. Los datos recopilados
fueron los siguientes:
1500 $1400 $1600 $2100
1200 1300 1900 1800
2000 1200 1200 1500
2200 2300 1500 1400

a. determine el salario promedio


b. calcule la mediana y la moda.
c. calcule el percentil 65. Explique el resultado.
d. determine los cuartiles.
Gracias…

También podría gustarte