Está en la página 1de 46

BIOESTADISTICA 1

BIOESTADISTICA 1

INTRODUCCION Y
CONCEPTOS GENERALES

DEFINICION

La Estadística en Medicina,
nace por la necesidad de
“MEDIR” y conocer el
comportamiento de la
Población en relación a
aspectos relacionados con la
salud y la enfermedad.
Es la matemática aplicada a
las ciencias de la salud.

 Sus fines son describir al conjunto de datos obtenidos y


tomar decisiones o realizar generalizaciones acerca de
las características de todas las observaciones bajo
consideración.

Pag. 1
BIOESTADISTICA 1

PROCESO ESTADISTICO

TOMAR 1. Recoger o
DECISIONES recopilar

4. INFORMACION 2.Organizar
Interpretar (DATO) u ordenar

3. Procesar
o analizar

TIPOS

Pag. 2
BIOESTADISTICA 1

1. RECOPILAR DATOS (RECOGER / RECOLECTAR)


Cuando se registran características mediante la
medición, observación y conteo, para lo cual utiliza
Fuentes primarias o secundarias.

FUENTE PRIMARIA

 Una vez que se


ha realizado la
recolección de
los datos, se
obtienen datos
en bruto, los
cuales rara vez
FUENTE SECUNDARIA son
significativos
sin una
organización y
tabulación.

2. ORGANIZAR DATOS (ORDENAR)


Cuando se ordenan para una mejor comprensión y
facilitar sus análisis.(tablas, gráficos y figuras)

Tabla de Distribución Diagrama Circular

Edad N° Pacientes

30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2

Pag. 3
BIOESTADISTICA 1

3. PROCESAR DATOS (ANALISIS)

E. DESCRIPTIVA
Cuando se calculan
promedios y medidas de
variabilidad entres
otros cálculos.

E. ANALITICA
cuando se establecen
relaciones entre las
variables (regresión y
correlación).

4. INTERPRETAR RESULTADOS

Cuando se le otorga un
sentido práctico a los
resultados obtenidos en el
análisis

Pag. 4
BIOESTADISTICA 1

CONCEPTOS BASICOS

1. Dato o Información
2. Marco poblacional - población
3. marco muestral - muestra
4. Parámetro y estadístico
5. Tipos de datos
6. Clasificación de variables
7. Escalas de medición

1. ¿Qué es un DATO (información)?

Toda unidad Estructura a partir de la cual


de el investigador genera sus
Información estudios e indagaciones

Las tres partes del “dato”:


UNIDAD DE ANALISIS
(SUJETO)

DATO

VALOR O VARIABLE
MAGNITUD (CARACTERISTICA)

Pag. 5
BIOESTADISTICA 1

LA UNIDAD DE ANALISIS (sujeto o individuo estadístico)


 Es el elemento mínimo de estudio, observable o medible en relación
con un conjunto de elementos que son de su mismo tipo.
 Se denomina también UNIDAD ELEMENTAL o ESTADISTICA.

«Es la persona, animal o cosa de la que se quiere


conocer o saber algo»
Ejemplos
• En ciencia sociales: la familia, el obrero, la empresa, los grupos, las naciones,
etc.

LA VARIABLE (característica a estudiar)


 Es una dimensión o característica de la unidad de análisis, que
permite su clasificación.
 propiedad, atributo, rasgos o cualidades de las Unidades de
Análisis (individuos), que es materia de interés del estudio.

«Es aquello que se quiere conocer de la unidad de


Ejemplo
análisis»
En la familia: numero de componentes, ingresos, el grado de educación, gastos
mensuales, etc.
TALLA COLOR
EDAD
Lo importante en una PESO
PISOS
MIEMBROS
variable es:
VENTANAS
a. Que se derive siempre de COLOR DE
CABELLO
PROFESION

una unidad de análisis. AREA

b. Que admita un rango IDIOMA

mínimo de variación
PRESION
ARTERIAL

Pag. 6
BIOESTADISTICA 1

VALOR
Un valor es la magnitud, rango o atributo a través del cual se
expresa la variable.
La variable edad puede tomar los
siguientes valores:
Cada uno de estos  1 a 10 años
 11 a 20 años
rangos son valores de
 21 a 30 años
la variable  31 a 40 años

La variable sexo admite dos valores


• Hombre
• Mujer

La variable educación puede ser construida mediante


tres valores
• Educación alta
• Educación media
• Educación Baja

Ejemplo de dato:

Características (Variable) Valor Unidad de medida

Peso 75 Kg.
Estatura 1,80 mts.
Profesión Médico ----

INDIVIDUO
O
SUJETO Si el DATO es útil para tomar decisiones
se convierte en INFORMACIÓN.

Pag. 7
BIOESTADISTICA 1

2. MARCO POBLACIONAL y POBLACION


MARCO POBLACIONAL: Es el conjunto total de individuos
estadísticos, elementos o unidades de análisis.

TODAS las Unidades de análisis


(Individuos)

POBLACION (UNIVERSO): Es el conjunto total de variables


(características de interés) de estudio, de un marco poblacional.

Cada población tiene el mismo número de VARIABLES que número de


INDIVIDUOS tiene el marco poblacional.

De cada Marco Poblacional se podrán extraer tantas poblaciones como


características de interés (variables), se deseen investigar.

3. MARCO MUESTRAL Y MUESTRA

MARCO MUESTRAL: subconjunto de individuos estadísticos,


extraídos de un marco poblacional.

Sub conjunto de Unidades de análisis


(Individuos)

MUESTRA: subconjunto de variables de estudio, de un marco


muestral.

•Una muestra tiene el mismo número de variables que número de


individuos tiene el marco muestral.
•De cada marco muestral se podrán extraer tantas muestras como
características se deseen investigar.

Pag. 8
BIOESTADISTICA 1

Marco Poblacional Técnicas Marco Muestral


1200 pacientes de un hospital de muestreo 75 pacientes de un hospìtal

Característica Edad Peso Énf. Ant. Estado civil

Edad Peso Enf. Ant. Estado civil


MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

75 datos

Registro
de la POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN

carac-
terística.

P1 P2 P3 ... Pn

1 MARCO POBLACIONAL n
« » POBLACIONES

1 MARCO MUESTRAL n
« » MUESTRAS

4. PARAMETROS y ESTADISTICOS
ESTADISTICO
 Parámetro: Valor representativo de una
POBLACION. Se simboliza por letras
griegas. Sólo hay un parámetro por cada Muestra
población. Muestra
 Media poblacional POBLACION
2 Varianza poblacional
 Desviación estándar poblacional
 Proporción poblacional

 Estadístico: Valor representativo de una


MUESTRA. Se simboliza por letras ESTADISTICO ESTADISTICO
latinas. Existen tantos estimadores
como muestras se extraigan de una PARAMETRO
población. Sinónimo: Estimador-
Estadígrafo.
x Media muestral.

s 2 Varianza muestra.
s Desviación estándar muestral.
p Proporción muestral.

Pag. 9
BIOESTADISTICA 1

5. TIPOS DE DATOS (INFORMACION)

¬ DATO CONSTANTE: Si la característica de


interés solo puede adoptar un sólo valor en
todas las unidades estadísticas (individuos
estadísticos).

Ejemplo:

• Profesión de los integrantes del Colegio


Médico del Perú

Las constantes no son de mayor interés en Estadística.

- DATO VARIABLE: Si la característica


de interés puede adoptar diversos valores
en las unidades estadísticas (individuos
estadísticos).

Ejemplo:

• Edad de los pacientes: 20 años, 54 años, 43 años, etc.

• Profesión de los profesores de la Universidad Daniel


Alcides Carrión: médicos, abogados, economistas, etc.

Los datos variables son los de mayor interés en Estadística.


A estos se les denomina comúnmente “VARIABLES”.

Pag. 10
BIOESTADISTICA 1

6. CLASIFICACIÓN DE VARIABLES

  CONTÍNUAS
 
 NUMÉRICAS 
 cuantitativas 
 DISCRETAS


VARIABLES 


 DICOTOMICAS
 
 CATEGORICAS  ORDINALES
 cualitativas 
  NOMINALES

CLASIFICACIÓN DE VARIABLES
1.- Variable Numérica o Cuantitativa :
 Las que se expresan por números los que se obtienen por
conteo o medición.
 Las operaciones posibles con estas son los promedios y
medidas de dispersión, entre otras.

 Estas variables necesariamente tienen unidades de medida.

Las variable cuantitativa puede ser:

- DISCRETA : Cuando la variable sólo puede tomar valores enteros dentro


de una escala de valores. Proviene de un conteo.
Ejemplo: Número de emergencias médicas por día.

- CONTINUA : Cuando la variable puede tomar cualquier valor (entero o


fracción), dentro de una escala de valores. Provienen de una medición.
Ejemplo: Tiempo de permanencia de un paciente en un consultorio

Pag. 11
BIOESTADISTICA 1

CLASIFICACIÓN DE VARIABLES
2.-Variable Cualitativa :
 Es la que no se pueden expresar mediante números, sino por
cualidades o categorías que representen sus atributos.
 Solo se pueden registrar mediante el conteo.
 En casos especiales se puede expresar por un número pero
este se reconoce porque carece de unidad de medida.
 Matemáticamente las operaciones posibles con estas son: la
tasa porcentual (porcentaje), proporciones y la moda.

Ejemplo: Profesión de los participantes a un curso.


• 80% son médicos (tasa porcentual).
• 8 de cada 10 participantes son médicos (proporción).

Las variables cualitativas pueden ser:


a) Dicotómicas o Binarias (si o no)
b) Ordinales (orden creciente o decreciente)
c) Nominales (Profesiones, Estado Civil, etc.)

7. ESCALAS DE MEDIDA O MEDICION:

DEFINICION

Una escala es un patrón


convencional de medición, y
básicamente consiste en un
instrumento capaz de representar
con gran fidelidad verbal, gráfica o
simbólica, el estado de una variable

Pag. 12
BIOESTADISTICA 1

Tipos de escalas de medición


a) Escala Nominal o Intensiva: variables cualitativas nominales

b) Escala Ordinal: variables cualitativas ordinales

c) Escala de Intervalo

d) Escala de Proporción o Razón

a) Escala Nominal:
(variables cualitativas nominales)

 La escala de medida nominal, consiste en la asignación arbitraria


de números o símbolos a cada una de las diferentes categorías en
las cuales podemos dividir el carácter que observamos, sin que
puedan establecerse relaciones entre dichas categorías.
 consiste en clasificar los objetos de estudio según las categorías
de una variable. El alcance de esta escala es el conteo.

Ejemplo ESCALA

Sexo 1:Masculino 2:Femenino

Especialidad 1:Clínico 2:Cirugía

Pag. 13
BIOESTADISTICA 1

b) Escala Ordinal:
(variables cualitativas ordinales y cuantitativas ordenadas)

 En caso de que puedan detectarse diversos grados de un atributo, la escala


ordinal es la indicada, puesto que puede recurrirse a la propiedad de
"orden" de los números asignándolo a los objetos en estudio de modo que,
si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A
posee un mayor grado que B.

 Hay variables cuantitativas que se pueden convertir en una forma


ordinal, por ejemplo, la glicemia, se puede expresar en: Hipoglicemia,
Normoglicemia e Hiperglicemia.

Ejemplo: ESCALA
 Calificación : A,B,C,D A>B
 Lugar : 1º , 2º , 3º 1º > 2º
 Grado de deshidratación : I, II, III, IV I>II
 APGAR, Silverman, Glasgow.
 Escala del dolor
 Satisfacción de usuarios

c) Escalas de intervalos:
(variables cuantitativas)

 Se basa en la afirmación de la existencia de un continuo,


seccionable en partes iguales, en donde cada parte seccionada
contiene la misma cantidad de unidades que cualquier otra
sección.
 Es importante destacar que el punto cero en las escalas de
intervalos iguales es arbitrario, y no refleja en ningún momento
ausencia de la magnitud que estamos midiendo.
 Esta escala, además de poseer las características de la escala
ordinal, encontramos que la asignación de los números a los
elemento es tan precisa que podemos determinar la magnitud de
los intervalos (distancia) entre todos los elementos de la escala.

Ejemplo: Año 0
Hora 00:00
Temperatura 0ºC

Pag. 14
BIOESTADISTICA 1

d) Escala de coeficientes o Razones:


(Variables cuantitativas)

 La escala de medida más elevada es el de coeficientes o razones, y


se diferencia de las escalas de intervalos iguales únicamente por
poseer un punto cero propio como origen; es decir que el valor
cero de esta escala significa ausencia de la magnitud que se mide.

 Además, siendo que cero ya no es arbitrario, sino un valor


absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.

Ejemplo:
Ingreso mensual : S/.00.
Nº de hijos : 0
Procesos deficientes : 0

BIOESTADISTICA 2

PRESENTACION DE
DATOS

Pag. 15
BIOESTADISTICA 1

Tabulación y Graficación

 Todo análisis estadístico es una


estrategia para traducir la cantidad
de información obtenida en la
recolección de datos, a índices o
formas que sean interpretables y
que representen alguna dimensión
del comportamiento de las
variables

 La estrategia más sencilla es


mostrar la información en un
formato visual (gráficos) o en un
esquema sintetizado (tablas)

TABLAS ESTADISTICAS (de frecuencia)


Características
 Las tablas deben incluir todos los puntajes registrados
 Deben respetar las características de la variable
 Llevan un título representativo del contenido (sobre la tabla, numerado)
 Al pie de la tabla se debe consignar la fuente de la que proceden los datos.
 La forma más sencilla de presentar la información obtenida en un estudio es
contabilizar el número de veces que aparece cada VARIABLE. Este indicador se
conoce como la frecuencia (cantidad) de aparición da cada variable.
 Cuando presentamos una variable indicando la frecuencia de aparición de cada uno
de sus valores, tenemos una tabla de frecuencia.

 Frecuencias absolutas: Contabilizan el número total de variables de cada


modalidad o clase (intervalo).
 Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido por el
total, normalizadas y expresada en proporción o porcentaje.
 Frecuencias acumuladas absolutas y relativas: Acumulan las frecuencias
absolutas y relativas. Son especialmente útiles para calcular cuantiles
(como veremos más adelante).

Pag. 16
BIOESTADISTICA 1

Ejemplo de Tabla para variables cualitativas nominales

Título
Resultados de la votación distrital

Talón Cuerpo

Fuente
XXXX

Ejemplo de Tabla para variables cuantitativas discretas

OJO: Todo tipo de variables (cuanti y cuali) se puede tabular.

GRAFICOS (graficación)

 Son complementarios a la tabulación

 Representan la distribución de la variable

 Deben ser fáciles de interpretar

 Deben llevar un título representativo (bajo el gráfico y


numerado)

Pag. 17
BIOESTADISTICA 1

Gráficos para variables cualitativas

Gráficos de barras
CARGO

OPERARIO GENERAL
OPERADOR DE M AQUINA
AUTOM ATICA
DES PACHADOR DE PRODUCTO
TERM INADO LOCAL
OPERADOR DE DOBLE FILO

Se utilizan para representar la frecuencia de variables de OPERARIO GENERAL


OPERADOR DE DOBLE FILO

tipo cualitativa, por lo general de nivel nominal. CARGO

OPERARIO GENERAL
OPERADOR DE M AQUINA
Frec

145

10
AUTOM ATICA
DES PACHADOR DE PRODUCTO

Para graficarla, la variable debe haberse resumido TERM INADO LOCAL


OPERADOR DE DOBLE FILO
OPERADOR DE M AQUINA S T
8

4
12
OPERADOR DE S ERVICIOS

previamente en una tabla de frecuencias... GENERALES


OPERADOR GRAL. ALM ACEN
M ATERIA PRIM A Y PRODUCTOS
1

5
TERM INADOS

Título
203 operarios clasificados segùn tipo
160
145
140

Escalas 120
Cuerpo
Número de operarios

100

80

60

40

20 10 8 12
4 1 5
0
OPERARIO GENERAL OPERADOR DE MAQUINA DESPACHAD OR DE OPERADOR DE DOBLE OPERADOR DE MAQUINA OPERADOR DE OPERADOR GR AL.
AUTOMATICA PRODUCT O TERMINAD O FILO ST SERVICIOS G ENERALES ALMACEN MAT ERIA
LOCAL PRIMA Y PRO DUCTO S

Fuente TERMINAD OS

XXX Tipo de ope rario

Las barras están separadas entre si, y el ancho de las mismas no es representativo

Gráficos para variables cualitativas

Gráficos circulares (tortas, sectores, pie)


Al igual que los gráficos de barra, se utilizan para representar variables
de tipo cualitativa, generalmente para representar distribuciones
porcentuales respecto a una clasificación.
203 operadores según tipo

2% 1%
OPERARIO GENERAL
3%
4%
OPERADOR DE MAQUINA ST
5%

7% OPERADOR DE MAQUINA AUTOMATICA

DESPACHADOR DE PRODUCTO TERMINADO


LOCAL

OPERADOR GRAL. ALMACEN MATERIA PRIMA


Y PRODUCTOS TERMINADOS

OPERADOR DE DOBLE FILO


78%

OPERADOR DE SERVICIOS GENERALES

Pag. 18
BIOESTADISTICA 1

Otros gráficos para variables cualitativas

Pictogramas

 Fáciles de entender.
 Cada modalidad debe ser
proporcional a la
frecuencia.

Gráficos para variables cuantitativas

VARIABLES CUANTITATIVAS DISCRETAS

GRAFICO DE BARRAS GRAFICO INTEGRAL


(diferencial)

Pag. 19
BIOESTADISTICA 1

VARIABLES CUANTITATIVAS CONTINUAS

Histograma
Se utilizan para representar un conjunto de datos cuantitativos continuos. En
general se requiere previamente el cálculo de una tabla de frecuencia, y su
posterior representación.
Resultado Evaluación

70
60
Operadores

50
40
30
20
10
0
10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20
Salarios en miles

Polígonos de frecuencia

Están vinculados al histograma porque trabajan con la misma


información.

Resultado Evaluación Con dos pequeños


cambios se puede
60
convertir un
50
histograma en este
Operadores

40
polígono.
30
20
10 No es un gráfico muy
0 difundido a pesar de
11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 sus ventajas sobre el
Salarios en miles histograma.

Permite comparar varios conjunto de datos cuantitativos continuos

Pag. 20
BIOESTADISTICA 1

Otros tipos de Gráficos

Diagramas de dispersión
(gráfico de puntos o nube)

 Son gráficos muy simples que sirven para comparar la relación que existe
entre variables cuantitativas.

Peso - Talla

Peso - Velocidad Edad - Talla

Diagrama de Tallos y Hojas

Es un diagrama donde cada


valor de datos es dividido en
una “hoja” (normalmente el
último dígito) y un “tallo”
(los otros dígitos). Por
ejemplo el valor 32 seria
dividido en “3” (tallo) y “2”
(hoja).

Se aplica para variables


cuantitativas discretas.

Pag. 21
BIOESTADISTICA 1

Gráficos temporales

Se utilizan para representar series de datos donde el eje horizontal


está representado por el tiempo, es decir la variable evoluciona en el
tiempo.

Energía Consumida Mensual

8.000
7.500
7.000
GWh

6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses

Estos gráficos son útiles para explorar datos donde no


hay relaciones causales conocidas con otras variables

ESTADISTICA DESCRIPTIVA I

Pag. 22
BIOESTADISTICA 1

1. Centralización (Tendencia central)


◦ Indican valores con respecto a los que los datos parecen
agruparse.
 Media, mediana y moda

2. Medidas de Posición
◦ Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
 Cuantiles, percentiles, cuartiles, deciles,...

3. Medidas de Dispersión
◦ Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
 Desviación típica, coeficiente de variación, rango,
varianza

4. Formas de la Distribuciòn
◦ 4.1 Simetría
◦ 4.2 Apuntamiento o curtosis

 Son medidas estadísticas que se usan para resumir la localización


de los datos.
 Ubican e identifican UN VALOR alrededor del cual se centran o
agrupan los datos. Las medidas de tendencia central nos indican
hacia donde se inclinan o se agrupan más los datos.
 Las más utilizadas son: la media, la mediana y la moda.
 Es un valor de resumen que pretende “representar” a los valores
del conjunto.
. .
. . .
. . .
.
. .
. .
.
..
.

.
. .
.

. .
.
.. .
. .
.. .
..
.

. . .
.
.
.
.

.
.
.

.. . . . . MTC .
.
.
. .... . .

Pag. 23
BIOESTADISTICA 1

MEDIDAS DE TENDENCIA CENTRAL

MEDIA

MEDIANA

MODA

PERCENTILES

CUARTILES

 La media o media aritmética, usualmente se le llama promedio o


«esperanza matemática».
 Se obtiene sumando todos los valores de los datos y dividiendo
el resultado entre la cantidad de datos.
 Si los datos proceden de una muestra, el promedio se representa
con X (estadístico). Si los datos proceden de la población, se
utiliza la letra griega µ (parámetro).
 La Media es un valor que “depende” directamente de las
magnitudes de cada dato del conjunto.

Pag. 24
BIOESTADISTICA 1

Ventajas y desventajas de la media aritmética

Ventajas:

ä Concepto familiar para muchas personas

ä Es única para cada conjunto de datos

ä Es posible comparar medias de diferentes muestras

Desventajas

ä Se ve afectada por los valores extremos


ä Si la muestra es grande y los datos no están

agrupados, su cálculo es tedioso

ä Si los datos están agrupados en clases con extremos


abiertos, no es posible calcular la media.

1. Concepto
 Se le llama también media posicional, porque
queda exactamente en el medio de un grupo de
datos, luego de que los datos se han colocado
de forma ordenada.

 En este caso, la mitad (50%) de los datos estará


por encima del valor central (la mediana) y la
otra mitad (50%) estará por debajo de ella.

 La mediana es el valor que se ubica en el medio


de los valores de los datos previamente
ordenados.

 Se puede aplicar para variables cuantitativas y


cualitativas ordinales.

Pag. 25
BIOESTADISTICA 1

2. Calculo de la mediana
Obtención: Se obtiene ordenando la serie de datos (en forma
ascendente o descendente) y ubicando el dato central.
Ejemplo:
Los siguientes datos se refieren al número de niños atendidos durante
los últimos 11 días en un Servicio de Emergencia Pedriáticas del
Hospital de Huacho. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16


Primero se ordenan los datos:

5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17


5 datos menores 5 datos mayores
mediana

3. Interpretacion
Durante 5 días (50% del tiempo), se atendieron a menos de 11 pacientes
por día, y durante 5 días se atendieron a más de 11 pacientes por día.

Reglas

1º Si la serie es impar, la mediana corresponde a un valor del


conjunto de datos que ocupa el lugar central de la serie
previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

2º Si la serie es par, la mediana se obtiene de la semisuma de los dos


valores centrales de la serie previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18  23
mediana   20,5
2

3º Sea la serie par o impar, la mediana ocupa el lugar,


 n  1
de la serie previamente ordenada.  2 
 

Pag. 26
BIOESTADISTICA 1

Ventajas y desventajas de la mediana

Ventajas:

ä Los valores extremos no afectan a la mediana como en el caso de la media


aritmética.
ä Es fácil de calcular, interpretar y entender.
ä Es única para cada conjunto de datos
ä Se puede determinar para datos cualitativos.

Desventajas:

ä Como valor central, se debe ordenar primero la serie de datos.


ä Para una serie amplia de datos no agrupados, el proceso de ordenamiento
de los datos demanda tiempo y usualmente provoca equivocaciones.

Altura mediana

¿La serie de datos tiene


valores extremos?
(muy altos o muy bajos respecto
a la mayoría de datos)

SI NO

ASIMETRIA SIMETRIA

x x

Pag. 27
BIOESTADISTICA 1

 La moda es el dato que más se repite o el


dato que ocurre con mayor frecuencia.

 Un grupo de datos puede tener más de


una moda.

 Se puede aplicar para variables


cuantitativas y cualitativas nominales.

 Veamos el siguiente ejemplo: se tiene una


muestra con valores 20, 23, 20, 24, 25,
25, 26 y 30. El 20 y 25 son la moda
entonces, se dice que es bimodal.

Calculo de la moda
Obtención: se obtiene organizando la serie de datos y seleccionando el
o los datos que más se repiten.
Ejemplo:

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38

El modo
Cuando la muestra
es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal

Pag. 28
BIOESTADISTICA 1

MEDIDAS DE POSICION
(fractiles, cuantiles)

MEDIA

MEDIANA

MODA

PERCENTILES

CUARTILES

DEFINICIONES Y EQUIVALENCIAS
100%

 Las medidas de posición nos permiten


dividir a una distribución en 2 o mas partes,
iguales.
 Según el número de partes, éstas divisiones 50% M 50%
tendrán distintos nombres:

◦ Percentiles: Cuando dividimos una


distribución en100 partes. Q1 Q2 Q3
25% 25% 25% 25%

◦ Deciles: Cuando dividimos una


distribución en 10 partes.
20% 20% 20% 20% 20%
◦ Cuartiles : Cuando dividimos una
distribución en 4 partes.

◦ Mediana: Cuando dividimos una D5


distribución en 2 partes. 10% 10%

 Se aplica para Variables cuantitativas,


excepcionalmente ordinales.
P25 P50 P75
1% 1% 1% 1%

Pag. 29
BIOESTADISTICA 1

 Los percentiles dividen a los datos en cien partes iguales, cada una de
ellas contiene el 1% de los elementos del conjunto.
 Más o menos el (p) por ciento de los datos tienen valores menores que
el percentil y aproximadamente (100-p) por ciento de los datos tienen
valores mayores que el percentil.
 Un percentil nos provee información de como se distribuyen los
valores de los datos desde el menor hasta el mayor.

Un percentil divide en dos partes las observaciones. Por ejemplo, el


percentil X, P(X) , es el valor que deja por debajo un X % y por encima un
(100 – X) % de las observaciones

(X) % (100-X)%

Mínimo Percentil X Máximo

(PX)

VALORES

1 2 3 4 5 6 7

CADA POSICION CORRESPONDE A UN PERCENTIL

Posición (i) = Percentil X

Pag. 30
BIOESTADISTICA 1

p10 p90

1,800 gr 3,900 gr

10% de neonatos 80% de neonatos 10% de neonatos


PEQUEÑO PARA ADECUADO GRANDE PARA
EDAD PARA EDAD EDAD
GESTACIONAL GESTACIONAL GESTACIONAL

100% de neonatos

 Para calcular la posición del percentil, debe seguir los siguientes pasos:
Paso 1. Ordene los datos de manera ascendente.

Paso 2. Calcule un índice (i) que indica la


posición del percentil que se busca  P 
i n
en la serie de datos ordenados.  100 
en donde (p) es el percentil de interés y (n) es el número de datos u
observaciones del conjunto o serie.

Paso 3.
a) Si (i) no es entero, utilizando las reglas de redondeo, se lleva al próximo
numero entero. El valor entero inmediato mayor que (i) indica la posición
donde se encuentra el percentil. Esto significa que si (i) = 3.5, el percentil
se encuentra en la posición 4 de los datos ordenados.

b) Si (i) es entero, la posición del percentil es el promedio de los valores de


los datos ubicados en los lugares i e (i + 1). Veamos como se aplica

Pag. 31
BIOESTADISTICA 1

 Como ejemplo de este procedimiento, determina el percentil 75


de los datos sobre las edades del siguiente un grupo de
ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.

Paso 1. Ordene los datos en orden ascendente:

19 20 21 22 23 25 26 27 28 30
posición 1 2 3 4 5 6 7 8 9 10

Paso 2. Calcule el índice (i):  P   75 


i n i 10  7.5
 100   100 
Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o sea, el lugar
8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es el valor del dato ubicado
en la posición número 8, que en este caso es 27.

19 20 21 22 23 25 26 27 28 30
posición 1 2 3 4 5 6 7 8 9 10

Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el percentil que
estamos buscando.

 Significa que el 75% de las edades son menores de 27


años y el 25% restante (100-p) es mayor de 27 años.

 Los cuartiles dividen los datos en cuatro partes iguales.


 Cada una de las partes representa una cuarta parte, o el 25% de las observaciones.
 Los cuartiles son percentiles específicos; por consiguiente, los pasos para calcular
los percentiles los podemos emplear para calcular los cuartiles.
 El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima
75% de las observaciones (equivale al P 25). El Q2 es la mediana (50%)
(equivale al P50) y Q3 deja por debajo 75% y por encima 25% de las
observaciones (equivale al P75)

75% 25%
25% 75%

25% 25% 25% 25%

Cuartil 1 Mediana Cuartil 3 Máximo


Mínimo Cuartil 2
Q1 Q3
Q2

Pag. 32
BIOESTADISTICA 1

 A continuación se presenta un conjunto de datos con los siguientes


valores;
5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.

¿ Cómo identificamos los cuartiles en este ejemplo?


Utilizarás los mismos pasos para identificar los percentiles:

Primero, ordenamos los datos

5 8 11 12 14 15 18 20 25 30
1 2 3 4 5 6 7 8 9 10

Segundo, determinamos (i) para cada cuartil:

Q1 = primer cuartil, o percentil 25


Q2 = segundo cuartil, o percentil 50 (también la mediana)
Q3 = tercer cuartil, o percentil 75

 Primer cuartil:
Q1 = primer cuartil, o percentil 25
 25 
i 10 = 2.5
 100 
Como(i) no es un número entero, se redondea al próximo entero mayor que 2.5, o sea 3. Al
referirnos a los datos vemos que el primer cuartil está ubicado en la posición 3 de los datos que
este caso es 11. El primer cuartil en los datos se divide de la siguiente forma:
5 8 11 12 14 15 18 20 25 30 Q1=11
1 2 3 4 5 6 7 8 9 10

 Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (también la mediana)
 50 
i 10 = 5
 100 
Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los
datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:

5 8 11 12 14 15 18 20 25 30 Q1=11 ; Q2=14.5
1 2 3 4 5 6 7 8 9 10

Pag. 33
BIOESTADISTICA 1

 Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

 75  = 7.5
i 10
 100 
Como (i) no es un número entero, se redondea al próximo entero mayor que
7.5, o sea 8. Al referirnos a los datos , vemos que el tercer cuartil está ubicado
en posición 8 de los datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:

5 8 11 12 14 15 18 20 25 30
1 2 3 4 5 6 7 8 9 10

Q1=11 Q2=14.5 Q3=20

Ejemplos
En el Hospital Dos de Mayo los pesos de RN durante el año 2009 variaron
entre los 1500 gr hasta los 4,500 gr. Diga usted que porcentaje de niños
tuvieron un peso mayor de 3000 gr si se sabe que este peso corresponde
al percentil 80 de la serie total de RN durante el 2009?

p80

1500 gr 4500 gr
3000 gr

Pag. 34
BIOESTADISTICA 1

Ejercicios

• El 5% de los recién nacidos tiene un peso demasiado bajo. ¿En que percentil se
encuentra el peso por debajo del cual se considera “demasiado bajo”?

◦ ¿En que percentil se encuentra el peso que es superado sólo por el 25% de los
recién nacidos?

◦ El colesterol se distribuye simétricamente en la población. Si se


consideran patológicos los valores extremos. El 90% de los individuos son
normales ¿Entre qué percentiles se encuentran los valores que incluyen a
los individuos normales?

◦ ¿Entre qué percentiles se encuentran los valores en los que está la mitad de
los individuos “más normales” de una población?

Pag. 35
BIOESTADISTICA 1

Resuelve los siguientes ejercicios:

Se ha obtenido una muestra del salario de los Bomberos. Los datos recopilados
fueron los siguientes:
1500 $1400 $1600 $2100
1200 1300 1900 1800
2000 1200 1200 1500
2200 2300 1500 1400

a. determine el salario promedio


b. calcule la mediana y la moda.
c. calcule el percentil 65. Explique el resultado.
d. determine los cuartiles.

ESTADISTICA DESCRIPTIVA II

Pag. 36
BIOESTADISTICA 1

3. MEDIDAS DE DISPERSIÓN
Llamadas también medidas de variabilidad, variación.
Son útiles porque:
ä Permiten juzgar la confiabilidad de la medida de
tendencia central.

ä Miden la variabilidad de los datos y reflejan la


tendencia de los datos de alejarse entre si o de la
media, ya que caracterizar una distribución
solamente a través de una medida central no es
apropiado.

ä Es posible comparar dispersión de diversas


muestras.
Miden el grado de dispersión
ä Son importantes debido a que dos muestras de (variabilidad) de los datos,
observaciones con el mismo valor central pueden independientemente de su
tener una variabilidad muy distinta. causa.

MEDIDAS DE DISPERSIÓN

RANGO
DISPERSION EN RELACION
RANGO INTERCUARTIL A VALORES EXTREMOS

VARIANZA
DISPERSION EN RELACION
LA MEDIA ARITMETICA
DESVIACIÓN ESTÁNDAR

COMPARACION DE DISPERSION
COEFICIENTE DE VARIACION ENTRE GRUPOS O CONJUNTOS

Pag. 37
BIOESTADISTICA 1

RANGO
 Es también llamado: Amplitud, intervalo, recorrido o alcance.
 Es la medida de dispersión más sencilla.
 Se determina restando el valor mayor de los datos, del valor menor.

Ejemplo: Se tienen los siguientes valores de datos:

20, 25, 10, 5, 30, 35, 31, 23.


Rango = valor mayor – valor menor
35 – 5 = 30

Interpretación
La diferencia entre el valor mayor y el menor es de 30.

RANGO INTERCUARTILICO

También se denomina
Alcance intercuartilico.

Permite ubicar 50% de


los datos que se
encuentran en el centro
de la distribución, es
decir, 25% de los datos
son menores al primer
cuartil y también 25% de
los datos son mayores al
tercer cuartil.

RI  Q3  Q1

Pag. 38
BIOESTADISTICA 1

Veamos el siguiente ejemplo:

Determine el rango intercuartil para los datos siguientes (pesos de pacientes pediátricos);

30, 40, 35, 5, 10, 20, 15, 30 y 45:

Paso 1. Ordenar los datos de forma ascendente.


5 10 15 20 30 30 35 40 45
posición 1 2 3 4 5 6 7 8 9

Paso 2. Calcular los cuartiles Q3 y Q1:


Q3 = 75 percentil
Q1 = 25 percentil
Nota: Utiliza el mismo procedimiento para calcular los percentiles.
 Cuartil uno: Q1 = 25 percentil
 P   25 
i n = i   9 = 2.25
 100   100 

Como (i) no es un entero, redondeamos al próximo entero mayor que 2.25, o sea 3. Así,
que Q1 está ubicado en la posición tres (3) de los datos, que en este ejemplo es 15.

 Cuartil tres: Q3 = 75 percentil

 P   75  = 6.75
i n = i 9
 100   100 
Como (i) no es un entero, redondeamos al próximo entero mayor que 6.75, o sea 7. Así,
que Q1 está ubicado en la posición siete (7) de los datos, que en este ejemplo es 35.
5 10 15 20 30 30 35 40 45
posición 1 2 3 4 5 6 7 8 9

 Paso 3. Ahora, podemos sustituir los valores de los cuartiles en la fórmula.

Rango Intercuartil = Q3 – Q1

Interpretación:
El 50% de los pacientes pediátricos pesan entre 15 y 25 Kilos.
El rango intercuartilico de pesos de los pacientes pediátricos es de 20 Kilos.

Pag. 39
BIOESTADISTICA 1

VARIANZA
 La varianza es otra medida de dispersión que se basa en la diferencia entre
el valor de cada dato (Xi) y la media (x ).

 La diferencia entre cada dato (Xi) y su media ( x ) para una muestra se llama
desviación con respecto a la media o promedio y se expresa con la siguiente
fórmula:
n

 (X  x )
2

i

2 i 1
S n 1
 Para calcular la varianza, las desviaciones respecto a la media se elevan al
cuadrado y se dividen entre (N – 1).
• Este indicador nos muestra las variaciones al cuadrado respecto al
promedio.
• No se puede interpretar

Ejemplo:
La siguiente información se refiere al número de quejas recibidas en un Centro
Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15.

Elaboramos un cuadro de la forma siguiente

x Xi  x Xi  x  2

8 8 - 10 = - 2 4
60
x
10 10 - 10 = 0 0
5 5 - 10 = - 5 25 6
12 12 - 10 = 2 4

10 10 - 10 = 0 0
15 15 - 10 = 5 25 x  10
 X  60  Xi  x   0  Xi  x   58
2

 Xi  x   58
2

 (X i  x )
2
2 58
2
 S   11,6 quejas2
S n 1 6 1

Pag. 40
BIOESTADISTICA 1

DESVIACION ESTANDAR
 También llamada DESVIACION TIPICA, es la RAÍZ CUADRADA DE LA
VARIANZA.
 Es una medida de la variabilidad de un conjunto de datos respecto a
la MEDIA.
 Se calcula sacando la raíz cuadrada de la varianza. Nos indica cuánto
tienden a alejarse los datos del promedio. Si los datos son de una
muestra, la desviación estándar se representa como:

n
 (Xi  x)2
i 1
S s2 
n 1

 Para poder interpretar los datos debemos regresarlos a la escala


original (sacar la raíz cuadrada de la varianza).

Ejemplo:

La siguiente información se refiere al número de quejas recibidas en


un Centro Médico durante una semana. Calcule la desviación
estándar.
8, 10, 5, 12, 10, 15

Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2.


Entonces:

S
2
s

S  11,6 quejas 2
La unidad de medida de la DS
es igual a la de las variables
del conjunto

S  3,4 quejas

Pag. 41
BIOESTADISTICA 1

COEFICIENTE DE VARIACION
R
También llamado COEFICIENTE DE VARIACION DE PEARSON.

Es una medida de variabilidad relativa de los datos, permite


comparar la variabilidad de dos o más conjuntos de datos
expresados en unidades diferentes (peso; kg. y libras).

Cálculos a partir de datos no agrupados

Para la muestra:
s
CV  100
x

Ejercicio:

Diga usted cual de los siguientes conjuntos de variables es la


que tiene mayor variabilidad:

a) glicemia poblacional: media = 120 mg% y DS= 3 mg%

b) colesterolemia: media 150 mg% y DS = 10 mg%

c) talla: media =160 cm y DS = 5 cm

d) peso: media = 65 kg y DS = 6 kg

e) edad: media = 45 años y DS = 3 años

Pag. 42
BIOESTADISTICA 1

4. FORMAS DE DISTRIBUCION
(GRAFICOS)

4.1 SIMETRIA DE LOS DATOS

Otra característica de un conjunto de datos es la forma, es decir, la


manera en que están distribuidas las observaciones.
La distribución de los datos puede ser o no simétrica. Si la
distribución de los datos no es simétrica, se llama asimétrica, No
Normal o sesgada.
Para describir la forma se puede comparar la media y la mediana.
También puede observarse a través del coeficiente de asimetría Mide el
grado de Simetría / Asimetría de la distribución

Ejemplos de diferentes formas de distribución

Distribuciones simétricas
X = media
S = Desviación
estándar

Distribuciones asimétricas

Md = mediana
RI = Rango inter cuartil

Sesgo positivo Sesgo negativo

Asimétrica Derecha Asimétrica izquierda

Pag. 43
BIOESTADISTICA 1

PROPIEDADES DE LA DISTRIBUCION NORMAL


1. Tiene forma de campana, es
asintótica al eje de las abscisas.
2. Es simétrica respecto a la media.
3. La media, la mediana y la moda Puntos
tienen el mismo valor. de
inflexión
4. Toda curva normal se determina por
la media (X) y la desviación estándar
(S)
5. Los puntos de inflexión tienen como
abscisas los valores X  S
6. Independientemente de la X y S, el  S S
área total bajo la curva normal es +
1,00 (100%).  X-S X+S 
X
7. Regresión a la media, es decir la
mayoría de datos están cerca a la
media aritmética.

8. Regla Empírica “Teorema de


Chebyshev”

-1 1
-2 2
68%
-3 95% 3

99.9%

Pag. 44
BIOESTADISTICA 1

APLICACIÓN EN ESTADISTICA DESCRIPTIVA


ejercicios
 Diga ud. ¿cual es el intervalo de peso en Kg. en el que se encontrará el 68% de individuos de un marco
muestral, en el cual la media de peso es de 78Kg con una DS de + - 6 Kg.? .

 En que rango de Talla se encontrará el 95% de la población en la que se sabe que la media de talla es de 160
cm con una DS de + - 15 cm?

 En que rango de edades se encontrará el 99% de individuos de una muestra (marco), cuya media aritmética
fue de 35 años con una DS de +- 3 años.

Coeficiente de Asimetría de Pearson:


Fácil de calcular e interpretar.
 Cálculo:

ASP 

3 X  Md 
s
o Interpretación:
= 0, X=Md Simétrica

ASP > 0, X>Md Asimétrica Positiva

< 0, X<Md Asimétrica Negativa

Pag. 45
BIOESTADISTICA 1

4.2 KURTOSIS

La Forma de la distribución
Otra manera de apreciar la forma de una distribución es observar el
nivel de apilamiento o llanura de la curva

leptocúrtica Platicúrtica mesocúrtica


. (menor dispersión) (mayor dispersión)

El coeficiente de kurtosis mide el grado de apuntamiento de la


curva

Pag. 46

También podría gustarte