Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadistica Residentes Parte 2 Medidasdedispersion Agostode 2016
Bioestadistica Residentes Parte 2 Medidasdedispersion Agostode 2016
net/publication/305776015
CITATION READS
1 16,701
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
La aplicación de los dispositivos móviles y su inclusión como herramientas de trabajo en Facultades de Medicina. View project
All content following this page was uploaded by Octavio O. Danel Ruas on 04 August 2016.
Autores:
Octavio Oscar Danel Ruas
Asela Isabel Acosta Valenzuela
Carlos Andrés Santa María Rodríguez
Facultad de Ciencias Médicas Manuel Fajardo
Julio 2016
En el capítulo anterior vimos que las medidas de tendencia central nos informan sobre el
valor central de un conjunto de datos
La media, entre sus propiedades siempre existe y es única. Si a cada elemento de un
conjunto de datos se le suma una constante, la media aritmética de nuevo conjunto
será igual a la media aritmética del primer conjunto más la constante.En un conjunto de
datos, la sumatoria de la diferencia de todos los valores menos la media aritmética es
igual a 0.
La mediana, es el punto medio de los datos ordenados; es el valor que tiene por encima
y por debajo el 50% de los datos ordenados. Esta Indica el "centro" de la distribución,
no tiene en cuenta el valor de las observaciones.
Para calcular la mediana de un conjunto de datos primeramente será necesario
ordenar de menor a mayor o viceversa y después encontrar la posición central.La
mediana siempre existe, es única y no se afecta por valores extremos.
La moda, es el valor más frecuente de la distribución de los datos. No tiene fórmula.
Podemos tener más de una moda. Cuando todas las observaciones de una muestra
tienen lamisma frecuencia decimos que la muestra no tiene moda.La moda no siempre
existe. Si ninguno de los valores del conjunto de datos se repite no hay moda, no
siempre es única.
No siempre las medidas de tendencia central son suficientes para caracterizar a un
conjunto de datos. Por ejemplo: si tenemos el siguiente conjunto de datos
correspondientes al peso de un primer grupo de niños:
42 kg; 44 kg; 46 k, 48 kg y 50 kg.
Entonces a media de este conjunto de datos es:
MEDIDAS DE DISPERSIÓN
Medidas de dispersión:
• Nos indican donde se sitúa un grupo de observaciones.
• Nos indican si esas observaciones están próximas entre sí o si están muy
dispersas.
Medidas de Dispersión
Varianza:
Desviación típica
La desviación típica muestral es la raíz
cuadrada de la varianza muestral.
Ejercicio 2:
Tenemos dos grupos de personas del sexo masculino que nos proporcionan los
siguientes datos:
Grupo 1 Grupo 2 Establece a través del cálculo de
Edad 25 años 11 años los dos coeficientes de variación
Peso medio 72,5 kg 40 kg en cuál de los dos grupos de
Desviación Estándar 5 kg 5 kg edades hay mayor variabilidad.
Rango:
Otra medida de dispersión es el rango. Indica el recorrido de la variable en estudio, es
la diferencia entre el valormáximo y el mínimo en un conjunto de datos
Donde, x MAX es el mayor dato observado y x MIN es el
valor mínimo observado
Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más
dispersos están los datos de ese conjunto.
Ejercicio 4:
Se brindan los valores correspondientes a los niveles de colesterol en sangre de diez
pacientes hipertensos: 230, 240; 250; 250; 250; 210; 270; 240; 160 y 300 mg/100 ml.
a) Calcular la media de este conjunto de datos.
b) Calcular la varianza aplicando la fórmula anteriormente estudiada.
c) Determinar la desviación media y el coeficiente de variación.
Ejercicio 5:
A continuación se registran los datos de la edad de aparición genitourinaria en dos
grupos de mujeres:
Grupo 1: 35, 35, 37, 34, 38, 36, 32, 34, 36 y 33 años
Grupo 2: 2, 8, 30, 23, 68, 62, 40, 54, 47 y 16 años
Se quiere:
a) Calcular la media para ambos grupos de mujeres.
b) Determinar para cada uno de estos grupos la varianza.
c) Determinar la desviación media y el coeficiente de variación.
En ocasiones se nos presenta la necesidad del cálculo de estas medidas para un
conjunto de datos agrupados.
Ejercicio 6:
En un grupo de 16 estudiantes, se observó la estatura y se obtuvieron los siguientes
datos (ya ordenados):
1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.60 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79
Los datos se resumen en la siguiente tabla:
Después de ordenar los datos de menor a mayor, debemos localizar la posición del
cuantil (cuartil, decil o percentil deseado) para ello se calcula el por ciento de los
datos que se encuentran a la izquierda de dicho cuantil si el valor obtenido como
resultado del cálculo no es entero, se aproxima al entero inmediato superior que
coincide con esa condición del cuantil calculado. Si este número es entero se toma
el promedio de las observaciones del lugar que ocupa este entero y el entero
siguiente, de manera similar a lo que se realiza con la mediana.
b)La moda
c)La mediana
1er cuartil= 60
3er cuartil= 70
Ejercicio 14:
A continuación se muestra una Tabla que registra los 815 pacientes atendidos en la
consulta de emergencia de un hospital por accidentes de tránsito
Estos son los cálculos de P0, 10; P0, 25 y P0, 75 utilizando la fórmula con los datos
completos obtendremos P0, 10=10, 6; P0, 25=18,63 y P 0,75= 46,75 años
Percentiles en una Distribución normal.
La Asimetría.
Es una estadística necesaria para conocer cuánto se parece nuestra distribución a una
distribución teórica llamada “curva normal” y constituye un indicador del lado de la curva
donde se agrupan las frecuencias. Si es cero (asimetría = 0), la curva de distribución es
simétrica. Cuando es positiva quiere decir que hay valores agrupados hacia la izquierda
de la curva, por debajo de la media. Cuando es negativa significa que los valores
tienden a agruparse hacia la derecha de la curva, por encima de la media.
Procedimiento:
2- Para obtener los tres valores numéricos que dividen a la muestra ordenada en
cuatro partes iguales.
3- Los tres cuartiles, se denotan por Q1; Q 2 y Q 3
4- Primer cuartil, es un valor tal que 25% de las observaciones son menores y 75%
son mayores Q 1=XN+1/4 ( el subíndice indica la posición del dato), de donde
Q 1=X16+1/4= (153+157)/2= 155
El 25% de los estudiantes miden menos de 1.55 m y el otro 75% mide más
5- Segundo cuartil, es un valor tal que 50% de las observaciones son menores y el
otro 50% son mayores Q 2=X2( 16+1) /4 ( el subíndice indica la posición del dato),
de donde Q 2=X2(16+1) /4= (160+164)/2= 162
El 50% de los estudiantes miden menos de 1.62 m y el otro 50% mide más
Este es el valor de la mediana de estos datos
6- Tercer cuartil, es un valor tal que 75% de las observaciones son menores y el
otro 25% son mayores Q 3=X3(16+1) /4 ( el subíndice indica la posición del dato),
de donde Q 3=X3(16+1) /4= (166+166)/2= 166
El 50% de los estudiantes miden menos de 1.62 m y el otro 50% mide más
Ejercicio 16:
Con el objetivo de estudiar la eficacia de un régimen alimentario para tratamiento de
diabetes fueron recogidas 12 muestras de sangre en diabéticos y analizada la cantidad de
azúcar. Datos de glucosa de muestras sanguíneas (mg/100ml)
Ejercicio 17:
Los datos referentes al número de dientes cariados, perdidos u obturados en una muestra
de 20 personas tratadas en una clínica dentaria están presentados en la tabla a
continuación. (). Se pide:
Dientes cariados, perdidos u obturados 6 4 1 0 2 3 0 5 0 4 0 4 6 1 3 5 8 3 2 7
Ordenar el conjunto
De este modo queda identificado el 1ero. 2do y 3er cuartil para este conjunto o serie de
datos.
Ejercicio 21:
a) Para los datos de la función pulmonar de los 25 pacientes con fibrosis quística. Calcule el
valor de la mediana.
b) Calcula el primero, segundo y tercer cuartil.
c) Halla los percentil P10; P20 y P30
La Curtosis.
La curtosis es un indicador de lo plano o puntiaguda que es una curva. Cuando es cero,
curtosis = 0, significa que se trata de una curva Normal. Si es positiva, quiere decir que
la curva o distribución o polígono es más puntiaguda o levantada. Si es negativa quiere
decir que es más plana.
Asimetría
En distribuciones unimodales, la asimetría es una medida que nos permitirá saber hacia
dónde se agrupan los valores, si es una distribución normal, lo que tendremos que la
mayor parte de los valores se encuentren en el centro y en los extremos se encuentre
valores en menor cantidad. Pero si tenemos que hay más valores agrupados a la
izquierda se denomina asimetría positiva, mientras que si la mayor parte de los valores,
están agrupados a la derecha la asimetría será negativa, tal como se observa en la
figura de la página anterior.
PERCENTILES, DECILES Y CUARTILES
Si intentamos contestar la siguiente pregunta: ¿qué proporción de los valores de una
variable es menor o igual a un valor dado? ¿O proporción es mayor o igual a un dado
valor? ¿O entre dos valores?"
Cuando construimos una distribución de frecuencia acumulada, tales cuestiones
solamente pueden ser contestadas con relación a los límites de clase exactos.
Así diremos que el percentil x, es el valor de la variable que es mayor de lo que x % de
las observaciones. En otras palabras, el percentil x es el valor de la variable
correspondiente al valor de frecuencia relativa acumulada de x %
Para el cálculo del valor exacto del percentil x para datos agrupados se utiliza el mismo
método para la determinación de la mediana para un conjunto de datos ordenados, es
decir, la interpolación lineal.
El primer decil es el valor de la variable que supera un décimo (o en un 10 %) del total
de las observaciones. Si tenemos 200 observaciones, el segundo decil será
aproximadamente la observación de puesto 40.
El primer cuartil es el valor de la variable cuya frecuencia relativa acumulada es 0,25 (o
25 %). El tercer cuartil es el valor de la variable cuya frecuencia relativa acumulada es
0,75 (o 75 %). El primer cuartil es mayor de lo que un cuarto de los valores observados
y menor de lo que tres cuartos de estos valores. El tercer cuartil es mayor de lo que tres
cuartos de los valores observados y menor de lo que un cuarto de estos valores. El
segundo cuartil se coincide con la mediana.
Ejercicio 22:
A continuación se muestra la distribución de una muestra de 351 mujeres (adultas)
según su estatura, agrupadas por intervalos de frecuencias 1:
Aplica los cálculos correspondientes para comprobar los resultados de los valores de
los cuartiles, que se muestran en la siguiente Tabla de de mujeres según su estatura
Ejercicio 23:
Supongamos que tenemos 620 observaciones de frecuencia cardiaca en pacientes
portadores de hipertiroidismo.
¿Qué medida podría servirnos para delimitar el 25% de las frecuencias cardíacas
más bajas y que posición ocupará el elemento que separe ese 25% del 75%
restante?
El primer cuartil Q1 es el valor que tiene el 25% de 620 y el 75% a la derecha. Como
el conjunto contiene 620 observaciones.
Si deseáramos el dato del valor que separa el 20% a la izquierda y el 80% a la
derecha tendríamos que calcular el 20% de 620 y el 80% de 620.
En este caso aplicaremos una sencilla regla de 3, donde
¿Cuál sería la posición del primer cuartil, si en lugar de 620 fueran 625 observaciones,
manteniendo el fragmento anterior con la misma numeración?
Como 625 es un número impar el 25% de esa cantidad, será un número fraccionario. El
25% de 625 es 156,25 por lo que se aproxima al entero siguiente que es 157, la
posición del cuartil (Q 1)es 157 a esta observación le corresponde el valor de presión
arterial 120
Ejercicio 24:
Los siguientes datos corresponden a los tiempos de reacción de una muestra de 33
pacientes, medidos en centésimas de segundo.
55, 51, 60, 56, 64, 56, 63, 63, 61 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74,
65, 58, 61, 62, 59, 64, 57, 63, 52, 67. Para este conjunto de datos:
a) Calcule la media y la mediana
b) Determina el primer y tercer cuartil, a partir de los datos.
Con los datos del ejercicio anterior, se ha construido una tabla agrupados en cinco
intervalos de igual amplitud. Como R= X máx – X mín= 74 – 45 = 29, este número no es
divisible por cinco, luego redondeamos al valor más próximo por exceso, que es 30,
dividiendo entre el número de intervalos que deseamos que son cinco, tendremos que
la amplitud que deben tomar los intervalos es seis.
Ejercicio 25: