Está en la página 1de 25

21/02/2017

Universidad Autónoma de Sinaloa


Definiciones
Facultad de Ciencias Químico-Biológicas
Licenciatura en Químico Farmacéutico Biólogo Estadística: es un conjunto de procedimientos desarrollados para la
Bioestadística recopilación, representación, interpretación y el uso de datos de una
o varias características de interés a efecto de tomar decisiones,
extraer conclusiones o emprender acciones.

Estadística descriptiva

Dr. Carlos Iván Delgado Nieblas

Definiciones Definiciones

Estadística descriptiva: es la parte de la estadística encargada de Estadística inferencial: es la que trata de estimar las características de
organizar, resumir y describir las características principales de los una población a través del estudio de una muestra.
datos, generalmente en forma tabular, gráfica o numérica.
El estudio se realiza para hacer inferencias y generalizaciones respecto a
El análisis se limita a los datos coleccionados sin realizar inferencia una totalidad, basándose en la teoría de la probabilidad.
alguna o generalizaciones sobre la totalidad de donde provienen las
observaciones.

1
21/02/2017

Conceptos básicos Conceptos básicos


Población (N): es una colección finita o infinita de
Unidad estadística o de análisis: es el sujeto u objeto de estudio, que
individuos, elementos u objetos con características
se relaciona con el planteamiento inicial de la investigación, en donde para
comunes.
seleccionar la muestra, primero es definida la unidad de análisis.

Datos estadísticos: son el resultado de la observación asociado a la


Muestra (n): es un subconjunto de la población.
unidad de análisis.

Estos números pueden ser comparados, analizados e interpretados,


Parámetro: es un valor, medida o indicador
tomándose de la población o universo, pudiendo ayudar a tomar una
representativo de la población seleccionada para
decisión con más bases en una situación particular.
ser estudiada (µ, Md, σ, σ2), siendo datos
comprobados, existiendo registros (tasa de inflación,
crecimiento, etc).

Estadístico: elemento que describe una muestra,


sirviendo como estimación del parámetro de la
población (edad media de alumnos ( ), desviación
típica ( ) de ingresos de una empresa, etc).

Conceptos básicos Conceptos básicos


Cualitativa: son aquellas que no son medibles, en Ordinal: está caracterizada por una relación de orden dentro de
donde las observaciones no tienen carácter las categorías.
numérico, expresando atributos o categorías.

Segundo Primer Tercer


lugar lugar lugar

Variable
Variable estadística Cuantitativa: son aquellas que son medibles, cualitativa Nominal: está caracterizada por eventos mutuamente
(es toda característica que teniendo sus observaciones carácter numérico. excluyentes, denotando características únicas.
puede tomar diferentes Colores
valores).

2
21/02/2017

Conceptos básicos Representación tabular de datos


Continuas: pueden tomar cualquier valor real dentro de un Se presentan datos estadísticos por medio de un conjunto de filas y de
intervalo. Entre 2 valores, podrá presentarse otro valor columnas que responden a un ordenamiento lógico.
intermedio que puede tomarse como valor por la variable
continua. Tiene alta importancia para el usuario, constituyendo una forma con alta
exactitud para presentar la información.
Peso
Estatura La representación tabular de datos se lleva a cabo mayormente mediante
tablas de distribución de frecuencias y tablas de contingencia.

Variable
cuantitativa
Discretas: estas variables sólo pueden tomar valores
enteros de un conjunto de números, existiendo entre los Tabla de distribución de frecuencias Tabla de contingencia
valores de esta variable una distancia que no se completa con
valores intermedios.
Producción estimada de
Número de hijos Vehículos en México (millones)
Número de vehículos
Cantidad de mascotas

Distribución de frecuencia Distribución de frecuencia


Es una disposición tabular de datos estadísticos, ordenados ascendente
Rango (R): es la diferencia entre el valor mayor y el valor menor en un
o descendentemente, de acuerdo a la frecuencia de cada dato.
estudio de una distribución de datos.
Existen 2 tipos de distribución de frecuencias fundamentales, las no DM = Dato mayor.
agrupadas en intervalos (n < 30) y las agrupadas en intervalos (alto R= DM - Dm Dm = Dato menor.
número de datos, (n> 30)).

Cuando se agrupan los datos en intervalos de clase, la tabla se


construye con los valores de frecuencia absoluta, frecuencia relativa,
frecuencia acumulada absoluta, frecuencia acumulada relativa, etc.
Sin agrupar en Agrupados
intervalos en intervalos
Marca de clase (Xi): es el punto medio de
Datos no agrupados la clase, obteniéndose dividiendo entre dos
la suma de los valores extremos de cada
clase.

3
21/02/2017

Distribución de frecuencia Distribución de frecuencia

Clase: es cada uno de los grupos en que se dividen los datos. Frecuencia absoluta (fi): es el número de veces que se repite cada dato.
Cuando se agrupan los datos, es el número de datos que tiene cada clase.
Para determinar el número de clases a crear, puede utilizarse la fórmula
de Sturges, en donde al obtenerse un número decimal, se aproxima al Frecuencia absoluta acumulada (Fi): es la frecuencia total hasta el límite
siguiente entero. superior de cada clase, siendo simbolizada con Fj.

Número de clases = 1 + 3.322 log n


n= número total de datos

Intervalo de clase: es el espacio que hay entre el límite superior y el


límite inferior de la clase (valores extremos), utilizándose para su
obtención la siguiente fórmula:

Intervalo o amplitud de clase = (dato superior – dato inferior (R)) / número de


clases
Rango
Intervalo o amplitud de clase =
Número de clases

Distribución de frecuencia Representación tabular de datos


Frecuencia relativa (fri): se obtiene dividiendo la frecuencia absoluta
entre el número total de datos, pudiendo expresarse como fracción, Tablas de contingencia: es una tabla de frecuencias utilizadas para el
decimal o porcentaje, siendo simbolizada con: registro y análisis de la correlación entre diferentes variables
f
fi = j normalmente cualitativas (nominales u ordinales), conociéndose también
N como tabla bidimensional o de doble entrada.
Frecuencia relativa acumulada (Fri): es la frecuencia relativa total hasta
el límite superior de cada clase, simbolizándose con Fj / N donde N es el
número total de datos. # Persona 1 2 3 4 5 6 7 8 9 10
Sexo M M F F M M F M F M
Estado civil C S S D C D S S C D
C= Casado; S= Soltero; D= Divorciado; M= Masculino; F= Femenino.

Encuesta sobre el
estado civil y sexo de
10 personas

4
21/02/2017

Representación gráfica de datos Representación gráfica de datos


Es una representación visual complementaria a la tabular en donde se Diagrama de barras: utiliza barras rectangulares de forma horizontal o
resumen los datos de estudio. vertical que tienen proporcionalidad con las frecuencias que representan
dichas barras, para llevar a cabo la comparación de diferentes valores.
Esta representación es adaptada en los diferentes casos a la finalidad
informativa perseguida, transmitiéndose los resultados de los análisis de forma Representan variables cualitativas y cuantitativas discretas,
rápida, directa y comprensible a un amplio conjunto de personas. colocándose las variables y frecuencias de cada dato o modalidad en el
eje de la abscisas u ordenadas dependiendo del tipo de gráfica.
Alguna formas de representación gráfica son: diagramas de barras,
histogramas, polígonos de frecuencias, gráficos de sectores, pictogramas,
cartogramas, pirámides de población, etc. Diagrama de barras-Calificaciones obtenidas en la Diagrama de barras-Tipo de enfermedades en personas
asignatura de Biología. hospitalizadas.

Representación gráfica de datos Representación gráfica de datos


Histograma: es un tipo de gráfica en la cual las barras aparecen pegadas
Polígono de frecuencias: es la gráfica obtenida al unir consecutivamente
(sin espacio entre ellas), representando cada barra un subconjunto de
mediante segmentos los puntos de intersección entre los puntos
datos.
medios de las clases (marcas de clase) y su frecuencia.
Es adecuado para la representación gráfica de variables continuas y
Esta gráfica incluye el punto medio previo a la primera clase y el punto
discretas, mostrándose la distribución de la variable, y pudiéndose
medio siguiente a la última clase
agrupar los datos en intervalos de igual tamaño denominados clases.
Galones muestreados

28 30 32 34

Concentración de cloro (ppm)

5
21/02/2017

Representación gráfica de datos Representación gráfica de datos


Gráfica de sectores: es un círculo dividido en sectores de amplitud
Ojiva: es un polígono de frecuencias acumuladas que muestra la proporcional a la frecuencia de cada valor, pudiendo utilizarse para datos
cantidad de observaciones encontradas por encima o debajo de cualitativos y cuantitativos.
ciertos valores, utilizando en el eje horizontal los límites de cada
intervalo.

Existen las ojivas «mayor qué, >» y las ojivas «menor qué, <), en donde
la ojiva «mayor qué» el dato que se está comparando tendrá una
pendiente negativa (hacia abajo y a la derecha), mientras que la «menor
qué», tendrá una pendiente positiva.
Composición en volumen del gas natural
Tipos de sangre y factor Rh
Ojiva menor qué Ojiva mayor qué
Frecuencias absolutas acumuladas Frecuencias absolutas acumuladas

Representación gráfica de datos Representación gráfica de datos


Pictograma: es utilizado para datos cualitativos, colocando dibujos
Diagrama de caja: es un gráfico que permite visualizar a través de los
relacionados con el estudio en lugar de diagramas de barras, siendo
cuartiles la distribución, grado de asimetría, valores extremos, posición de
el tamaño de los dibujos proporcional a la frecuencia.
la mediana, de un grupo de datos.
Simétrica
Tienen menor exactitud, pero presentan alta atracción visual.

6
21/02/2017

Representación gráfica de datos Representación gráfica de datos

Cartogramas: son gráficos realizados sobre mapas, en donde se Píramide poblacional: es una forma de representar datos estadísticos
presentan indicadas sobre las diferentes zonas, cantidades o colores de básicos, sexo y edad, de la población de un país.
acuerdo a lo que representan.
Los segmentos de población se establecen como generaciones,
generalmente de 5 años, representadas en forma de barras
horizontales que parten de un eje común, hacia la izquierda los varones,
hacia la derecha las mujeres.

Distribución de frecuencia Distribución de frecuencia


De acuerdo a los siguientes datos de los análisis de niveles de glucosa en sangre
(mg/dL) de un grupo de obreros, realizados antes del desayuno: 101 87 80 75 97 160 165 101 103 97 95 92 109 103 105
92 93 93 103 105 108 96 106 94 97 92 103 102 101 93
101 87 80 75 97 160 165 101 103 97 95 92 109 103 105 95 97 91 93 95 97 100 92 87 95 100 101 83 78 87
92 93 93 103 105 108 96 106 94 97 92 103 102 101 93 92 93 104 101 96 101 102 92 83 87 78 79 87 83 86
95 97 91 93 95 97 100 92 87 95 100 101 83 78 87 92 93 95 90 105 102 110 125 153 138 57 89 83 82 95
92 93 104 101 96 101 102 92 83 87 78 79 87 83 86 Rango (R) = XM – Xm
92 93 95 90 105 102 110 125 153 138 57 89 83 82 95 XM = 165
Xm = 57 Intervalo o R
Rango = 165 – 57 amplitud de clase =
Construya lo siguiente: k

1.- Una distribución de frecuencias absolutas, relativas, absolutas acumuladas, R = 108 Intervalo o 108
relativas acumuladas amplitud de clase =
8
2.- Un histograma de frecuencias Recomendación: 5 ≤ k ≤15
3.- Un polígono de frecuencias Intervalo o
4.- Una ojiva menor qué y una ojiva mayor qué. amplitud de clase = 13.5 = 14
Número de intervalos (k) = 1 + 3.322 log n
a) Qué porcentaje de las mediciones es < a 98 mg/dL?
k= 1 + 3.322 log 75
b) Qué porcentaje de los datos es ≥ a 126 mg/dL ?
k= 7.228 = 8

7
21/02/2017

Distribución de frecuencia Representación gráfica


Marca de Frecuencia Frecuencia Frecuencia Frecuencia
L.I. L.S. clase Absoluta Relativa absoluta relativa Histograma:
(Xi) (fi) (fri) acumulada acumulada
(Fi) (Fri)
56 70 63 1 0.013333333 1 0.013333333
70 84 77 10

(Frecuencia absoluta)
Número de pacientes
0.133333333 11 0.146666667
84 98 91 36 0.48 47 0.626666667
98 112 105 23 0.306666667 70 0.933333333
112 126 119 1 0.013333333 71 0.946666667
126 140 133 1 0.013333333 72 0.96
140 154 147 1 0.013333333 73 0.973333333
154 168 161 2 0.026666667 75 1
Total 75 1
Recomendaciones: 56 70 L.I. (56) ≥ X < L.S. (70)
LI= Xm – U LI= X – (U/2) Marca de
LS= LI + A
m clase 52 75 98 Unidad (U)= 1
4.5 5.4 6.3 Unidad (U)= 0.1 Niveles de glucosa en sangre (mg/dL)
Xm= dato menor = (Marca de clase)
A= amplitud de clase 52.05 63.06 98.07 Unidad (U)= 0.01

Representación gráfica Representación gráfica

Polígono de frecuencias: Histograma y polígono de frecuencias superpuestos:


(Frecuencia absoluta)

(Frecuencia absoluta)
Número de pacientes

Número de pacientes

Niveles de glucosa en sangre (mg/dL) Niveles de glucosa en sangre (mg/dL)


(Marca de clase) (Marca de clase)

8
21/02/2017

Distribución de frecuencia Representación gráfica

Ojiva (<, menor qué): Ojiva (<, menor qué):

Clase agregada

(Frecuencia absoluta acumulada


Frecuencia Frecuencia absoluta Frecuencia absoluta
para elaborar la L.I. L.S. Absoluta acumulada acumulada
gráfica iniciando (fi) (ascendente (Fi)) (descendente (Fid))
en Fi= 0 (- a +) (+ a -)
42 56 0 0

Ascendente)
56 70 1 1 75
70 84 10 11 74
84 98 36 47 64
98 112 23 70 28
112 126 1 71 5
126 140 1 72 4
140 154 1 73 3
154 168 2 75 2 (Límite superior)
Total 75 0

Distribución de frecuencia Representación gráfica

Ojiva (>, mayor qué): Ojiva (>, mayor qué):


(Frecuencia absoluta acumulada

Frecuencia Frecuencia absoluta Frecuencia absoluta


L.I. L.S. Absoluta acumulada acumulada
(fi) (ascendente (Fi)) (descendente (Fid))
(- a +) (+ a -)
descendente)

56 70 1 1 75
70 84 10 11 74
84 98 36 47 64
98 112 23 70 28
Clase agregada
para elaborar la
112 126 1 71 5
gráfica, 126 140 1 72 4
finalizando en 140 154 1 73 3
Fi= 0
154 168 2 75 2
168 182 0 0 0 (Límite inferior)
Total 75

9
21/02/2017

Representación gráfica Representación gráfica


Niveles de glucosa (mg/dL) Frecuencia absoluta
57 1
Datos no agrupados en intervalos: 75 1 Datos no agrupados en intervalos:
78 2
79 1
80 1
82 1
83 4
86 1
87 5
89 1
90 1

(Frecuencia absoluta)
Número de pacientes
91 1
92 7
93 6
94 1
95 6
96 2
97 5
100 2
101 6
102 3
103 4
104 1
105 3
106 1
108 1
109 1
110 1
125 1
138 1
153 1
160 1 Niveles de glucosa en sangre (mg/dL)
165 1

Distribución de frecuencia Distribución de frecuencia


De acuerdo a los siguientes datos de los niveles de hemoglobina (g/dL) en sangre de
12.4 12.8 19.2 14.5 12.3 12.9 10.2 13.5 12.8
pacientes en el hospital.
13.4 7.5 14.3 15.8 16.3 11.2 11.6 11.3 7.5

12.4 12.8 19.2 14.5 12.3 12.9 10.2 13.5 12.8 16.8 18.3 13.5 10.1 12.7 14.5 12.8 12.9 13.7

13.4 7.5 14.3 15.8 16.3 11.2 11.6 11.3 7.5 14.5 14.4 17.5 16.9 14.1 14.5 14.7 12.8 12.4

16.8 18.3 13.5 10.1 12.7 14.5 12.8 12.9 13.7 10.4 10.7 12.6 9.8 11.9 12.7 12.6 12.7 14.7

14.5 14.4 17.5 16.9 14.1 14.5 14.7 12.8 12.4 Rango (R) = XM – Xm
10.4 10.7 12.6 9.8 11.9 12.7 12.6 12.7 14.7 XM = 19.2
Xm = 7.5 Intervalo o R
Rango = 19.2 – 7.5 amplitud de clase =
Construya lo siguiente: k

1.- Una distribución de frecuencias absolutas, relativas, absolutas acumuladas, R = 11.7 Intervalo o 11.7
relativas acumuladas amplitud de clase =
7
2.- Un histograma de frecuencias Recomendación: 5 ≤ k ≤15
3.- Un polígono de frecuencias Intervalo o
4.- Una ojiva menor qué y una ojiva mayor qué. amplitud de clase = 1.67 = 1.7
Número de intervalos (k) = 1 + 3.322 log n
a) Qué porcentaje de las mediciones es ≥ a 12.5 g/dL y menor a 15.9 g/dL ?
k= 1 + 3.322 log 45
b) Qué porcentaje de los pacientes tiene un valor de hemoglobina ≥ a 10.8 g/dL ?
k= 6.491 = 7

10
21/02/2017

Distribución de frecuencia Representación gráfica

L.I. L.S. Marca de Frecuencia Frecuencia Frecuencia Frecuencia


Histograma:
clase Absoluta Relativa absoluta relativa
(Xi) (fi) (fri) acumulada acumulada
(Fi) (Fri)
7.4 9.1 8.25 2 0.044444444 2 0.044444444

(Frecuencia absoluta)
Número de personas
9.1 10.8 9.95 5 0.111111111 7 0.155555556
10.8 12.5 11.65 7 0.155555556 14 0.311111111
12.5 14.2 13.35 16 0.355555556 30 0.666666667
14.2 15.9 15.05 9 0.2 39 0.866666667
15.9 17.6 16.75 4 0.088888889 43 0.955555556
17.6 19.3 18.45 2 0.044444444 45 1
Total 45 1

Recomendaciones: 7.4 9.1 L.I. (7.4) ≥ X < L.S. (9.1)


LI= Xm – U LI= X – (U/2) Marca de
LS= LI + A
m clase 52 75 98 Unidad (U)= 1
4.5 5.4 6.3 Unidad (U)= 0.1 Contenido de hemoglobina (g/dL)
Xm= dato menor = (Marca de clase)
A= amplitud de clase 52.05 63.06 98.07 Unidad (U)= 0.01

Representación gráfica Representación gráfica

Polígono de frecuencias: Histograma y polígono de frecuencias superpuestos:


(Frecuencia absoluta)

(Frecuencia absoluta)
Número de personas

Número de personas

Contenido de hemoglobina (g/dL) Contenido de hemoglobina (g/dL)


(Marca de clase) (Marca de clase)

11
21/02/2017

Distribución de frecuencia Representación gráfica

Ojiva (<, menor qué): Ojiva (<, menor qué):

Clase agregada

(Frecuencia absoluta acumulada


Frecuencia Frecuencia absoluta Frecuencia absoluta
para elaborar la L.I. L.S. Absoluta acumulada acumulada
gráfica, (fi) (ascendente(Fi)) (descendente (Fid))
iniciando en (- a +) (+ a -)
5.7 7.4 0 0

Ascendente)
Fi= 0.

7.4 9.1 2 2 45
9.1 10.8 5 7 43
10.8 12.5 7 14 38
12.5 14.2 16 30 31
14.2 15.9 9 39 15
15.9 17.6 4 43 6
17.6 19.3 2 45 2
(Límite superior)
Total 45 0

Distribución de frecuencia Representación gráfica

Ojiva (>, mayor qué): Ojiva (>, mayor qué):


(Frecuencia absoluta acumulada

Frecuencia Frecuencia absoluta Frecuencia absoluta


L.I. L.S. acumulada acumulada
Absoluta
(ascendente (Fi)) (descendente (Fid))
(- a +) (+ a -)
descendente)

7.4 9.1 2 2 45
9.1 10.8 5 7 43
10.8 12.5 7 14 38
12.5 14.2 16 30 31
Clase agregada
para elaborar la 14.2 15.9 9 39 15
gráfica, 15.9 17.6 4 43 6
finalizando en
17.6 19.3 2 45 2
Fid= 0.
19.3 21 0 0 (Límite inferior)

Total 45

12
21/02/2017

Representación gráfica Representación gráfica


Contenido de hemoglobina (g/dL) Frecuencia absoluta
7.5 2
Datos no agrupados en intervalos: 9.8 1 Datos no agrupados en intervalos:
10.1 1
10.2 1
10.4 1
10.7 1
11.2 1
11.3 1
11.6 1
11.9 1

(Frecuencia absoluta)
12.3 1

Número de pacientes
12.4 2
12.6 2
12.7 3
12.8 4
12.9 2
13.4 1
13.5 2
13.7 1
14.1 1
14.3 1
14.4 1
14.5 4
14.7 2
15.8 1
16.3 1
16.8 1
16.9 1
17.5 1
18.3 1
19.2 1 Contenido de hemoglobina (g/dL)

Medidas de tendencia central Medidas de tendencia central


Son medidas estadísticas que resumen en sólo un valor al conjunto Datos agrupados: son aquellos datos que se agrupan en frecuencias
total de datos, considerándose representativo del todo, indicando como simples, o en intervalos de clase, generalmente cuando su población es
los datos individuales se relacionan con el centro del conjunto total. mayor a 30 elementos, siendo uno de sus objetivos resumir la
información.
Las medidas de tendencia central más utilizadas son: media, mediana y
moda, pudiéndose utilizar para datos agrupados y no agrupados. Cuando los datos se presentan en una tabla de frecuencias sólo pueden
Datos agrupados Datos no agrupados obtenerse aproximaciones de las medidas de tendencia central.

57 68 58 21 12 45 56 58 59
47 35 16 22 57 26 21 65 92

13
21/02/2017

Medidas de tendencia central Medidas de tendencia central


Media aritmética: cuando es calculado este valor en datos agrupados se 1.- Obtener la media aritmética de los datos de la edad (años) de enfermos
obtiene mediante la siguiente formula: atendidos en una clínica, agrupados en intervalos.

Donde:
= media aritmética; = frecuencia absoluta; k= número
de clases; = marca de clase.

Medidas de tendencia central Medidas de tendencia central


2.- Obtener la media aritmética de los datos de niveles de glucosa (mg/dL) de 3.- Obtener la media aritmética de los datos de niveles de hemoglobina (g/dL) de diferentes
diferentes personas, agrupados en intervalos. pacientes, agrupados en intervalos.

Marca de Frecuencia Frecuencia Frecuencia Frecuencia


L.I. L.S. L.I. L.S. Marca de Frecuencia Frecuencia Frecuencia Frecuencia
clase Absoluta Relativa absoluta relativa
clase Absoluta Relativa absoluta relativa
(Xi) (fi) (fri) acumulada acumulada
(Xi) (fi) (fri) acumulada acumulada
(Fi) (Fri)
(Fi) (Fri)
56 70 63 1 0.01333333 1 0.013333333
7.4 9.1 8.25 2 0.04444444 2 0.044444444
70 84 77 10 0.13333333 11 0.146666667
9.1 10.8 9.95 5 0.11111111 7 0.155555556
84 98 91 36 0.48 47 0.626666667
10.8 12.5 11.65 7 0.15555555 14 0.311111111
98 112 105 23 0.30666666 70 0.933333333
12.5 14.2 13.35 16 0.35555555 30 0.666666667
112 126 119 1 0.01333333 71 0.946666667
14.2 15.9 15.05 9 0.2 39 0.866666667
126 140 133 1 0.01333333 72 0.96
15.9 17.6 16.75 4 0.08888888 43 0.955555556
140 154 147 1 0.01333333 73 0.973333333
17.6 19.3 18.45 2 0.04444444 45 1
154 168 161 2 0.02666666 75 1
Total 45 1
Total 75 1
= (63)(1)+ (77)(10) + (91) (36) + (105) (23) + (119) (1) + (133)(1) + (147)(1)+ (161)(2) = = (8.25)(2) + (9.95)(5) + (11.65) (7) + (13.35) (16) + (15.05) (9) + (16.75)(4) + (18.45) (2) =
75
45
= 96.6 mg/dL = 13.35 g/dL

14
21/02/2017

Medidas de tendencia central Medidas de tendencia central


Mediana: su obtención en datos agrupados es mediante la utilización de 1.- Obtener la mediana de los datos de niveles de glucosa (mg/dL) de
la siguiente fórmula: diferentes personas, agrupados en intervalos.

Mediana se encuentra en el intervalo


donde la frecuencia acumulada llega
hasta la mitad de la suma de las
frecuencias absolutas

Donde:

Li = límite inferior de la clase que contiene a la mediana.

= sumatoria de frecuencias acumuladas hasta la clase anterior de la que


contiene a la mediana.

= frecuencia absoluta de la clase que contiene a la mediana.

A = amplitud de la clase que contiene a la mediana.


75
11
= número de datos en la muestra. Mediana = 84 + 2 * 14 = 94. 305 mg/dL
36 Mediana

Medidas de tendencia central Medidas de tendencia central


2.- Obtener la mediana de los datos de niveles de hemoglobina (g/dL) de diferentes Moda: se obtiene en datos agrupados utilizando la fórmula siguiente:
pacientes, agrupados en intervalos.

La moda se encuentra en
Mo = Li + * A
+ la clase que tiene la mayor
frecuencia absoluta

Mo= Moda.

Li= Límite inferior del intervalo que contiene la moda.

A= Tamaño del intervalo de clase.

d1= Frecuencia absoluta modal sobre la clase contigua anterior.


* = ( )

45 d2= Frecuencia absoluta modal sobre la clase contigua superior.


14 13.40 g/dL
Mediana = 12.5 + 2 * 1.7 =
= ( + )
16 Mediana

15
21/02/2017

Medidas de tendencia central Medidas de tendencia central


1.- Obtener la moda de los datos de niveles de glucosa (mg/dL) de diferentes 2.- Obtener la moda de los datos de niveles de hemoglobina (g/dL) de diferentes pacientes,
personas, agrupados en intervalos. agrupados en intervalos.

*

Mo = Li + + * A Mo = Li + + * A " %
!" # Mo =12.5 + = 13.456 mg/dL
= ( ) Mo = 84 + = 93.333 mg/dL = ( ) & + % * 1.7
" + ! * 14 Moda
Moda
=
( + )) =
( + ))

Medidas de tendencia central Medidas de tendencia central


Datos no agrupados: son aquellos datos presentados en su forma Media aritmética: es el promedio de las lecturas o mediciones
original, de la manera en la cual fueron recolectados, obteniendo individuales que se tienen en la muestra o población
información directamente de ellos.
∑+,-
Son analizados sin necesidad de formar clases con ellos. ) =
.
Donde:
Donde: ) = media aritmética; = dato i; .=
' = media aritmética; = dato i; ( = número de observaciones en la
número de datos en la muestra. población.

Propiedades:
Para un conjunto de datos existe únicamente una media, siendo su cálculo y
comprensión sencillos.
Todos los valores del conjunto sirven para su determinación, por lo que valores
extremos pueden distorsionar la información.
Reporte el tiempo de caducidad promedio (meses) de un medicamento antigripal, de acuerdo a
los siguientes datos:

54 36 56 43 21 34 42 53

= 54+ 36 + 56 + 43 + 21 + 34 + 42 + 53 = 42.3 meses


8

16
21/02/2017

Medidas de tendencia central Medidas de tendencia central


Media geométrica ( / ): es obtenida de un conjunto de números Media armónica ( 9: ): esta determinación es recíproca de la media
estrictamente positivos (X1, X2,…,Xn), siendo la raíz n-ésima del aritmética, en donde los datos del conjunto deben ser diferentes de 0, con
producto de los n elementos, además / ≤ . poca sensibilidad a valores grandes, pero con alta sensibilidad a números
cercanos a 0, siendo ;< ≤ .
En un hospital quieren conocer la proporción media de mujeres en 5 especialidades
médicas, a partir de los porcentajes mostrados, reporte la media geométrica:
Un automóvil en el cual se distribuyen medicamentos hizo un recorrido de 400 km,
los primeros 100 km los recorrió a 80 km/h, los siguientes 100 km a 50 km/h, los
terceros 100 km a 110 km/h y los últimos 100 km a 95 km/h. A qué velocidad
Porcentaje de mujeres por promedio se desplazó el automóvil?, repórtela como media armónica.
especialidad 8
Especialidad Porcentaje (%) 01 = 1 ∗ 2 ∗ 3…... (
Donde:
Oftalmología 35.7 5
= 35.7 ∗ 62.4 ∗ 35.8 ∗ 45.2 ∗ 36.7 n = número total de datos.
01
Ginecología 62.4 X = elementos.
Psiquiatría 35.8 01 = 42.10
Dermatología 45.2 @ @ @ ∗AEGBB = 76.75 km/hr
=>? , -
- ,
- - @ECF , @ECF
Alergología 36.7 AB CB --B DC AEGBB

Medidas de tendencia central Medidas de tendencia central


Media ponderada ( U ): Este tipo de media asigna a cada dato un peso en Mediana: es aquel valor que divide al conjunto en dos partes iguales,
función de su importancia, teniendo amplias aplicaciones, tales como el de forma que el número de valores mayores o iguales a la mediana es
promedio de una asignatura, entre otras. igual al número de valores menores o iguales a esta.

En caso de presentarse un número de valores impar, la mediana será el


Reporte la calificación final del parcial # 1 de la asignatura de química, tomando en valor medio o central, al arreglarse los datos por orden de magnitud.
consideración el valor asignado a cada uno de los elementos evaluados.
Al ser el número de valores del conjunto par, existen dos valores medios,
Calificación parcial de la asignatura de siendo la mediana la media de esos valores centrales, al ser arreglados
Química los valores en orden de magnitud.
∑ X Elemento Calificación Valor
U =
∑X evaluado
Datos arreglados por orden de magnitud.
Donde: Examen 9 50 %
U = media ponderada. De menor a mayor valor.
Trabajo en aula 8 20 %
∑ X = peso o ponderación del dato
De mayor a menor valor
Exposición 9.5 30 %

D CB A B D.C (EB) ADC = 8.95 Mediana= (n+ 1)/ 2-esima observación


=V , , -BB
CB B EB

17
21/02/2017

Medidas de tendencia central Medidas de tendencia central


Propiedades de la mediana: Moda: en un conjunto de valores, es aquel que se presenta con mayor
En un conjunto de datos existe únicamente una mediana, siendo fácil su frecuencia.
cálculo y comprensión, a diferencia de la media los valores extremos no
tienen efectos importantes sobre la mediana. Si todos los valores son diferentes, no hay moda, pudiendo tener un
Obtener la mediana de las puntuaciones obtenidas en el examen de Microbiología conjunto de valores más de una moda
Puntuación Puntuación
orden orden 75 100 44 91 86 84 81 78 100 71 92
Ascendente descendente 21 20 27 34 22 24 27 20
2 modas (Bimodal) 20, 27
44 100 44 71 75 78 81 84 86 91 92 100 100
71 100
Datos ordenados 27 34 22 31 38 44 34 36
75 92
1 moda (Unimodal) 34
78 91
81 86
Mediana=
84 84 10 21 33 53 54
(n+ 1)/ 2-esima observación
86 81
Ninguna moda (Amodal)
91 78 (11 + 1)/2=
92 75 12/2= sexta observación= 84
100 71
100 44

Medidas de dispersión Medidas de dispersión


Son aquellos valores numéricos que indican el grado de separación de Rango: es la diferencia entre el valor máximo y el valor mínimo de un
los valores de una serie estadística con respecto a las medidas de conjunto de datos.
tendencia central.
Calcule el rango de los siguientes datos.
Los valores altos para estas medidas indican una mayor variabilidad de
los datos analizados.
17 11 23 65
Las medidas de dispersión más utilizadas son: el rango, desviación 21 22 97 34
típica o estándar, varianza, y coeficiente de variación, realizándose 8 72 53 46
estas mediciones en datos agrupados y no agrupados.
28 12 15 16
10 31 14 19

Rango (R) = XM – Xm
XM = 97
Xm = 8
Rango = 97 – 8
R = 89

18
21/02/2017

Medidas de dispersión Medidas de dispersión


Desviación estándar o típica (DE): muestra el grado de dispersión de
los datos en relación a la media, representándose con la s para una Obtenga la desviación estándar para los siguientes datos de edades de
muestra y con la σ para la población. personas.
25 31 26 43 33
Puede definirse como la raíz cuadrada de la varianza, valores bajos de
DE, muestran datos más homogéneos y menor dispersión, mientras qué -
S= ∑Z,- − 2
valores altos de DE indican datos con mayor variabilidad. Z [-

= 25 + 31 + 26 + 43 + 33 = 31.6
- 5
S= ∑Z,- 2
Datos no
Z [-
agrupados S=
-
∑C,- 25 − 31.6 2 + 31 − 31.6 2 + 26 − 31.6 2 + 43 − 31.6 2 + 33 − 31.6 2
C [-

Donde:
S = desviación estándar.
, ……. = conjunto de datos. BF. BF. = 7.197
, S = = = 51.8
= media aritmética de los datos. C[- @
= número de datos.

Medidas de dispersión Medidas de dispersión


Desviación estándar o típica (DE): para obtener este valor en datos Obtener la desviación estándar de los datos de niveles de glucosa (mg/dL) de
agrupados en intervalos de clases, se utiliza la siguiente fórmula. diferentes personas, agrupados en intervalos.

∑i
jkl h = [ =
Datos agrupados
S= 2
en clases
Z [-

Donde:
S = desviación estándar.
b = número de clases en la distribución de frecuencia.
= frecuencia absoluta del i-ésimo intervalo de clase.

= marca de clase del i-ésimo intervalo de clase.
= media aritmética de los datos.
= número de datos. ∑i
jkl h = [ = = 96.6 mg/dL
S= 2
Media aritmética
Z [-

19
21/02/2017

Medidas de dispersión Medidas de dispersión


Obtener la desviación estándar de los datos de niveles de glucosa (mg/dL) de Obtener la desviación estándar de los datos de niveles de hemoglobina (g/dL)
diferentes personas, agrupados en intervalos. de diferentes pacientes, agrupados en intervalos.

∑i
jkl h = [ =
S= 2
Z [-

- GE[DG.G -B FF [ DG.G EG D-[ DG.G E -BC[ DG.G


S= 2 FC [-

2 - --D[DG.G - -EE [ DG.G - -@F[ DG.G -G- [ DG.G


FC [-

FF .@ - GG-.G BEA@ 2
S= 2 =2 = 275.459 = 16.596 ∑i = 13.35 g/dL
F@ F@ jkl h = [ =
S= 2 Media aritmética
Z [-

Medidas de dispersión Medidas de dispersión


Obtener la desviación estándar de los datos de niveles de hemoglobina (g/dL) Varianza: se obtiene mediante la división de la sumatoria de las
de diferentes pacientes, agrupados en intervalos. distancias existentes entre cada uno de los datos y su media aritmética
elevadas al cuadrado, y el número total de datos
∑i
jkl h = [ =
S= 2 Se representa con la s2 para una muestra y con la σ2 para la población.
Z [-

2 A. C[-E.EC C D.DC [-E.EC F --.GC[-E.EC -G -E.EC[-E.EC


S=
@C [- = [ = Datos no
S2= ∑Z,- agrupados
2 D -C.BC[-E.EC @ -G.FC [-E.EC -A.@C[-E.EC Z [-
@C [-

-EB.BC - @. F C@.E 2 Donde:


S= 2 @@
= 2
@@
= 5.78 = 2. 404
,
, ……. = conjunto de datos.
= media aritmética de los datos.
= número de datos.

20
21/02/2017

Medidas de dispersión Medidas de dispersión


Varianza: para obtener este valor en datos agrupados en intervalos de
Obtenga la varianza para el siguiente conjunto de datos no agrupados. clases, se utiliza la siguiente fórmula.
25 31 26 43 33

∑i
jkl h = [= Datos agrupados
S2= ∑Z,-
= [ = S2= en clases
Z [-
Z [-
= 25 + 31 + 26 + 43 + 33 = 31.6
Donde:
5
S2 = varianza.
C[E-.G E-[E-.G G[E-.G @E[E-.G EE[E-.G b = número de intervalos de clase en la distribución de frecuencia.
S2= ∑Z,- = frecuencia absoluta del i-ésimo intervalo de clase.
C [-
= marca de clase del i-ésimo intervalo de clase.
BF. = media aritmética de los datos.
S2 = @
= 51.8 = número de datos.

Medidas de dispersión Medidas de dispersión


Obtener la varianza de los datos de niveles de glucosa (mg/dL) de diferentes Obtener la varianza de los datos de niveles de glucosa (mg/dL) de diferentes
personas, agrupados en intervalos. personas, agrupados en intervalos.

∑i
jkl h = [=
S2=
Z [-

- GE[DG.G -B FF [ DG.G EG D-[ DG.G E -BC[ DG.G


S2 =
FC [-
- --D[DG.G - -EE [ DG.G - -@F[ DG.G -G- [ DG.G
FC [-

FF .@ - GG-.G BEA@ = 275.459


S2 = F@
= F@
∑i
jkl h = [=
S2=
Z [-

21
21/02/2017

Medidas de dispersión Medidas de dispersión


Obtener la varianza de los datos de niveles de hemoglobina (g/dL) de Obtener la varianza de los datos de niveles de hemoglobina (g/dL) de
diferentes pacientes, agrupados en intervalos. diferentes pacientes, agrupados en intervalos.

∑i
jkl h = [ =
S2=
Z [-

A. C[-E.EC C D.DC [-E.EC F --.GC[-E.EC -G -E.EC[-E.EC
S2= @C [-

D -C.BC[-E.EC @ -G.FC [-E.EC -A.@C[-E.EC
@C [-

-EB.BC - @. F C@.E = 5.78


S2= =
@@
@@
∑i
jkl h = [ =
S2=
Z [-

Medidas de dispersión Medidas de dispersión


Coeficiente de variación: representa la relación que existe entre la
desviación estándar de una muestra y su media aritmética. Obtenga el coeficiente de variación para el siguiente conjunto de datos no
agrupados.
Al compararse la dispersión de un conjunto de datos, se tendrá menor
25 31 26 43 33
dispersión en aquellos que tengan menor coeficiente de variación.
-
S= ∑Z,- 2
Este coeficiente es inversamente proporcional a la media aritmética, por lo Z [-
que cuando la media presente valores próximos a cero, el coeficiente = 25 + 31 + 26 + 43 + 33
presentará valores muy elevados. = 31.6
5
-
S= ∑C,- 25 − 31.6 2 + 31 − 31.6 2 + 26 − 31.6 2 + 43 − 31.6 2 + 33 − 31.6 2
C [-
t
r. s. = S=
BF.
=
BF. = 7.197
C[- @

t 7.197
Donde: r. s. = = = 0.227
r. s. = coeficiente de variación.
31.6
t= desviación estándar. t F.-DF
= media aritmética r. s. = ∗ 100 = * 100 = 22.775 %
E-.G

22
21/02/2017

Medidas de dispersión Medidas de dispersión


Obtener el coeficiente de variación de los datos de niveles de glucosa (mg/dL) Obtener el coeficiente de variación de los datos de niveles de hemoglobina
de diferentes personas, agrupados en intervalos. (g/dL) de diferentes pacientes, agrupados en intervalos.

t -G.CDG t .@B@
r. s. ∗ 100 * 100 17.180 % r. s. ∗ 100 * 100 18. 007 %
DG.G -E.EC

Distribución de frecuencia Distribución de frecuencia


A partir de la siguiente información correspondiente a la presión arterial sistólica (mm 1.- Obtener la media aritmética de los datos de los valores de presión arterial (mm/Hg) de
40 personas, agrupados en intervalos.
Hg) de 40 personas en edad de 25 a 30 años.

106 112 123 165 121 98 93 105


122 121 127 121 114 175 121 103
112 103 99 95 102 123 111 108
87 124 111 145 154 95 104 117
103 111 114 190 127 128 123 119

Reporte la siguiente información:

1.- Una distribución de frecuencias absolutas, relativas, absolutas acumuladas,


relativas acumuladas, marca de clase.
2.- Las medidas de tendencia central (media aritmética, mediana y moda) de los
datos agrupados en intervalos.
3.- Las medidas de dispersión (desviación estándar, varianza y coeficiente de = (6)(93.5) + (15)(108.5) + (14) (123.5) + (1) (138.5) + (1) (153.5) + (2)(168.5) + (1) (183.5) =
variación) de los datos agrupados en intervalos. 40
= 4730 = 118.25 mm/Hg
40

23
21/02/2017

Medidas de tendencia central Medidas de tendencia central


2.- Obtener la mediana de los valores de presión arterial (mm/Hg) de 40 personas, 3.- Obtener la moda de los valores de presión arterial (mm/Hg) de 40 personas, agrupados
agrupados en intervalos. en intervalos.


40 Mo = Li + * A w "
Mediana = 101 + 2 6 * 15 = 115 mm/Hg Mo =101 + * 15 = 114.5 mm/Hg
15 ) & Moda
Mediana

))

Medidas de dispersión Medidas de dispersión


Obtener la desviación estándar de los datos de los valores de presión arterial Obtener la desviación estándar de los datos de los valores de presión arterial
(mm/Hg) de 40 personas, agrupados en intervalos. (mm/Hg) de 40 personas, agrupados en intervalos.

∑i
jkl h = [ =
S 2
Z [-

2 G DE.C[--A. C -C -BA.C[--A. C -@ - E.C[--A. C - -EA.C[--A. C
S @B[-

2 - -CE.C[--A. C -GA.C[--A. C - -AE.C[--A. C
@B [-

CADF. C -BCCB. C -G@@F.FC 2


∑i S 2 = 2 = 421.737 = 20.536
jkl h = [ = ED ED
S 2
Z [-

24
21/02/2017

Medidas de dispersión Medidas de dispersión


Obtener la varianza de los valores de presión arterial (mm/Hg) de 40 personas, Obtener la varianza de los valores de presión arterial (mm/Hg) de 40 personas,
agrupados en intervalos. agrupados en intervalos.

∑i
jkl h = [ =
S2=
Z [-

G DE.C[--A. C -C -BA.C[--A. C -@ - E.C[--A. C - -EA.C[--A. C
S2=
@B[-

- -CE.C[--A. C -GA.C[--A. C - -AE.C[--A. C
@B [-

CADF. C -BCCB. C -G@@F.FC = 421.737


S2= =
ED
ED
∑i
jkl h = [ =
S2=
Z [-

Medidas de dispersión
Obtener el coeficiente de variación de los valores de presión arterial (mm/Hg)
de 40 personas, agrupados en intervalos.

t B.CEG
r. s. = ∗ 100 = * 100 = 17.366 %
--A. C

25

También podría gustarte