Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística descriptiva
Definiciones Definiciones
Estadística descriptiva: es la parte de la estadística encargada de Estadística inferencial: es la que trata de estimar las características de
organizar, resumir y describir las características principales de los una población a través del estudio de una muestra.
datos, generalmente en forma tabular, gráfica o numérica.
El estudio se realiza para hacer inferencias y generalizaciones respecto a
El análisis se limita a los datos coleccionados sin realizar inferencia una totalidad, basándose en la teoría de la probabilidad.
alguna o generalizaciones sobre la totalidad de donde provienen las
observaciones.
1
21/02/2017
Variable
Variable estadística Cuantitativa: son aquellas que son medibles, cualitativa Nominal: está caracterizada por eventos mutuamente
(es toda característica que teniendo sus observaciones carácter numérico. excluyentes, denotando características únicas.
puede tomar diferentes Colores
valores).
2
21/02/2017
Variable
cuantitativa
Discretas: estas variables sólo pueden tomar valores
enteros de un conjunto de números, existiendo entre los Tabla de distribución de frecuencias Tabla de contingencia
valores de esta variable una distancia que no se completa con
valores intermedios.
Producción estimada de
Número de hijos Vehículos en México (millones)
Número de vehículos
Cantidad de mascotas
3
21/02/2017
Clase: es cada uno de los grupos en que se dividen los datos. Frecuencia absoluta (fi): es el número de veces que se repite cada dato.
Cuando se agrupan los datos, es el número de datos que tiene cada clase.
Para determinar el número de clases a crear, puede utilizarse la fórmula
de Sturges, en donde al obtenerse un número decimal, se aproxima al Frecuencia absoluta acumulada (Fi): es la frecuencia total hasta el límite
siguiente entero. superior de cada clase, siendo simbolizada con Fj.
Encuesta sobre el
estado civil y sexo de
10 personas
4
21/02/2017
28 30 32 34
5
21/02/2017
Existen las ojivas «mayor qué, >» y las ojivas «menor qué, <), en donde
la ojiva «mayor qué» el dato que se está comparando tendrá una
pendiente negativa (hacia abajo y a la derecha), mientras que la «menor
qué», tendrá una pendiente positiva.
Composición en volumen del gas natural
Tipos de sangre y factor Rh
Ojiva menor qué Ojiva mayor qué
Frecuencias absolutas acumuladas Frecuencias absolutas acumuladas
6
21/02/2017
Cartogramas: son gráficos realizados sobre mapas, en donde se Píramide poblacional: es una forma de representar datos estadísticos
presentan indicadas sobre las diferentes zonas, cantidades o colores de básicos, sexo y edad, de la población de un país.
acuerdo a lo que representan.
Los segmentos de población se establecen como generaciones,
generalmente de 5 años, representadas en forma de barras
horizontales que parten de un eje común, hacia la izquierda los varones,
hacia la derecha las mujeres.
1.- Una distribución de frecuencias absolutas, relativas, absolutas acumuladas, R = 108 Intervalo o 108
relativas acumuladas amplitud de clase =
8
2.- Un histograma de frecuencias Recomendación: 5 ≤ k ≤15
3.- Un polígono de frecuencias Intervalo o
4.- Una ojiva menor qué y una ojiva mayor qué. amplitud de clase = 13.5 = 14
Número de intervalos (k) = 1 + 3.322 log n
a) Qué porcentaje de las mediciones es < a 98 mg/dL?
k= 1 + 3.322 log 75
b) Qué porcentaje de los datos es ≥ a 126 mg/dL ?
k= 7.228 = 8
7
21/02/2017
(Frecuencia absoluta)
Número de pacientes
0.133333333 11 0.146666667
84 98 91 36 0.48 47 0.626666667
98 112 105 23 0.306666667 70 0.933333333
112 126 119 1 0.013333333 71 0.946666667
126 140 133 1 0.013333333 72 0.96
140 154 147 1 0.013333333 73 0.973333333
154 168 161 2 0.026666667 75 1
Total 75 1
Recomendaciones: 56 70 L.I. (56) ≥ X < L.S. (70)
LI= Xm – U LI= X – (U/2) Marca de
LS= LI + A
m clase 52 75 98 Unidad (U)= 1
4.5 5.4 6.3 Unidad (U)= 0.1 Niveles de glucosa en sangre (mg/dL)
Xm= dato menor = (Marca de clase)
A= amplitud de clase 52.05 63.06 98.07 Unidad (U)= 0.01
(Frecuencia absoluta)
Número de pacientes
Número de pacientes
8
21/02/2017
Clase agregada
Ascendente)
56 70 1 1 75
70 84 10 11 74
84 98 36 47 64
98 112 23 70 28
112 126 1 71 5
126 140 1 72 4
140 154 1 73 3
154 168 2 75 2 (Límite superior)
Total 75 0
56 70 1 1 75
70 84 10 11 74
84 98 36 47 64
98 112 23 70 28
Clase agregada
para elaborar la
112 126 1 71 5
gráfica, 126 140 1 72 4
finalizando en 140 154 1 73 3
Fi= 0
154 168 2 75 2
168 182 0 0 0 (Límite inferior)
Total 75
9
21/02/2017
(Frecuencia absoluta)
Número de pacientes
91 1
92 7
93 6
94 1
95 6
96 2
97 5
100 2
101 6
102 3
103 4
104 1
105 3
106 1
108 1
109 1
110 1
125 1
138 1
153 1
160 1 Niveles de glucosa en sangre (mg/dL)
165 1
12.4 12.8 19.2 14.5 12.3 12.9 10.2 13.5 12.8 16.8 18.3 13.5 10.1 12.7 14.5 12.8 12.9 13.7
13.4 7.5 14.3 15.8 16.3 11.2 11.6 11.3 7.5 14.5 14.4 17.5 16.9 14.1 14.5 14.7 12.8 12.4
16.8 18.3 13.5 10.1 12.7 14.5 12.8 12.9 13.7 10.4 10.7 12.6 9.8 11.9 12.7 12.6 12.7 14.7
14.5 14.4 17.5 16.9 14.1 14.5 14.7 12.8 12.4 Rango (R) = XM – Xm
10.4 10.7 12.6 9.8 11.9 12.7 12.6 12.7 14.7 XM = 19.2
Xm = 7.5 Intervalo o R
Rango = 19.2 – 7.5 amplitud de clase =
Construya lo siguiente: k
1.- Una distribución de frecuencias absolutas, relativas, absolutas acumuladas, R = 11.7 Intervalo o 11.7
relativas acumuladas amplitud de clase =
7
2.- Un histograma de frecuencias Recomendación: 5 ≤ k ≤15
3.- Un polígono de frecuencias Intervalo o
4.- Una ojiva menor qué y una ojiva mayor qué. amplitud de clase = 1.67 = 1.7
Número de intervalos (k) = 1 + 3.322 log n
a) Qué porcentaje de las mediciones es ≥ a 12.5 g/dL y menor a 15.9 g/dL ?
k= 1 + 3.322 log 45
b) Qué porcentaje de los pacientes tiene un valor de hemoglobina ≥ a 10.8 g/dL ?
k= 6.491 = 7
10
21/02/2017
(Frecuencia absoluta)
Número de personas
9.1 10.8 9.95 5 0.111111111 7 0.155555556
10.8 12.5 11.65 7 0.155555556 14 0.311111111
12.5 14.2 13.35 16 0.355555556 30 0.666666667
14.2 15.9 15.05 9 0.2 39 0.866666667
15.9 17.6 16.75 4 0.088888889 43 0.955555556
17.6 19.3 18.45 2 0.044444444 45 1
Total 45 1
(Frecuencia absoluta)
Número de personas
Número de personas
11
21/02/2017
Clase agregada
Ascendente)
Fi= 0.
7.4 9.1 2 2 45
9.1 10.8 5 7 43
10.8 12.5 7 14 38
12.5 14.2 16 30 31
14.2 15.9 9 39 15
15.9 17.6 4 43 6
17.6 19.3 2 45 2
(Límite superior)
Total 45 0
7.4 9.1 2 2 45
9.1 10.8 5 7 43
10.8 12.5 7 14 38
12.5 14.2 16 30 31
Clase agregada
para elaborar la 14.2 15.9 9 39 15
gráfica, 15.9 17.6 4 43 6
finalizando en
17.6 19.3 2 45 2
Fid= 0.
19.3 21 0 0 (Límite inferior)
Total 45
12
21/02/2017
(Frecuencia absoluta)
12.3 1
Número de pacientes
12.4 2
12.6 2
12.7 3
12.8 4
12.9 2
13.4 1
13.5 2
13.7 1
14.1 1
14.3 1
14.4 1
14.5 4
14.7 2
15.8 1
16.3 1
16.8 1
16.9 1
17.5 1
18.3 1
19.2 1 Contenido de hemoglobina (g/dL)
57 68 58 21 12 45 56 58 59
47 35 16 22 57 26 21 65 92
13
21/02/2017
Donde:
= media aritmética; = frecuencia absoluta; k= número
de clases; = marca de clase.
14
21/02/2017
Donde:
La moda se encuentra en
Mo = Li + * A
+ la clase que tiene la mayor
frecuencia absoluta
Mo= Moda.
15
21/02/2017
*
Mo = Li + + * A Mo = Li + + * A " %
!" # Mo =12.5 + = 13.456 mg/dL
= ( ) Mo = 84 + = 93.333 mg/dL = ( ) & + % * 1.7
" + ! * 14 Moda
Moda
=
( + )) =
( + ))
Propiedades:
Para un conjunto de datos existe únicamente una media, siendo su cálculo y
comprensión sencillos.
Todos los valores del conjunto sirven para su determinación, por lo que valores
extremos pueden distorsionar la información.
Reporte el tiempo de caducidad promedio (meses) de un medicamento antigripal, de acuerdo a
los siguientes datos:
54 36 56 43 21 34 42 53
16
21/02/2017
17
21/02/2017
Rango (R) = XM – Xm
XM = 97
Xm = 8
Rango = 97 – 8
R = 89
18
21/02/2017
= 25 + 31 + 26 + 43 + 33 = 31.6
- 5
S= ∑Z,- 2
Datos no
Z [-
agrupados S=
-
∑C,- 25 − 31.6 2 + 31 − 31.6 2 + 26 − 31.6 2 + 43 − 31.6 2 + 33 − 31.6 2
C [-
Donde:
S = desviación estándar.
, ……. = conjunto de datos. BF. BF. = 7.197
, S = = = 51.8
= media aritmética de los datos. C[- @
= número de datos.
∑i
jkl h = [ =
Datos agrupados
S= 2
en clases
Z [-
Donde:
S = desviación estándar.
b = número de clases en la distribución de frecuencia.
= frecuencia absoluta del i-ésimo intervalo de clase.
= marca de clase del i-ésimo intervalo de clase.
= media aritmética de los datos.
= número de datos. ∑i
jkl h = [ = = 96.6 mg/dL
S= 2
Media aritmética
Z [-
19
21/02/2017
∑i
jkl h = [ =
S= 2
Z [-
FF .@ - GG-.G BEA@ 2
S= 2 =2 = 275.459 = 16.596 ∑i = 13.35 g/dL
F@ F@ jkl h = [ =
S= 2 Media aritmética
Z [-
20
21/02/2017
∑i
jkl h = [= Datos agrupados
S2= ∑Z,-
= [ = S2= en clases
Z [-
Z [-
= 25 + 31 + 26 + 43 + 33 = 31.6
Donde:
5
S2 = varianza.
C[E-.G E-[E-.G G[E-.G @E[E-.G EE[E-.G b = número de intervalos de clase en la distribución de frecuencia.
S2= ∑Z,- = frecuencia absoluta del i-ésimo intervalo de clase.
C [-
= marca de clase del i-ésimo intervalo de clase.
BF. = media aritmética de los datos.
S2 = @
= 51.8 = número de datos.
∑i
jkl h = [=
S2=
Z [-
21
21/02/2017
∑i
jkl h = [ =
S2=
Z [-
A. C[-E.EC C D.DC [-E.EC F --.GC[-E.EC -G -E.EC[-E.EC
S2= @C [-
D -C.BC[-E.EC @ -G.FC [-E.EC -A.@C[-E.EC
@C [-
t 7.197
Donde: r. s. = = = 0.227
r. s. = coeficiente de variación.
31.6
t= desviación estándar. t F.-DF
= media aritmética r. s. = ∗ 100 = * 100 = 22.775 %
E-.G
22
21/02/2017
t -G.CDG t .@B@
r. s. ∗ 100 * 100 17.180 % r. s. ∗ 100 * 100 18. 007 %
DG.G -E.EC
23
21/02/2017
40 Mo = Li + * A w "
Mediana = 101 + 2 6 * 15 = 115 mm/Hg Mo =101 + * 15 = 114.5 mm/Hg
15 ) & Moda
Mediana
))
∑i
jkl h = [ =
S 2
Z [-
2 G DE.C[--A. C -C -BA.C[--A. C -@ - E.C[--A. C - -EA.C[--A. C
S @B[-
2 - -CE.C[--A. C -GA.C[--A. C - -AE.C[--A. C
@B [-
24
21/02/2017
∑i
jkl h = [ =
S2=
Z [-
G DE.C[--A. C -C -BA.C[--A. C -@ - E.C[--A. C - -EA.C[--A. C
S2=
@B[-
- -CE.C[--A. C -GA.C[--A. C - -AE.C[--A. C
@B [-
Medidas de dispersión
Obtener el coeficiente de variación de los valores de presión arterial (mm/Hg)
de 40 personas, agrupados en intervalos.
t B.CEG
r. s. = ∗ 100 = * 100 = 17.366 %
--A. C
25