Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INDICE .
1. Estadística Descriptiva
1.1 Introducción
1.2 Organización de los datos de un conjunto
1.3 Distribuciones de frecuencias
1.3.1 Definición de distribución de frecuencia. Terminologíaa
1.3.2 Reglas generales para formar distribuciones de frecuencia
1.3.3 Ejercicios
1.4 Representación grafica de los datos de un conjunto
1.4.1 Variables Cualitativas
1.4.2 Variables Cuantitativas Discretas
1.4.3 Variables Cuantitativas Continuas
1.4.4 Ejercicios
1.5 Medidas de tendencia central
1.5.1 La media aritmética (Media Ponderada)
1.5.2 La moda
1.5.3 La mediana
1.5.4 Ejercicios
1.6 Medidas de dispersión
1.6.1 Amplitud (recorrido o rango)
1.6.2 Desviación típica (o estándar).Varianza
1.6.3 Ejercicios
1.7 Medidas de Posición
1.7.1 Cuantiles(cuartiles, deciles y percentiles)
1.7.2 Ejercicios
2
PARTE II. ELEMENTOS DE PROBABILIDAD Y ESTADISTICA
1. ESTADÍSTICA DESCRIPTIVA
1.1 INTRODUCCION
Definición:
Las distribuciones de frecuencias son disposiciones tabulares de los datos,
por clases con sus respectivas frecuencias absolutas.
Terminología:
CLASES. (Para una característica continua): Son intervalos abiertos o
cerrados. Deben ser exhaustivos y excluyentes; es decir, tales que se
elimine la posibilidad
- Los números que definen una clase: 28-32, 33-37, etc. se llaman
Límites de Clase.
- Los valores a la izquierda: 28, 37, etc. se llaman Limites Inferiores
aparentes, los valores a la derecha: 32, 37, etc. son los Limites
Superiores aparentes de la clase.
- La diferencia entre el límite superior ( ls) y el límite inferior (li), más 1,
es un Intervalo de Clase (o Amplitud de Clase); y se denota por ic .
En símbolos:
ic = l s – l i + 1
- Marca de clase o punto medio: Es la mitad de la suma de los
límites
de la clase.
Los datos que corresponden a una variable continua, generalmente no son
medidas exactas. Así decimos por ejemplo que 58 es un valor que está entre
57.5 y 58.5; el primero es el límite real inferior y el segundo es el límite
real superior. Para estas distribuciones ic = lrs – lri.
A continuación se presenta la distribución de frecuencias del ejemplo
anterior, con límites reales.
Ejemplo 2.
Clase Puntajes Frecuencias Absolutas
1ra. 27.5 a menos de 32.5 10
2da. 32.5 a menos de 37.5 15
3ra. 37.5 a menos de 42.5 20
4ta. 42.5 a menos de 47.5 35
5ta. 47.5 a menos de 52.5 19
6ta. 52.5 a menos de 57.5 12
7ma. 57.5 a menos de 62.5 9
Total 120
clase i Fi
clase k Fk
Total n
k
∑ fi/n
La frecuencia relativa es fi/n, donde 0 ≤ fi/n ≤ 1 y “ i=1 = 1.
Cuando fi/n se multiplica por 100, se llama frecuencia porcentual. La
frecuencia acumulada menor que fi se denota por Fi y es la suma de las
frecuencias absolutas que van desde la clase 1 hasta la clase i. En símbolos:
Fi = f1 +f2 + f3 +…+ fi
Ejemplo 3.
Distribución de frecuencias porcentuales y acumuladas, basada en los datos
que aparecen en la ejemplo 1.
1.3.3 EJERCICIOS
6.7 6.3 8.7 7.9 8.8 9.2 8.6 8.3 7.8 4.1
6.6 6.8 7.7 4.6 7.6 8.1 9.2 8.4 8.6 7.0
6.0 7.7 8.1 9.8 7.5 8.1 8.2 8.7 7.8 7.0
6.1 9.4 8.1 5.2 7.9 8.2 7.7 7.7 7.0 7.4
Xi f
80 - 81 6
82 – 83 14
84 – 85 30
86 – 87 33
88 - 89 13
90 - 91 4
a) Calcule las frecuencias acumuladas del tipo “menos que” y ”más que”.
b) Calcule el % de datos de 87 o menos.
c) Calcule el % de datos mayores o iguales a 82.
d) Calcule el % de datos mayores o iguales a 82 pero menores o iguales que
89
x F
100-106 2
107-113 6
114-120 11
121-127 8
128-134 9
135-141 6
142-148 5
149-155 2
156-162 1
Total 50
0.19 0.29 0.30 0.27 0.32 0.22 0.22 0.15 0.22 0.27
0.35 0.19 0.32 0.27 0.39 0.32 0.24 0.27 0.23 0.28
0.37 0.17 0.37 0.26 0.37 0.27 0.32 0.29 0.26 0.28
0.25 0.20 0.22 0.27 0.32 0.27 0.34 0.27 0.26 0.27
BARRAS SEPARADAS.
Ejemplo 4.
Una pequeña encuesta estudiantil sobre preferencias de bebidas gaseosas
produjo los siguientes resultados:
i bebida fi fri % Fi %
1 Coca 17 34 34%
2 Fanta 8 16 50%
3 Pepsi 11 22 72%
4 Salva 8 16 88%
5 Sprite 6 12 100%
total 50
9
Lic. Mauro H. Henríquez Rauda
CIRCULAR
Ejemplo 5.
Distribución de frecuencias del número de maestros en una muestra de
escuelas públicas, en Chalatenango.
10
Ejemplo 6.
Clasificación de 40 alumnos de una escuela rural de acuerdo a su peso en
libras.
Frecuencia
Clases Frecuencia Puntos acumulada Frecuencia
medios “menos de” relativa
29.5 – 34.5 1 32 1 0.025
34.5 – 39.5 3 37 4 0.075
11
39.5 – 44.5 8 42 12 0.200
44.5 – 49.5 9 47 21 0.225
49.5 – 54.5 7 52 28 0.175
54.5 – 59.5 4 57 32 0.100
59.5 – 64.5 3 62 35 0.075
64.5 – 69.5 3 67 38 0.075
69.5 – 74.5 2 72 40 0.050
Total 40 1.000
SOLUCION:
8+16+ 4+12+10 50
x= = =10
5 5
Advierta: la media es uno de los datos.
13
Lic. Mauro H. Henríquez Rauda
EJEMPLO 2: Calcular la media de 8, 16, 4, 12 y 5
SOLUCION:
8+16+ 4+12+5 45
x= = =9
5 5
La media, 9, no es uno de los datos
Si los números
x 1 +x 2 +. .. .. x N ocurren
f 1 ,f 2 , .. ..., f N veces, respectivamente
f ,f ,.. ..., f N ), la media aritmética es
(o sea con frecuencias 1 2
N N
f 1 x 1 + f 2 x 2 +. .. .. . .. f N x N ∑ f i xi ∑ f i xi
i =1 i =1
x= = N
=
f 1 + f 2+.. . .. . . .. . f N N
∑fi
i=1
EJEMPLO 3: 5,8,6 y 2 ocurren con frecuencias 3,2,4 y 1 respectivamente.
Hallar la media.
SOLUCION:
3(5)+2(8 )+4 (6 )+2 15+16+24 +2 57
x= = = =5 . 7
3+2+4 +1 10 10
pesos)
w ,w ,.....,w
1 2 N , dependiente de la relevancia asignada a cada número
(no a su frecuencia). En este caso:
N
w1 x 1 + w2 x 2 +. .. . . wN x N ∑ wi x i
x= = i=1N
w 1 +w 2 +. .. .. w N
∑ wi
i =1
VERIFICANDO SU COMPRENSIÓN
1.5.2 LA MODA
1.5.3 LA MEDIANA
SOLUCION:
Primero se ordenan los números (orden creciente): 2,2,5,5,6,6,7,8,9 y 10.
Como hay un número impar de datos, la mediana es 6 (la mediana es uno de
los datos)
EJEMPLO 11. Calcular la mediana del conjunto: 7,4,7,4,5,5,6,6,6,3,3,2,1 y 1
SOLUCION:
Primero se ordenan los números (orden creciente): 1,1,2,3,3,4,4,5,5,6,6,6,7 y
4+5
=4 . 5
7. Como hay un número par de datos, la mediana es 2 (la mediana
no es uno de los datos)
VERIFICANDO SU COMPRENSION
Calcule la mediana a cada uno de los conjuntos de números dados.
a) 7,5,6,4,4,4,3,3,1 y 10 b) -4, -6, -1, 1, 4, 10 y 3
Lic. Mauro H. Henríquez Rauda
1.5.4 EJERCICIOS
15
EJEMPLO 1.
Suponga que en un hospital, el nivel de azúcar en la sangre de cada
paciente se mide tres veces por semana. En cierta semana los registros de
dos pacientes indican:
En efecto:
90+100+110 300
= =100
Paciente A: 3 3
40+100+160 300
= =100
Paciente B: 3 3
Observe la diferencia en variabilidad. Mientras que el paciente A es bastante
estable, el nivel del paciente B fluctúa ampliamente. Este resultado deberá
tomarse en cuenta cuando se prescriba su tratamiento.
EJEMPLO 2.
Se va a seleccionar a un atleta para que represente a la Universidad en los
juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos
candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que
se tardan en recorrer los 100 metros en cinco ocasiones. A continuación de
detallan:
EJEMPLO 3.
En el ejemplo 1, el rango para el nivel de azúcar en la sangre del paciente A
es 110 – 90 = 20 y de 160 – 40 = 120, para el paciente B.
media
Conjunto B:
3 8 9 10 11 12 13 14 19
√
N
∑ ( xi −x )2
i =1
σ=
N
Si
x 1 ,x 2 ,.....,.x N
ocurren con frecuencias
f 1 ,f 2 ,.....f N respectivamente, la
desviación típica puede expresarse como
√
N
∑ f i ( x i−x )2 N
σ= i =1
∑ fi
N donde N = i=1
√
N
∑ ( x i− x )2
i=1
S=
N −1 para datos sin agrupar
√
N
∑ f i ( xi −x )2
i=1
S=
N −1 para datos agrupados en tablas de frecuencia
NOTA: “Muestra” es el conjunto de datos que se pueden utilizar, en forma
razonable, para hacer generalizaciones acerca de la población de la cual
provienen.
SOLUCION.
Para la muestra A.
3+4 +5+6+11+ 16+17+18+19 99
x= = =11
Paso 1. 9 9
9
S=∑ ( x i−x )2
Paso 2. El cálculo de i=1 se facilita con una tabla como la que
sigue:
Variable x ( xi −x) Cuadrado de la
Desviación 2
desviación ( xi −x )
3 -8 64
4 -7 49
5 -6 36
6 -5 25
11 0 0
16 5 25
17 6 36
18 7 49
19 8 64
9
S=∑ ( x i−x )2
i=1 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348 y
√
9
∑ ( x i− x )2
S= i=1
N −1 = √ 348
9−1 = √ 348
9−1 = 6.6
Para la muestra B
3+8+9+10+ 11+12+13+14+19 99
x= = =11
Paso 1. 9 9
9
∑ ( xi −x )2
Paso 2. Calculamos i=1
√
9
∑ ( x i− x )2
S=
i=1
N −1 = √ 3156
9−1 = √ 3156
9−1 = 4.4
Puesto que la desviación típica del conjunta A es mayor que la del conjunto
B, concluimos que la muestra A es la más dispersa.
VERIFICANDO SU COMPRENSION
SOLUCION
Para facilitar los cálculos usamos la siguiente tabla
√
4 N
∑ f i xi ∑ f i ( xi −x )2
x=
i=1
N
=
616
40
=15 . 4 S= i=1
N −1
=
√ 27 . 6
39
=0 . 84
VERIFICANDO SU COMPRENSION
a) X f x f
6 5 2 4
5 4 3 3
3 6 4 5
1.6.3 EJERCICIOS 5 2
Seleccione la respuesta correcta
6. Si la desviación estándar fuese cero ¿qué podrías decir acerca del conjunto
de datos?
23
En los ejercicios 7 - 10. Encontrar el recorrido, la varianza y la desviación
estándar del conjunto de datos
7. 1,2,3,4 y 5 9. 3,5,8,13 y 21
8. 21,22,23,24 y 25 10. 79,90,95,95 y 96
1.7.1 CUANTILES
Así, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos
son menores que él y tres cuartas partes son mayores. Q2, es igual a la
mediana y Q3, supera a los tres cuartos de los datos y solo es superado por
un cuarto de ellos.
Además de la mediana y los cuartiles pueden calcularse también lo deciles:
D1, D2, ......D9, los cuales dividen al conjunto en décimas. Los percentiles:
P1, P2,....P99, que lo dividen en centésimos. Todos éstos valores reciben el
nombre de cuantiles y pueden resultar muy apropiados para apreciar la
posición de los datos de un conjunto y su posición.
Tanto la mediana como los cuartiles y los deciles constituyen casos
particulares de los percentiles y pueden expresarse como percentiles.
49 60 45 37 54
44 59 40 62 47
46 52 55 41 66
45 36 50 51 48
42 53 53 68 56
35 74 43 47 60
51 67 40 70 49
41 46 32 57 43
Así como están los datos resulta difícil sacar una conclusión, por lo tanto,
como no son muchos, puede iniciarse el análisis haciendo una ordenación en
forma creciente.
32 42 47 52 60
35 43 47 53 60
36 43 48 53 62
37 44 49 54 66
40 45 49 55 67
40 45 50 56 68
41 46 51 57 70
41 46 51 59 74
La posición de Q2 es igual a la posición de P50, la cual se obtiene así:
40
x 50
100 = 20 Los datos a localizar son: X20 y X21. El valor de Q2 es:
Lic. Mauro H. Henríquez Rauda
X 20+ X 21 50+53
=
Q2 = 2 2
= 51.5
La mediana es igual a P50 = Q2 = 51.5
25
1.7.2 EJERCICIOS .
Salarios (x) f
500-599 8
600-699 12
700-799 18
800-899 10
900-999 6
1000-1099 2
Calcule:
a) El valor del cuartil uno.
b) El valor del cuartil dos.
c) El valor del cuartil tres.
d) El valor del decil cinco.
e) El valor del decil cinco.
f) El valor del percentil ochenta.
g) El valor del percentil cincuenta.
h) El salario que limita el 20% superior de la distribución.
i) El salario que se deja sobre sí, el 70% de los casos.
j) Entre qué salarios está el 60% central de la distribución.