Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA I
CAPITULO II
ANALISIS DESCRIPTIVO DE UNA VARIABLE
DATOS TABULADOS: Son aquellos datos, ya distribuidos con sus respectivas frecuencias,
es decir
ESTADÍSTICA I
Población Muestra
Ejemplo
X Fi 0
12 5 0,16 15,63 5
13 12 0,38 37,50 17
14 8 0,25 25,00 25
15 7 0,22 21,88 32
32 1,00 100,00
Frecuencia
Edad
Absoluta
X
Fi
12 5
13 12
14 8
15 7
n = 32
Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos, se
suele expresar en tanto por uno, siendo su valor -iésimo
ni
f r=
n
La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad (1).
ESTADÍSTICA I
ESTADÍSTICA I
Xi f f a↓ fr f ra ↓ f% f a% ↓
0 2 2 0,04 0.04 4 4
1 4 6 0,08 0.12 8 12
2 21 27 0,42 0.54 42 54
3 15 42 0,3 0.84 30 84
4 6 48 0,12 0.96 12 96
5 1 49 0,02 0.98 2 98
6 1 50 0,02 1 2 100
ESTADÍSTICA I
n = 50 ∑ ¿1,00 ∑ ¿100
ESTADÍSTICA I
ESTADÍSTICA I
Nº de intervalos=√ 40=6,32
Veremos que la raíz cuadrada de 40 es igual a 6,32 por lo tanto tomaremos 6 intervalos.
b) Si se calcula según el criterio de Sturges se tiene:
K = 1 + 3,32 * log (40)
K = 1 + 3.32 * 1,60
K = 1 + 5,31883917
K = 6,32 por lo tanto tomaremos 6 intervalos.
c) Criterio Propio: Construir 6 intervalos o clases
3. Amplitud:
R
a i=
N º de Intervalos
Como el recorrido o rango es 285 se divide por el nº de intervalos y así se obtiene la
amplitud de cada uno de ellos y así:
285
a i= =47,5 ≈ 48
6
La amplitud es de 48 podemos tomar un valor inferior de la variable y también incluir
valores superiores a la misma, en este caso el rango termina en 613
Tabla Nº 1.6. Distribución de frecuencias datos agrupados precios de habitaciones de
hoteles
¿ f Ẋ ¿ f a↓ fr f ra ↓ f% f a% ↓
(325 –
2 349 (324,5 – 373,5) 2 0,05 0,05 5,0 5,0
373)
(374 –
8 397 (373,5 – 421,5) 10 0,20 0,25 20,0 25,0
421)
(422 –
10 445 (421,5 – 469,5) 20 0,25 0,50 25,0 50,0
469)
(470 –
11 493 (469,5 – 517,5) 31 0,28 0,78 27,5 77,5
517)
(518 –
4 541 (517,5 – 565,5) 35 0,10 0,88 10,0 87,5
565)
(566 –
5 589 (565,5 – 613,5) 40 0,13 1,00 12,5 100,0
613)
n = 40 ∑ ¿1,00 ∑ ¿100
ESTADÍSTICA I
e) R = 3
f) R = 10
g) R = 20
h) R = 75 %
En la distribución se pueden observar las siguientes características
a) Número de clases: Existe un total de 6 clases
b) Limites de clases: Son los valores extremos de cada clase. Para la primera clase se
tienen los limites siguientes: límite superior = 373 límite inferior = 325
c) Limites reales: La zona que no pertenece a ninguna clase se distribuye entre las clase
contiguas para evitar la ambigüedad con respecto a la ubicación de algún dato que, por
alguna razón, cayese en dicha zona. Así se originan los límites reales de clase. P.e. para
la primera clase, estos límites son:
Ẋ =349
f) Amplitud de las clases: es el tamaño de determinada clase. Se sugiere que todas las
clases tengan el mismo tamaño. Para calcular la amplitud se restan los limites reales de
la clase, por ejemplo, para la primera clase la amplitud es
C = 373 – 325 = 48,
C = 48
g) Rango de la distribución: es la amplitud de toda la distribución completa. Se calcula
mediante la diferencia entre el limite real superior de la mayor o última de las clases y el
limite real inferior de la primera o menor de todas las clases; para el caso que se está
tratando, se tiene
R = 610 – 325 = 285
h). Número de clases en los datos agrupados: En la práctica, se tiene el conjunto de datos
brutos, en el cual se determinan el dato mayor y el dato menor, así se obtiene el rango total.
Este rango total se divide entre el número de clases deseado. Se recomienda entre 6 y 15 el
número de clases.
ESTADÍSTICA I
Tabla Nº 1.7.
¿ ¿ Ẋ f fr f% f a↓ f a% ↓
n = ∑ ¿1,00 ∑ ¿100
Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable estamos estudiando?
c) ¿Qué tipo de variable es?
d) Construir la tabla de frecuencias
ESTADÍSTICA I
Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable estamos estudiando?
c) ¿Qué tipo de variable es?
d) ¿Construya una tabla de frecuencias para datos agrupados?
e) ¿Cuántos empleados tienen un salario entre 250 y 305?
f) ¿Cuántos empleados tienen un salario entre 320 y 400?
g) ¿Cuánto empleados tienen un salario superior a 450?
h) ¿Qué porcentaje empleados tienen un salario superior a 500?
Grafico Nº 1.1
ESTADÍSTICA I
Este diagrama se utiliza para cualquier tipo de variable. Tomando como ejemplo la
distribución de frecuencia de la tabla 1.1 de la variable sexo se tiene:
Tabla Nº 1.10
Distribución de frecuencia de la variable sexo
VARIABLE SEXO
Hombres
40%
Mujeres
60%
ESTADÍSTICA I
VARIABLE SEXO
Hombres
40%
Mujeres
60%
Grafico Nº 1.3
Diagrama de Barras
ESTADÍSTICA I
CALIFICACIONES
20
18
16
14
12 CALIFICACIONES
10
8
6
4
2
0
8 9 10 11 12 13
Histograma: Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar.
La diferencia: es para variables CONTINUAS. Si la amplitud del intervalo es la misma, se
elevan columnas UNIDAS, a altura la frecuencia correspondiente. Si la amplitud del intervalo
es diferente, el área del rectángulo columna será proporcional a la frecuencia representada.
Esto es, los rectángulos tienen sus bases sobre el eje horizontal, con centro en las marcas
de clase, de anchos igual al tamaño del intervalo de cada clase y de altura igual a la
frecuencia de la clase.
Ejemplo: De la tabla siguiente
Tabla Nº 1.11
Distribución de Frecuencias
¿ f Ẋ ¿ f a↓ fr f ra ↓ f% f a% ↓
(325 –
2 349 (324,5 – 373,5) 2 0,05 0,05 5,0 5,0
373)
(374 –
8 397 (373,5 – 421,5) 10 0,20 0,25 20,0 25,0
421)
(422 –
10 445 (421,5 – 469,5) 20 0,25 0,50 25,0 50,0
469)
(470 –
11 493 (469,5 – 517,5) 31 0,28 0,78 27,5 77,5
517)
(518 –
4 541 (517,5 – 565,5) 35 0,10 0,88 10,0 87,5
565)
(566 –
5 589 (565,5 – 613,5) 40 0,13 1,00 12,5 100,0
613)
n = 40 ∑ ¿1,00 ∑ ¿100
ESTADÍSTICA I
Se tiene el histograma:
Grafico Nº 1.4
HISTOGRAMA
Grafico Nº 1.5
Histograma
Diagrama de Escalera o
ESTADÍSTICA I
Grafico Nº 1.6
POLÍGONO DE FRECUENCIA:
POLIGONO DE FRECUENCIAS
12
10
8
POLIGONO DE FRECUENCIAS
6
0
349 397 445 493 541 589
ESTADÍSTICA I
Grafico Nº 1.7
POLÍGONO DE FRECUENCIAS
Obsérvese que el polígono se extiende hasta las clases supuestas inferior y superior
inmediatos a la distribución, de frecuencia cero.
Pictograma: se suele utilizar para expresar un atributo. Se suelen utilizar iconos que se
identifiquen con la variable (ejemplo un coche) y su tamaño suele guardar relación con la
frecuencia, números de árboles plantados, número de habitantes, otros.
Grafico Nº 1.8
PICTOGRAMAS
ESTADÍSTICA I
Grafico Nº 1.9
CARTOGRAMA
Grafico Nº 1.9
ESTADÍSTICA I
LA OJIVA
OJIVA
45
40
35
30
OJIVA
25
20
15
10
5
0
350 400 450 500 550 600 650
OJIVA
45
40
35
30
25 OJIVA
20
15
10
5
0
300 350 400 450 500 550 600
ESTADÍSTICA I
Observe que la ojiva comienza con frecuencia cero en el límite superior de la clase inferior
supuesta. También se puede construir la ojiva de la frecuencia acumulada descendente.
Ejercicio: Construir el histograma, el polígono de frecuencias y las ojivas de las
frecuencias acumuladas ascendente y descendente, de la siguiente distribución:
Tabla Nº 1.13
Distribución de Frecuencias
CLASES FRECUENCIAS
2.000-2.400 200
2.500-2.900 350
3.000-3.400 400
3.500-3.900 380
4.000-4.400 300
4.500-4.900 250
TEMA 2
MEDIDAS DE TENDENCIA CENTRAL
ESTADÍSTICA I
TENDENCIA CENTRAL: Las medidas de tendencia central indican hacia qué valor tienden
a agruparse los datos en una distribución, es decir, el centro de la agrupación. Entre las
medidas de tendencia central tenemos: La media aritmética, la moda y la mediana. A
continuación un estudio de cada una de ellas.
MEDIA ARITMÉTICA: Es una de las medidas más importante en la estadísticas, por su
gran utilidad y operacionabilidad. Se define como la suma de todos los valores de la
variable, dividida por el número o cantidad (n) de valores, su fórmula de cálculo es:
x 1 + x 2+ x 3 +…+ xn
X=
n
Usando el símbolo de sumatoria, la media aritmética se escribe así:
n
∑ xi
X = i=0
n
MEDIA ARTMÉTICA EN DATOS NO PROCESADOS
Cuando los datos están no procesados, la media aritmética se calcula, simplemente
sumando todos los datos sin importar el orden, y luego dividir esa suma entre el número total
de ellos. La formula anterior es utilizada en datos brutos.
Ejemplo:
La compañía Componentes H&G, C.A., tiene fondos de reserva en valores negociables a
corto plazo. El saldo diario de cierre (en millones de Bs.) de la cuenta de valores negociables
en un lapso de dos semanas es el que se muestra a continuación:
Semana Nº 1 Bs. 1.973 1.970 1.972 1.975 1.976
Semana Nº 2 Bs. 1.969 1.892 1.893 1.887 1.895
¿Cuál fue la cantidad promedio invertida en valores negociables durante
a) La primera semana
1.973+1.970+ 1.972+1.975+1.976 9.866
X= = =1.973
5 5
Interpretación: la empresa mantuvo en el periodo de la primera semana un saldo promedio
de 1.973 millones de bolívares en valores negociables.
b) La segunda semana
1.969+1.892+1.893+1.887+ 1.895 9.536
X= = =1.907
5 5
Interpretación: la empresa mantuvo en el periodo de la segunda semana un saldo promedio
de 1.907 millones de bolívares en valores negociables.
c) En el periodo de las dos semanas
1.973+1.970+ 1.972+1.975+1.976 +1.973+1.970+1.972+1.975+1.976
X=
10
19.402
X= =1.940
10
ESTADÍSTICA I
∑ xi∗f i
i=0
X=
n
Donde: Xi * Fi es el producto de un dato por su frecuencia, es decir por las veces que el
dato aparece repetido
Ejemplo: Las siguientes son las calificaciones de Estadística tomadas de una muestra de
20 alumnos:
Tabla Nº 2.1
Distribución de frecuencia de la variable calificaciones de Estadística
Calificacion
es f
4 3
5 2
6 3
7 1
8 6
9 1
10 4
Total 20
¿Cuál fue la calificación promedio? Considera usted, que es un buen promedio tomando
en cuenta que el rango de evaluación es del 1 – 10.
Solución: En la práctica se le agrega a la distribución la columna del producto F.X, se
suma esta columna, finalmente se divide la suma entre n, cuyo valor es igual a la suma de
las frecuencias absolutas.
Tabla Nº 2.2
Distribución de frecuencia de la variable calificaciones de Estadística
Calificacione
s f X*f
4 3 12
5 2 10
6 3 18
7 1 7
8 6 48
9 1 9
10 4 40
ESTADÍSTICA I
Total n = 20 ∑ X∗F=144
12+10+18+ 7+48+ 9+40 144
X= = =7,2
20 20
n
∑ xi∗f i 144
i=0
X= = =7,2
n 20
Tomando el rango de evaluación de 1-10 se considera que para la muestra tomada de 20
alumnos es un buen promedio de calificación en la asignatura estadística.
MEDIA ARITMÉTICA EN DATOS AGRUPADOS.
Cuando los datos están agrupados se utiliza la misma fórmula para calcular el
promedio, pero cambiando el símbolo de la variable Xi por el de punto medio o marca
de clase ẋ ,quedando así:
n
∑ ẋi∗f i
i=0
X=
n
Ejemplo: La siguiente distribución de frecuencia representa los pesos en kilogramos
de una muestra de paquetes transportados por una pequeña empresa de transporte:
Calcular la media de la muestra para determinar el peso promedio en kilogramos de
los paquetes transportados
Tabla Nº 2.3
Distribución de frecuencia de la variable pesos en kilogramos de los paquetes
transportados
Pesos ¿
Li – Ls
x F F . Ẋ
n = 31 ∑ Ẋ∗F=411,95
∑ ẋi∗f i 411,95
X = i=0 = =13,3
n 31
ESTADÍSTICA I
Ejemplo:
a) La serie 2, 2, 3, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 8 , tiene por moda: M o = 3.
b) La serie 20,21,21,21,22,23,23,24,24,24,25,26,26 , es bimodal : M o1= 21 y Mo2 =24
ESTADÍSTICA I
2, 1, 1, 2, 3, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 3, 3, 3, 3.
Tabla Nº 2.4
Distribución de frecuencia de la variable calificaciones de Estadística
Calificaciones F
4 3
5 2
6 3
7 1
8 6
9 1
10 4
Total n = 20
M o=L RI +
( Fmodal −F anterior
)
2 F modal −( F anterior + F siguiente )
∗C (amplitud)
Donde:
Lri = limite real inferior
F modal = frecuencia de la clase modal
F anterior = frecuencia anterior a la clase modal
F siguiente = frecuencia siguiente a la clase modal
Amplitud de la clase modal
Ejemplo: siguiendo con el ejemplo de la tabla Nº 3.3 de distribución de frecuencia de
los pesos en kilogramos de una muestra de paquetes.
Tabla Nº 2.5
ESTADÍSTICA I
Lo primero es observar cuál es la clase que tiene la mayor frecuencia, para este caso se
tiene que la clase con mayor frecuencia (clase modal) es el intervalo de: (14,0 – 14,9) cuya F
= 12. Entonces, en esa clase se encuentra incluido el valor de la moda, por lo tanto se le
aplica la formula anterior a esa clase, donde se tienen los valores siguientes:
Lri = 13.95
Fmodal = 12
Fanterior = 8
Fsiguiente = 0
Amplitud de la clase modal = C modal = 13,95 - 14,95 = 1
Sustituyendo en la formula de la moda se tiene
M o=L RI +
( Fmodal −F anterior
)
2 F modal −( F anterior + F siguiente )
∗C (amplitud)
M o=13,95+
( 2∗12−
12−8
( 8+0 ) )∗1=13,95+
4
24−8
∗1=¿
4
M o=13,95+ ∗1=¿
16
M o=13,95+ 0,25∗1=¿
M o=13,95+ 0,25=¿
M o=14,2
El dato que más se repite es 14,2 kilogramos
MEDIANA (Me): es el valor que separa por la mitad las observaciones ordenadas de
menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro
50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par
tomaremos como mediana la media aritmética de los dos valores centrales.
Figura Nº 4
ESTADÍSTICA I
3+3 6
Me= = =3
2 2
La mediana es: Me = 3
MEDIANA EN DATOS TABULADOS
ESTADÍSTICA I
Cuando los datos están tabulados, se calculan las frecuencias acumuladas que indican
los lugares que ocupan cada dato, luego se observa cual ocupa el lugar central.
Ejemplo: siguiendo con el ejemplo de las calificaciones de estadística se tienen la
siguiente distribución de frecuencia:
Tabla Nº 2.6
Distribución de frecuencia de la variable calificaciones de Estadística
Calificaciones F Fa
4 3 3
5 2 5
6 3 8
7 1 9
8 6 15
9 1 16
10 4 20
Total n = 20
( )
n
−Facumulada anterior
2
M e =LRI + ∗C( amplitud)
F mediana
ESTADÍSTICA I
Pesos
F F. acumulada
Li – Ls
El primer paso 10,0 – 10,9 1 1 es calcular el
lugar que ocupa la
mediana en la 11,0 – 11,9 4 5 distribución de
frecuencias de 12,0 – 12,9 6 11 los datos
agrupados:
Clase mediana 13,0 – 13,9 8 19
14,0 – 14,9 12 31
n = 31
31+1 32
L Me= = =16
2 2
Como se observa la clase mediana es (13,0 – 13,9), donde:
Lri = 12,95
F acumulada anterior = 11
F mediana = 19
Amplitud de la clase mediana = C mediana = 12,95 - 13,95 = 1
Sustituyendo en la formula de la mediana, se tiene
( )
n
−Facumulada anterior
2
M e =LRI + ∗C( amplitud)
F mediana
( )
31
−11
2
M e =12,95+ ∗1
19
M e =12,95+ ( 15,5−11
19 )
∗1
M =12,95+(
19 )
4,5
e ∗1
M e =12,95+0,237∗1
M e =12,95+0,237
M e =13,187
ESTADÍSTICA I
b) {5, 5, 6, 7, 5, 7, 7, 7, 5, 6, 8, 5, 2, 2, 3, 4 }
Media:
Moda:
Mediana:
c) Tabla Nº 2.9
Distribución de frecuencia de la variable X
X F
25 15
26 23
29 38
30 12
ESTADÍSTICA I
c) Tabla Nº 2.10
Distribución de frecuencia de la variable X
CLASE FRECUENCIA
56-60 12
61-65 35
66-70 16
TEMA 4
TEMA 3
MEDIDAS DE ORDEN O DE POSICIÓN
Indican la acumulación de los datos ordenados hasta un punto determinado,
generalmente expresado en términos de porcentaje.
Representa un porcentaje de datos con respecto al total (n) del conjunto S. Si se considera
n igual al 100% de los datos y a k igual al Pk %, se obtiene la regla de tres siguiente
n → 100 %
k→ Pk
Despejando k y Pk se obtienen las ecuaciones:
P k∗n
k=
100
k∗100
pk =
n
ESTADÍSTICA I
Con estas ecuaciones se pueden resolver problemas como los que plantean las
siguientes preguntas:
1.- ¿Cuántos elementos (k) conforman el Pk % del total general (n) ?
2.- ¿Qué porcentaje representan los primeros k-elementos del total general n ?
PERCENTIL: Sea XP el punto que acumula el p% de los datos en una serie ordenada.
Supóngase a este punto ubicado entre dos elementos de la serie, llámese X i al elemento
inferior y XS al superior. Llámese Lx I al lugar que ocupa X I y Lx S el lugar de X S , donde
la diferencia entre ellos es uno (Lxs−Lxi=1), por ser lugares consecutivos, y llámese Lxp
el lugar de X p .
Figura Nº 5
ESTADÍSTICA I
Por otro lado se tiene que el percentil ocupa un lugar en la serie y ese lugar se determina
mediante la siguiente ecuación
np
LX P = +1/2
100
Donde
n = tamaño de la serie
P = porcentaje acumulado
Para obtener el valor de un percentil se deben realizar dos pasos: i) se calcula el lugar que
ocupa el percentil mediante la ecuación 3.5, y ii) se calcula el valor del percentil mediante la
ecuación 3.4
Ejemplo: Dada la serie S = {40, 42, 45, 47, 49}, ¿qué valor acumula a su izquierda el 36%
de los datos?
Solución: Se debe calcular el percentil 36 ( X36 )
5∗36 1
i) L xp= + =2,3
100 2
ii) Como el valor buscado ocupa el lugar 2.3, entonces está ubicado entre el segundo y
tercer elemento de la serie, es decir está entre 42 y 45 (entre el segundo y tercer lugar),
luego se tiene que
X I =42
Lx I =2
X S=45
Sustituyendo en la ecuación
X p =X I + ( X S− X I )∗( L XP−L XI ) :
X 36=42+(45−42)∗(2.3−2)=42.9
Interpretación: A la izquierda del 42.9 se acumula el 36% de los datos de la serie, ese es
el valor del percentil 36.
Ejemplo: Calcular X 21,33 y X 50 en la distribución siguiente
Tabla Nº 3.1
Distribución de frecuencia de la variable X
X F
1 3
2 2
7 4
9 3
10 3
ESTADÍSTICA I
ii) El percentil buscado está entre el 7 que ocupa el séptimo lugar y el 7 que ocupa el
noveno lugar, entonces el valor buscado es X50 = 7.
Para identificar mejor los lugares puede construir la columna de las frecuencias acumuladas.
Otra manera de ver las cosas: i) escríbase cada uno de los valores ordenados, ii) obsérvese
el número que ocupa el octavo lugar
ESTADÍSTICA I
La distancia o amplitud del intervalo (C) se obtiene restando los límites reales
C=Ls – Li
ESTADÍSTICA I
20-24 12 12
25-29 16 28
30-34 18 46
35-39 15 61
40-44 10 71
Por el lugar que ocupa el percentil, éste está ubicado en la segunda clase: (25-29), donde
Li=24.5
Fai=12
F=16
C=29.5−24.5=5
Sustituyendo en la ecuación
xp
−F aI
100
x p=Li + ∗C
F
21,3−12
x 30=24,5+ ∗27,41
16
Ejercicio: De la distribución anterior, calcular
a) X 50
b) X2
c) X 86
ESTADÍSTICA I
P=
100
n ( X − XI
Lx i+ P
X S −X I
−1 /2
)
Ejemplo: De la serie S={40 , 42 , 45 , 47 , 49 }, ¿qué porcentaje acumula el punto
Xp=42.9 ?
Solución: el punto 42.9 está ubicado entre el 42 y el 45 de la serie, es decir entre el segundo
y tercer lugar, entonces
Lxi=2
Xp=42.9
Xi=42
Xs=45
n=5
Sustituyendo en la ecuación, se tiene
P=
100
n ( X − XI
Lx i+ P
X S −X I
−1 /2
)
P=
100
5 (
2+
42,9−42
45−42
−1/2 =36 %)
Interpretación: El punto 42.9 acumula a su izquierda, el 36% de los datos
b) Para datos agrupados se tiene la ecuación la siguiente ecuación:
P=
100
n (
X −LI
Fai+ P
C
∗F )
Dra. Yeanny Marcano
45
Dra. Yeanny Marcano
ESTADÍSTICA I
P=
100
71 (
12+
27,41−24,5
5
∗16 =30 % )
Interpretación: El punto 27.41 acumula a su izquierda, el 30% de la información.
np np
Lx P = + 1/ 2 Lx P=
Localización 100 100
np
100
−Fai
Percentil X p = X I +( X S−X I ).(Lx P−Lx I )
Xp=Li+ .C
F
ESTADÍSTICA I
d) el rango percentil P8
II) Calcular P 32 en la distribución siguiente
Tabla Nº 3.14
Distribución de frecuencia de la variable X
X F Fa
20-24 12 12
25-29 16 28
30-34 18 46
35-39 15 61
40-44 10 71
TEMA 4
MEDIDAS DE DISPERSIÓN.
Las medidas de tendencia central o de posición nos indica donde se sitúa un grupo de
datos. Los de variabilidad o dispersión nos indican si estos están próximos entre sí o por el
ESTADÍSTICA I
contrario está muy dispersos. Observe que el conjunto A de puntos, es menos disperso que
el B, pero ¿cómo medir esta dispersión?
Figura Nº 7
Co
nju nto
A Conjunto B
Entre las medidas de dispersión tenemos el rango, los desvíos, la desviación media, la
varianza, la desviación estándar y el coeficiente de variación de Pearson
RANGO: Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos,
es fácil de calcular y sus unidades son las mismas que las de la variable. Posee algunos
inconvenientes; no utiliza todas las observaciones (solo 2 de ellas), también puede verse
afectada por alguna observación extrema. Es la distancia que ocupa la serie estadística. Se
define operacionalmente como la diferencia entre el dato mayor y el dato menor
R = dato mayor – dato menor
DESVÍO: Es la distancia entre un dato y el centro de la distribución, que en general, se toma
la media aritmética como dicho centro.
D i=X i−X
Nota: Una propiedad importante de los desvíos es que la suma de todos los desvíos es cero
¡Compruébelo!
DESVIACIÓN MEDIA: Es el promedio o media aritmética de todos los valores absolutos de
los desvíos
n
∑|X i−X|
D m = i=0
n
VARIANZA: Mide la distancia existente entre los valores de la serie y la media. La varianza
siempre será mayor que cero. Mientras más cerca se encuentren los valores de cero, estos
valores están más concentrados alrededor de la media; además es el cuadrado de la
desviación estándar o también puede definirse como la media aritmética de los cuadrados de
los desvíos
ESTADÍSTICA I
√
n (Desviación Típica Poblacional)
∑ ( X i−μ ) 2
2 i=0
σ =
N
√
n (Desviación Típica Muestral)
∑ ( x i−x ) 2
2 i=0
S=
n−1
D 3=3 – 3 .25=−0 . 25
D 5=5 – 3 . 25=1. 75
c) La Desviación Media:
ESTADÍSTICA I
d) La varianza
( 2 , 25 )2 + ( 0 , 25 )2 + ( 0 ,75 )2+ (1 , 75 )2
σ 2=
4
2 5 , 0625+0 ,0625+ 0 ,5625+3 , 0625 8 , 75
σ = = =2 ,1875
4 4
σ 2=2 ,1875
e) La Desviación Estándar:
σ =√ 2 ,1875=1 , 4790
f) El Coeficiente De Variación:
1 , 4790
C . V .= =0 , 455
3 , 25
CALCULO DE LA VARIANZA:
Tanto la varianza como la desviación típica son las medidas de dispersión más importantes
por el uso que tienen. Indican cuan están los datos separados del centro de la distribución.
Para calcular la varianza se estila agregar columnas a la tabla de distribución según las
exigencias de la formula que se esté utilizando.
Ejemplo: calcular la varianza en la siguiente distribución {2, 3, 5, 6, 7, 8}
Solución: Se desea utilizar la fórmula de cálculo rápido.
N ∑ X 2− ( ∑ X )
2
2
σ = 2
N
Basta agregar la columna de X2 y hacer las sumas de las dos columnas x y x 2
Tabla Nº 4.1
Distribución de frecuencia
X X2
2 4
3 9
5 25
6 36
7 49
8 64
ESTADÍSTICA I
x=31 x 2=187
N ∑ F . X −( ∑ F . X )
2 2
2
σ = 2
N
Ejemplo: Calcular la varianza en la distribución que se presenta a continuación
Tabla Nº 4.2
Distribución de frecuencia
X F
2 5
3 7
4 6
5 4
Tabla Nº 4.3
Distribución de frecuencia
X F X2 F.X F.X2
2 5 4 10 20
3 7 9 21 63
4 6 16 24 96
5 4 25 20 100
F . X =75 , F . X 2=279
ESTADÍSTICA I
2
2 22∗279− (75 ) 6 . 138−5 . 625 513
σ = 2
= = =1, 0599
( 22 ) 484 484
Cuando los datos están agrupados se aplica el procedimiento inmediato anterior, solo que se
utiliza el punto medio en sustitución de la variable X, es decir se debe abrir, previamente a
las columnas de X 2 , F . X y F . X 2 y la columna del punto medio
Tabla Nº 4.4
Distribución de frecuencia
Clase X
10-14 5
15-19 12
20-24 11
25-29 9
ESTADÍSTICA I
PROPIEDAD 2.
Si todos los elemento de la serie S o se multiplican o dividen por una cantidad constante K
se obtiene la nueva serie derivada Sd ={ X 1∗K , X 2∗K , ... Xn∗K }, donde la operación
asterisco (*) significa multiplicar o dividir, entonces
a) La media de la nueva serie sale afectada (multiplicada o dividida, según sea el caso) por
esa constante
X d= X 0∗k
Ejemplo: Si la serie S o =\{ 3, 4, 5, 6, 7 \}, que tiene por media X 0=5, se multiplica por
ESTADÍSTICA I
X d =5* 2=10
La nueva serie Sd tiene por
Varianza
2 2 2
σ d=k ∗σ 0
Desviación Estándar
σ d=k∗σ 0
2 2
σ d=2 ∗2=4∗2=8
σ 0=2∗ √2=2,8284
ESTADÍSTICA I
b) Agrupar los datos en las siguientes clases: {04-06, 07-09, 10-12, 13-15, 16-18 }.
Calcular los mismos estadísticos de la parte a) anterior