Está en la página 1de 20

ASIGNATURA:

ESTADÍSTICA

MAESTRIA EN EDUCACIÓN SUPERIOR CEPI - USFX


ASIGNATURA: ESTADÍSTICA
2019

OBJETIVOS FORMATIVOS DE LA UNIDAD

• Calcular, analizar e interpretar medidas de tendencia


central y de localización y aplicarlas en los diferentes
1
fenómenos sociales.
• Valorar los estadísticos de tendencia central,
localización y dispersión.

INDICE

1. Medidas de posición Pág. 2


1.1. Media Aritmética Pág. 2
1.2. Mediana Pág. 5
1.3. Moda Pág. 8
1.4. Cuartiles, Deciles y Percentiles Pág. 9
2. Medidas de dispersión Pág. 12
2.1. Rango o recorrido Pág. 13
2.2. Desviación media Pág. 14
2.3. Varianza de población y muestra Pág. 16
2.4. Desviación estándar o típica Pág. 16
ASIGNATURA: ESTADÍSTICA

MEDIDAS DE POSICIÓN Y DE DISPERSIÓN

Para una adecuada interpretación de los datos se precisa de ciertos valores que
caracterizan a un conjunto de datos, a tales valores se les llama Medidas estadísticas.
Se clasifican en:

- Medidas de posición
- Medidas de dispersión
- Medidas de forma

Las que más se usan en el área social son las de posición y dispersión.

1. Medidas de posición.

Las medidas de posición describen la posición que ocupa la Distribución de frecuencias


respecto a un valor de la variable. A su vez se distinguen dos tipos:

- Medidas de tendencia central, deben su nombre a la característica de que sus


valores tienden a ocupar posiciones centrales o intermedias entre el menor y
mayor valor del conjunto de datos. Por tanto brindan información sobre el centro
de la distribución. Las más usuales y las que aprenderemos son la media
aritmética y la mediana.
- Medidas de localización, señalan la ubicación de los valores más frecuentes o de
valores extremos, los más usuales son la moda y los percentiles.

1.1. Media Aritmética.

Se la conoce directamente como Media o Promedio, es una medida de tendencia central.


De un conjunto de datos X1, X2, X3, …, Xn de tamaño n, de una variable o característica
X. Se denota por X a su media aritmética y se define como la suma de todos los valores
observados en la Muestra, dividida entre el número total de datos n.
ASIGNATURA: ESTADÍSTICA

De una manera más simplificada, se puede escribir la media mediante la expresión,


prescindiendo de los subíndices en la sumatoria. Sobreentendiéndose que , sin
ningún subíndice, indica la suma de todos los valores,:

Ejemplo: Se calcula la media aritmética 2+4+7+8+9


X= =6
de los datos siguientes: 2,4,7,8,9 5

La media aritmética significa un valor central o un valor de equilibrio que representa a


todos los demás valores. La media aritmética puede interpretarse también como aquel
valor que se le atribuye a cada término. En el ejemplo, se puede decir que el conjunto
de datos 2, 4, 7, 8, 9 es equivalente al conjunto de datos: 6,6,6,6,6. La media no
necesariamente es uno de los valores del conjunto de datos, En el ejemplo, la media es
6, pero 6 no era uno de los datos iniciales.

Media aritmética de una población


Si las observaciones del fenómeno corresponden a los datos de toda una población (N),
entonces la media aritmética corresponde a lo que se denomina media poblacional (𝜇),
la cual constituye un parámetro que denotamos como:

X1 + X2 + X3 + ⋯ + Xn Ʃ∑𝑥 Note que para simbolizar la media


𝜇= =
𝑁 𝑁 aritmética de una Población se emplea µ.

Media aritmética ponderada.

Cuando los datos X1, X2, X3, …, Xn, que respectivamente poseen los factores de
ponderación (o de peso) W1, W2, W3, …, Wn, la media aritmética ponderada, se define
por:

Su uso viene aconsejado cuando se


pretende calcular la media en una
distribución cuyos valores tiene diferente
significado o importancia respecto al
resultado final.

Ejemplo:
Considerando la ponderación para la obtención de la nota final, calcular la media
ponderada, de un escolar que obtuvo las siguientes notas:

Examen Nota (sobre W WX ∑WX


7) ponderación X=
∑W
1er examen 3.2 25% 80
2do examen 4.2 25% 105 480
Asistencia 6.6 15% 99 X= = 4,8
100
Examen final 5.6 35% 196
∑W=100% ∑WX=480
ASIGNATURA: ESTADÍSTICA

Media Aritmética para una tabulación discreta de datos


Si un conjunto de datos, están presentado como una tabulación discreta, es decir los
datos X1, X2, X3, …, Xn, se reiteran f1, f2, f3, …, fn, entonces la media aritmética se calcula
como:

Ejemplo: 4
Se trata de calcular la edad promedio de un grupo de 25 universitarios, si 4 de ellos
tienen 17 años, 6 de ellos tienen 18 años, 8 tienen 19 años y 7 son de 20 años.
Es conveniente agrupar los datos en una tabla, esto es una Tabulación discreta de datos.

X f Fx Aplicando la fórmula:
datos frecuencia
17 4 68 468
X= = 18,72
18 6 108 25
19 8 152
20 7 140
N = 25 ∑Fx=468

Media aritmética para una clasificación de datos (datos agrupados en intervalos


de clase)

Si los datos se presentan como un clasificación con k clases, marca de clase Xj de


Frecuencia f, con j 1,2,3, …,k, de estos datos la media aritmética se define como:

Ejemplo:
Se calcula la media aritmética de la Clasificación de datos de la tabla.

Puntuaciones Xi F fXi
2-6 4 8 32 Aplicando la fórmula:
7 - 11 9 15 135
12 - 16 14 26 364 X=
1362
= 15,5
17 - 21 19 21 399 88

22 - 26 24 18 432
N = 88 1362

Note la conveniencia de agregar una columna a los datos iniciales, la columna de fXi ,
cuya suma posterior permite el cálculo directo de la Media aritmética.

La Media de una Tabulación discreta siempre coincide con la Media de los datos antes
de tabularlos.
La Media de una Clasificación no siempre coincide con la Media de los datos antes de
clasificarlos.

Ventajas y Desventajas de la media aritmética.


ASIGNATURA: ESTADÍSTICA

- Es un concepto ampliamente conocido y empleado en todas las actividades


- Es un valor fácilmente calculable
- En el cálculo de la Media, intervienen todos los datos del conjunto, por tanto es una
medida sumamente confiable y precisa.
- Si en un conjunto de datos hay valores extremos, esto afecta a la representatividad
de la Media, por tanto se debe analizar por ejemplo la presencia de números
extremadamente grandes dentro de un conjunto de mayoría de números pequeños. 5
- El cálculo de la Media de una Clasificación de datos, sólo es una aproximación del
valor que se obtendría, respecto al cálculo si los datos no estaban clasificados.
- No se puede calcular la Media de una Clasificación de datos abierta, por ejemplo,
cuando el primer intervalo no posee límite inferior o el último intervalo no posee
límite superior.

1.2. La Mediana.

La mediana es el punto o valor numérico que deja debajo (y por encima) a la mitad de
los valores de una distribución de valores.
La Mediana que se denota por Me(X) se define como el valor central de un conjunto de
datos X1, X2, X3, …, Xn de tamaño n, de una variable o característica X, donde los datos
están ordenados correlativamente. Por tanto, se considera la mediana como la medida
de tendencia central que corta la distribución en dos partes iguales.

Cuando se tiene un número impar de datos la Mediana será el valor del dato central X
(n+1)/2. Para un número par de datos se calcula la Media de los datos centrales: X n/2,
Xn/2+1

Ejemplo 1: Calcular la Mediana de los siguientes conjuntos de números.

23 24 24 25 26 27 28 29 29
X1 X2 X3 X4 X5 X6 X7 X8 X9

Son nueve datos, por tanto: X (n+1)/2 = X (9+1)/2 = X5 = 26


Entonces Me = 26. El dato central es el quinto (X5), de valor 26.

Ejemplo 2: Calcular la Mediana de los siguientes conjuntos de números.

11 13 14 16 17 19
X1 X2 X3 X4 X5 X6

Se tiene un número par de datos, por tanto son dos los valores centrales, X 6/2 = X3;
X3+1 =X4
Se obtiene la media aritmética del tercer y cuarto lugar. Entonces Me = 14+16/2 = 15

Note que en el cálculo de la Mediana no interesa el valor de todos los datos sino la
posición dentro de una secuencia ordenada de los datos.

Mediana de tabulación discreta


ASIGNATURA: ESTADÍSTICA

En el cálculo de la Mediana de una Tabulación discreta de datos, se debe verificar que la


tabla incluya la columna de Frecuencias acumuladas absolutas (fa).

Para calcular la Mediana de los datos de la tabla, se calcula n/2, se compara este cociente
con las frecuencias acumuladas, buscando la inmediata superior fa j, comparando se
presentan dos casos:
Si n/2 < faj , entonces la Mediana es Xj 6
Si n/2 = faj , entonces la Mediana es Xj +Xj+1
2

Ejemplo 1:
Calcular la Mediana de los números: 2,3,4,5 que reiteran 10, 16, 13, 11 veces
respectivamente.

Se siguen los siguientes pasos


X f fa 1. Agrupar los datos en una tabla
Datos frecuencia Frecuencia 2. Calcular la frecuencia acumulada
acumulada absoluta
2 10 10 3. Calcular n/2= 50/2 =25
3 16 26 4. Comparar este valor con las
4 13 39 frecuencias acumuladas, buscando su
5 11 50 inmediato mayor.
50 5. Verificar que: n/2 = 25 <26 = fa2
La frecuencia acumulada fa2=26,
corresponde al dato x2 = 3, entonces la
Me = 3.

Ejemplo 2:
Calcular la mediana de la siguiente tabulación discreta:

X f fa 1. Calcular la frecuencia acumulada


datos frecuencia Frecuencia absoluta.
acumulada 2. Calcular n/2 = 16/2 = 8
18 1 1 3. Comparando este valor con las
19 3 4 frecuencias acumuladas:
20 4 8 n/2 = 8 = fa3 ,entonces j= 3 y la
21 5 13 Mediana es:
22 2 15
23 1 16 𝑀𝑒 =
Xj +Xj+1
=
X3 +X4
=
20+21
= 20,5
2 2 2
20 16 Esto significa que el 50% de los datos
tienen un valor máximo de 20,5 y l 50%
de los datos tienen un valor superior a
20,5.

Mediana de clasificación de datos


Para obtener la Mediana de una Clasificación de datos, previamente se determina la
Clase de la mediana, que es aquella Clase donde se encuentra la Mediana. Para ello se
ASIGNATURA: ESTADÍSTICA

calcula n/2 buscando la Frecuencia acumulada fj , inmediata superior a este valor, esta
faj, corresponde a la Clase de la mediada. Luego se emplea la siguiente fórmula.

Donde:
𝑛 Li = límite inferior real de la clase de la
2
− 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 mediana
𝑀𝑒 = 𝐿𝑖 + 𝑐 N = número total de datos, es decir frecuencia 7
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎
total
fa anterior = frecuencia acumulada anterior a
la clase de la mediana
f mediana = frecuencia de la clase de la
mediana
c = amplitud o anchura del intervalo de clase.

Ejemplo 1:
Calcular mediana de los datos clasificados de la siguiente tabla:
Se siguen los siguientes pasos:
Peso Frecuenci Amplitu Frecuenci 1. Calcular los límites reales. En este caso,
(Kgr) a de clase d de a la tabla ya presenta los límites reales y
(f) clase (c) acumulad por tanto ya no es necesario.
a (fa) 2. Calcular la amplitud del intervalo
40– 46 4 6 4
3. Calcular la frecuencia acumulada
46 – 52 5 6 9
52 – 58 7 6 16 4. Calcular la clase de la mediana. Para
58 – 64 6 6 22 ello se hace N/2 = 25/2 = 12,5.
64 - 70 3 6 25 Se busca la frecuencia acumulada
N = 25 inmediata superior a 12,5 que es 16.
Entonces la clase de la mediana será: 52
– 58.
5. Aplicar la fórmula:
( 𝑛− 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟) (12,5 − 9) 3,5
𝑀𝑒 = 𝐿𝑖 + 2 𝑐 = 52 + ∗ 6 = 52 + 6 = 52 + 3 = 55
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 7 7

Este resultado significa que no más del 50% de los datos observados son menores a 55
Kgr y que también no más del 50% son mayores a 55 Kgr.

Ventajas de la mediana Desventajas de la mediana


- Es fácil de comprender y puede ser - Para calcular la Mediana, antes se
rápidamente calculada a partir de deben ordenar los datos, es fácil
cualquier tipo de datos. comprende que cuando el número de
- Esta afectada por el número de datos es alto, esto significará un gran
observaciones y no por la magnitud consumo de tiempo.
de cualquier valor extremo. - Ciertos procedimientos estadísticos
- Se puede encontrar la Mediana que usan la Mediana son más
inclusive de datos de variable complejos que en el uso de la Media.
cualitativa ordinal. - No es adecuada para manipulaciones
algebraicas posteriores.
ASIGNATURA: ESTADÍSTICA

1.3. La Moda.

Se define la moda como el valor que se presenta u ocurre con mayor frecuencia. Es
decir la Moda es el valor más común de una distribución. La moda puede no existir en
una distribución determinada o bien puede ser única. En un representación gráfica, la
Moda será el rectángulo más alto, en el caso de un histograma o el pico más alto en el
caso de un polígono. 8

En un conjunto de datos X1, X2, X3, …, Xn de tamaño n, de una variable o característica


X. La Moda se define como el valor que ocurre con mayor frecuencia, se denota por Mo.

Con variables nominales la moda es la categoría con mayor frecuencia.


Con variables ordinales, la moda es el valor ordinal con mayor frecuencia.

Ejemplos:
a) Calcular la moda de los siguientes conjuntos de números: 2, 3, 4, 4, 5, 6, 6, 6,
7 y 9.
La Moda es el número que más veces se repite, en este caso es el 6. Por existir una sola
Moda se llama Unimodal.
b) Calcular la moda de los siguientes conjuntos de números: 11, 12, 13, 14, 15, 16,
18 y 19.
Ningún número se reitera, por tanto no existe una Moda en este conjunto de números.
c) Calcular la moda de los siguientes conjuntos de números: 5, 6, 7, 7, 9, 11, 11 y
13.
Hay dos números que se reiteran, por tanto existirán dos Modas, el conjunto de datos
se llama Bimodal.

Moda para tabulación discreta.


En una tabulación discreta para hallar la Moda, simplemente se debe buscar la mayor
frecuencia, su valor correspondiente será la Moda. De acuerdo al concepto de que Moda
es el dato más frecuente.

Ejemplo: Calcular la Moda con los datos de la siguiente tabla.

X (Datos) F (frecuencia) Se siguen los siguientes pasos


2 10 1. Identificar la frecuencia más alta. En este caso
3 16 es 16.
4 13 2. Identificar el valor de la variable que
5 11
corresponde a esa frecuencia más alta. En este
50
caso es 3.
3. La moda es 3. Mo = 3

Moda para una clasificación de datos


Para calcular la Moda de una clasificación de datos, previamente se identifica la clase o
intervalo de clase que tiene la mayor frecuencia, es decir la Clase Modal. Y se aplica la
siguiente fórmula:

Donde:
Li = límite inferior real de la clase de la moda
ASIGNATURA: ESTADÍSTICA

𝑑1 d1 = diferencia de la frecuencia modal sobre la frecuencia


𝑀𝑜 = 𝐿𝑖 + 𝑐
(𝑑1 + 𝑑2) de la clase
anterior inmediata
d2 = diferencia de la frecuencia modal sobre la frecuencia
de la clase
posterior inmediata.
c = amplitud o anchura de la clase modal. 9

Ejemplo 1: Calcular moda de los datos clasificados de la siguiente tabla:

Peso Frecuencia Amplitud Se siguen los siguientes pasos:


(Kgr) de clase (f) de clase (c) 1. Identificar el intervalo de clase que tiene
40– 46 4 6 la frecuencia más alta. En este caso es:
46 – 52 5 6
52 – 58.
52 – 58 7 6
2. Calcular la amplitud del intervalo
58 – 64 6 6
64 – 70 3 6 3. Calcular d1. d1= 7-5=2
N = 25 4. Calcular d2. d2 = 7-6 = 1
5. Aplicar la fórmula:
2 12
𝑀𝑜 = 52 + 6 = 52 + = 56
(2 + 1) 3

Ventajas de la Moda Desventajas de la Moda


- Puede usarse tanto para datos de - Existen conjuntos de datos donde la
variable cuantitativa como Moda no existe.
cualitativa. - Existen conjuntos de datos donde hay
- Es fácilmente reconocible por simple dos o más Modas. En estos casos la
inspección. interpretación se hace difícil y sería
- No se ve afectada por valores complejo decidir a la Moda que
extremos representa al conjunto de datos.
- Se aplica incluso en clases de
extremo abierto (un extremo no
definido)

1.3. Cuantiles

Además de las medidas de tendencia central antes estudiadas (media, mediana, moda),
existen los Cuantiles que pueden ser más prácticas en ciertas situaciones donde el
investigador no busca una ubicación central, sino una posición específica en la
distribución de sus datos. Estas medidas de posición son los cuartiles, deciles y
percentiles; éstos, en cierta forma, son una extensión de la mediana.

Cuartiles

Los cuartiles de una sucesión de datos ordenados son aquellos números que dividen la
sucesión en cuatro partes porcentualmente iguales. Hay tres cuartiles, denotados como
Q1, Q2 y Q3. El segundo cuartil (Q2) es, precisamente, la mediana. El primer cuartil es
el valor por debajo del cual queda un cuarto (25%) de los valores de la sucesión
ASIGNATURA: ESTADÍSTICA

ordenada, mientras que para el tercer cuartil es el valor que no supera a más de tres
cuartas partes de las observaciones (75%) y no es superado por más de la cuarta parte.

Puesto que estas medidas adquieren mayor importancia cuando los datos están
agrupados en una tabla de distribución de frecuencias, nos limitaremos entonces a
mostrar su fórmula de cálculo para estos casos.
10
Donde:
Li = límite inferior real de la clase del cuartil
𝑘𝑁
− 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 K = es el cuartil que estamos calculando
𝑄𝑘 = 𝐿𝑖 + 4 𝑐 N = número total de datos, es decir frecuencia total
𝑓𝑐𝑢𝑎𝑟𝑡𝑖𝑙 fa anterior = frecuencia acumulada anterior a la clase
del cuartil
f cuartil = frecuencia de la clase del cuartil
c = amplitud o anchura del intervalo de clase.

Ejemplo:
Calcular el tercer cuartil ó Q3 con los datos clasificados de la siguiente tabla:

Se siguen los siguientes pasos:


Frecuencia Amplitud Frecuencia Calcular los límites reales de los
Clases de clase (f) de clase acumulada intervalos de clase.
(c) (fa) 1. Calcular la amplitud del intervalo
32 – 40 4 8 4 2. Calcular la frecuencia acumulada
40 – 48 8 8 12
3. Identificar la clase que contiene el
48 – 56 5 8 17
56 – 64 4 8 21
tercer cuartil. Para ello se hace 3∗𝑁 =
4
64 - 3 8 24 3∗24
= 18.
72 4

N = 24 Se busca la frecuencia acumulada


inmediata superior a 18 que en este
caso es 21. Entonces la clase del
tercer cuartil será: 56-64.
3𝑁 4. Aplicar la fórmula:
− 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 3 ∗ 24 1
( 4 − 17)
𝑄3 = 𝐿𝑖 + 4 𝑐 = 56 + ∗ 8 = 56 + 8 = 56 + 2 = 58
𝑓𝑐𝑢𝑎𝑟𝑡𝑖𝑙 4 4
Este resultado significa que el 75% de las observaciones, se encuentran por debajo de
58 y el 25 % restante, se encuentra por encima.

Deciles.

Los deciles son números que dividen a una sucesión ordenada de datos en diez partes
porcentualmente iguales. Los dediles se calculan del decil 1 (D1) al decil 9 (D9). Su
fórmula de cálculo para datos agrupados en una tabla de distribución de frecuencias es:
Donde:
𝑘𝑁
− 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 Li = límite inferior real de la clase del decil
𝐷𝑘 = 𝐿𝑖 + 10 𝑐 K = es el decil que estamos calculando
𝑓𝑑𝑒𝑐𝑖𝑙 N = número total de datos, es decir frecuencia total
fa anterior = frecuencia acumulada anterior a la clase
del decil.
ASIGNATURA: ESTADÍSTICA

f decil = frecuencia de la clase del decil


c = amplitud o anchura del intervalo de clase.
Ejemplo:
Calcular el sexto decil ó D6 con los datos clasificados de la siguiente tabla:

Se siguen los siguientes pasos:


Clases Frecuencia Amplitud Frecuencia 1. Calcular los límites reales de los 11
de clase de clase acumulada intervalos de clase.
(f) (c) (fa) 2. Calcular la amplitud del intervalo
32 – 40 4 8 4 3. Calcular la frecuencia acumulada
40 – 48 8 8 12
4. Identificar la clase que contiene el
48 – 56 5 8 17
56 – 64 4 8 21 sexto decil. Para ello se hace 6∗𝑁 =
10
64 - 72 3 8 24 6∗24
= 14,4
10
N= 24
Se busca la frecuencia acumulada
inmediata superior a 14,4 que en este
caso es 17. Entonces la clase del
sexto decil es: 48 - 56.
Aplicar la fórmula:
6∗𝑁
− 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 6 ∗ 24 2,4
( 10 − 12)
𝐷6 = 𝐿𝑖 + 10 𝑐 = 48 + ∗ 8 = 48 + 8 = 48 + 3,84 = 51,84
𝑓𝑑𝑒𝑐𝑖𝑙 5 5

Este resultado significa que la sexta parte de las observaciones o datos, se encuentran
por debajo de 51, 84.

Percentiles.

Se llaman percentiles a aquellos valores que dividen a un conjunto de datos ordenados


en cien partes iguales, se representan por P1, P2 … , P99.

El percentil es el valor por debajo del cual queda un porcentaje determinado de


observaciones y se representa por la letra “P” (Pi oscila entre los valores 1 y 100).
Ejemplo, el percentil 20 ó P20 es el valor que no supera a más de veinte centésimas de
observaciones y no es superado por más de las ochenta centésimas partes. Dicho de
otra manera, el P20 deja por debajo de su valor un 20 por 100 de casos.

El valor que divide a los datos en dos partes iguales es el percentil P50 y se llama también
Mediana.

Cuando dividimos los datos en cuatro partes iguales tenemos lo que llamamos los
CUARTILES y viene representado por: Q1, Q2 (MEDIANA), Q3 y Q4.

Cuando divido los datos en diez partes iguales tenemos lo que llamamos los DECILES y
viene representado por D1, D2,..., D10.
El P50 es igual Q2 y esto es lo mismo que hablar de la Mediana: P50 = Q2 = MEDIANA.
ASIGNATURA: ESTADÍSTICA

Los percentiles pueden ser positivos o negativos y no se refieren a un dato sino al valor
que deja un porcentaje.

Vamos a ver de qué forma se puede calcular un percentil. Para calcular el rango del
percentil de una puntuación determinada utilizaremos la siguiente fórmula:
Donde:
Li = límite inferior real del intervalo de clase 12
𝑘𝑁
( − 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟) contiene el percentil
100
𝑃𝑘 = 𝐿𝑖 + 𝑐 k = Valor del percentil que estamos calculando.
𝑓𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 N = número total de datos, es decir frecuencia
total
fa anterior = frecuencia acumulada anterior al
intervalo de clase que contiene el percentil
f percentil = frecuencia del intervalo que
contiene el percentil
c = amplitud o anchura del intervalo de clase.

Ejemplo: Calcular el percentil 20º con los datos clasificados de la siguiente tabla:

Se siguen los siguientes pasos:


Frecuencia Amplitud Frecuencia 1. Calcular los límites reales de los
Clases de clase (f) de clase acumulada intervalos de clase.
(c) (fa) 2. Calcular la amplitud del intervalo
32 – 40 4 8 4 3. Calcular la frecuencia acumulada
40 – 48 8 8 12 4. Identificar la clase que contiene el
48 – 56 5 8 17 percentil 20º. Para ello se hace 20∗𝑁
100
56 – 64 4 8 21 20∗24
= 100 = 4,8.
64 - 72 3 8 24
N = 24 Se busca la frecuencia acumulada
inmediata superior a 4,8 que en este
caso es 12. Entonces la clase
percentil será: 40-48.
5. Aplicar la fórmula:

20 𝑁
( − 𝑓𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟) 20 ∗ 24 0,8
100 ( 100 − 4)
𝑃20 = 𝐿𝑖 + 𝑐 = 40 + ∗ 8 = 40 + 8 = 40 + 0,8 = 40,8
𝑓𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 8 8

Esto significa que por debajo de 40,8 se encuentran el 20% de las observaciones. Dicho
de otra manera, el 20% de las observaciones máximo tiene un valor de 40,8.

2. MEDIDAS DE DISPERSIÓN.

Mientras que las medidas de tendencia central o posición indican donde se sitúa un grupo
de puntuaciones, los índices de variabilidad o dispersión, indican si esas puntuaciones
son muy parecidas o muy distintas entre sí.

Por ejemplo, si tenemos estas tres distribuciones:


ASIGNATURA: ESTADÍSTICA

Me X
Ejemplo a 51 52 53 54 55 N=5 53 53
Ejemplo b 52 53 53 53 54 N=5 53 53
Ejemplo c 47 50 53 56 59 N=5 53 53

13
Si calculamos la media y la mediana de cada una de las distribuciones, obtenemos para
las tres, la misma media y mediana en cada ejemplo (53), sin embargo, los tres grupos
difieren entre sí en el grado de agrupamiento-dispersión de sus puntuaciones alrededor
del valor medio. Sin hacer ningún cálculo, podemos observar que el ejemplo c) es
claramente más disperso que los otros dos ejemplos.

Existen diferentes formas de cálculo para medir la variabilidad de un grupo de


puntuaciones distinguiéndose las diferentes formas de cálculo según se trate de datos
nominales, ordinales o de intervalo. Con datos ordinales, se suele utilizar las mismas
que con datos de intervalo.

Las medidas más usuales son las que miden la concentración de los valores del conjunto
de datos alrededor de algún valor medio. Entre estas medidas estudiaremos:

• Rango o recorrido
• Desviación media
• Varianza de población y muestra
• Desviación estándar o típica

Mientras más pequeños sean los valores de estas medidas, menor será la dispersión de
datos. Si todos los datos fuesen iguales entre sí, se dirá que su dispersión es cero.

La media aritmética es una medida de posición, que representa a todos los valores, con
los cuales se ha calculado, sin embargo esta representación será más fiable cuando
menor sea la dispersión.

Un conjunto de datos que presente menor dispersión será más fiable. Sin embargo una
idea más precisa, requiere precisamente de las medidas de dispersión.
2.1. Recorrido o rango

El recorrido o rango de un conjunto de números, es la diferencia entre el mayor y el


menor de todos ellos. La principal desventaja de esta medida es que sólo depende de
los valores extremos y no tiene en cuenta los valores intermedios.

Rango = X máx – X min

Ejemplo:
Calcular el rango de los siguientes datos.
76 82 64 85 86 78 63 75 72 61 67 79 79

Se siguen los siguientes pasos:


1. Ordenar las datos de menor a mayor o identificar el mayor y el menor valor.
ASIGNATURA: ESTADÍSTICA

2. Aplicar la formula

61 63 64 67 69 72 75 76 78 79 82 85 86

Rango = X máx – X min = 86 – 61 = 25


14

2.2. Desviación media.

La desviación media llamada también Desviación promedio viene dada por la media
aritmética de los valores absolutos de las desviaciones observadas a un determinado
valor medio (DM).

Cálculo de la desviación media para datos no agrupados:

Donde:
∑∣X− ∣ = Es la media aritmética de los números dados
𝐷𝑀 = |Xi - | = Es el valor absoluto de las desviaciones
𝑛
de los diferentes valores de X al valor medio.

Ejemplo:
Calcular la desviación media de los siguientes 5 números: 2, 4, 6, 8, 10.
Se realizan los siguientes pasos:

Datos Xi - |Xi - | Se siguen los siguientes pasos:


X 1. Calcular la media aritmética.
2 2-6=-4 4 =
2+4+6+8+10
=6
5
4 4-6=-2 2 2. Calcular las desviaciones de cada dato
6 6-6=0 0 respecto a la media aritmética. Para ello
8 8-6=2 2
se construye la columna Xi -
10 10-6=4 4
3. Calcular el valor absoluta de las
12
desviaciones en la columna |Xi - |
12 4. Efectuar la sumatoria de la última
𝐷𝑀 = = 2,4 columna y aplicar la fórmula de la
5 Desviación Media.
5.
Cálculo de la desviación media para datos agrupados:
Donde:
∑f ∣ X − ∣ = Es la media aritmética de los números dados
𝐷𝑀 = f = frecuencia
𝑛
|Xi - | = es el valor absoluto de las desviaciones
de los diferentes valores de X al valor medio.

Ejemplo 1:
Calcular la desviación media con los siguientes datos:
ASIGNATURA: ESTADÍSTICA

Datos Frecuencia Se siguen los siguientes pasos:


X F 1. Calcular la media aritmética, para ello se construye la
2 10 columna f*X y se aplica la fórmula de la media aritmética.
3 16 2. Calcular las desviaciones de cada dato respecto a la
4 13 media aritmética. Para ello se construye la columna |Xi
5 11 - | 15
N =50 3. Calcular la columna f*|Xi - |
4. Efectuar la sumatoria de la última columna y aplicar la
fórmula de la Desviación Media.
175
Datos Frecuencia f*X |Xi - | f*|Xi - | = = 3,5
X f 50

2 10 20 1,5 15 46
3 16 48 0,5 8 𝐷𝑀 = = 0,92
50
4 13 52 0,5 6,5
5 11 55 1,5 16,5
N =50 ∑=175 46

Ejemplo 2:

Datos Frecuencia Se siguen los siguientes pasos:


X f 1. Calcular la marca de clase.
55 - 59 3 2. Calcular la media aritmética, construyendo la
59 - 63 7 columna f*X:
63 - 67 8 ∑fx 1536
= 𝑛 = 24 = 64
67 - 71 5
3. Calcular las desviaciones de cada dato
71 - 75 1
respecto a la media aritmética. Para ello se
n =24
construye la columna |Xi - |
4. Calcular la columna f*|Xi - |
5. Efectuar la sumatoria de la última columna y
aplicar la fórmula de la Desviación Media.

Datos Frecuencia Marca de f*X |Xi - f*|Xi - |


X f clase |
55 - 59 3 57 171 7 21 84
𝐷𝑀 =
59 - 63 7 61 427 3 21 24
63 - 67 8 65 520 1 8 = 3,5
67 - 71 5 69 345 5 25
71 - 75 1 73 73 9 9
n =24 1536 84

2.3. Varianza y la Desviación Típica


ASIGNATURA: ESTADÍSTICA

La Varianza y la Desviación Típica son medidas similares a la desviación media, en el


sentido de que se basan en las diferencias existentes entre la media aritmética y cada
valor de la variable, pero se diferencia de ella en que, en lugar de tomar el valor absoluto
de tales desviaciones, se utiliza el cuadrado de las mismas.

La varianza es la principal medida de dispersión, es la más precisa y de mayor uso, en


especial su uso es más amplio en la Estadística Inferencial. Dependiendo de si los datos 16
corresponden a una Población o a una Muestra se obtendrán la varianza poblacional o la
Varianza muestral, cuyas definiciones son ligeramente diferentes.

La Varianza de una población o Varianza Poblacional se designa por σ2 (Sigma cuadrado).


La Varianza de una muestra o Varianza muestral se designa por S2.
∑( X −µ)²
Varianza poblacional: 𝜎² =
N

Para muestras mayores o iguales a 60 datos:


∑( X − )²
Varianza muestral para datos no agrupados: 𝑉(𝑥) = 𝑆² =
n

∑ f(X− )²
Varianza muestral para datos agrupados: 𝑉(𝑥) = 𝑆² =
n

∑ f X2
Método abreviado para muestras mayores a 60 datos: 𝑉(𝑥) = 𝑆 2 = − (∑ )²
n

Para muestras menores a 60 datos, se utiliza la corrección de Bessel, introduciendo a la


formula anterior, el siguiente factor: n , entonces las fórmulas quedan así:
n−1

∑( X − )² n ∑ X2 –(∑X)²
Varianza muestral para datos no tabulados: 𝑉(𝑥) = 𝑆 2 = =
n−1 n−1

∑ f(X− )² n ∑ fX2 –(∑fX)²


Varianza muestral para datos agrupados: 𝑉(𝑥) = 𝑆² = =
(n−1) n(n−1)

Desviación estándar o típica.


La desviación estándar o típica es la raíz cuadrado de la varianza.

Desviación estándar poblacional: 𝜎 = √𝜎²


Desviación estándar muestral: 𝑠 = √𝑠²

Ejemplo para datos no agrupados:


Calcular la varianza y la desviación típica de los siguientes datos: 1, 3, 4, 6, 8, 14, 20.
ASIGNATURA: ESTADÍSTICA

Se siguen los siguientes pasos:


Datos Diferencias 1. Colocar los datos en una tabla.
X Xi - (Xi - )2 2. Calcular la media aritmética:
1+3+4+6+8+14+20 56
1 1 - 8 = -7 49 = 7
= 7= 8
3 3 – 8 = -5 25 3. Calcular las desviaciones de cada dato
4 4 – 8 = -4 16 respecto a la media aritmética. Para ello
6 6 - 8 = -2 4 se construye la columna Xi - 17
8 8-8=0 0
4. Calcular la columna (Xi - )2
14 14 - 8 = 6 36
5. Efectuar la sumatoria de la última
20 20 - 8 = 12 144
columna y aplicar las fórmulas de la
56 274
varianza y la desviación típica.

∑( X – )² 274 274
𝑉(𝑥) = 𝑠2 = = = = 45.67
n−1 7−1 6

𝑠 = √𝑠² = √45.67 = 6.76

De momento el significado de estos valores, simplemente es que a mayor valor, mayor


será la dispersión de las puntuaciones alrededor de la media aritmética.

Ejemplo para datos agrupados:


Calcular la varianza y desviación estándar de los siguientes datos agrupados:

Datos Frecuencia Se siguen los siguientes pasos:


X F 1. Calcular la marca de clase.
55 - 59 3 2. Calcular la media aritmética, construyendo la
59 - 63 7 columna f*X
63 - 67 8 ∑fx 1536
= 𝑛 = 24 = 64
67 - 71 5 3. Calcular las desviaciones de cada dato respecto a
71 - 75 1 la media aritmética. Para ello se construye la
n =24
columna Xi -
4. Calcular la columna f*(Xi - )
5. Efectuar la sumatoria de la última columna y
aplicar las fórmulas de la Varianza y Desviación
Estándar.

Datos Frecuencia Marca de f(Xi -


f*X Xi - (Xi - )2
X f clase )2
55 - 59 3 57 171 -7 49 147
59 - 63 7 61 427 -3 9 63
63 - 67 8 65 520 1 1 8
67 - 71 5 69 345 5 25 125
71 - 75 1 73 73 9 81 81
N =24 1536 84 424

∑ f( X – )² 424 424
𝑉(𝑥) = 𝑠2 = = = = 18,43
n−1 24−1 23

𝑠 = √𝑠² = √18,43 = 4,29


ASIGNATURA: ESTADÍSTICA

Propiedades de las desviaciones típicas:


1. Si todos los valores de la distribución fueran iguales, las desviaciones de todos los
datos alrededor de la media valen cero y este será el valor de la desviación típica.
2. Los valores extremos tiene mucho peso. Cuando la distribución tenga casos
extremos, conviene utilizar la desviación mediana o la desviación intercuartílica
como mejor medida de dispersión.
18

¿SABÍA UD.QUE…?
• Un estudio hizo ver que en cierta
población europea se produjo un
fuerte crecimiento de la población y
un notable incremento del número de
nidos de cigüeñas. ¿No es esto
demostración de que son las
cigüeñas quiénes traen a los niños al
mundo?

No. Refleja el hecho de que al aumentar el


número de edificios las cigüeñas
dispusieron de más sitios donde anidar.
Las parejas recién casadas suelen irse a
vivir a casas nuevas, donde no hay nidos
de cigüeñas.

CTRL + CLIC PARA APRENDER…

ftp://ftp.math.ethz.ch/hg/EMIS/journals/BEIO/Algunas-paradojas-y-curiosidades-
estadisticas.html

REFLEXIONE "No se pueden alimentar


hambrientos con estadísticas".

David Lloyd George (1863-1945)


Político británico.
ASIGNATURA: ESTADÍSTICA

19

PREGUNTAS DE AUTO APRENDIZAJE

Consigna: A partir de los contenidos desarrollados en esta unidad didáctica, responda


las siguientes preguntas y envíelas a la Plataforma, adjunta a su Tarea para la semana.

1. Con los siguientes datos calcular: Datos f


a) Desviación Media (x)
b) Varianza 20 12
c) Desviación Típica 30 10
50 20
60 18
70 15
80 10
90 7
92

También podría gustarte