0% encontró este documento útil (0 votos)
34 vistas30 páginas

Clase 2 v1

El documento aborda las medidas de tendencia central y dispersión en estadística, incluyendo la media, mediana, moda, y desviación estándar, tanto para datos sin agrupar como para datos agrupados. Se explican conceptos clave como media poblacional y muestral, así como la importancia de las medidas de dispersión para evaluar la confiabilidad de la media. Además, se presentan ejemplos prácticos para calcular estas medidas en diferentes contextos.

Cargado por

avril
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas30 páginas

Clase 2 v1

El documento aborda las medidas de tendencia central y dispersión en estadística, incluyendo la media, mediana, moda, y desviación estándar, tanto para datos sin agrupar como para datos agrupados. Se explican conceptos clave como media poblacional y muestral, así como la importancia de las medidas de dispersión para evaluar la confiabilidad de la media. Además, se presentan ejemplos prácticos para calcular estas medidas en diferentes contextos.

Cargado por

avril
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA Y

PROBABILIDAD
BÁSICA

Ing. Marco Antonio Molina Paredes Meng.


CLASE 2
Medidas de tendencia central y medidas de dispersión
para datos sin agrupar (media, mediana, moda y
(desviación estándar).
Medidas de tendencia central y medidas de dispersión
para datos agrupados (media y desviación estándar).

2
MEDIDAS DE
TENDENCIA
CENTRAL
MEDIDAS DE TENDENCIA CENTRAL.

También llamadas de ubicación o de localización. Un único valor que resume


un conjunto de datos. Señala el centro de los valores.
Consideraremos las siguientes:
• La media (aritmética)
• La media ponderada
• La mediana
• La moda
También existen la media geométrica y la media harmónica.

4
MEDIA POBLACIONAL 𝝁
Es la suma de todos los valores observados de la población dividida entre el número
de valores de la población.
∑𝑋
𝜇=
𝑁
Donde 𝜇: media poblacional
𝑋:cualquier valor particular
𝑁: número de valores de la población

PARÁMETRO. Una característica de una población.


DATO ESTADÍSTICO. Una característica de una muestra.
VALOR ATÍPICO. Es una observación, dato o medición que es inusualmente grande o
inusualmente pequeño comparado con los demás.
5
MEDIA MUESTRAL 𝑿
Es la suma de todos los valores de la muestra dividida entre el número de valores de
la muestra.
∑𝑋
𝑋ത =
𝑛
ത media muestral o promedio
Donde 𝑋:
𝑋:cualquier valor particular
𝑛: número de valores de la muestra
Es decir,
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘 ∑𝑛𝑖=1 𝑋𝑘
𝑋ത = =
𝑛 𝑛

6
• Si las observaciones están agrupadas en una tabla de frecuencias de datos
sin agrupar como la siguiente:

Observación Frecuencia Absoluta


𝑋1 𝑤1
𝑋2 𝑤2
⋮ ⋮
𝑋𝑘 𝑤𝑘

Donde 𝑛𝑖 es la frecuencia absoluta de la observación 𝑋𝑖 , el promedio se calcula


por:
𝑤1 𝑋1 + 𝑤2 𝑋2 + ⋯ + 𝑤𝑘 𝑋𝑘 ∑(𝑤𝑋)
𝑋𝑛 = =
𝑤1 + 𝑤2 + ⋯ + 𝑤𝑘 𝑛
Donde n = ∑𝑤
A esta se la conoce como MEDIA PONDERADA.
7
• Si los datos se presentan en una tabla de frecuencias, agrupados por clases:

Clase Límite Límite Punto Frecuencia


inferior de superior de medio Absoluta de
la clase la clase clase
1 𝑙1 𝑠1 𝑥1 𝑓1
2 𝑙2 𝑠2 𝑥2 𝑓2
⋮ ⋮ ⋮ ⋮ ⋮
𝑘 𝑙𝑘 𝑠𝑘 𝑥𝑘 𝑓𝑘

Donde el punto medio 𝒙 de cada clase se calcula como


𝑙𝑖 +𝑠𝑖
𝑥𝑖 = con 𝑖 = (1,2, … 𝑘)
2
y el promedio se calcula con:
𝑓1 𝑥1 + 𝑓2 𝑥2 + ⋯ + 𝑓𝑘 𝑥𝑘 ∑(𝑓𝑥)
𝑋𝑛 = =
𝑛 𝑛
8
VENTAJAS Y DESVENTAJAS:
1. Todo conjunto de datos de intervalo -o de nivel de razón- posee una media.
2. Todos los valores se encuentran incluidos en el cálculo de la media.
3. La media es única. Sólo existe una media en un conjunto de datos.
4. La suma de las desviaciones de cada valor de la media es cero (“punto de
equilibrio o centro de gravedad”). Expresado simbólicamente,
∑ 𝑋 − 𝑋ത = 0.
5. Se expresa en las mismas unidades que la variable.
6. Se ve afectado por valores atípicos.

9
• Calcule el sueldo promedio de diez personas que ganan (en dólares):
470 472 468 465 473 478 480 465 467 472

R: $471

• Calcule la estatura promedio de 46 pacientes de una clínica, cuyas


medidas son:

Estatura 1,46 1,48 1,50 1,53 1,55 1,57 1,60 1,63 1,65
Frecuencia 2 4 5 8 12 7 4 3 1
R: 1,55m

10
• En una famosa cooperativa de ahorro y crédito de la capital se realizó la
tabla de frecuencias de ahorros de sus socios (en dólares). Calcular el
promedio de los ahorros de los socios de la cooperativa.

Desde Hasta Frecuencia


0 100 12
100 200 28
200 300 46
300 400 71
400 500 186
500 600 224
600 700 209
700 800 122
800 900 53
900 1000 19

R: $555.16
11
MEDIANA 𝑴𝒆𝒅
Es el punto medio de los valores una vez que se han ordenado de menor a mayor o
de mayor a menor.
Se tiene que el 50% de las observaciones se encuentran por arriba de la mediana y
%50 por debajo de ella.

VENTAJAS Y DESVENTAJAS:
1. Es única.
2. No influyen en ella los valores atípicos. Por consiguiente, la mediana es
una valiosa medida de ubicación cuando dichos valores se presentan.
3. Es calculable en el caso de datos de nivel ordinal o más altos.
4. La mediana de un conjunto de datos no necesariamente pertenece a este.
5. No intervienen todos los valores de las observaciones en su determinación.
12
Si disponemos de un conjunto de datos individuales (sin agrupar), para el
cálculo de la mediana se procederá de la siguiente manera:
1. Se ordenan las 𝑛 observaciones 𝑥1 , 𝑥2 , … , 𝑥𝑛 de manera creciente.
2. Si el número de observaciones es impar, entonces 𝑛 = 2m + 1. La
mediana es la observación que se encuentra en el lugar 𝑚 + 1. Así, si
disponemos de 𝑛 = 29 observaciones ordenadas de manera creciente,
entonces 𝑚 = 14, es decir, la mediana es la observación que se encuentra
en el lugar 14 + 1 = 15.
3. Si el número de observaciones es par, entonces 𝑛 = 2𝑚. La mediana es
igual a la suma de las observaciones que se encuentran en los lugares 𝑚
y 𝑚 + 1, dividido para 2. Así, si el número de observaciones es de 𝑛 = 30,
entonces 𝑚 = 15. Por tanto, la mediana es el promedio de las
observaciones que se encuentran en los lugares 15 y 16, es decir, 15.5.

13
Si los datos están resumidos en una tabla de distribución de frecuencias de
datos individuales (sin agrupar) se procederá de la siguiente manera:
1. Ordene las observaciones de manera creciente, con sus respectivas
frecuencias acumuladas.
𝑛
2. Calcule y redondee al entero más cercano. Determine en la columna de
2
la frecuencia acumulada a qué dato pertenece, comparando el valor
obtenido con el valor de la frecuencia acumulada que es igual o
inmediatamente superior; este valor es la mediana.

14
• Determinar la mediana de las siguientes calificaciones:
5,5 6,9 7 3 4,8 4,1 3,2 4,3 5,5 6,5 4,3

R: 4,8

• Calcule la mediana del sueldo de diez personas que ganan (en


dólares):
470 472 468 465 473 478 480 465 467 472

• R: $471

• Calcule la mediana de la estatura de 46 pacientes de una clínica,


cuyas medidas son:

R: 1,55m
15
MODA 𝑴𝒐
Es el valor de la observación que aparece con mayor frecuencia, es decir, aquel
valor que tiene la mayor frecuencia absoluta.

VENTAJAS Y DESVENTAJAS:

1. Es posible determinar la moda para todos los niveles de datos: nominal,


ordinal, de intervalo y de razón.
2. No influyen en ella los valores atípicos.
3. En su determinación no intervienen todos los valores de la distribución.
4. Hay ocasiones en las cuales los datos pueden tener dos o más modas, o
no puede existir, cuando todos los datos tienen igual frecuencia.

Mes de nacimiento (N), Servicio del MetroQ (p,b,mb,e)(O), Calificaciones


16
MEDIDAS DE
DISPERSIÓN
MEDIDAS DE DISPERSIÓN
¿Por qué estudiarlas?
• Una medida de dispersión pequeña indica
que los datos se acumulan con proximidad
alrededor de la media aritmética. Por
consiguiente, la media se considera
representativa de los datos. Por el contrario, Consideraremos:

una medida grande de dispersión indica que  El rango


la media no es confiable.  La desviación media
• Permite comparar la propagación en dos o  La varianza, y
más distribuciones.  La desviación
estándar.
18
MEDIDAS DE DISPERSIÓN

19
RANGO O AMPLITUD DE VARIACIÓN
Representa la diferencia entre los valores máximo y mínimo de un conjunto de datos,
es decir,
𝑅𝑎𝑛𝑔𝑜 = 𝑉 𝑀𝐴𝑋 − 𝑉 𝑀𝐼𝑁

DESVIACIÓN MEDIA
Es la media aritmética de los valores absolutos de las desviaciones con respecto
a la media aritmética., es decir,

∑|𝑋 − 𝑋|
𝐷𝑀 =
𝑛
ത media aritmética, 𝑛: número de
Donde 𝑋: valor de cada observación, 𝑋:
observaciones de la muestra

20
La siguiente tabla muestra el número de capuchinos que se vendieron en el
local de Juan Valdez de los aeropuertos de Quito y de Guayaquil, entre las 4 y
las 5 de la tarde, de una muestra de 5 días el mes pasado.

Quito Guayaquil
20 20
40 49
50 50
60 51
80 80

Determine la media, la mediana, el rango y la desviación media de cada local.


Compare las similitudes y diferencias.

21
Media Quito: 50, Media Guayaquil: 50
Mediana Quito: 50, Mediana Guayaquil: 50
Rango Quito: 80-20=60, Rango Guayaquil: 80-20=60

Desviación media
Quito Guayaquil
Cafés Vendidos |𝑋 − 𝑋𝑄 | Cafés Vendidos |𝑋 − 𝑋𝐺 |
20 20 − 50 = 30 20 20 − 50 = 30
40 40 − 50 = 10 49 49 − 50 = 1
50 50 − 50 = 0 50 50 − 50 = 0
60 60 − 50 = 10 51 51 − 50 = 1
80 80 − 50 = 30 80 80 − 50 = 30
Total 80 Total 62

∑|𝑋 − 𝑋𝑄 | 80 ∑|𝑋 − 𝑋𝐺 | 62
𝐷𝑀 = = = 16 𝐷𝑀 = = = 12,4
𝑛 5 𝑛 5 22
VENTAJAS Y DESVENTAJAS DE LA DESVIACIÓN MEDIA
• Incluye todos los valores de los cálculos, a diferencia del rango que
sólo incluye los valores máximo y mínimo.
• Es fácil de definir, de este modo, es la cantidad promedio que los
valores se desvían de la media.
• Su inconveniente es el empleo de valores absolutos.

VARIANZA
Es la media aritmética de las desviaciones de la media elevadas al cuadrado.

DESVIACIÓN ESTÁNDAR
Es la raíz cuadrada de la varianza.
23
Varianza poblacional
2
2
∑ 𝑋−𝜇
𝜎 =
𝑁

Donde 𝑋: valor de la observación en la población,


𝜇: media (aritmética) poblacional,
𝑁:número total de observaciones de la población

Desviación estándar poblacional


∑ 𝑋−𝜇 2
𝜎=
𝑁

Donde la desviación estándar se presenta en las mismas unidades que los datos.

24
Varianza muestral 2
2 ∑𝑋
∑ 𝑋 − ത
𝑋 2 ∑𝑋 −
2 𝑛
𝑠2 = 𝑠 =
𝑛−1 𝑛−1

Donde 𝑋: valor de la observación en la población,


𝑋ത : media (aritmética) muestral,
𝑛: número total de observaciones de la muestra

Desviación estándar muestral


∑𝑋 2
2
∑ 𝑋 − 𝑋ത 2 ∑𝑋 −
𝑛
𝑠= 𝑠=
𝑛−1 𝑛−1

Donde la desviación estándar se presenta en las mismas unidades que los datos.

25
Los sueldos por hora en una muestra de trabajadores de medio tiempo en la
empresa Megamaxi son: $2, $10, $6, $8, $9. ¿Cuál es la varianza muestral?

Sueldo por
hora (X) ഥ
𝑿−𝑿 ഥ
𝑿−𝑿 𝟐

2 -5 25
10 3 9
6 -1 1
8 1 1
9 2 4
Media 7 40

2
∑ 𝑋 − 𝑋ത 2
40
𝑠 = = = 10
𝑛−1 4

26
PARA DATOS AGRUPADOS EN UNA DISTRIBUCIÓN DE FRECUENCIAS

Rango. Se resta el límite inferior de la clase más pequeña del límite


superior de la clase mayor.

Desviación estándar para datos agrupados.

∑𝑓𝑋 2
∑𝑓𝑋 2 −
𝑠= 𝑛
𝑛−1

27
Inversiones quincenales ($) realizadas por empleados con respecto a sus
utilidades. Determine la desviación estándar muestral.

CANTIDAD Número de Punto


INVERTIDA empleados (f) medio x (f*x) (f*x^2)
[30,35] 3 32,5 97,5 3168,75
(35,40] 7 37,5 262,5 9843,75
(40,45] 11 42,5 467,5 19868,75
(45.50] 22 47,5 1045 49637,5
(50,55] 40 52,5 2100 110250
(55,60] 24 57,5 1380 79350
(60,65] 9 62,5 562,5 35156,25
(65,70] 4 67,5 270 18225
Total 120 6185 325500

2 ∑𝑓𝑋 2 6185 2
∑𝑓𝑋 − 325500−
𝑛 120
𝑠= = = 7,51
𝑛−1 119

28
REFERENCIAS
• Lind, D., Marchal, W. & Wathen, S. (2012). Estadística aplicada a los negocios y la
economía. McGrawHill
• Galindo, E. (2011). Estadística. Métodos y Aplicaciones. Prociencia.

29
MUCHAS GRACIAS
Marco Molina

+593-992732183

marco.molinao@epn.edu.ec

También podría gustarte