Está en la página 1de 34

ESTADÍSTICA APLICADA

Solange Lugo
Ingeniera de Sistemas, Especialista en Estadística
T.P. 68255125305 ST
MEDIDAS DE TENDENCIA
CENTRAL DE POSICIÓN Y
DE DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Medidas de Tendencia Central

 Son tres valores, con cada uno de los cuales pretende describir,
parcialmente, el comportamiento de una muestra o de una
población
 Son llamadas así porque al representar el resultado de un cálculo
en un gráfico de una distribución de frecuencias (histograma o
polígono de frecuencias), el valor calculado siempre se sitúa hacia
el centro de la gráfica

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Clases de Medidas de Tendencia Central

 Media aritmética o promedio


 Mediana
 Moda

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Media aritmética

Es el punto de equilibrio, equivale a la suma de todos los valores (población o


muestra) divido entre el número de valores (población o muestra)

Media poblacional: µ (letra minúscula griega mu)


Media muestral: ഥ
X (X barra)

∑𝑋𝑖 ∑𝑥𝑖
µ= 𝑋ത =
𝑁 𝑛
𝑋𝑖 : Valores que toma la variable en estudio en la población o la muestra (𝑥𝑖 )
N: Número de valores de la población n: Número de valores de la muestra
∑: Sumatoria
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Propiedades de la media aritmética

 Todo conjunto de datos de intervalo posee una media


 Todos los valores se encuentran incluidos en el cálculo de la media
 ഥ)
La suma de las desviaciones de cada valor de la media es cero ∑(X-X
 El cálculo de la media aritmética tiene en cuenta todos los valores de la
variable en estudio registrados
 A todas las variables cuantitativas se les puede calcular la media aritmética
 Un conjunto de datos sólo tiene una media
 La media permite hacer comparaciones entre poblaciones o muestras
 La media se puede trabajar matemáticamente
 La media es afectada por los valores extremos
 No se puede calcular la media en distribuciones de frecuencias que tienen
clase de extremo abierto

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplos

1. Tenemos la edad de tres niños, tomados al azar en una muestra: 3, 8 y 4 años


y necesitamos conocer la edad promedio

2. Los ingresos de la semana pasada de los


empleados de Almacenes Jerry Asociados
fueron $215.000, $180.000, $190.000,
$180.800, $175.400, $265.000, $195.000,
$198.800
3. Defina si los datos presentados en el punto 1 y 2 son poblacionales o
muestrales
4. Determine las medias de ambos ejercicios

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Media ponderada

Es un caso especial de la media aritmética y se presenta cuando existen varias


observaciones con el mismo valor y diferente nivel de importancia (ponderación)

Media ponderada: 𝑋ത𝑝


∑(𝑋𝑖 ∗ 𝑤𝑖 )
𝑋ത𝑝 =
∑𝑤𝑖
𝑋ത𝑝 Símbolo de la media ponderada

𝑤𝑖 : Ponderaciones
𝑋𝑖 : Valores que toma la variable en estudio

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplos

1. Las siguientes son las notas que un estudiante en su primer:

Asignatura Notal Final Créditos (𝑋𝑖 ∗ 𝑤𝑖 )


Electiva 4,9 2 9,8
Estadística 3,1 4 12,4
Cultura Física 3 3 9
SUMA 9 31,2

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Media geométrica
En muchas situaciones los datos se presentan en valores relativos tales como porcentajes o proporciones.
En tales casos el procedimiento de cálculo de la media, que se ha estado utilizando hasta ahora, puede
apartarse de los resultados reales sí la variabilidad de los datos es alta.

𝑛
𝑋G = 𝐹𝐶1 ∗ 𝐹𝐶2 ∗ (𝐹𝐶3) … (𝐹𝐶𝑛)
𝑋 G = Es el símbolo de la media geométrica
FC1, FC2…..FCn se llaman Factores de Crecimiento
El índice de la raíz depende del número de factores de crecimiento.
Como el valor en porcentaje se llama Tasa, la expresión, más apropiada, para el Factor de Crecimiento es:
𝑇𝑎𝑠𝑎
Factor de crecimiento (FC) = 1 + 100

Y para tener una respuesta en tasa, utilizamos la expresión:

Tasa = (𝐹𝐶 − 1) ∗ 100

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo
La rentabilidad de un título ha estado variando en las últimas semanas como se
presenta en la siguiente tabla:

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Propiedades de la media geométrica

 La media geométrica siempre es menor o igual a la media aritmética, es


decir:
𝑋G < 𝑋

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Usos de la media geométrica

 Se utiliza para calcular promedios o cantidades expresadas en porcentajes o


en proporciones

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Mediana

Es el punto medio de los valores una vez que se han ordenado de menor a mayor o
de mayor a menor

Mediana: M𝑒

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Propiedades de la mediana

 No influyen en ella los valores extremos


 Es calculable para datos de nivel ordinal o más altos
 Se puede calcular en distribuciones de frecuencias que tengan
clases de extremo abierto
 El cálculo de la mediana es más complejo que los de las demás
medidas de tendencia central
 La mediana no se pueden operar matemáticamente
 Para calcular la mediana, los datos deben estar ordenados

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo

1. Pensando en invertir en finca raíz usted piensa en comprar un apartamento, un


agente de bienes raíces le dice que el precio típico de las unidades disponibles
en este momento en un proyecto es de $1.000.000 mt2, pero usted tiene
presupuestado invertir solo $750.000 mt2. Sin embargo si usted hace una
verificación de precios pueden llevarse algunas sorpresas

Ubicación Valor por mt2


Piso 1 600.000
Piso 2 650.000
Piso 5 700.000
Piso 6 770.000
Piso 8 780.000
Piso 10 1.500.000
Piso 15 Penthouse 2.000.000
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
 Una muestra de las estaturas, en metros, de 10 estudiantes de una clase se
presentan en la siguiente tabla:

Me =

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Moda

Es el valor de la observación que aparece con mayor frecuencia

Moda: Mo
Muestra de colores de ojos en un estudio
60

50

40

30

20

10

0
Verdes Cafés Negros Amarillos

Moda

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Propiedades de la moda

 Es posible determinar la moda para todos los niveles de


datos: nominal, ordinal, de intervalo y de razón
 No influyen en ella los valores extremos
 Cuando existen muchos datos y todos son diferentes, puede
argumentarse que cada valor es la moda y al contrario
cuando existe dos modas el agrupamiento se denomina
Bimodal y más de dos Polimodal
 La moda se puede calcular en distribuciones de frecuencias
que tengan clases de extremo abierto
 La moda no se puede operar matemáticamente

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejercicio práctico
1. Edades y tallas del grupo de estudio para análisis de las tres medidas de
tendencia central vistas hasta el momento y definición el tipo de variable

Estudiante Edad Talla

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Medidas de Posición

Cuartiles
Deciles
Percentiles

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Cuartiles
Son cuatro valores que se determinan o calculan a partir de un conjunto de datos, con la
particularidad de que dividen el conjunto de datos en cuatro partes iguales cuando este conjunto está
ordenado en forma ascendente.

 Primer cuartil o Q1: Es el valor por debajo del cual se encuentran la cuarta parte de los
datos o 25% de los datos cuando están ordenados de menor a mayor
 Segundo cuartil o Q2:Es el valor por debajo del cual se encuentran la mitad de los datos o
50% de los datos cuando están ordenados de menor a mayor, es decir, es la misma mediana
 Tercer cuartil o Q3: Es el valor por debajo del cual se encuentran las tres cuartas partes de
los datos o 75% de los datos cuando están ordenados de menor a mayor
 Cuartil cuartil o Q4: Es el valor por debajo del cual se encuentran las cuatro cuartas partes
de los datos o 100% de los datos cuando están ordenados de menor a mayor

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Ejemplo

 El número de clientes que atendieron en un día once vendedores de un centro


comercial escogidos al azar se presenta en la siguiente tabla

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Percentiles

Los percentiles son valores que dividen un conjunto de datos en 100 partes iguales,
cuando este conjunto está ordenado de menor a mayor, por lo tanto, es un valor por
debajo del cual se encuentra un determinado porcentaje de los datos.
Por ejemplo:
P30 = 200 que se lee:
Que por debajo del valor 200, del conjunto ordenado de datos, se encuentran el 30% de
los datos

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Para formalizar el proceso de cálculo, suponga que Lp representa la ubicación de cierto
percentil que se busca. De esta manera, si quiere encontrar el trigésimo tercer
percentil, utilizaría L33, y si buscara la mediana, el percentil 50o, entonces L50.
El número de observaciones es n; así que, si desea localizar la mediana, su posición se
encuentra en (n + 1)/2, o podría escribir esta expresión como (n + 1)(P/100), en la que
P representa el percentil que busca.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Propiedades de los cuartiles, deciles y
percentiles
 No influyen en ella los valores extremos
 Es calculable para datos de nivel ordinal o más altos
 Se puede calcular en distribuciones de frecuencias que
tengan clases de extremo abierto
 Los deciles, cuartiles o percentiles no se pueden operar
matemáticamente
 Para calcular los percentiles, deciles o cuartiles, los
datos deben estar ordenados
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Diagramas de caja
Un diagrama de caja es la representación gráfica, basada
en cuartiles, que ayuda a exhibir un conjunto de datos.
Para construir un diagrama de caja, sólo necesita cinco
estadísticos:
1. El valor mínimo,
2. Q1 (primer cuartil),
3. La mediana,
4. Q3 (tercer cuartil) y
5. El valor máximo.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Ejemplo
Alexander’s Pizza ofrece entregas gratuitas de pizza a 15 kilómetros a la redonda. Alex, el propietario, desea información
relacionada con el tiempo de entrega. ¿Cuánto tiempo tarda una entrega típica? ¿En qué margen de tiempos deben completarse
la mayoría de las entregas? En el caso de una muestra de 20 entregas, Alex recopiló la siguiente información:
 Valor mínimo = 13 minutos
 Q1 = 15 minutos
 Mediana = 18 minutos
 Q3 = 22 minutos
 Valor máximo = 30 minutos

El diagrama de caja muestra que el valor medio de las entregas, 50%, consume entre 15 y 22
minutos. La distancia entre los extremos de la caja, 7 minutos, es el rango intercuartílico. Este
rango es la distancia entre el primer y el tercer cuartil; muestra la propagación o dispersión de
la mayoría de las entregas.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Medidas de Dispersión

 Existen varias medidas de dispersión, las cuales en algunos


casos intentan acompañar el análisis de las medidas de
tendencia central o de ubicación
 Permiten además en los casos en que las medidas de
tendencia central no permiten dar una explicación
describir mejor el análisis

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Clases de Medidas de Dispersión

Consideraremos diversas medidas de dispersión. El rango


se sustenta en los valores máximo y mínimo del conjunto
de datos. La desviación media, la varianza y la desviación
estándar se basan en desviaciones de la media aritmética.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Rango

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Desviación media
La desviación media posee dos ventajas:
1. Incluye todos los valores de los cálculos, el rango sólo incluye los valores máximo y
mínimo.
2. Es fácil de definir: es la cantidad promedio que los valores se desvían de la media.

Sin embargo, su inconveniente es el empleo de valores absolutos. Por lo general, es


difícil trabajar con valores absolutos, así que la desviación media no se emplea con
tanta frecuencia como otras medidas de dispersión, como la desviación estándar.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Varianza y desviación estándar
La varianza y la desviación estándar también se fundamentan en las desviaciones
de la media. Sin embargo, en lugar de trabajar con el valor absoluto de las
desviaciones, la varianza y la desviación estándar lo hacen con el cuadrado de las
desviaciones.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST


Coeficiente de variación

𝑠
c.v= MUESTRAL
𝑋ത

σ
C.V= POBLACIONAL
μ

Nos permite comparar dispersión entre muestras o poblaciones

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST