Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NUESTRAS MODALIDADES
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMETICA(PROMEDIO)
Es el promedio y es la medida de tendencia central que se utiliza con
mayor frecuencia. Se calcula con la suma de todas las observaciones
en un conjunto de datos, dividida entre el número de elementos
involucrados.
Se la simboliza con Me .
La mediana me divide mis observaciones en dos partes
iguales.
La mediana es aquel valor de la variable que un 50% de
los datos es igual a ella o menor.
Lo primero que debemos hacer es ordenar los datos en
forma crecientes.-
Nº IMPAR DE DATOS.-
Supongamos tener los tiempos que un empleado durante 15 días tiene
que esperar el ómnibus para llegar al trabajo.- Estos son:
8 8 9 9 9 10 10 10 11 12 13 15 17 18
20
Me = (n + 1) / 2 = 16 / 2 = 8ª posición
Me = 10 minutos
Nº PAR DE DATOS.
En el ejemplo anterior supongamos tener datos durante 14 días.-
8 9 9 10 10 11 12 13 13 15 17 18 18 20
Me = (n + 1) / 2 = 15 / 2 = 7,5 ª posición
12 + 13
Me = = 12,5 minutos
2
MODA
• Se lo simboliza con Mo.
• Es el valor de la variable que más veces se repite.
• Es la única medida descriptiva que podemos calcular en una
variable nominal.
Ejemplo.
Si tenemos los montos de ingresos quincenales de un grupo de
empleados de una empresa
850 – 875 – 856 – 882 – 875 – 880 – 896 – 810 – 875 – 942 -
975
Observamos el valor de variable que más veces se da:
M o = 875 $
MEDIDAS DE DISPERSION
RANGO O RECORRIDO DE LA
VARIABLE
• Se simboliza Rx .
• Se la calcula haciendo la diferencia entre el máximo
valor de la variable y el mínimo que toma.
• Como medida de dispersión se la toma poco en cuenta
ya que nada me dice de los valores intermedio de la
variable.
• Un uso importante del Rango lo encontramos cuando
vemos la Estadística Descriptiva en el Control de
Calidad de Procesos.
RANGO INTERCUARTÍLICO.
• Se simboliza con RI
RI = Q3 - Q1
• Esta medida considera la dispersión de la mitad (parte
central) de los datos; por lo tanto, los valores extremos
no influyen en ella. Es una buena medida de dispersión
cuando los datos están mejor representados por la
mediana.-
VARIANZA
• Aunque el rango es una medida de la dispersión total y el rango
intercuartílico es una medida de la dispersión media, ninguna
de estas medidas de variación toman en cuenta como se
distribuyen o agrupan las observaciones. Por lo tanto se pensó
en una medida estadística que me tuviera en cuenta todos los
datos y esa medida es la VARIANZA.
Simbolizamos a la variancia:
S² si trabajamos con la muestra
σ² si trabajamos con la población
VARIANZA DE LA MUESTRA
La varianza de la muestra es la suma de los cuadrados de las diferencias con
relación a la media aritmética dividida entre el tamaño de la muestra menos uno.-
∑ ( xi - x )²
S² =
n - 1
Si el denominador fuera n en lugar de (n – 1), se obtendría el promedio de los
cuadrados de las diferencias con respecto a la media.- Si embargo, se utiliza (n –
1) debido a ciertas propiedades matemáticas deseadas que tiene el estadístico
S², lo cual lo hacen muy apropiadas para hacer inferencias estadísticas.- A
medida que se aumenta el tamaño de la muestra, la diferencia entre n y (n – 1)
disminuye cada vez más.-
VARIANCIA DE LA
POBLACION
La varianza de la POBLACION es la suma de los cuadrados de las
diferencias con relación a la media aritmética poblacional dividida entre el
tamaño de la población.-
∑ ( xi - μ)²
σ² =
N
sx = variancia
0,00
0 2,5 5 7,5 10 12,5 15 17,5 20 -4 -3 -2 -1 0 1 2 3 4 0 2,5 5 7,5 10 12,5 15 17,5 20
0
g1 < 0 g1 = 0 g1 > 0
Distribución, tiende a Distribución, es simétrica Distribución, tiende a concentrarse
concentrarse en Valores Altos de respecto a la Media en Valores Bajos de la Variable
la Variable
Mo = MA = Me Mo < MA < Me
Mo > MA > Me
• Los resultados de esta ecuación se interpretan:
• (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de
la media. Este valor es difícil de conseguir por lo que se tiende a
tomar los valores que son cercanos ya sean positivos o negativos (±
0.5).
• (g1 > 0): La curva es asimétricamente positiva por lo que los valores
se tienden a reunir más en la parte izquierda que en la derecha de
la media.
• (g1 < 0): La curva es asimétricamente negativa por lo que los
valores se tienden a reunir más en la parte derecha de la media.
• Desde luego entre mayor sea el número (Positivo o Negativo),
mayor será la distancia que separa la aglomeración de los valores
con respecto a la media.
COEFICIENTE DE CURTOSIS:
ACHATAMIENTO
Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si
existe una gran concentración de valores (Leptocúrtica), una concentración normal
(Mesocúrtica) ó una baja concentración (Platicúrtica).
0,45 0,45
0,45
0,40 0,40
0,40
0,35 0,35
0,35
0,30 0,30
0,30
0,25 0,25
0,25
0,20 0,20
0,20
0,15 0,15
0,15
0,10 0,10
0,10
0,05 0,05
0,05
0,00 0,00
0,00 -4 -3 -2 -1 0 1 2 3 4
0 -5 -4 -3 -2 -1 0 1 2 3 4 5
-2 -1
g2 > 0
0 1 2
g2 = 0 g2 < 0
Distribución tiende a concentrarse Distribución
alrededor de la Media. Distribución
“Normal” tiende a
Variancia Pequeña dispersarse
Aguzada Variancia grande
Achatada.
• El coeficiente de curtosis que calcula Stata es el de
Fisher.
• Los resultados de esta fórmula se interpretan:
Para los tres casos que vimos cuartiles, los percentiles se aplica el
mismo criterio solo que recordemos que dividen las observaciones en
100 partes iguales.- Es decir que en todos los casos que usamos 4
debemos usar 100.- Vamos a ver esto mediante ejemplos.-
https://sistemas.inei.gob.pe/WebCerEnei/