Documentos de Académico
Documentos de Profesional
Documentos de Cultura
conjunto de datos:
Métodos numéricos
Estadística Descriptiva
1
Estadísticos
Tendencia central
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana, moda
Dispersión
Indican la mayor o menor concentración de los datos con
respecto a las medidas de tendencia central.
Varianza, Desvío estándar, coeficiente de variación, rango intercuartílico
Posición
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Cuartiles, deciles, percentiles
Forma
Indican como se distribuyen los datos 3
Ceficiente de asimetría y Coeficiente de curtosis
2
Estadísticos de tendencia central
Son medidas que buscan posiciones (valores) con respecto
a los cuales los datos muestran tendencia a agruparse.
150 151 152 154 155 155 155 157 157 160 162
Media
Son valores numéricos que Mediana
tienden a localizar la parte central Modo
de un conjunto de datos.
x i
x i 1
n
3
Media – Propiedades
Media aritmética
En tablas de datos sin En tablas de datos
agrupar agrupados
x f x mc f
3 1 2a4 3 2
n
x . fa
i
6
9
8
15
4a6 5 9
x i1 6a8 7 10
n 12 4 8 a 10 9 1
total 28 total 22
4
Media
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
MEDIA PONDERADA
La media ponderada nos
permite calcular un promedio
que toma en cuenta la
importancia de cada valor con
respecto al total.
10
5
Mediana
Es un valor que divide a las observaciones ordenadas en
dos grupos con el mismo número de individuos
Mediana de 1,2,4,5,6,6,8 es
Mediana de 1,2,4,5,6,6,8,9 es
Es conveniente cuando los datos son asimétricos. No
es sensible a valores extremos.
Altura mediana
Número par de datos: promedio de los Número impar de datos: valor que
valores centrales de la serie ordenada está justo en el centro de la serie
ordenada
150 152 154 155 155 157 157 157 157 160 150 151 152 154 155 155 157 157 157 157 160
Propiedad
Su valor está afectado por el número de observaciones, pero no por los valores
que adopta la variable.
6
Mediana
Datos sin agrupar
Número de observaciones
impar: la mediana
corresponde al valor central
2, 3, 5, 5, 7
Mn=5
Número de observacionales
par: la mediana corresponde
al promedio de los dos
valores centrales
2, 3, 5, 7 X f F
Mn=(3+5)/2=4 2-8 6 6
8-14 10 16
14-20 15 31
20-26 9 40
26-32 8 48
Moda
Es el valor de la variable que más se
repite
Moda de 1,2,4,5,6,6,8 es
Moda de 1,2,2,5,6,6,8 es
Moda de 1,2,4,5,6,7,8,9 es
Es el único estadístico calculable en
variables cualitativas
En variables continuas, es el/los
valor/es donde la distribución de
frecuencia alcanza un máximo, relativo
o absoluto.
7
Moda
X f
0-5 1
5-10 13
10-15 17
15-20 21
20-25 12
25-30 7
En general:
Variables cuantitativas
Si la distribución es simétrica, puede elegirse la Media, Mediana o el Modo; se
recomienda la Media por que posee propiedades útiles, como estimador en
Inferencia Estadística.
Si la distribución es asimétrica, se recomienda el uso de la Mediana.
Variables Cualitativas
Nominales, solo es factible calcular el Modo.
Ordinales, se recomienda el Modo o la Mediana.
8
Estadísticos de posición
Se define el fractil de orden k como un valor de la variable
por debajo del cual se encuentra una frecuencia acumulada k.
Estadísticos de posición
Cuartiles: Dividen a la muestra en 4 grupos con la
misma cantidad de datos.
Q1 = Valor de la variable correspondiente a la (n+1)/4
observación ordenada.
Deja por debajo el 25% de los datos
Q2 = Valor de la variable correspondiente a la 2(n+1)/4
observación ordenada.
Deja por debajo el 50% de los datos = mediana
Q3 = Valor de la variable correspondiente a la 3(n+1)/4
observación ordenada.
Deja por debajo el 75% de los datos
9
Estadísticos de posición
Deciles: Dividen a la muestra en 10 grupos con la
misma cantidad de datos
El D1 deja por debajo al 10% de las observaciones. Por encima
queda el 90%
Estadísticos de posición
Cuartiles: dividen a la muestra en cuatro grupos con la misma cantidad de
datos K .n
FA
QK li 4 .h K=1, 2, 3
fa
20
10
Ejemplo
Calcular el RIQ = Q3 – Q1
RIQ
10
Med
Calcular los límites inferior y superior
Q1
como min y max, respectivamente
5
Prolongar la línea hasta el valor menor y
mayor, respectivamente, dentro de los
límites
0
11
Un experto en estándares de trabajo
observa el tiempo que se requiere para
preparar una muestra de 10 cartas de
negocios, en una oficina y obtiene los
siguientes resultados:
7 14 5 9 15 16 5 18 15
Calcula las medidas de posición
23
13
11
H ora s
9 Q 3
7
M e d ia
5
M
M ee ddi ai a
nna a
Q 1
3 X m i ni n
X m
12
¿Cómo podemos interpretar nuestros datos
a partir del diagrama de caja ?
Ubicación de la mediana en la caja
No esta en el centro de la caja entonces la distribución presenta asimetría.
• Si se localiza cerca del extremo inferior (Q1), distribución asimétrica positiva, con
una cola (sesgo) alargado a la derecha.
• Si se localiza cerca del extremo superior (Q3), distribución asimétrica negativa, con
una cola (sesgo) alargado a la izquierda.
Podemos suponer que los datos Podemos suponer que los datos
de ambos son iguales??? son distintos???
13
Medidas de Dispersión
Estadísticos de dispersión
Miden el grado de dispersión (variabilidad) de los
datos, independientemente de su causa.
Amplitud o Rango:
La diferencia entre las observaciónes extremas.
2,1,4,3,8,4. El rango es
Es muy sensible a los valores extremos.
Su uso sólo es válido para conjuntos de datos pequeños
28
14
Varianza
x
n n n
2 2 2
i x fa x i x fa mc x
Varianza i 1
i 1
i 1
n -1 n -1 n -1
29
x
n
2
i x
Desvío estándar var ianza i 1
30
15
Variancia y Desvío Estándar
∑ (x i- x )2 2
S2=
(n - 1)
S = S
Unidades
S2 = 8,3 (gr)2 S =2,9 gr
32
16
•Dada la siguiente distribución de salarios, en pesos,
observada en una jurisdicción provincial:
1)Calcula el sueldo promedio, moda y mediana.
2)Calcula la desviación estándar
f 6 9 16 12 9 5 3
33
Coeficiente de variación
s
CV 100
x
No tiene unidades
Es una medida de variabilidad relativa: Mide que proporción de
la media representa el desvío estándar
Se utiliza para comparar variabilidad
34
17
Coeficiente de Variación
S
C .V . = * 100
x
36
18
Asimetría
Una distribución es simétrica si
la mitad izquierda de su
distribución es la imagen
especular de su mitad derecha.
En las distribuciones simétricas
media y mediana coinciden. Si
sólo hay una moda también
coincide
La asimetría es positiva o
negativa en función de a qué
lado se encuentra la cola de la
distribución.
La media tiende a desplazarse
hacia las valores extremos
(colas).
Las discrepancias entre las
medidas de tendencia central
son indicación de asimetría.
37
Asimetría
Propiedad de los datos que tiene en cuenta la forma
de distribución de los mismos
Posición de la media con respecto a la mediada
Media > Mediana Asimétrica positiva
Media = Mediana Simétrica
Media < Mediana Asimétrica negativa
Coeficiente Pearsoniano
3( Media Mediana)
S KP
Desvío
Valores negativos: asimetría negativa
Valores positivos: asimetría positiva
Valores aproximados a cero: simétrica 38
19
Coeficiente de curtosis
1 (Q3 Q1 )
K 2
P90 P10
K=0 platicurtica
K=0.26 mesocurtica
K=0.5 leptocurtica
39
20