Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONCENTRAC
IÓN DE
DATOS
MEDIDAS DE
DEFORMACIÓ
N
La deformación o asimetría
La deformación consiste en estadística se deduce
analizar la simetría o comparando la distribución
asimetría (no simetría) de las con la forma de la “curva
distribuciones. normal” que corresponde a
una distribución simétrica.
COEFICIENTE DE ASIMETRÍA DE
PEARSON (AS)
(Propuesto por Karl Pearson)
o
XX 3( X X )
AS1 AS 2
S S
ASIMETRÍA ASIMETRÍA
SIMÉTRICA
NEGATIVA POSITIVA
La distribución La distribución
es asimétrica representa La distribución
negativa o una curva es asimétrica
alargada normal, es positiva o
(sesgada) a la simétrica: alargada
izquierda: AS=0 (sesgada) a la
AS<0 derecha: AS>0
o
o o
XXX XXX XXX
25 0
15 15
20 0
Recuento
15 0
10 10
10 0
5 5
50
0 0
20 25 30 35 40 20 25 30 35 40 20 40 60 80
o
X X 174.40 167
AS1 0.170 0
S 43.60
3( X X ) 3(174.40 174)
AS 2 AS 2 0.028 0
S 43.60
Q3 2Q2 Q1 208.20 2(174) 140.80
AS 0.00015 0
Q3 Q1 208.20 140.80
Interpretación: Las AS son positivas, tienen asimetría
positivas, hay un ligero predominio de sueldos menores.
Existen muchos trabajadores que ganan poco y pocos
trabajadores que ganan bien.
MEDIDAS DE
KURTOSIS
Q3 Q1
K
2( P90 P10 ))
50%
25% 25% Dato Atípico
Solución:
Dato menor: 33,1 Dato
mayor: 36,5
Tallos posibles: 33, 34, 35 y
36
Hojas: 1, 4, 7, 7, 9, 8, 6, 2, 2,
…
Sólo existen 4 tallos,
debiendo ser el mínimo 5
tallos, entonces los tallos
propuestos se desdoblan, de
la siguiente manera: Interpretación:
33 (del 33,0 al 33,4) - Son 35 casos.
- La menor observación es de 33,1 cm
33 (del 33,5 al 33,9)
- La mayor observación es de 36,5 cm
34 (del 34,0 al 34,4) - Tiene distribución asimétrica positiva
34 (del 34,5 al 34,9) porque la distribución de datos está
35 (del 35,0 al 35,4) sesgada (sesgo positivo), es decir, hay
35 (del 35,5 al 35,9) mayor concentración de datos a la
Ejemplo: Se entrevistaron a 474 empleados y se le preguntaron
sobre el sector donde trabajan, obteniéndose los siguientes
resultados utilizando el SPSS 22:
Categoría Laboral
50%
25% 25%
Dato Atípico
X min X max
Q1 X Q3
L U
NORMALIDAD
Muchos métodos
estadísticos se basan en la
Existen varios métodos
hipótesis de normalidad de
para evaluar la normalidad
la variable
de un conjunto de datos
objeto de estudio. De
que
hecho, si la falta de
pueden dividirse en dos
normalidad de la variable
grupos: - Métodos
es suficientemente
gráficos: Histograma
fuerte, muchos de los
diagramas de cuantiles (Q-
contrastes utilizados en los
Q plots), Diagrama de
análisis estadístico -
cajas
inferenciales no son
Contrastes de
válidos. El investigador
Hipótesis:
debería evaluar la
Test de Kolmogorov-
normalidad de todas las
Smirnov
variables
Ejemplo: Se recolectó información sobre los salarios (en
dólares) de 16 empleados administrativos, en el estudio se
realizó un analisis de normalidad con los siguientes datos:
1200 1210 1210 1220 1220 1220 1230 1230 1230 1230 1240
1240 1240 1250 1250 1260
HISTOGRAMA: Los
salarios de los
administrativos siguen
una distribución
normal.
N Válido 16
Perdidos
0
Media 1230,00
Mediana 1230,00
Moda 1230
Asimetría ,000
GRAFICO DE CAJAS: En el grafico observamos que las líneas en
forma de bigotes que están hacia el lado derecho e izquierdo son
iguales, la mediana esta al centro de la caja, no hay datos
atípicos; entonces podemos afirmar que los datos siguen una
distribución normal.
X 1220, Q1 1230, Q3 1240, X min 1200, X max 1260
50%
25% 25%
X min X max
Q1 Q3
X
L U
GRAFICO Q-Q: En el grafico observamos que los datos están
muy cerca a la línea por lo tanto siguen una distribución normal
ANÁLISIS
ESTADÍSTICO
BIDIMENSIONAL
Es un gráfico donde se
presentan una variable
en el eje horizontal y la
otra en el vertical. El
patrón de los puntos
representa la relación
entre las variables.
DIAGRAMA DE DISPERSIÓN
Se denomina diagrama de dispersión o nube
de puntos a la grafica de los valores (xi, yi) de
las variables X e Y en el sistema cartesiano.
En el diagrama de dispersión se visualiza el
tipo de relación existente entre dos variables.
DIAGRAMA DE DISPERSIÓN
CORRELACI CORRELACI
ÓN ÓN CORRELACI
DIRECTA INDIRECTA ÓN NULA
POSITIVA NEGATIVA
Ejemplo: En el siguiente ejemplo, se realiza un grafico de
dispersión entre
El grafico las variables “salario inicial “y “salario actual”
de dispersión
del archivo “DATOS EMPLEADOS.SAV”.
muestra a las variables
“salario inicial “ (eje X) y
“salario actual” (eje Y) del
archivo “DATOS
EMPLEADOS.SAV”:
- En el grafico se observa que
los datos muestran un
comportamiento lineal
positivo.
- El diagrama no asegura
tener una alta correlación
lineal, eso lo confirmaremos
con el coeficiente de
correlación (r), en el tema de
análisis de regresión.
- En el diagrama observamos
un dato que esta bastante
separado del grupo, puede
MUCHAS
GRACIAS