Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Registros continuos
Muestreo (encuestas)
Experimentos (diseos controlados)
Censos, etc.
CONFIRMATORIO
Enfoque descriptivo
Enfoque inferencial
Prueba hiptesis
Semeja un juicio
42
2. ANLISIS EXPLORATORIO
El enfoque [del anlisis exploratorio] es el de un detective en
busca de pistas para descubrir las relaciones en una serie de
datos(2)
Es un conjunto de conceptos y herramientas (tcnicas) que permiten examinar los
datos para describir sus principales caractersticas, privilegiando la representacin
visual de los mismos. Los datos a los que se aplica este procedimiento son numricos
continuos o discretos. Puede analizarse el conjunto de datos, por ejemplo la edad,
pero tambin se puede analizar estos datos segn ciertas categoras como el sexo, la
ocupacin o el estado civil.
Los objetivos del anlisis exploratorio son:
43
Ejemplo:
Edad de pacientes en un estudio sobre diabetes:
54-59-35-41-46-25-47-60-54-46-49-46-41-34-22
Ordenamos los datos: 22, 25, 34, 35, 41, 41, 46, 46, 46, 47, 49, 54, 54, 59, 60
25
45
1166679
449
Tallo
Hojas
Los cinco datos bsicos para la construccin del grfico de caja son:
Valor mnimo
Cuartil 1 (Q1)
Mediana (M)
Cuartil 3 (Q3)
Valor Mximo
44
22-25-34-35-41-41-46-46-46-47-49-54-54-59-60
Q1
Q3
70
V.max
60
3er Q
2do Q
50
40
1er Q
30
V. min
20
10
N=
N =1515
Una caja central que une los cuartiles Q1 a Q3, que representa el 50% de las
observaciones (rango intercuartil).
Lneas que parten de la caja y que muestran el recorrido de datos hasta el lmite
superior e inferior respectivamente (conocido como bigotes).
La mediana, representada por la lnea media de la caja.
La simetra de la distribucin
Casos posiblemente anmalos (aquellos que se encuentran ms all de 1.5 del
rango intercuartil, sobre Q3 o debajo de Q1).
Datos
Casos
anmalos
anmalos:
45
Stem &
1
2
2
3
3
4
4
5
5
6
6
7
7
8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Leaf
889
011223344
57788899999
112223333444444
5555666777778888899
00000000122222223344
555556666677777888888899999999
00000000111111222223333344444
55555555555566666778888888899999
000000002222222223333344
555555555566666788889
001
558
11
1 case(s)
En el grfico, los nmeros representan las edades especficas de todos los hombres.
En la primera fila las edades son: 18,18 y 19 (Frecuencia =3 hombres); en la segunda
fila: 20, 21, 21, 22, 22, 23, 23, 24 y 24 (Frecuencia =9 hombres); y as sucesivamente.
Los tallos representan las decenas y las hojas las unidades.
46
Grfico de cajas
Sexo
En este caso se analiz la edad segn sexo. Esto facilita la comparacin entre estos
dos grupos, donde podemos ver que el sexo masculino es de mayor edad y es ms
disperso que el femenino. El sexo femenino tiene una distribucin ms prxima a la
normalidad.
47
Resumen Estadstico
Prueba de normalidad
Significado
Media
Intervalo de confianza
Mediana
Varianza
Desviacin tpica.
48
Mnimo
Mximo
Rango
Cuartil(8)
Amplitud intercuartil
Asimetra(6)
Curtosis(6)
Pruebas de normalidad
(Kolmogorov-Smirnov y
Shapiro-Wilk) (5)
Anlisis de residuos
Transformacin de los datos para encontrar la escala que mejor simplifique o
clarifique el anlisis.
REFERENCIAS BIBLIOGRFICAS
1.
2.
3.
4.
5.
6.
7.
8.
49