Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Carrin
Escuela de Formacin Profesional de Sistemas
y Computacin
Docente:
Ing. Williams Muoz Robles
Integrantes:
-
RESUMEN
INDICE
RESUMEN................................................................................................................................... 2
INDICE......................................................................................................................................... 3
INTRODUCCIN......................................................................................................................... 5
CONTENIDO................................................................................................................................ 6
1.
2.
Histograma De Frecuencias.....................................................................................6
1.2.
1.3.
1.4.
1.5.
Grfico de simetra................................................................................................... 8
1.6.
Grfico de dispersin................................................................................................ 9
1.7.
2.2.
Contraste de Klomogorov-Smirnov Lilliefors de la bondad de ajuste a una
distribucin......................................................................................................................... 12
3.
2.3.
2.4.
2.5.
CONTRASTES DE ALETORIEDAD...............................................................................13
3.1.
Teste de rachas de Wald-Wolfowitz y el test del cuadrado medio de diferencias
sucesivas............................................................................................................................ 14
3.2.
Test de Daniel......................................................................................................... 14
4.
5.
Normalidad............................................................................................................. 14
5.2.
5.3.
Contrastes de la bondad de ajuste de la chi-cuadrado y kolmogorov- Smirnov
Lilliefors.............................................................................................................................. 15
5.4.
5.5.
Heteroscedasticidad............................................................................................... 16
5.6.
Multicolinealidad..................................................................................................... 17
5.7.
Auto correlacin...................................................................................................... 17
5.8.
Linealidad............................................................................................................... 17
CONCLUSIONES....................................................................................................................... 18
INTRODUCCIN
Despus de la fase de seleccin, el proceso de extraccin
del conocimiento contempla la fase de explotacin,
mediante tcnicas formales de anlisis exploratorio de
datos.
Es necesario examinar las variables individuales y las
relaciones entre ellas, as como evaluar y solucionar
problemas en el diseo de la investigacin y en la recogida
de datos. La primera tarea que se suele abordar es el
anlisis exploratorio y grfico de los datos. Hay que tener
presente que las representaciones graficas nunca
sustituyen a las medidas de diagnstico formal estadstico,
pero proporcionan una forma alternativa de desarrollar
una perspectiva del carcter de los datos y de las
interrelaciones que existen.
Tambin como tarea previa tenemos los supuestos
adyacentes en los mtodos multivariantes para la minera
de datos. Dependen de la tcnica que se apliquen y suelen
ser el contraste de la normalidad, el testeo de la linealidad
la comprobacin de la homocedasticidad, la comprobacin
de la multicolinealidad, la ausencia correlacin serial de
los residuos o auto correlacin.
CONTENIDO
1. HERRAMIENTAS DE EXPLORACIN VISUAL
1.1. Histograma De Frecuencias
Siempre es conveniente iniciar el anlisis
exploratorio de datos con la construccin del
histograma de frecuencias asociado, para poder
intuir la distribucin de probabilidad de los datos,
su normalidad, su simetra y otras propiedades
interesantes en el anlisis de datos.
3. CONTRASTES DE ALETORIEDAD
Se determina si un conjunto de datos se distribuye
aleatoriamente. Se puede determinar aleatoriedad
mediante un grfico pero se necesita certificar dicha
aleatoriedad.
3.1. Teste de rachas de Wald-Wolfowitz y el test del
cuadrado medio de diferencias sucesivas
Se trata de un test para contrastar la aleatoriedad
de una muestra basndose en el nmero de rachas
observadas en la misma, las rachas son conjunto de
nmeros iguales o de la misma naturaleza.
3.2. Test de Daniel
Se trata de un test para contrastar la hiptesis nula
de aleatoriedad de una muestra basndose en el
coeficiente de correlacin por rangos de Spearman.
4. TRANSFORMACIN DE LAS VARIABLES
5.6. Multicolinealidad
El proceso o trmino de multicolinealidad es una
situacin en la que se presenta una fuerte
correlacin entre variables explicativas del modelo.
La correlacin ha de ser fuerte, ya que siempre
existir correlacin entre dos variables explicativas
en un modelo, es decir, la no correlacin de dos
variables es un proceso idlico, que slo se podra
encontrar en condiciones de laboratorio.
Es un modelo multivariable suele suponerse como
hiptesis que sus variables (sobre todo en las
variables exgenas).
5.7. Auto correlacin
La
auto
correlacin es
una
herramienta matemtica utilizada frecuentemente
en el procesado de seales.
La funcin de auto correlacin se define como
la correlacin cruzada de la seal consigo misma.
La funcin de auto correlacin resulta de gran
CONCLUSIONES
Hay que realizar siempre el anlisis de los datos
aleatorios que previamente seleccionamos y ver si nos
pueden proporcionar informacin y/o conocimiento.
Cada grfico visual debe estar fundamentado por las
herramientas de exploracin formal.