Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis de datos
Universidad de Oviedo
ndice general I
1. Elaboraci on de informes 2. Pasos para el manejo del SPAD 2.1. Introducci on 2.2. Inicio 2.3. Pasos generales 2.3.1. Ventana de trabajo Filiere 2.3.2. Selecci on de la Base de datos 2.3.3. Selecci on del m etodo estad stico 2.3.4. Introducir par ametros en el modelo 2.3.5. Salvar y ejecutar el an alisis 2.3.6. An alisis de resultados 3. Estad stica bidimensional: DEMOD 4. An alisis factoriales 4.1. Procedimiento general
1 3 3 4 4 4 5 6 7 8 9 10 15 15 ii
NDICE GENERAL I
iii 18 21 21 23 24
4.2. Gr acos factoriales 5. An alisis de clasicaci on 5.1. An alisis factorial 5.2. An alisis del dendograma 5.3. An alisis de los grupos de la clasicaci on
1
Elaboraci on de informes
La elaboraci on de un estudio estad stico conlleva un intenso trabajo que no siempre queda reejado en el informe nal. Se presenta una peque na gu a que ayude a conseguir la mejor calidad posible en la redacci on nal del informe1 . Se detalla un listado de cuestiones y sugerencias que facilitan la redacci on y presentaci on del trabajo. Antes de entregar su informe denitivo, aseg urese de que se verican todas y cada una de las siguientes cuestiones. 1. Ha le do el informe denitivo impreso en papel antes de entregarlo? an corregidas todas las faltas de ortograf a? 2. Est 3. Es correcta la construcci on sint actica de las frases?
1
La utilizaci on y el conocimiento de un procesador de texto son esenciales para obtener una optima calidad. Los procesadores de texto m as usuales son Microsoft Word y OpenOce (http://es.openoce.org/), si bien estos son A elementales. Un procesador de texto excelente es L TEX(http://www.latexproject.org/).
4. Ha utilizado correctamente las comas, puntos y comas, puntos seguidos y los puntos y aparte? 5. Consta un t tulo, el nombre del autor, su identicaci on, la fecha y el nombre de la asignatura? 6. Ha realizado una introducci on adecuada al tema objeto de estudio? 7. Finaliza con unas sucintas conclusiones? 8. Est an numeradas las p aginas, tablas o guras? 9. Respecto a las tablas o guras, presentan una leyenda explicativa y est an referenciadas en el texto? nado la bibliograf a utilizada? 10. Ha rese 11. Considera que se puede difundir p ublicamente su trabajo?
2
Pasos para el manejo del SPAD
2.1 INTRODUCCION
El paquete estad stico SPAD es una herramienta destinada al an alisis exploratorio de datos multidimensionales. Est a orientado al an alisis estad stico descriptivo de grandes tablas de datos obtenidos a partir de encuestas. Se basa en las t ecnicas factoriales que tienen como fundamento el algebra lineal, descomponiendo la matriz de datos mediante sus valores propios. La idea subyacente de esta metodolog a es que se puede calcular las distancias entre las l neas y las columnas de una tabla rectangular utilizando distintos tipos de medidas (correlaciones, coecientes de contingencia, etc.). Adem as, desarrolla t ecnicas de clasicaci on de los elementos de la tabla (las o columnas) a partir de los vectores propios, obteniendo caracterizaciones estad sticas autom aticas de las distintas clases.
3
INICIO
2.2
INICIO
Se aprieta dos veces en el icono SPAD (Winspad3) Aparecen autom aticamente tres ventanas Ventana principal del SPADN (SPAD Version 3.21), Ventana de m etodos estad sticos (M ethodes), Ventana de programaci on (Fili ere 1:sans noms) (Fig. 2.1).
2.3 2.3.1
Una vez que tenemos abierto el SPAD, aparece por defecto una ventana Filiere y vamos a trabajar principalmente con esta ventana. (Fig. 2.2). En el caso de que esta ventana no aparezca o que queramos abrir una nueva, en el men u Principal, vamos al comando Filierie y escogemos Nouevelle Filiere. Se pueden abrir tantas ventanas Filiere como queramos seleccionando en la ventana principal del SPAD el comando Filiere: nouvelle para crear una nueva base o bien para recuperar alguna ventana de programaci on ya archivada (Fig. 2.3).
PASOS GENERALES
2.3.2
Dentro de la ventana Filiere vamos a dise nar y realizar el an alisis estad stico de la base de datos en estudio. Si queremos seleccionar una base de datos ya existente, en la ventana Filiere que aparece al iniciar el SPAD apretamos dos veces en el icono BASE, y seleccionamos la base que queremos.
PASOS GENERALES
2.3.3
Para dise nar la ventana de programaci on estad stica, hemos de seleccionar el m etodo estad stico deseado, que normalmente ser a alguno de los siguientes: descripci on estad stica univariante y bivariante, an alisis factoriales y an alisis de clasicaci on.
PASOS GENERALES
2.3.4
En la ventana Filiere aparece el icono con el m etodo de c alculo escogido 1. Si aparece en color gris, debemos introducir los par ametros del modelo. 2. Si est a en color amarillo, ya hemos introducido los par ametros necesarios.
Cuando el icono del m etodo est a en gris, pinchamos dos veces en el icono, y dependiendo del m etodo, y aparecer an distintas pantallas que hemos de cumplimentar.
Apretamos Ok y en la ventana Filiere los iconos correspondientes se han puesto de color amarillo, y por lo tanto los par ametros est an bien introducidosa
a
Esto implica que efectuar a un an alisis, pero no tiene porqu e ser el an alisis correcto que responda al ejercicio.
PASOS GENERALES
2.3.5
Una vez cumplimentados los par ametros del modelo, y con la conanza de que nuestro m etodo sea el correcto y que los par ametros (variables, individuos, etc.) est an bien denidos, procedemos a salvar y ejecutar el m etodo estad stico dise nado.
Si no hemos dado un nombre a este procedimiento, saldr a un mensaje indicando si deseamos guardarlo con un nombre. Responderemos que s .
Pedir a un nombre de ocho caracteres de m aximo. No hay que dejar espacios en blanco ni letras acentuadas. Pulsamos Aceptar.
Si deseamos dar una peque na descripci on del m etodo, escribimos lo que consideremos oportuno
PASOS GENERALES
2.3.6
Analisis de resultados
3
Estad stica bidimensional: DEMOD
El an alisis descriptivo de los cruces de variables conlleva a extraer los resultados m as signicativos que diferencian unas caracter sticas de otras. En este sentido, el programa SPAD tiene una poderosa herramienta que automatiza y extrae los elementos m as signicativos al cruzar las variables de dos en dos, el procedimiento DEMOD. En esta pr actica se ense nar a los pasos b asicos para su adecuada utilizaci on.
Con la base de datos Turisguay.sba, se pretende analizar las principales diferencias que existen entre los turistas que se alojan en Hotel, Turismo Rural y Camping.
10
11
Escogemos Descripci on estad stica y Caracterizaci on autom atica de una variable nominal. Pulsamos OK.
Este analisis
Este metodo
Pinchamos
12
Nominal a caracterizar
Seleccionamos las variables nominales que queremos caracterizar. En este caso s olo se estudia la variable tipo de alojamiento.
Variable seleccionada
Seleccionamos las variables nominales que caracterizar an a las variables iniciales. En este ejemplo se han escogido como variables nominales caracterizantes todas las dem as variables nominales.
Nominales caracterizarantes
Variables seleccionadas
Seleccionamos las variables continuas que caracterizar an a las variables iniciales. En este ejemplo se han escogido como variables continuas caracterizantes todas las variables continuas excepto el c odigo del cuestionario.
Nominales caracterizarantes
Variables seleccionadas
13
Ejecuci on. Ejecutamos este chero seg un lo descrito en el apartado 2.3.5 del cap tulo 2, p agina 8.
Si deseamos modicar alg un par ametro establecido, podemos pinchar dos veces en el icono DEMOD.
Si deseamos crear una nueva ventana, o recuperar alg un an alisis guardado, acudimos al men u principal.
Modalidad caracterizada
MODALITES CARACTERISTIQUES Hotel Hotel Trabajo Centro No Solo Nacional Avion Tipo establecimiento Motivos de su visita Zona geografica La estancia, incluye fin de semana? Acompaante Procedencia Medio transporte DES VARIABLES
Hotel
V.TEST PROBA ---- POURCENTAGES ---IDEN POIDS CLA/MOD MOD/CLA GLOBAL 55.59 100.00 95.84 70.62 89.74 93.21 62.33 95.14 100.00 24.26 65.22 22.09 17.32 81.56 9.61 55.59 14.07 51.35 13.68 10.33 72.75 5.61
El 95.84% de los que vienen por trabajo se alojan en hotel El 24.26% de los se alojan en hotel vienen por trabajo El 14.07% de todos los turistas vienen por trabajo
Hotel MOYENNES | CLASSE GENERALE | Hotel 30.95 84.76 4.50 5.83 | 6.94 11.36 | 22.94 | 67.29 | 20.26 42.95 18.83 | 41.65 | ( POIDS = 1426.00 ECARTS TYPES CLASSE GENERAL | | NUM.LIBELLE VARIABLES CARACTERISTIQUES | IDEN |
| V.TEST | PROBA | | | |
| | | |
EFFECTIF = 1426 )
-6.64 | 0.000 |
Valor
medio
de
los
que
se
alojan
en
el
14
4
An alisis factoriales
4.1 PROCEDIMIENTO GENERAL
Dentro de la ventana Filiere vamos a dise nar y realizar el an alisis estad stico de la base de datos en estudio. Si queremos seleccionar una base de datos ya existente, en la ventana Filiere que aparece al iniciar el SPAD apretamos dos veces en el icono BASE, y seleccionamos la base que queremos.
15
PROCEDIMIENTO GENERAL
16
Seleccionamos el m etodo estad stico necesario para analizar nuestros datos. En este ejemplo, An alisis Factoriales, An alisis a Componentes Principales
a
En la ventana Filiere aparece el icono con el m etodo de c alculo escogido 1. Si aparece en color gris, debemos introducir los par ametros del modelo. 2. Si est a en color amarillo, ya hemos introducido los par ametros necesarios. Cuando el icono del m etodo est a en gris, pinchamos dos veces en el icono ACP. Seleccionamos en el panel superior Variables continuas activas. Posteriormente escogemos las variables correspondientes.a
a
PROCEDIMIENTO GENERAL
17
Seleccionamos en el panel superior Variables nominales ilustrativas. Posteriormente escogemos las variables correspondientes.
Seleccionamos en el panel superior Variables continuas ilustrativas. Posteriormente escogemos las variables correspondientes.
Apretamos Ok y en la ventana Filiere los iconos correspondientes se han puesto de color amarillo, y por lo tanto los par ametros a est an bien introducidos
a
Esto implica que efectuar a un an alisis, pero no tiene porqu e ser el an alisis correcto que responda al ejercicio.
GRAFICOS FACTORIALES
18
Una vez cumplimentados los par ametros del modelo, y con la conanza de que nuestro m etodo sea el correcto y que los par ametros (variables, individuos, etc.) est an bien denidos, procedemos a salvar y ejecutar el m etodo estad stico dise nadoa
a
4.2
GRAFICOS FACTORIALES
La primera vez, seleccionamos Variables Continuas Activas. Es una versi on simplicada del gr aco, en que que s olo aparecen las variables continuas activas.
GRAFICOS FACTORIALES
19
Para editar las etiquetas basta con realizar un doble clic sobre las echas. SPAD permite arrastar las etiquetas. Las echas deben interpretarse como direcciones de crecimiento de las variables en el espacio factorial. Hay que interpretar el gr aco.
GRAFICOS FACTORIALES
20
Aparecen representados todos los individuos en el plano factorial. Si deseamos obtener informaci on de cada individuo, pinchamos primero en el icono correspondiente y luego en el punto del gr aco.
5
An alisis de clasicaci on
Primero se realiza un an alisis factorial, luego se examina el dendograma y por u ltimo de decide el n umero de grupos, caracteriz andolos.
5.1
ANALISIS FACTORIAL
Dentro de la ventana Filiere vamos a dise nar y realizar el an alisis estad stico de la base de datos en estudio. Si queremos seleccionar una base de datos ya existente, en la ventana Filiere que aparece al iniciar el SPAD apretamos dos veces en el icono BASE, y seleccionamos la base que queremos.
21
ANALISIS FACTORIAL
22
Seleccionamos el m etodo estad stico necesario para analizar nuestros datos. En este ejemplo, An alisis Factorial y Clasicaci on, An alisis Componentes Principalesa
a
23
5.2
24
Estudiamos y probamos qu e divisi on es la m as conveniente. En este caso puede considerarse el dividir a la muestra en tres grupos o bien en cuatro grupos.
5.3
25
Seleccionamos Denidos por el usuario. Introducimos el n umero de grupos en los que hemos decidido hacer la partici on. Apretamos OK.
Al cambiar los par ametros, los resultados que est an son los viejos (en color gris). Hay que volver a ejecutar el programa, presionando la tecla F5.
26