Está en la página 1de 29

T ecnicas de muestreo y an alisis de datos

Diplomatura en CC. Empresariales Diplomatura en Turismo


Practica.

Analisis de datos

Jos e Manuel Men endez Est ebanez Emilio Torres Manzanera


Departamento de Estad stica e Investigacion Operativa y D.M.

Universidad de Oviedo

ndice general I

1. Elaboraci on de informes 2. Pasos para el manejo del SPAD 2.1. Introducci on 2.2. Inicio 2.3. Pasos generales 2.3.1. Ventana de trabajo Filiere 2.3.2. Selecci on de la Base de datos 2.3.3. Selecci on del m etodo estad stico 2.3.4. Introducir par ametros en el modelo 2.3.5. Salvar y ejecutar el an alisis 2.3.6. An alisis de resultados 3. Estad stica bidimensional: DEMOD 4. An alisis factoriales 4.1. Procedimiento general

1 3 3 4 4 4 5 6 7 8 9 10 15 15 ii

NDICE GENERAL I

iii 18 21 21 23 24

4.2. Gr acos factoriales 5. An alisis de clasicaci on 5.1. An alisis factorial 5.2. An alisis del dendograma 5.3. An alisis de los grupos de la clasicaci on

1
Elaboraci on de informes
La elaboraci on de un estudio estad stico conlleva un intenso trabajo que no siempre queda reejado en el informe nal. Se presenta una peque na gu a que ayude a conseguir la mejor calidad posible en la redacci on nal del informe1 . Se detalla un listado de cuestiones y sugerencias que facilitan la redacci on y presentaci on del trabajo. Antes de entregar su informe denitivo, aseg urese de que se verican todas y cada una de las siguientes cuestiones. 1. Ha le do el informe denitivo impreso en papel antes de entregarlo? an corregidas todas las faltas de ortograf a? 2. Est 3. Es correcta la construcci on sint actica de las frases?
1

La utilizaci on y el conocimiento de un procesador de texto son esenciales para obtener una optima calidad. Los procesadores de texto m as usuales son Microsoft Word y OpenOce (http://es.openoce.org/), si bien estos son A elementales. Un procesador de texto excelente es L TEX(http://www.latexproject.org/).

4. Ha utilizado correctamente las comas, puntos y comas, puntos seguidos y los puntos y aparte? 5. Consta un t tulo, el nombre del autor, su identicaci on, la fecha y el nombre de la asignatura? 6. Ha realizado una introducci on adecuada al tema objeto de estudio? 7. Finaliza con unas sucintas conclusiones? 8. Est an numeradas las p aginas, tablas o guras? 9. Respecto a las tablas o guras, presentan una leyenda explicativa y est an referenciadas en el texto? nado la bibliograf a utilizada? 10. Ha rese 11. Considera que se puede difundir p ublicamente su trabajo?

2
Pasos para el manejo del SPAD
2.1 INTRODUCCION

El paquete estad stico SPAD es una herramienta destinada al an alisis exploratorio de datos multidimensionales. Est a orientado al an alisis estad stico descriptivo de grandes tablas de datos obtenidos a partir de encuestas. Se basa en las t ecnicas factoriales que tienen como fundamento el algebra lineal, descomponiendo la matriz de datos mediante sus valores propios. La idea subyacente de esta metodolog a es que se puede calcular las distancias entre las l neas y las columnas de una tabla rectangular utilizando distintos tipos de medidas (correlaciones, coecientes de contingencia, etc.). Adem as, desarrolla t ecnicas de clasicaci on de los elementos de la tabla (las o columnas) a partir de los vectores propios, obteniendo caracterizaciones estad sticas autom aticas de las distintas clases.
3

INICIO

2.2

INICIO

Se aprieta dos veces en el icono SPAD (Winspad3) Aparecen autom aticamente tres ventanas Ventana principal del SPADN (SPAD Version 3.21), Ventana de m etodos estad sticos (M ethodes), Ventana de programaci on (Fili ere 1:sans noms) (Fig. 2.1).

Figura 2.1 Pantallas iniciales.

2.3 2.3.1

PASOS GENERALES Ventana de trabajo Filiere

Una vez que tenemos abierto el SPAD, aparece por defecto una ventana Filiere y vamos a trabajar principalmente con esta ventana. (Fig. 2.2). En el caso de que esta ventana no aparezca o que queramos abrir una nueva, en el men u Principal, vamos al comando Filierie y escogemos Nouevelle Filiere. Se pueden abrir tantas ventanas Filiere como queramos seleccionando en la ventana principal del SPAD el comando Filiere: nouvelle para crear una nueva base o bien para recuperar alguna ventana de programaci on ya archivada (Fig. 2.3).

PASOS GENERALES

Figura 2.2 Ventana Filiere.

Figura 2.3 Nuevo y/o Abrir Filiere.

2.3.2

de la Base de datos Seleccion

Dentro de la ventana Filiere vamos a dise nar y realizar el an alisis estad stico de la base de datos en estudio. Si queremos seleccionar una base de datos ya existente, en la ventana Filiere que aparece al iniciar el SPAD apretamos dos veces en el icono BASE, y seleccionamos la base que queremos.

PASOS GENERALES

Cuando est a la Base de datos seleccionada el icono ha de aparecer en color azul.

2.3.3

del metodo Seleccion estad stico

Para dise nar la ventana de programaci on estad stica, hemos de seleccionar el m etodo estad stico deseado, que normalmente ser a alguno de los siguientes: descripci on estad stica univariante y bivariante, an alisis factoriales y an alisis de clasicaci on.

En la ventana Filiere seleccionamos el comando Modele y escogemos un m etodo predenido

Seleccionamos el m etodo estad stico que queramos emplear

PASOS GENERALES

2.3.4

Introducir parametros en el modelo

En la ventana Filiere aparece el icono con el m etodo de c alculo escogido 1. Si aparece en color gris, debemos introducir los par ametros del modelo. 2. Si est a en color amarillo, ya hemos introducido los par ametros necesarios.

Cuando el icono del m etodo est a en gris, pinchamos dos veces en el icono, y dependiendo del m etodo, y aparecer an distintas pantallas que hemos de cumplimentar.

Apretamos Ok y en la ventana Filiere los iconos correspondientes se han puesto de color amarillo, y por lo tanto los par ametros est an bien introducidosa
a

Esto implica que efectuar a un an alisis, pero no tiene porqu e ser el an alisis correcto que responda al ejercicio.

PASOS GENERALES

2.3.5

Salvar y ejecutar el analisis

Una vez cumplimentados los par ametros del modelo, y con la conanza de que nuestro m etodo sea el correcto y que los par ametros (variables, individuos, etc.) est an bien denidos, procedemos a salvar y ejecutar el m etodo estad stico dise nado.

Si no hemos dado un nombre a este procedimiento, saldr a un mensaje indicando si deseamos guardarlo con un nombre. Responderemos que s .

Pedir a un nombre de ocho caracteres de m aximo. No hay que dejar espacios en blanco ni letras acentuadas. Pulsamos Aceptar.

Si deseamos dar una peque na descripci on del m etodo, escribimos lo que consideremos oportuno

PASOS GENERALES

Se ejecuta el programa y aparecen los resultados

2.3.6

Analisis de resultados

Pinchamos en el Icono de los resultados

Seleccionamos aquello que queramos visualizar

3
Estad stica bidimensional: DEMOD

El an alisis descriptivo de los cruces de variables conlleva a extraer los resultados m as signicativos que diferencian unas caracter sticas de otras. En este sentido, el programa SPAD tiene una poderosa herramienta que automatiza y extrae los elementos m as signicativos al cruzar las variables de dos en dos, el procedimiento DEMOD. En esta pr actica se ense nar a los pasos b asicos para su adecuada utilizaci on.

Con la base de datos Turisguay.sba, se pretende analizar las principales diferencias que existen entre los turistas que se alojan en Hotel, Turismo Rural y Camping.
10

11

Seleccionamos la base Turisguay.sba pinchando dos veces en el icono Base.

Nombre En color azul

Pinchamos en el comando Modele y Filiere Predenie.

Escogemos Descripci on estad stica y Caracterizaci on autom atica de una variable nominal. Pulsamos OK.

Este analisis

Este metodo

Pinchamos dos veces en el icono DEMOD.

Pinchamos

12

Nominal a caracterizar

Seleccionamos las variables nominales que queremos caracterizar. En este caso s olo se estudia la variable tipo de alojamiento.

Variable seleccionada

Seleccionamos las variables nominales que caracterizar an a las variables iniciales. En este ejemplo se han escogido como variables nominales caracterizantes todas las dem as variables nominales.

Nominales caracterizarantes

Variables seleccionadas

Seleccionamos las variables continuas que caracterizar an a las variables iniciales. En este ejemplo se han escogido como variables continuas caracterizantes todas las variables continuas excepto el c odigo del cuestionario.

Nominales caracterizarantes

Variables seleccionadas

13

Pulsamos OK. El an alisis est a listo para ser ejecutado.

Ejecuci on. Ejecutamos este chero seg un lo descrito en el apartado 2.3.5 del cap tulo 2, p agina 8.

Si deseamos modicar alg un par ametro establecido, podemos pinchar dos veces en el icono DEMOD.

Pinchamos para modicar

Si deseamos crear una nueva ventana, o recuperar alg un an alisis guardado, acudimos al men u principal.

Modalidad caracterizada
MODALITES CARACTERISTIQUES Hotel Hotel Trabajo Centro No Solo Nacional Avion Tipo establecimiento Motivos de su visita Zona geografica La estancia, incluye fin de semana? Acompaante Procedencia Medio transporte DES VARIABLES

Hotel

V.TEST PROBA ---- POURCENTAGES ---IDEN POIDS CLA/MOD MOD/CLA GLOBAL 55.59 100.00 95.84 70.62 89.74 93.21 62.33 95.14 100.00 24.26 65.22 22.09 17.32 81.56 9.61 55.59 14.07 51.35 13.68 10.33 72.75 5.61

Modalidades con una relacion signicativa

P601 P601 P302 P102 P901 P401 P702

1426 1426 361 1317 351 265 1866

59.21 18.47 15.81 14.83 14.23 11.16 10.89

0.000 0.000 0.000 0.000 0.000 0.000 0.000

El 95.84% de los que vienen por trabajo se alojan en hotel El 24.26% de los se alojan en hotel vienen por trabajo El 14.07% de todos los turistas vienen por trabajo

Hotel MOYENNES | CLASSE GENERALE | Hotel 30.95 84.76 4.50 5.83 | 6.94 11.36 | 22.94 | 67.29 | 20.26 42.95 18.83 | 41.65 | ( POIDS = 1426.00 ECARTS TYPES CLASSE GENERAL | | NUM.LIBELLE VARIABLES CARACTERISTIQUES | IDEN |

| V.TEST | PROBA | | | |

| | | |

EFFECTIF = 1426 )

24.10 | 0.000 | 23.76 | 0.000 |

15.Gasto alojamiento 20.Gasto total diario por persona 9.Cuantas noches?

Variables con un valor P601 | | medio superior signicativo P14 |


GASD | P8 Variables con un valor medio inferior signicativo |

-6.64 | 0.000 |

Valor

medio

de

los

que

se

alojan

en

el

Hotel Desviacion tipica

Valor medio de todos los turistas

14

4
An alisis factoriales
4.1 PROCEDIMIENTO GENERAL

Dentro de la ventana Filiere vamos a dise nar y realizar el an alisis estad stico de la base de datos en estudio. Si queremos seleccionar una base de datos ya existente, en la ventana Filiere que aparece al iniciar el SPAD apretamos dos veces en el icono BASE, y seleccionamos la base que queremos.

Cuando est a la Base de datos seleccionada el icono ha de aparecer en color azul.

15

PROCEDIMIENTO GENERAL

16

En la ventana Filiere seleccionamos el comando Modele y escogemos el m etodo predenido

Seleccionamos el m etodo estad stico necesario para analizar nuestros datos. En este ejemplo, An alisis Factoriales, An alisis a Componentes Principales
a

En el caso del An alisis de Correspondencias M ultiples el procedimiento es muy similar.

En la ventana Filiere aparece el icono con el m etodo de c alculo escogido 1. Si aparece en color gris, debemos introducir los par ametros del modelo. 2. Si est a en color amarillo, ya hemos introducido los par ametros necesarios. Cuando el icono del m etodo est a en gris, pinchamos dos veces en el icono ACP. Seleccionamos en el panel superior Variables continuas activas. Posteriormente escogemos las variables correspondientes.a
a

En el ACM ser an las variables nominales activas.

PROCEDIMIENTO GENERAL

17

Seleccionamos en el panel superior Variables nominales ilustrativas. Posteriormente escogemos las variables correspondientes.

Seleccionamos en el panel superior Variables continuas ilustrativas. Posteriormente escogemos las variables correspondientes.

Apretamos Ok y en la ventana Filiere los iconos correspondientes se han puesto de color amarillo, y por lo tanto los par ametros a est an bien introducidos
a

Esto implica que efectuar a un an alisis, pero no tiene porqu e ser el an alisis correcto que responda al ejercicio.

GRAFICOS FACTORIALES

18

Una vez cumplimentados los par ametros del modelo, y con la conanza de que nuestro m etodo sea el correcto y que los par ametros (variables, individuos, etc.) est an bien denidos, procedemos a salvar y ejecutar el m etodo estad stico dise nadoa
a

V ease lo descrito en el apartado 2.3.5 del cap tulo 2, p agina 8.

4.2

GRAFICOS FACTORIALES

Si deseamos visualizar el plano factorial, pinchamos dos veces en el icono de Gr acos.

La primera vez, seleccionamos Variables Continuas Activas. Es una versi on simplicada del gr aco, en que que s olo aparecen las variables continuas activas.

GRAFICOS FACTORIALES

19

Aparece el plano factorial con las variables activas.

Para editar las etiquetas basta con realizar un doble clic sobre las echas. SPAD permite arrastar las etiquetas. Las echas deben interpretarse como direcciones de crecimiento de las variables en el espacio factorial. Hay que interpretar el gr aco.

Cerramos el gr aco sin salvarlo

De nuevo pinchamos dos veces en el icono de Gr acos.

GRAFICOS FACTORIALES

20

Seleccionamos a los individuos activos.

Aparecen representados todos los individuos en el plano factorial. Si deseamos obtener informaci on de cada individuo, pinchamos primero en el icono correspondiente y luego en el punto del gr aco.

5
An alisis de clasicaci on
Primero se realiza un an alisis factorial, luego se examina el dendograma y por u ltimo de decide el n umero de grupos, caracteriz andolos.

5.1

ANALISIS FACTORIAL

Dentro de la ventana Filiere vamos a dise nar y realizar el an alisis estad stico de la base de datos en estudio. Si queremos seleccionar una base de datos ya existente, en la ventana Filiere que aparece al iniciar el SPAD apretamos dos veces en el icono BASE, y seleccionamos la base que queremos.
21

ANALISIS FACTORIAL

22

Cuando est a la Base de datos seleccionada el icono ha de aparecer en color azul.

En la ventana Filiere seleccionamos el comando Modele y escogemos el m etodo predenido

Seleccionamos el m etodo estad stico necesario para analizar nuestros datos. En este ejemplo, An alisis Factorial y Clasicaci on, An alisis Componentes Principalesa
a

En el caso del An alisis de Correspondencias M ultiples el procedimiento es muy similar.

ANALISIS DEL DENDOGRAMA

23

Realizamos el an alisis factoriala


a

Seg un lo descrito en el apartado 4.1 del cap tulo 4, p agina 15.

5.2

ANALISIS DEL DENDOGRAMA

Pinchamos dos veces en el icono gr aco del dendograma

ANALISIS DE LOS GRUPOS DE LA CLASIFICACION

24

Estudiamos y probamos qu e divisi on es la m as conveniente. En este caso puede considerarse el dividir a la muestra en tres grupos o bien en cuatro grupos.

Cerramos el gr aco del dendograma.

5.3

ANALISIS DE LOS GRUPOS DE LA CLASIFICACION

Pinchamos dos veces en el icono del Parti-Decla.

ANALISIS DE LOS GRUPOS DE LA CLASIFICACION

25

Seleccionamos Denidos por el usuario. Introducimos el n umero de grupos en los que hemos decidido hacer la partici on. Apretamos OK.

Al cambiar los par ametros, los resultados que est an son los viejos (en color gris). Hay que volver a ejecutar el programa, presionando la tecla F5.

ANALISIS DE LOS GRUPOS DE LA CLASIFICACION

26

Ahora ya se pueden estudiar las clasicaciones realizadas.

También podría gustarte