Está en la página 1de 22

Master en Calidad Total Estadstica Manual de Stagraphics 1

UNIVERSIDAD CARLOS III DE MADRID


MASTER EN CALIDAD TOTAL





PRCTICAS DE ESTADSTICA I
MANUAL DE STATGRAPHICS






I. INTRODUCCIN Y MANEJO DE DATOS

Master en Calidad Total Estadstica Manual de Stagraphics 2
INTRODUCCION

El programa Statgraphics es un software que est diseado para facilitar el anlisis
estadstico de datos. Mediante su aplicacin es posible realizar una anlisis descriptivo de
una o varias variables, utilizando grficos que expliquen su distribucin o calculando sus
medidas caractersticas. Entre sus muchas prestaciones, tambin figuran el clculo de
intervalos de confianza, contrastes de hiptesis, anlisis de regresin, anlisis
multivariantes, as como diversas tcnicas aplicadas en Control de Calidad.

El programa trabaja en un entorno WINDOWS y su pantalla principal (a la que se accede
ejecutando el programa SGWIN.EXE o directamente clickeando sobre el icono
correspondiente, es la siguiente:



(Para salir del programa seleccionamos en la barra de men FILE...EXIT
STATGRAPHICS o simplemente se cierra la ventana principal de la aplicacin)

En la pantalla principal de Statgraphics, podemos distinguir los siguientes elementos:

1. Barra de men
2. Barra de herramientas
3. Barra de tareas


Master en Calidad Total Estadstica Manual de Stagraphics 3
Analicemos ahora cada uno de los elementos que podemos encontrar en la ventana
principal.


Barra de men




La barra de men siempre estar disponible al utilizar el programa, de forma que sea
posible seleccionar el anlisis deseado.

Al clickear con el ratn sobra cada una de las palabras que componen la barra, aparecer un
men desplegable con otras opciones asociadas. As tendremos:

File: permite realizar operaciones de carcter general: abrir, cerrar o grabar ficheros,
imprimir y salir de Statgraphics.

Edit: como en otras aplicaciones en entorno Windows, este men esta asociado a
diversas opciones de edicin: cortar, copiar, pegar, deshacer...

Plot, Describe, Compare, Special: al presionar con el ratn sobre ellos tendremos
acceso a diversos mens de anlisis de Statgraphics que se irn analizando a lo largo
de este manual.

View, Window, Help: tienen disponible varias opciones de formato y ayuda, de
forma similar a otras aplicaciones que trabajan en el mismo entorno.


Master en Calidad Total Estadstica Manual de Stagraphics 4
Barra de herramientas


La barra de herramientas tiene como funcin asociar iconos (botones rpidos) con algunas
de las opciones mas frecuentemente utilizadas de la barra de men. Si se seala con el ratn
cualquier botn de la barra, aparecer una breve descripcin de la funcin asociada.

Barra de tareas

Incluye iconos asociados que contendrn los datos que se analizan, comentarios
personales sobre el anlisis, resultados del anlisis efectuado y comentarios e
interpretaciones del programa de los resultados obtenidos. El conjunto de estos elementos
forma el Statfolio.



Statadvisor: herramienta incorporada al programa, que interpreta de forma sencilla
los resultados obtenidos.
Statgalery: permite almacenar los resultados (grficos incluidos) del anlisis
realizado. El realizar cualquier anlisis estadstico, el sistema genera una ventana de
anlisis, que estar dividida en paneles conteniendo las diferentes partes del anlisis.
Clickeando con el botn derecho del ratn sobre cada uno de estos paneles y
seleccionando Copy to Galery podremos incluir el panel en el Statgalery al utilizar

Master en Calidad Total Estadstica Manual de Stagraphics 5
la opcion de Copiar una vez posicionados con el ratn sobre el panel de destino. (La
configuracin de los paneles del Statgalery es seleccionable sin ms que desplazar
con el ratn las barras horizontales y verticales)
Untiled comments y Statreporter: opciones de Statgrafics que permiten introducir
los comentarios de usuario para su posterior edicin.
Ventana de datos: hoja de clculo que contiene los datos que se van analizar.
Pueden introducirse directamente desde el teclado o recurarse desde un fichero ya
grabado. (FILE...OPEN...OPEN DATA FILE)

Al conjunto de los elementos anteriores se le denomina Statfolio, que puede
almacenarse bajo un nombre nico (fichero .spg) activando la opcin
FILE...SAVE...SAVE STATFOLIO. Si abrimos un Statfolio previamente guardado
y continuamos con el anlisis estadstico, cualquier modificacin que se realice
sobre los datos se transmitir automticamente sobre todos los anlisis previamente
realizados, por lo que la principal utilidad del Statfolio es repetir un anlisis
sistemticamente sobre distintos conjuntos de datos.


TRABAJAR CON DATOS EN STATGRAPHICS

Los datos que van analizarse mediante Statgraphics pueden introducirse directamente desde
el teclado en la ventana de datos. Los datos pueden agruparse formando una variable (cada
una de las columnas de la hoja de clculo de constituye la ventana de datos).
Para poder analizar una variable (es decir, los datos que contiene) es necesario definirla
realizando las siguientes operaciones:


Seleccionamos la columna en la que queremos introducir los datos. Para ello
clickeamos sobre la etiqueta de la columna (Inicialmente ser Col_1)




Master en Calidad Total Estadstica Manual de Stagraphics 6

Pulsamos con el botn derecho del ratn sobre la columna seleccionada. Aparecer
un men del que seleccionamos la opcin Modify Column:






En esta pantalla escribiremos el nombre de la variable (mximo 32 caracteres, sin
blancos ni signos especiales y utilizando siempre una letra como primer carcter), y
el tipo de variable (numeric si vamos a analizar nmeros). Tras pulsar OK ya
estamos en condiciones de introducir los datos en las distintas celdas que componen
la columna.

A continuacin vemos como se han introducido un conjunto de datos agrupados en
la variable EJEMPLO


Master en Calidad Total Estadstica Manual de Stagraphics 7


Statgraphcis permite introducir columnas calculadas como una transformacin de
otras columnas previamente definidas. Para ello realizaremos las siguientes
operaciones:
1. Seleccionamos la columna donde queremos que aparezcan los datos calculados
2. Clickeamos con el botn derecho del ratn y elegimos la opcin Generate Data
del men que aparece
3. Componemos, en la ventana que aparece, la expresin para el clculo de los
nuevos datos: (en este caso multiplicaremos por 2 la variable EJEMPLO)




Master en Calidad Total Estadstica Manual de Stagraphics 8

Al pulsar OK nos aparecer en la ventana de datos el clculo deseado:




Los ficheros de datos generados pueden almacenarse para anlisis posteriores. Para ello, en
el men FILE seleccionaremos SAVE DATA FILE AS... y elegiremos el nombre y la
ubicacin del archivo deseada. (Podrn recuperarse posteriormente con la opcion OPEN
DATA FILE del men FILE)








UNIVERSIDAD CARLOS III DE MADRID
MASTER EN CALIDAD TOTAL



Master en Calidad Total Estadstica Manual de Stagraphics 9


PRCTICAS DE ESTADSTICA I
MANUAL DE STATGRAPHICS






II. ESTADSTICA DESCRIPTIVA / GRFICOS DE DATOS

Master en Calidad Total Estadstica Manual de Stagraphics 10
La Estadstica Descriptiva se ocupa de presentar, de forma resumida, la informacin ms
importante de un conjunto de datos. Para ello se calculan sus medidas centrales (media,
mediana...) y se da una medida de cmo estn los datos dispersos en torno a esos valores
centrales (varianza, desviacin tpica, rango...). Asimismo, tras un anlisis descriptivo, se
dispondr de una representacin de los datos en forma de grficos, de forma que sea posible
detectar valores atpicos, tendencias o agrupaciones.

Las diferentes opciones de anlisis descriptivo de las que dispone Statgraphics estn
incluidas en la opcin DESCRIBE de la barra de men.

A continuacin se muestran las opciones ms importantes de un anlisis descriptivo de los
datos.

Resumen estadstico

El resumen estadstico (SUMMARY STATISTICS) nos reproduce hasta 19 estadsticos
(valores numricos caractersticos) de un conjunto de datos.

Pare ello, en la pantalla de entrada de datos tendremos que introducir la variable que se
quiere analizar, tal y como aparece a continuacin:







Master en Calidad Total Estadstica Manual de Stagraphics 11
Una vez seleccionada la variable a analizar, debe seleccionarse la opcin de SUMMARY
STATISTICS en el men de TABULAR OPTIONS:



Por defecto, aparecern calculados los estadsticos de uso ms comn, como puede verse en
la figura que sigue:



Sin embargo pueden seleccionarse otros estadsticos que Statgraphics calcula sin ms que
clickear con el botn derecho del ratn sobre el panel de SUMMARY STATISTIS y activar
la opcin de PANE OPTIONS:




Master en Calidad Total Estadstica Manual de Stagraphics 12



Activando la opcin de cualquiera de los estadsticos que estn incluidos en la ventana que
aparece, el resultado de su clculo se mostrar inmediatamente por pantalla al clickear OK.

El SUMMARY STATISTICS puede obtenerse simultneamente para varias variables, sin
ms que entrar en al anlisis mltiple de variables: DESCRIBE...NUMERIC
DATA...MLTIPLE VARIABLE ANLISIS.

Tabla de frecuencias

La tabla de frecuencias nos permite resumir la distribucin de los datos contenidos en una
variable. Al igual que el SUMMARY STATISTICS, la opcin de la tabla de frecuencias
(FREQUENCY TABULATION) se activa en el men de TABULAR OPTIONS del
anlisis descriptivo de una variable. Como resultado del anlisis, Statgraphcis crea una serie
de intervalos que constituyen una particin del rango de los datos estudiados; la tabla nos
dar informacin del nmero de datos que tienen su valor dentro de cada intervalo.



Master en Calidad Total Estadstica Manual de Stagraphics 13
El nmero de observaciones en cada intervalo ser la frecuencia absoluta, mientras que el
porcentaje que esas observaciones representa frente al total se llama frecuencia relativa. (El
programa presenta tambin las frecuencias acumuladas para cada una de los intervalos).
El nmero de intervalos (tambin llamados clases) en los que se divide el rango de los datos
puede modificarse clickeando con el botn derecho del ratn sobre la tabla y seleccionando
la opcin PANE OPTIONS:




La tabla de frecuencias no slo puede aplicarse a datos numricos, sino tambin a variables
cualitativas. As en el fichero cardata.sf se recogen diferentes variables de automviles
junto con el nombre de su fabricante:



Veamos como podemos aplicar la tabla de frecuencias a la variable que contiene el
fabricante del vehculo. Para ello se sigue DESCRIBE...CATEGORICAL DATA...
TABULATION y se selecciona la opcin FREQUENCY TABULATION del men de
Tabular Options. El resultado es el que continuacin se muestra:



Master en Calidad Total Estadstica Manual de Stagraphics 14


Donde obtenemos informacin sumaria de los vehculos que aporta cada fabricante a la
muestra y de su frecuencia de aparicin.

Histograma de frecuencias

Los histogramas de frecuencias son representaciones grficas de las tablas de frecuencias
estudiadas con anterioridad, donde a cada intervalo o clase en que se divide el rango de los
datos, se le asigna una barra cuya altura es proporcional a la frecuencia de aparicin de sus
elementos.

El histograma se encuentra en las opciones grficas del men DESCRIBE... NUMERIC
DATA... ONE VARIABLE ANLISIS, tal y como puede verse en la figura que sigue:



Master en Calidad Total Estadstica Manual de Stagraphics 15
El resultado se muestra en la siguiente pantalla:

Histogram for altura
altura
f
r
e
q
u
e
n
c
y
150 160 170 180 190 200 210
0
10
20
30
40
50
60


Donde podemos ver que el histograma presenta informacin sobre la variable analizada. En
los datos analizados, la altura ms frecuente entre los individuos analizados est entre 172 y
182 cms.

Percentiles

Los percentiles de una variable proporcionan informacin sobre como estn distribuidos los
datos estudiados. El percentil de orden k de una distribucin es una valor que es mayor que
el k% de los valores que toma la variable. As el percentil 10 es aquel valor de los datos
estudiados que es mayor que el 10% de las observaciones. Son importantes los percentiles
25 (cuartil inferior), 50 (mediana) y 75 (cuartil superior). Los percetiles pueden obtenerse
en la opcin Tabular options del men DESCRIBE... NUMERIC DATA... ONE
VARIABLE ANALYSIS.





Master en Calidad Total Estadstica Manual de Stagraphics 16
El resultado es el siguiente:

Percentiles for altura
1.0% = 156.0
5.0% = 161.0
10.0% = 163.0
25.0% = 169.0
50.0% = 176.0
75.0% = 180.0
90.0% = 186.0
95.0% = 190.0
99.0% = 193.0
The StatAdvisor
---------------
This pane shows sample percentiles for altura. The percentiles are
values below which specific percentages of the data are found. You
can see the percentiles graphically by selecting Quantile Plot from
the list of Graphical Options.


Diagrama de la caja

El diagrama de la caja es una representacin grfica de una variable en la que a partir de sus
percentiles se obtiene informacin sobre la distribucin de sus observaciones
(concentracin o dispersin de los datos o existencia de valores atpicos).
El diagrama de la caja se construye a partir de los percentiles 25%, 50% (mediana) y 75 %.
Como medida de la dispersin se utiliza el rango intercuartlico (percentil 75 % - percentil
25%) de manera que cualquier dato que se aleje de los percentiles 25 75% una distancia
superior a 1,5 veces el rango intercuartlico se considera atpico.
Para obtener el diagrama de la caja de una variable se sigue la ruta
DESCRIBE...NUMERIC DATA... ONE VARIABLE ANLISIS...y se selecciona BOX
AND WHISKER PLOT en el men de opciones grficas.


El resultado es el siguiente:

Master en Calidad Total Estadstica Manual de Stagraphics 17

Box-and-Whisker Plot
altura
150 160 170 180 190 200


En el diagrama se debe observar: la forma de los rectngulos que forman la caja (cuanto
ms estrechos sean, indicarn una mayor concentracin de datos); la posicin de la media,
marcada con una cruz, respecto de la mediana, lnea central de la caja (la coincidencia de
ambas indica simetra de la distribucin), y la existencia de valores ticos (quedan fuera de
los segmentos de longitud 1,5 veces el rango intercuartlico colocados a derecha a
izquierda).

En ocasiones puede ser til observar simultneamente dos diagramas de la caja: por
ejemplo para la variable altura en la que se separan los valores de las observaciones en
funcin del diferente sexo de los individuos. Esta opcin est disponible en el men
COMPARE...TWO SAMPLES...TWO SAMPLES COMPARISSON, seleccionando en la
ventana que aparece de acuerdo con la disposicin de nuestros datos.



El resultado obtenido (tras seleccionar la opcin de BOX AND WHISKER PLOT en el
Graphical Options) es el siguiente:

Master en Calidad Total Estadstica Manual de Stagraphics 18
Box-and-Whisker Plot
150 160 170 180 190 200
altura
sexo=0
sexo=1


De forma que es posible analizar simultneamente una variable discriminada segn el
criterio de seleccin.
(Esta misma representacin simultanea de grficos tambin est disponible cuando se
quiera observar el histograma de una variable).

Diagrama de tarta o grfico de sectores

El diagrama de tarta (Piechart) proporciona informacin sobre las categoras en que puede
dividirse una variable (y la importancia relativa de las mismas)

Para ensayara su aplicacin utilizaremos el fichero cardata.sf que contiene datos de
diferentes automviles fabricados en el mundo. Siguiendo el men
DESCRIBE...CATEGORICAL DATA... TABULATION



y activamos la opcin de PIECHART en el men del Graphical options veremos el
diagrama de sectores que nos dar la distribucin de las diferentes categoras en que puede
dividirse la variable make (que contiene marcas de coches) cuando la variable origin toma
el valor 3 (lo que equivale a estudiar nicamente coches fabricados en J apn)




Master en Calidad Total Estadstica Manual de Stagraphics 19
Piechart for make
make
Acura
Geo
Honda
Hyundai
Isuzu
Mazda
Mitsubishi
Nissan
Subaru
Suzuki
Toyota
Yugo
3.03%
6.06%
3.03%
3.03%
3.03%
9.09%
15.15%
21.21%
9.09%
3.03%
21.21%
3.03%


De modo que es posible analizar grficamente la importancia relativa de los fabricantes de
coches radicados en J apn.

Diagrama de barras

Mediante esta grfico es posible obtener informacin sobre las diferentes categoras en que
pude dividirse una variable.
As por ejemplo en el fichero cardata.sf podemos analizar los coches fabricados en
Amrica (origin = 1), en Europa (origin =2) o en J apn (origin=3) sin ms que hacer
DESCRIBE....CATEGORICAL DATA..TABULATION



Y seleccionar la opcin BARCHART del Graphical Options


Master en Calidad Total Estadstica Manual de Stagraphics 20
Barchart for origin
p
e
r
c
e
n
t
a
g
e
0
10
20
30
40
50
1 2 3



La representacin de grfico de barras permite cruzar dos variables y analizar por ejemplo
el nmero de cilindros del automvil (variable cylinder) segn su origen (variable origin).
Para ello seleccionamos el men DESCRIBE...CATEGORICAL DATA...
CROSSTABULATION.



Activando la opcin de BARTCHART del Graphical Options, se obtiene:




Master en Calidad Total Estadstica Manual de Stagraphics 21
cylinders
p
e
r
c
e
n
t
a
g
e
Barchart for cylinders by origin
origin
1
2
3
0
5
10
15
20
25
30
3 4 5 6 8


Lo que nos permite hacer un anlisis de las dos variables: por ejemplo puede verse que
coches con 8 cilindros slo son fabricados en Amrica.

Grficos de dispersin o Scatterplots

Los grficos de dispersin proporcionan informacin acerca de la distribucin de una
variable. Son especialmente tiles los grficos XY, pues permiten analizar la relacin entre
dos variables

Para visualizarlos se sigue el men PLOT...SCATTER PLOT...X-YPLOT



Como resultado obtenemos en diagrama que nos permite ver la distribucin conjunta de
ambas variables, y por tanto su relacin lineal, en la que al aumentar la altura de una
persona tambin lo har su peso. (Como puede verse, tambin est permitida la seleccin de
valores de las variables mediante una variable de seleccin, en el caso estudiado sexo)




Master en Calidad Total Estadstica Manual de Stagraphics 22
Plot of altura vs peso
peso
a
l
t
u
r
a
41 61 81 101 121
150
160
170
180
190
200

También podría gustarte