Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin:
El paquete SAS (Statistical Analysis System) es un sistema de programas para el
anlisis de datos. Consiste de un conjunto de mdulos capaces de entregar
resultados de diferentes procesos como regresin, anlisis de varianza, estadstica
bsica, distribucin de frecuencias, procedimientos multivariados y muchos mas.
Para entrar al paquete SAS bajo MSDOS se deben de teclear las siguientes
ordenes:
CD\
CD SAS
SAS
Para salir del paquete SAS bajo MSDOS se escribe BYE despus de la orden
COMMAND ==> BYE. Tambin puede salir del SAS si escribe ENDSAS
Las teclas de funciones son ordenes pre-programadas para el manejo del paquete
SAS.
A continuacin se indican las ms importantes para el SAS bajo MSDOS:
F1 AYUDA
F2 Teclado programado de funciones.
F3 Ventana de mensajes de compilacin (LOG)
F4 Ventana de salida de resultados (OUTPUT)
F5 Siguiente ventana (NEXT)
Los comando en SAS son ordenes pre-definidas con una accin en particular, se
escriben despus del indicador de Command ==>. En caso de que el cursor no se
encuentre junto a Command ==> presione la tecla de INICIO (HOME).
Algunos de los comandos ms comunes son:
HELP.- Ayuda
END.- Cierra la ventana activa con excepto las de OUTPUT, LOG, EDIT.
TOP.- Manda el cursor a la parte ms alta de la ventana activa (primer rengln).
BOTTOM.- Manda el cursor a la parte ms baja de la ventana activa (ltimo
rengln)
BYE.- Salida del paquete SAS. Tambin se puede usar el
comando ENDSAS para salir del SAS.
FILE "RUTA:NOMBRE.EXT".- Almacena el contenido de una ventana en
disco duro o flexible. Para este comando se recomienda utilizar diferentes
extensiones para el almacenamiento de datos. Estas extensiones son:
Para la ventana de OUTPUT extensin TXT
Para la ventana de LOG extensin LOG
Para la ventana del editor extensin SAS
Por ejemplo:
FILE "A:DATOS.SAS"
En el ejemplo se almacena en la ventana del editor el programa datos en el disco
flexible unidad A.
Por ejemplo:
INCLUDE "A:DATOS.SAS"
En el ejemplo se llama el archivo DATOS.SAS de la unidad A para ser agregado
en la ventana activa.
Algo muy comn en SAS es eliminar los saltos de pgina que automticamente
SAS asigna en la salida de resultados esto se puede hacer:
CHANGE " " " " ALL Cambia el smbolo por un espacio en blanco en el editor
de programas.
SAS bajo UNIX es un sistema que trabaja en Windows 95 / 98 en el modo de XWin 32.
Para entrar al paquete se selecciona INICIO, PROGRAMAS Y X-Win32 como lo
indica la siguiente figura:
EDIT
VIEW
GLOBALS
Dentro del men de Globals aparecen diferentes ordenes, algunas de estas son:
Program editor (Editor de programas) llama la ventana del editor de
programas. El Program editor es el lugar donde se escriben los programas.
Log llama la ventana de log. Log es el lugar donde se ven si existen o no errores
en la sintaxis de las instrucciones en el momento que se estn ejecutando.
Output (Salida) llama la ventana donde salen los resultados de los programas o
las salidas de los anlisis.
Graph (Grfica) lugar donde saldrn las grficas del SAS.
La figura siguiente muestra el men de Globals
HELP
What's New.- Muestra las cosas nuevas que tiene SAS con respecto a la versin
anterior.
About... .- Muestra informacin referente el paquete SAS para X-Win 32.
F1 AYUDA (Help)
F2 Teclado programado de funciones. (Keys)
F3 Ejecutar
F4 Ventana del editor de programas o llamado del programa al editor.
(PGM; RECALL)
F5 Siguiente bsqueda (rfind)
F6 Siguiente cambio(rchange)
F7 Atrs (backward)
F8 Adelante (forward).
F10 Izquierda (left)
F11 Derecha (right)
Editor SAS
El Programa SAS bajo MSDOS tiene un editor donde se pueden escribir los
programas.
El PROGRAM EDITOR muestra una ventana con:
COMMAND ==>
ORDENES
00001 INSTRUCCIONES
00002
00003
Agregar (I)
I Agrega lnea(s) en blanco.
Por ejemplo: se tienen las siguientes lneas:
00001 DATA S;
00002 CARDS;
00003 23 45 67 87
Se desea agregar un espacio entre las lneas 00001 y 00002. Para realizar la
insercin se coloca el cursor sobre la primera columna de la lnea 00001, se
teclea I y se presiona la tecla de ENTER.
I 001 DATA S;
00002 CARDS;
00003 23 45 67 87
Se observa que se agreg una lnea despus de la 00001 y los renglones que le
seguan se recorrieron en la numeracin.
NOTA: Se pueden insertar n lneas que no sean mltiplos de 10, esto es, 1 o 5 o 9 o 29 o 39 pero no 10 ni
20, , etc.
Borrar (D)
D Borra lnea(s) desde donde se indique la orden.
Para borrar una lnea del editor se utiliza la orden D. Por ejemplo:
Se desea borrar la lnea 00002 del editor de programas.
Para efectuar estos cambios es necesario colocar el cursor sobre la primera
columna de la lnea 00002, escribir la letra D y presionar ENTER ( ).
00001 DATA S;
D 002
00003 CARDS;
00004
00005
00006
00007 23 45 67 87
El editor del SAS responder con:
00001 DATA S;
00002 CARDS;
00003
00004
00005
00006 23 45 67 87
Si se desean borrar ms de una lnea esto se pueden hacer con la rden Dn donde
n es el nmero de lneas a borrar y no deben ser mltiplos de 10.
Por ejemplo:
Se desean borrar 3 lneas despus de la indicada con el nmero 00003 del
ejemplo anterior. Para efectuar esto se hace:
00001 DATA S;
00002 CARDS;
D3 03
00004
00005
00006 23 45 67 87
Otra forma de borrar lneas es al travs del comando DD. Con DD puede indicar
el principio y el fin de un bloque que desea borrar. Por ejemplo:
1. Se desea borrar un bloque de lneas de la 00002 a la 00005. Para efectuar
esto se hace:
2. Se coloca el cursor sobre la lnea 00002 primera columna.
3. Se escribe DD y se presiona ENTER ( ).
00004
B CARDS;
El resultado de esta operacin es:
00001 DATA S;
00002 CARDS;
00003 23 45 67 87
00004
00005 DATA S;
00006 CARDS;
00007 23 45 67 87
00008 CARDS;
Instrucciones bsicas
OPTIONS
DATA
INPUT
La instruccin INPUT se usa para indicar las variables que sern utilizadas para
el anlisis de datos. El formato de la Instruccin INPUT es el siguiente:
INPUT variable(s) [@@];
Las variables pueden ser numricas o alfanumricas ($) separadas por un espacio
en blanco.
Por ejemplo:
INPUT MERCADO $ X Y;
El ejemplo anterior muestra que la variable MERCADO es de tipo alfanumrica
y acepta letras y nmeros; X y Y son variables de tipo numricas.
Si se utiliza @@ los datos pueden introducirse en forma horizontal por ejemplo:
INPUT MERCADO $ X Y @@;
Si se utiliza @ los datos pueden introducirse desde un archivo externo en forma
de tabla.
CARDS
Por ejemplo:
options ls=72 ps=60 nodate;
data s;
input x @@;
cards;
23 34 25 27 23 29 29 43 28 33 31 32 31 23 29
25 28 35 38 39 42 41 40 29 31 25 29 27 28 33
27 29 32 33 39 43 41 45 29 39 33 32 34 37 34
35 28 33 33 38 37 36 42 39 41 32 34 39 41 33
37 29 33 28 27 22 29 34 43 37 22 28 29 45 37
40 28 33 30 30 23 30 34 45 31 33 29 33 45 28
En el ejemplo anterior con options se indica que se utilizaran 72 columnas, 60
renglones y que no se quiere la fecha; en data se indica que el conjunto universal
se llama s; en input se indica que la variable x tomara valores en forma de tabla
utilizando la orden cards; despus cards indica que se escribirn los valores con
al menos un espacio.
INFILE
Por ejemplo:
options ls=72 ps=60 nodate;
data s;
infile "edades.dat";
input x @;
Ciclos iterativos DO
end;
cards;
8 10 12 13 11
2 6 7 11 5
4 10 9 8 10
3 5 9 10 6
97553
donde la variable trat tomar valores desde 1 hasta 5, bloq desde 1 hasta 5, y en
total se tomarn 25 observaciones quedando los valores:
trat
1
1
1
1
1
...
...
5
bloq
1
2
3
4
5
obs
8
10
12
13
11
Procedimientos
Procedimiento PRINT
Procedimiento FREQ
Procedimiento MEANS
Procedimiento SORT
En caso de que se desee el orden ascendente agregue lo que esta entre corchetes.
Por ejemplo:
PROC SORT;
BY DESCENDIG tamaos;
Procedimiento CHART
VBAR variables;
HBAR variables:
BLOCK variables;
PIE variables;
STAR variables;
Nota: si se quiere sacar una grfica de pastel (PIE) debe escribir en el programa:
Options ls=72 ps=60;
Esto se hace por que la grfica de pastel no cabe en la salida por defecto de SAS.
Procedimiento PLOT
Otros Procedimientos
REG se usa para el modelo de regresin lineal simple, lineal mltiple y no lineal.
ANOVA es un procedimiento para hacer anlisis de varianza de los datos.
CORR procedimiento para calcular la correlacin entre datos.
GLM Modelo general lineal (General Lineal Model), con este procedimiento se
pueden hacer anlisis de varianza para diferentes modelos lineales como
regresin lineal simple, regresin lineal mltiple, diseos completamente al azar,
bloques al azar, cuadro latino, contrastes ortogonales, factoriales, entre otros ms.
Programas de SAS
Los datos son capturados en un procesador de texto (EDIT del MSDOS o en otro
procesador). y almacenado con el nombre edades.dat como solo texto con saltos
de lnea o en cdigo ASCII para que SAS pueda leerlo.
El programa en SAS es el siguiente:
optionsls=72ps=60nodate;
datas;
infile"edades.dat";
inputx@;
procprint;
procfreq;
procmeans;
procchart;
vbarx;
run;
Note que la orden INFILE esta colocada antes de INPUT y que los datos deben
tener el orden como si se metieran con la orden CARDS.
63
52
78
49
71
62
68
48
56
67
Estatura (Y)
162
158
167
151
162
168
167
153
152
173
datas;
inputxy;
cards;
63162
52158
78167
49151
71162
62168
68167
48153
56152
67173
proccorrcov;
run;
0.9 2
0.9 3
0.9 4
0.9 5
0.9 6
0.9 7
0.9 8
proc print;
run;
-3 3
-2 2
-1 1
-2.3 3.4
proc print;
run;
Programa 9 Distribucin T
1 1
1.761 14
2.042 30
proc print;
run;
Programa 10 Distribucin F
data s;
input valor n m;
y=1-probf(valor,n,m);
cards;
3.3200 2 30
3.0556 4 15
proc print;
run;
63
52
78
49
71
62
68
48
56
67
Estatura (Y)
162
158
167
151
162
168
167
153
152
173
*EjemplotomadodellibrodeMtodosEstadsticos,Cap.12.SaidInfanteGilyGuillermoZaratede
Lara.EditorialTrillas.
49151
71162
62168
68167
48153
56152
67173
procplot;
ploty*x;
procreg;
modely=x;
run;
Y1
Y2
Y3
110.9
106.5
105.9
114.3
109.6
117.4
121.2
118.7
136.3
134.2
129.3
159.4
142.8
137.8
176.1
148.9
147.4
195.8
169.1
153.9
217.7
183.8
165.1
241.8
195.2
175.9
275.2
10
214.7
186.6
306.7
11
221.8
188.0
335.5
12
241.2
198.1
371.4
13
247.1
208.2
409.6
14
284.5
214.6
448.6
15
309.8
221.9
455.4
*EjemplotomadodellibrodeMtodosEstadsticos,Cap.3.SaidInfanteGilyGuillermoZaratede
Lara.EditorialTrillas.datas
data s;
input x y1 y2 y3;
cards;
1
110.9
106.5
105.9
114.3
109.6
117.4
121.2
118.7
136.3
134.2
129.3
159.4
142.8
137.8
176.1
148.9
147.4
195.8
169.1
153.9
217.7
183.8
165.1
241.8
195.2
175.9
275.2
10
214.7
186.6
306.7
11
221.8
188.0
335.5
12
241.2
198.1
371.4
13
247.1
208.2
409.6
14
284.5
214.6
448.6
15
309.8
221.9
455.4
proc reg;
model x=y1 y2 y3;
run;
Programa 13 Diseo Bsico
datas;
inputobs@@;
cards;
686978867369806759687066697277
procglm;
modelobs=;
run;
Tratamiento 1
Tratamiento 2
Tratamiento 3
Tratamiento 4
(marca 1)
(marca 2)
(marca 3)
(marca 4)
63
60
59
70
68
65
66
69
71
61
58
62
59
71
70
69
70
66
*EjemplotomadodellibrodeMtodosEstadsticos,Cap.11.SaidInfanteGilyGuillermoZaratede
Lara.EditorialTrillas.
*Enunexperimentosequierencompararlascapacidadesdereproduccinde
frecuenciasbajasde4recubrimientosdecintamagnticaysevana
efectuar5observacionesdecadauno.Sepretendeutilizar5diferentes
grabadorasparaelexperimento,utilizandocadagrabadoracomounbloque
enelqueseprobaranlos4tratamientos.Elpropsitodelexperimentono
escompararlasgrabadorassinocompararloscuatrorecubrimientos.
Bloque
Tratamiento
Tratamiento
Tratamiento
Tratamiento
(grabadora)
20
10
30
22
30
20
39
26
32
19
37
27
18
26
23
26
18
29
20
*EjemplotomadodellibrodeMtodosEstadsticos,Cap.11.SaidInfanteGilyGuillermoZaratede
Lara.EditorialTrillas.
datas;
inputbloqtratobs;
cards;
1120
1210
1330
1422
2130
2220
2339
2426
3132
3219
3337
3427
4118
429
4326
4423
5126
5218
5329
5420
procglm;
classesbloqtrat;
modelobs=bloqtrat;
run;
4IIA4.5
5IIE2.4
6IIC5.8
1IIIC9.6
2IIIE3.7
3IIIF2.7
4IIIB3.7
5IIID6.0
6IIIA7.0
1IVD10.5
2IVC10.2
3IVB4.6
4IVE3.7
5IVA5.1
6IVF3.8
1VE3.1
2VA7.2
3VC4.0
4VF3.3
5VB3.5
6VD5.0
1VIA5.9
2VID7.6
3VIE0.7
4VIC3.0
5VIF4.0
6VIB8.6
procglm;
classeshileracolumnatrat;
MODELdato=hileracolumnatrat;
MEANStrat/alpha=0.05tukey;
run;
Bloq\Trat
A B
G H
16
14
10
12
19
16
11
19
24
14
12
22
13
11
19
14
19
13
A: Tratamiento testigo
B, C: Fungicidas mercricos
D, H: Fungicidas no mercricos producidos por la compaa I
E, F, G: Fungicidas no mercricos producidos por la compaa II. F y G son
nuevas formulaciones de E.
OBS
I
II
III
IV
II
III
IV
645
667
670
787
II
II
752
637
655
576
III
III
642
627
686
575
IV
IV
621
762
596
660
datas;
*Lasvariablestratrepresentatratamientos,nyplosdiferentes
niveles
inputhilerascolumtratnpobs;
cards;
II401645
III311667
IIII210670
IIV100787
III100752
IIII210637
IIIII311655
IIIV401576
IIII311642
IIIII401627
IIIIII100686
IIIIV210575
IVI210621
IVII100762
IVIII401596
IVIV311660
PROCPRINT;
*sehaceelclculodelanlisisdevarianzadeldiseocuadrolatino
PROCGLM;
CLASSEShilerascolumtrat;
MODELobs=hilerascolumtrat;
run;
*sehaceelclculousandofactoriales
*eldiseoanteriorserespetasoloenelmodeloseponenlos
*diferentesnivelesdepynysusinteracciones.
procglm;
classeshilerascolumtrat;
modelobs=npn*p;
run;
Cabeza
Mquina A
Mquina B
Mquina C
Mquina D
Mquina E
10
11
12
13
10
11
10
10
10
De la tabla:
Mquinas i= 1,..., 5
Cabezas j= 1 ,...,4
Repeticiones k=1 ,...,4
El ejemplo anterior se puede analizar como un Diseo Jerrquico , ya que
cabezas estn anidadas dentro de mquinas.
datas;
inputcabezamaq$obs;
cards;
1A6
1A2
1A0
1A8
1B10
1B9
1B7
1B12
1C0
1C0
1C5
1C5
1D11
1D0
1D6
1D4
1E1
1E4
1E7
1E9
2A13
2A3
2A9
2A8
2B2
2B1
2B1
2B10
2C10
2C11
2C6
2C7
2D5
2D10
2D8
2D3
2E6
2E7
2E0
2E3
3A1
3A10
3A0
3A6
3B4
3B1
3B7
3B9
3C8
3C5
3C0
3C7
3D1
3D8
3D9
3D4
3E3
3E0
3E2
3E2
4A7
4A4
4A7
4A9
4B0
4B3
4B4
4B1
4C7
4C2
4C5
4C4
4D0
4D8
4D6
4D5
4E3
4E7
4E4
4E0
procprint;
PROCGLM;
CLASSmaqcabeza;
modelobs=maq|cabeza;
run;
PROCGLM;
CLASSmaqcabeza;
modelobs=maqmaq(cabeza);
run;
procsort;bymaq;
PROCGLM;
CLASSmaqcabeza;
modelobs=maqmaq(cabeza)/alpha=.1;
bymaq;
run;