Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Practicas Estadística y Programación en SAS
Practicas Estadística y Programación en SAS
Practicas Estadística y Programación en SAS
Prcticas de estadstica y
programacin en SAS
1.
ndice
1.
ndice.................................................................................................................3
2.
Presentacin .....................................................................................................4
3.
Manipulacin de datos....................................................................................5
3.1.
3.1.1.
3.2.
3.2.1.
3.3.
3.3.1.
3.4.
3.4.1.
3.5.
3.5.1.
3.6.
3.6.1.
4.
Estadstica descriptiva...................................................................................22
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
5.
5.1.
5.2.
5.3.
5.4.
5.5.
5.6.
5.7.
5.8.
6.
6.1.
7.
7.1.
7.2.
8.
Los datos.........................................................................................................62
9.
Bibliografa .....................................................................................................63
3
2.
Presentacin
Los ficheros de datos as como los ficheros con las sintaxis pueden encontrarse en la pgina
web del Servei dEstadstica de la Universidad Autnoma de Barcelona, en la seccin de
Materiales.
3.
Manipulacin de datos
3.1.
1.
2.
3.
Sexo
Hombre
Mujer
Hombre
Hombre
Mujer
Hombre
Mujer
Mujer
Mujer
Hombre
Crear una variable nueva que contenga el salario anual en pesetas y otra variable
categrica para el salario con 4 categoras.
Aadir los datos para 3 individuos ms contenidos en la siguiente tabla:
Id
11
12
13
4.
Etiqueta
Joan
Slvia
Josep
Pere
Anna
David
Cristina
Marta
Magda
Carles
Etiqueta
Oriol
Ester
Rosa
Sexo
Hombre
Mujer
Mujer
Crear otro archivo SAS (socecon) con las caractersticas edad, nivel de estudios,
tipo de transporte para llegar al trabajo y tiempo de recorrido desde la vivienda
habitual hasta el trabajo (en minutos) que aparecen en la siguiente tabla:
Id
1
2
3
4
5
6
7
8
9
10
11
12
13
Edad
27
20
35
30
25
37
35
23
21
28
29
32
40
Nivel estudios
Transporte
Est. superiores
Bus
FP II o equiv.
Metro
FP II o equiv. Coche part.
Est. Superiores Coche part.
Est. Medios
Moto
Est. Medios
Bus
Est. Superiores
Bus
Est. medios.
Moto
FP II o equiv.
Moto
Est. medios
Metro
Est. Medios Coche part.
FP II o equiv.
Metro
Est. superiores
Bus
Tiempo
15
20
55
45
30
35
15
10
7
25
50
35
35
5.
6.
Fusionar los dos archivos anteriores y crear un archivo de SAS llamado ejemplo1
Asignar de forma aleatoria los individuos en dos grupos para poder realizar un
experimento de comparacin de medios de transporte
10 28 Gr_medio Metro 25
11 29 Gr_medio Coche 50
12 32 FPII Metro 35
13 40 Est_sup Bus 35
;
RUN;
DATA ejemplo1;
MERGE ej1salca socecon;
BY id;
RUN;
* asignacion aleatoria en dos grupos;
DATA ej12g;
SET ejemplo1;
grupo = RANBIN(0,1,0.5);
RUN;
3.2.
in
California,
1850-1900,
Los datos han sido obtenidos en la pgina web del National Archive of Criminal Justice Data de
los EUA (http://www.icpsr.umich.edu/NACJD/). Se dispone de variables referentes a
1.317 homicidios producidos en California durante los aos 1850 hasta 1900. Se obtuvieron
datos sobre el lugar, causa del crimen y arma utilizada as como la relacin entre raza, sexo,
edad y ocupacin de la vctima y el acusado.
2 HISPANIC
3 NATIVE AMERICAN
4 ORIENTAL
5 AFRICAN-AMERICAN
9 UNKNOWN
Sexo de la vctima (VICSEX)
Variable categrica
1 MALE
2 FEMALE
9 UNKNOWN
Edad de la vctima (VICAGE)
Variable cuantitativa
Ocupacin de la vctima (VICOCCUP)
Variable categrica
1 LABORER
2 FARMER
3 RANCHER
4 MERCHANT
5 COWBOY
6 SHEEP HERDER
7 SOLDIER
8 SAILOR
9 BARTENDER
10 LAWMAN
12 HOUSEWIFE
13 PROSTITUTE
14 LAWYER
15 COOK
16 BUTCHER
17 TEAMSTER
18 RR WORKER
19 MINER
20 HOTEL KEEPER
21 BAR OWNER
22 CLERICAL
23 TEACHER
24 TRANSIENT
25 FISHERMAN
26 NURSE
27 STUDENT
28 DOMESTIC
29 DRUGGIST
30 DOCTOR
31 STORE CLERK
32 BAKER
33 BARBER
34 WAITER
35 LAUNDRY
36 MUSICIAN
37 DENTIST
38 SHOEMAKER
39 MECHANIC
40 BLACKSMITH
41 CARPENTER
42 PREACHER
44 HARNESS MAKER
45 GARDENER
46 SALESMAN
47 TAILOR
48 STEAMBOAT RUNNER
49 DISHWASHER
50 PORTER
51 LEGISLATOR
52 RANCH/FARM HAND
53 OTHER TRADESMAN
54 BOAT HAND
55 GAMBLER
56 PIMP
57 MINISTER
58 EDITOR/PUBLISHER
59 PEDDLER
60 PRISON INMATE
61 WATCHMAN
62 BOOKKEEPER
63 WELLS FARGO GRD
64 ASYLUM INMATE
65 JUDGE/JUSTICE
66 SEAMSTRESS
99 UNKNOWN
Estado de la vctima (VICCOND)
Variable categrica
1 DRINKING
2 OTHER DRUGS
3 CALM
4 AGITATED
5 OTHER
9 UNKNOWN
Raza del acusado (ACCURACE)
Variable categrica
1 WHITE
2 HISPANIC
3 NATIVE AMERICAN
4 ORIENTAL
5 AFRICAN-AMERICAN
9 UNKNOWN
Sexo del acusado (ACCUSEX)
Variable categrica
1 MALE
2 FEMALE
9 UNKNOWN
Edad del acusado (ACCUAGE)
Variable cuantitativa
Ocupacin del acusado (ACCUOCCU)
Variable categrica
1 LABORER
2 FARMER
3
4
5
6
7
8
9
10
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
RANCHER
MERCHANT
COWBOY
SHEEP HERDER
SOLDIER
SAILOR
BARTENDER
LAWMAN
HOUSEWIFE
PROSTITUTE
LAWYER
COOK
BUTCHER
TEAMSTER
RR WORKER
MINER
HOTEL KEEPER
BAR OWNER
CLERICAL
TEACHER
TRANSIENT
FISHERMAN
NURSE
STUDENT
DOMESTIC
DRUGGIST
DOCTOR
STORE CLERK
BAKER
BARBER
WAITER
LAUNDRY
MUSICIAN
DENTIST
SHOEMAKER
MECHANIC
BLACKSMITH
CARPENTER
PREACHER
HARNESS MAKER
GARDENER
SALESMAN
TAILOR
STEAMBOAT RUNNER
DISHWASHER
PORTER
LEGISLATOR
RANCH/FARM HAND
OTHER TRADESMAN
BOAT HAND
GAMBLER
PIMP
MINISTER
EDITOR/PUBLISHER
PEDDLER
PRISON INMATE
WATCHMAN
BOOKKEEPER
WELLS FARGO GRD
ASYLUM INMATE
JUDGE/JUSTICE
SEAMSTRESS
10
99 UNKNOWN
Estado del acusado (ACCUCOND)
Variable categrica
1 DRINKING
2 OTHER DRUGS
3 CALM
4 AGITATED
5 OTHER
9 UNKNOWN
Relacin vctima-acusado (RELATION)
Variable categrica
1 MARRIED
2 IN-LAWS
3 FRIENDS
4 STRANGERS
5 ROOMMATES
8 OTHER
9 UNKNOWN
Causa del homicidio (CAUSE)
Variable categrica
1 DOMESTIC DISPUTE
2 QUARREL
3 BRAWL
4 LYNCH MOB
5 KILLED BY POLICE
6 KILLED POLICE
7 ROBBERY
8 OTHER
9 UNKNOWN
Arma utilizada (WEAPON)
Variable categrica
1 HAND GUN
2 RIFLE
3 SHOTGUN
4 GUN UNKNOWN
5 KNIFE
6 AXE
7 HANGING
8 FIRE
9 FALL
10 STRANGLED
11 FISTS
12 BLUNT INSTRUMENT
13 POISON
14 THROWN DOWN
15 SHARP INSTRUMENT
16 DRUGS
17 KICKED
18 DROWNED
99 UNKNOWN
Lugar del homicidio (LOCATION)
Variable categrica
1 VICTIM'S HOME
2 STREET
3 SALOON
4 WORK
5 RANCH
6 FARM
7 COUNTRY ROAD
8 DESERT
9 JAIL
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
99
WOODS
HOTEL
WHARF
SHIP
RAILROAD
BEACH
MOUNTAINS
RIVER
OCEAN
INDIAN RESERVE
ACCUSED HOME
CEMETARY
CHURCH
MISSION
COURTHOUSE
HOSPITAL
MILITARY FORT
BANK
SAW MILL
STORE
LAKE
HOSPITAL
MINE
BRIDGE
BROTHEL
CEMETARY
RESTAURANT
PRISON
ROOMING HOUSE
PARK
OTHER HOUSE
STATE BUILDING
BLACKSMITH SHOP
OTHER BUSINESS
STABLE OR CORRAL
STAGE/RR STATION
DANCE HALL
OTHER BUILDING
CABIN (RURAL)
ASYLUM
UNKNOWN
11
12
13
3.3.
En la siguiente tabla se muestra la reparticin (en porcentajes) de los gastos publicitarios segn
el medio de comunicacin de 16 pases de Europa. Los datos corresponden al ao 1990 y se
extrajeron de la revista Press Landscape update & Eur. Direct Marketing NTC, 1991.
Belgium
Denmark
France
Germany
Greece
Ireland
Italy
Netherlands
Portugal
Spain
U.K.
Austria
Finland
Norway
Sweden
Switzerland
Newspapers
Magazines
TV
Radio
Cinema
Outdoor/Transport
35.3
76.1
28.6
46.0
26.0
63.7
27.8
50.4
25.1
37.6
44.1
51.6
67.2
77.2
78.6
61.1
20.5
11.8
27.5
27.9
28.2
5.4
24.0
27.8
21.7
15.4
19.3
18.0
13.5
15.8
14.3
16.8
27.5
9.6
24.8
15.8
35.3
19.6
43.02
9.0
37.1
31.3
30.5
17.7
12.9
2.5
2.2
6.7
1.2
0.8
6.6
5.1
5.7
6.2
1.4
2.2
6.7
10.3
2.2
8.0
4.0
1.0
0.0
1.7
1.4
0.4
0.8
1.2
0.0
0.0
0.0
0.3
0.0
0.8
0.5
0.4
0.1
1.2
0.6
0.9
14.2
1.3
11.7
3.9
4.8
5.1
3.6
10.4
9.5
4.7
3.4
4.4
2.3
2.2
4.3
12.7
14
15
3.4.
Peso de bebs
El archivo PesoBebes.sav contiene informacin de 189 nacimientos, siendo el peso del beb al
nacer la variable principal.
1. Abrir el archivo con SPSS y exportarlo a SAS.
2. Editar las etiquetas de las variables y sus valores.
3. Se considera que un peso inferior a 2500 gramos es demasiado pequeo, pudiendo
afectar problemas en el recin nacido. Crear la variable binaria que discrimine a los
bebs segn este factor de riesgo.
16
17
3.5.
Caparazn Palletoida
18
19
3.6.
Una determinada fbrica desea conocer la mejor manera de producir un tipo de plstico. Para
ello, realizan un experimento controlado, tomando como variables experimentales:
Nivel de extrusin. 2 niveles (bajo o alto).
Cantidad de aditivo. 2 niveles (bajo o alto).
Creen que una variacin en los niveles de estos factores afecta a las caractersticas del plstico
finalmente fabricado. Concretamente, estn interesados en estudiar la resistencia a la ruptura, el
brillo y la opacidad de los plsticos generados (valorados en una escala de 0 a 10). Su objetivo
es fabricar un tipo de plstico con los mximos valores de estos parmetros. Para resolver esta
cuestin, realizan un experimento factorial 22, con cuatro rplicas para cada condicin
experimental. Los datos recogidos son los siguientes:
Nivel de extrusin
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
Cantidad de aditivo
1
1
1
1
1
2
2
2
2
2
1
1
1
1
1
2
2
2
2
2
Resistencia a la ruptura
6.5
6.2
5.8
6.5
6.5
6.9
7.2
6.9
6.1
6.3
6.7
6.6
7.2
7.1
6.8
7.1
7.0
7.2
7.5
7.6
Brillo
9.5
9.9
9.6
9.6
9.2
9.1
10.0
9.9
9.5
9.4
9.1
9.3
8.3
8.4
8.5
9.2
8.8
9.7
10.1
9.2
Opacidad
4.4
6.4
3.0
4.1
.8
5.7
2.0
3.9
1.9
5.7
2.8
4.1
3.8
1.6
3.4
8.4
5.2
6.9
2.7
1.9
1. Importar los datos del archivo ExperimentoPlastico.sav a un archivo editable con SAS.
2. Revisar la importacin de etiquetas.
20
21
4.
Estadstica descriptiva
4.1.
1.
2.
Comparar la variable salario para las dos submuestras que define la variable sexo
Antes de realizar un PROC UNIVARIATE para distintas submuestras los datos deben estar
ordenados segn la variable que define las submuestras
PROC SORT DATA=ej12g;
BY sexo;
RUN;
PROC UNIVARIATE DATA=ej12g;
CLASS sexo;
VAR salario;
RUN;
22
23
3.
4.
Resumir mediante una tabla de dos entradas las variables nivel de estudios y sexo
PROC FREQ DATA=ej12g;
TABLES nivest*sexo;
RUN;
5.
24
25
4.2.
26
27
28
4.3.
29
30
5. Diferenciar entre los pases de la zona mediterrnea del resto. Repetir los anlisis
*CREAMOS UNA NUEVA VARIABLE PARA DIFERENCIA L0S PASES
MEDITERRNEOS DEL RESTO;
DATA PUB;
SET PUB;
IF PAIS='France' OR PAIS='Greece' OR PAIS='Italy' OR
PAIS='Portugal' OR PAIS='Spain'
THEN MEDIT=1;
ELSE MEDIT=2;
RUN;
PROC FORMAT;
VALUE MEDIT 1='Pases mediterrneos'
2='Pases no mediterrneos';
RUN;
DATA PUB;
SET PUB;
FORMAT MEDIT MEDIT.;
RUN;
PROC PRINT LABEL DATA=PUB;
RUN;
PROC SORT DATA=PUB;
BY MEDIT;
RUN;
PROC CORR DATA=PUB;
VAR CINE DIARIOS EXTERIOR RADIO REVISTAS TV;
BY MEDIT;
RUN;
31
32
4.4.
Peso de bebs
1. Analizar las tablas de contingencia cruzando la variable peso del beb (superior o
inferior a 2500 gramos) con el resto de variables categricas.
PROC FREQ DATA=BEBES;
TABLES V5*POCOPESO;
RUN;
PROC FREQ DATA=BEBES;
TABLES V6*POCOPESO;
RUN;
PROC FREQ DATA=BEBES;
TABLES V7*POCOPESO;
RUN;
PROC FREQ DATA=BEBES;
TABLES V8*POCOPESO;
RUN;
PROC FREQ DATA=BEBES;
TABLES V9*POCOPESO;
RUN;
* TAMBIEN PODEM OBTENER LAS TABLAS DE CONTINGENCIA CON LA
INSTRUCCION;
PROC FREQ DATA=BEBES;
TABLES (V5 V6 V7 V8 V9)*POCOPESO;
RUN;
2. Crear una tabla con los estadsticos descriptivos y grficos adecuados para analizar la
edad de la madre y el nmero de visitas al mdico.
PROC MEANS DATA=BEBES;
VAR V3 V10;
RUN;
PROC UNIVARIATE DATA=BEBES;
VAR V3;
HISTOGRAM;
RUN;
PROC GCHART DATA=BEBES;
VBAR V10 /MIDPOINTS=(1 TO 6 BY 1) vminor=0;
RUN;
33
34
35
4.5.
Caparazn Palletoida
36
37
4.6.
38
39
40
41
42
43
5.
5.1.
Variable
salario
Lower CL
Mean
Mean
Upper CL
Mean
Lower CL
Std Dev
Std Dev
Upper CL
Std Dev
Std Err
13
16260
20385
24509
4894.6
6825.7
11267
1893.1
T-Tests
Variable
salario
DF
t Value
12
Pr > |t|
10.77
<.0001
2. Realizar los mismos intervalos distinguiendo para las dos submuestras que define la
variable sexo.
3. Calcular el coeficiente de correlacin entre las variables salario y edad. Evaluar su
significacin.
PROC CORR DATA=EJ12G;
VAR SALARIO EDAD;
RUN;
Pearson Correlation Coefficients, N = 13
Prob > |r| under H0: Rho=0
salario
edad
salario
1.00000
0.86315
0.0001
edad
0.86315
0.0001
1.00000
44
5.2.
Row Pct
Col Pct
1-MALE 2-FEMALE Total
1-MALE
1052
87
1139
90.38
7.47 97.85
92.36
7.64
98.23 93.55
2-FEMALE
19
6
25
1.63
0.52
2.15
76.00 24.00
1.77
6.45
Total
1071
93
1164
92.01
7.99
100.00
Chi-Square
1
8.9085
0.0028
Likelihood Ratio Chi-Square
1
6.1284
0.0133
Continuity Adj. Chi-Square
1
6.8218
0.0090
Mantel-Haenszel Chi-Square
1
8.9008
0.0029
Phi Coefficient
0.0875
Contingency Coefficient
0.0872
Cramer's V
0.0875
WARNING: 25% of the cells have expected counts less
than 5. Chi-Square may not be a valid test.
45
5.3.
Variables:
CINE
DIARIOS
EXTERIOR RADIO
REVISTAS TV
Simple Statistics
Variable
Mean
Std Dev
Sum
Minimum
Maximum
CINE
DIARIOS
EXTERIOR
RADIO
REVISTAS
TV
16
16
16
16
16
16
0.53750
49.77500
6.15625
3.94375
19.24375
20.35625
0.47170
19.00023
4.10186
3.05766
6.66033
12.86489
8.60000
796.40000
98.50000
63.10000
307.90000
325.70000
0
25.10000
1.30000
0
5.40000
2.20000
1.40000
78.60000
14.20000
10.30000
28.20000
43.20000
DIARIOS
EXTERIOR
RADIO
REVISTAS
TV
CINE
1.00000
0.14338
0.5963
0.30033
0.2584
-0.19350
0.4727
0.10448
0.7002
-0.35390
0.1787
DIARIOS
0.14338
0.5963
1.00000
-0.41420
0.1107
-0.46603
0.0688
-0.68887
0.0032
-0.88498
<.0001
EXTERIOR
0.30033
0.2584
-0.41420
0.1107
1.00000
0.00723
0.9788
0.35120
0.1823
0.09987
0.7129
-0.19350
0.4727
-0.46603
0.0688
0.00723
0.9788
1.00000
0.06992
0.7969
0.42136
0.1041
0.10448
0.7002
-0.68887
0.0032
0.35120
0.1823
0.06992
0.7969
1.00000
0.36761
0.1613
-0.35390
0.1787
-0.88498
<.0001
0.09987
0.7129
0.42136
0.1041
0.36761
0.1613
1.00000
RADIO
REVISTAS
TV
46
5.4.
Peso de bebs
1. Analizar las tablas de contingencia cruzando la variable peso del beb (superior o
inferior a 2500 gramos) con el resto de variables categricas. Plantear y resolver la
prueba de independencia de ji-cuadrado.
2. Comparar las medias de las edades de las madres y el nmero de visitas distinguiendo si
el beb ha presentado un peso menor o mayor a 2500 gramos.
47
5.5.
Caparazn Palletoida
48
5.6.
49
5.7.
Los murcilagos son capaces de detectar un objeto slido mediante un sofisticado sistema de
localizacin. Se piensa que este sistema presenta un dimetro mximo de 6 metros. Para
confirmar esta hiptesis se seleccion una muestra aleatoria simple de 16 murcilagos, cada
uno de los cules fue liberado en una zona grande que presentaba un nico obstculo. Se
observ la distancia a la que el murcilago era capaz de detectarlo. Los datos recogidos son los
siguientes:
6.2 , 6.8, 6.1, 5.7, 6.1, 6.3, 5.8, 6.3, 5.9, 6.3, 6.4, 6.0, 6.3, 6.2, 5.9, 6.1
1. Describir la muestra mediante una tabla de estadsticos descriptivos y un diagrama de
caja.
data MURC;
input DISTANCIA;
datalines;
6.2
6.8
6.1
5.7
6.1
6.3
5.8
6.3
5.9
6.3
6.4
6.0
6.3
6.2
5.9
6.1
;
RUN;
PROC PRINT DATA=MURC;
RUN;
PROC UNIVARIATE DATA=MURC;
RUN;
DATA MURC;
SET MURC;
MUESTRA=1;
RUN;
PROC BOXPLOT DATA=MURC;
PLOT DISTANCIA*MUESTRA;
RUN;
50
Variable
DISTANCIA
Lower CL
Mean
Mean
Upper CL
Mean
Lower CL
Std Dev
Std Dev
Upper CL
Std Dev
Std Err
16
6.0083
6.15
6.2917
0.1964
0.2658
0.4114
0.0665
T-Tests
Variable
DISTANCIA
DF
t Value
15
92.54
Pr > |t|
<.0001
51
Variable
CDIST
Lower CL
Mean
Mean
Upper CL
Mean
Lower CL
Std Dev
Std Dev
Upper CL
Std Dev
Std Err
16
0.0083
0.15
0.2917
0.1964
0.2658
0.4114
0.0665
T-Tests
Variable
CDIST
DF
t Value
15
2.26
Pr > |t|
0.0394
52
5.8.
Velocidad de reaccin
Se desea analizar la velocidad de reaccin de unas partculas sometidas a una reaccin qumica.
Para realizar este procedimiento se dispone de dos instrumentos de medida.
Fruto de la experimentacin, se obtuvieron dos muestras, con los siguientes resultados:
Instrumento A: 25.4, 27.8, 30.4, 15.2, 33.6, 30.2, 28.7, 40.7, 32.5, 36.8
Instrumento B: 35.6, 59.8, 43.2, 32.5, 26.7, 39.5, 63.4, 45.7, 56.8, 43.2
1. Realizar grficos descriptivos que permitan comparar ambas muestras
data REACCION;
input VEL MAQ$;
datalines;
25.4 A
27.8 A
30.4 A
15.2 A
33.6 A
30.2 A
28.7 A
40.7 A
32.5 A
36.8 A
35.6 B
59.8 B
43.2 B
32.5 B
26.7 B
39.5 B
63.4 B
45.7 B
56.8 B
43.2 B
;
RUN;
PROC PRINT DATA=REACCION;
RUN;
PROC SORT DATA=REACCION;
BY MAQ;
RUN;
PROC BOXPLOT DATA=REACCION;
PLOT VEL*MAQ;
RUN;
53
Variable
Class
VEL
VEL
VEL
A
B
Diff (1-2)
10
10
Lower CL
Mean
Mean
Upper CL
Mean
Lower CL
Std Dev
Std Dev
Upper CL
Std Dev
Std Err
25.204
36.002
-23.74
30.13
44.64
-14.51
35.056
53.278
-5.275
4.7361
8.3057
7.4269
6.8856
12.075
9.829
12.57
22.044
14.535
2.1774
3.8185
4.3957
T-Tests
Variable
Method
Variances
VEL
VEL
Pooled
Satterthwaite
Equal
Unequal
DF
t Value
Pr > |t|
18
14.3
-3.30
-3.30
0.0040
0.0051
Equality of Variances
Variable
Method
VEL
Folded F
Num DF
Den DF
F Value
Pr > F
3.08
0.1096
54
6.
Modelizacin estadstica
6.1.
Se desea estudiar el crecimiento de los ficus en funcin del tiempo. Para ello, se observa el
crecimiento, en centmetros, de un conjunto de 30 plantas hasta los 126 das.
Los datos se encuentran en el fichero FICUS.SAS7BDAT.
1. Plantear y ajustar modelos que expliquen el crecimiento a partir del tiempo.
libname datos 'N:\Material Cursos\Curs SAS - 2003\Fitxers dades';
goptions reset=all ftext=triplex2 fontres=presentation vsize=13cm
hsize=16cm device=gif;
options formdlim='_' nodate nonumber;
axis label=(a=90 r=0);
proc tabulate data=datos.ficus;
class dias;
var altura;
table altura,dias,n mean std cv;
title2 'Tabla';
run;
Tabla
ALTURA
Mean
Std
CV
DIAS
30.00
3.40
1.53
45.03
23
30.00
7.21
2.16
29.99
39
30.00
9.93
1.94
19.53
58
30.00
12.99
2.04
15.69
73
30.00
16.92
2.45
14.51
90
30.00
22.82
2.82
12.34
108
30.00
31.12
3.48
11.20
126
30.00
37.13
3.53
9.51
55
data ficus;
set datos.ficus;
laltura=log(altura);
run;
proc reg data=ficus;
model laltura=dias/clb;
output out=r student=st p=p;
title2 'Regresin del logaritmo de la altura';
run;
Regresin del logaritmo de la altura
The REG Procedure
Model: MODEL1
Dependent Variable: laltura
Analysis of Variance
DF
Sum of
Squares
Mean
Square
1
238
239
136.89863
16.97119
153.86982
136.89863
0.07131
Root MSE
Dependent Mean
Coeff Var
0.26703
2.60930
10.23396
Source
Model
Error
Corrected Total
R-Square
Adj R-Sq
F Value
Pr > F
1919.83
<.0001
0.8897
0.8892
Parameter Estimates
Variable
Intercept
1.42893
DIAS
0.01999
DF
Parameter
Estimate
Standard
Error
t Value
Pr > |t|
1.36343
0.03325
41.00
<.0001
1.29792
0.01913
0.00043661
43.82
<.0001
0.01827
56
Iter
alfa
beta
Sum of
Squares
0
1
2
3
4
5
6
3.0000
5.1391
5.2025
5.2847
5.2759
5.2765
5.2765
0.0200
0.0146
0.0161
0.0158
0.0158
0.0158
0.0158
4347.3
4205.2
1952.9
1927.1
1927.1
1927.1
1927.1
57
Estimation Summary
Method
Iterations
R
PPC(alfa)
RPC(alfa)
Object
Objective
Observations Read
Observations Used
Observations Missing
Gauss-Newton
6
8.676E-7
4.496E-7
6.927E-6
1.67E-10
1927.064
240
240
0
DF
Sum of
Squares
Mean
Square
Regression
Residual
Uncorrected Total
2
238
240
104172
1927.1
106099
52085.8
8.0969
Corrected Total
239
30990.4
Source
F Value
Approx
Pr > F
6432.80
<.0001
58
59
7.
7.1.
Antes de cualquier anlisis estadstico es necesario realizar una validacin de los datos
disponibles. En este proceso es habitual detectar los valores faltantes y los valores fuera de
rango.
Los datos se encuentran en el fichero PESOBEBES.POR
1. Detectar todos los casos con valores faltantes y producir un nico listado.
2. Detectar todos los casos con valores fuera de rango y producir un nico listado.
Se pueden tener en cuenta los siguientes rangos:
Edad de la Madre: 18-40
Peso de la Madre (en Libras): 90-200
Peso del Beb (en gramos): 1500-4000
Variables categricas dentro de las posibles categoras.
3. Detectar todos los casos con posibles errores de inconsistencia y producir un nico
listado.
Se puede validar la siguiente condicin:
Irritabilidad Uterina tendra que implicar al menos una visita al mdico en el primer
trimestre.
4. Producir un informe conjunto de todas las incidencias detectadas para cada individuo.
60
7.2.
En este ejemplo se utilizar la macro spss2sas para exportar las etiquetas de valores de las
variables categricas.
Los datos se encuentran en el fichero PESOBEBES.SAV
1. Utilizar la macro spss2sas para exportar la base de datos PESOBEBES.SAV de SPSS a
SAS.
61
8.
Los datos
En este apartado se enumeran, por orden de aparicin, los datos utilizados en estas prcticas
as como su precedencia.
HOMICIDIOS EN CALIFORNIA. National Archive of Criminal Justice Data de los EUA
(http://www.icpsr.umich.edu/NACJD/).
GASTOS DE PUBLICIDAD EN EUROPA Press Landscape update & Eur. Direct Marketing NTC,
1991
PESO DE BEB. Hosmer & Lemeshow (2000)
CAPARAZN PALLETOIDA Fichero base de SPSS.
FACTORES EXPERIMENTALES EN LA FABRICACIN DEL PLSTICO Milton, J. Estadstica
la Salud. McGraw-Hill
VELOCIDAD DE REACCIN Milton, J. Estadstica para Biologa y Ciencias de la Salud. McGraw-
Hill
CRECIMIENTO DEL FICUS Utilizado con autorizacin de la Escola dEnginyeria Tcnica
62
9.
Bibliografa
Delwiche, L. D. & Slaughter, S. J. (2002). The Little SAS Book: A Primer. Second ed. SAS
Institute
Gilmore, J. (1999). Painless Windows: A Handbook for SAS users. Second ed. SAS Institute
Hosmer, D.W. & Lemeshow, S. (2000). Applied Logistic Regression. Second ed. Willey & Sons
63