Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabla Tstudent 1
Tabla Tstudent 1
Prácticas de estadística y
programación en SAS®
1
Publicado por el Servei d’Estadística de la UAB, mayo 2003.
Este documento puede ser copiado y libremente distribuido, siempre y cuando sea
preservada su integridad y referenciado su origen. No está permitido añadir, borrar o
cambiar ninguna de sus partes, o extraer páginas para su uso en otros documentos.
2
1. Índice
1. Índice.................................................................................................................3
2. Presentación .....................................................................................................4
3. Manipulación de datos....................................................................................5
3.1. Ejemplo básico. Ejemplo 1 ...................................................................................... 5
3.1.1. Fichero SAS de Sintaxis: Ejemplo 1.Datos......................................................... 7
3.2. Homicidios en California 1850-1900...................................................................... 9
3.2.1. Fichero SAS de Sintaxis: Homicidios.Datos ..................................................... 13
3.3. Gastos de publicidad a Europa ............................................................................ 14
3.3.1. Fichero SAS de Sintaxis: Publicidad.Datos....................................................... 15
3.4. Peso de bebés ...................................................................................................... 16
3.4.1. Fichero SAS de Sintaxis: Bebes.Datos.............................................................. 17
3.5. Caparazón Palletoida ........................................................................................... 18
3.5.1. Fichero SAS de Sintaxis: Caparazon.Datos ...................................................... 19
3.6. Factores experimentales en la fabricación del plástico .......................................... 20
3.6.1. Fichero SAS de Sintaxis: Plastico.Datos ........................................................... 21
4. Estadística descriptiva...................................................................................22
4.1. Ejemplo básico. Ejemplo1 .................................................................................... 22
4.2. Homicidios en California 1850-1900.................................................................... 26
4.3. Gastos de publicidad a Europa ............................................................................ 29
4.4. Peso de bebés ...................................................................................................... 33
4.5. Caparazón Palletoida ........................................................................................... 36
4.6. Factores experimentales en la fabricación de plástico ........................................... 38
5. Inferencia estadística básica .........................................................................44
5.1. Ejemplo básico. Ejemplo1 .................................................................................... 44
5.2. Homicidios en California 1850-1900.................................................................... 45
5.3. Gastos de publicidad a Europa ............................................................................ 46
5.4. Peso de bebés ...................................................................................................... 47
5.5. Caparazón Palletoida ........................................................................................... 48
5.6. Factores experimentales en la fabricación de plástico ........................................... 49
5.7. Capacidad de detección de los murciélagos .......................................................... 50
5.8. Velocidad de reacción .......................................................................................... 53
6. Modelización estadística ...............................................................................55
6.1. Crecimiento del ficus ........................................................................................... 55
7. Programación en lenguaje macro................................................................60
7.1. Validación de una matriz de datos........................................................................ 60
7.2. Exportación de SPSS a SAS. ................................................................................ 61
8. Los datos.........................................................................................................62
9. Bibliografía .....................................................................................................63
3
2. Presentación
Los ficheros de datos así como los ficheros con las sintaxis pueden encontrarse en la página
web del Servei d’Estadística de la Universidad Autónoma de Barcelona, en la sección de
Materiales.
4
3. Manipulación de datos
2. Crear una variable nueva que contenga el salario anual en pesetas y otra variable
categórica para el salario con 4 categorías.
3. Añadir los datos para 3 individuos más contenidos en la siguiente tabla:
4. Crear otro archivo SAS (socecon) con las características edad, nivel de estudios,
tipo de transporte para llegar al trabajo y tiempo de recorrido desde la vivienda
habitual hasta el trabajo (en minutos) que aparecen en la siguiente tabla:
5
5. Fusionar los dos archivos anteriores y crear un archivo de SAS llamado ejemplo1
6. Asignar de forma aleatoria los individuos en dos grupos para poder realizar un
experimento de comparación de medios de transporte
6
3.1.1. Fichero SAS de Sintaxis: Ejemplo 1.Datos
DATA ejemplo1;
INPUT id etiqueta $ sexo $ salario;
CARDS;
1 Joan Hombre 18000
2 Silvia Mujer 15000
3 Josep Hombre 25000
4 Pere Hombre 17000
5 Anna Mujer 19000
6 David Hombre 30000
7 Cristina Mujer 22000
8 Marta Mujer 10000
9 Magda Mujer 13000
10 Carles Hombre 21000
;
RUN;
PROC PRINT DATA=ejemplo1;
RUN;
* crear una variable categorica para el salario;
DATA ej1salca;
SET ejemplo1;
salpts=salario*166.386;
IF salario <= 15000 THEN salca=1;
IF salario > 15000 AND salario <= 21000 THEN salca=2;
IF salario > 21000 AND salario <= 25000 THEN salca=3;
IF salario >25000 THEN salca=4;
RUN;
* añadimos 3 casos a los datos;
DATA ej11;
INPUT id etiqueta $ sexo $ salario;
CARDS;
11 Oriol Hombre 23000
12 Ester Mujer 17000
13 Rosa Mujer 35000
;
RUN;
DATA ej11salc;
SET ej11;
salpts=salario*166.386;
IF salario <= 15000 THEN salca=1;
IF salario > 15000 AND salario <= 21000 THEN salca=2;
IF salario > 21000 AND salario <= 25000 THEN salca=3;
IF salario >25000 THEN salca=4;
RUN;
PROC APPEND BASE=ej1salca DATA=ej11salc;
RUN;
* añadimos 4 variables;
DATA socecon;
INPUT id edad nivest $ transp $ tiempo;
CARDS;
1 27 Est_sup Bus 15
2 20 FPII Metro 20
3 35 FPII Coche 55
4 30 Est_sup Coche 45
5 25 Gr_medio Moto 30
6 37 Gr_medio Bus 35
7 35 Est_sup Bus 15
8 23 Gr_medio Moto 10
9 21 FPII Moto 7
7
10 28 Gr_medio Metro 25
11 29 Gr_medio Coche 50
12 32 FPII Metro 35
13 40 Est_sup Bus 35
;
RUN;
DATA ejemplo1;
MERGE ej1salca socecon;
BY id;
RUN;
* asignacion aleatoria en dos grupos;
DATA ej12g;
SET ejemplo1;
grupo = RANBIN(0,1,0.5);
RUN;
8
3.2. Homicidios en California 1850-1900
Los datos han sido obtenidos en la página web del National Archive of Criminal Justice Data de
los EUA (http://www.icpsr.umich.edu/NACJD/). Se dispone de variables referentes a
1.317 homicidios producidos en California durante los años 1850 hasta 1900. Se obtuvieron
datos sobre el lugar, causa del crimen y arma utilizada así como la relación entre raza, sexo,
edad y ocupación de la víctima y el acusado.
9
33 BARBER 3 RANCHER
34 WAITER 4 MERCHANT
35 LAUNDRY 5 COWBOY
36 MUSICIAN 6 SHEEP HERDER
37 DENTIST 7 SOLDIER
38 SHOEMAKER 8 SAILOR
39 MECHANIC 9 BARTENDER
40 BLACKSMITH 10 LAWMAN
41 CARPENTER 12 HOUSEWIFE
42 PREACHER 13 PROSTITUTE
44 HARNESS MAKER 14 LAWYER
45 GARDENER 15 COOK
46 SALESMAN 16 BUTCHER
47 TAILOR 17 TEAMSTER
48 STEAMBOAT RUNNER 18 RR WORKER
49 DISHWASHER 19 MINER
50 PORTER 20 HOTEL KEEPER
51 LEGISLATOR 21 BAR OWNER
52 RANCH/FARM HAND 22 CLERICAL
53 OTHER TRADESMAN 23 TEACHER
54 BOAT HAND 24 TRANSIENT
55 GAMBLER 25 FISHERMAN
56 PIMP 26 NURSE
57 MINISTER 27 STUDENT
58 EDITOR/PUBLISHER 28 DOMESTIC
59 PEDDLER 29 DRUGGIST
60 PRISON INMATE 30 DOCTOR
61 WATCHMAN 31 STORE CLERK
62 BOOKKEEPER 32 BAKER
63 WELLS FARGO GRD 33 BARBER
64 ASYLUM INMATE 34 WAITER
65 JUDGE/JUSTICE 35 LAUNDRY
66 SEAMSTRESS 36 MUSICIAN
99 UNKNOWN 37 DENTIST
• Estado de la víctima (VICCOND) 38 SHOEMAKER
Variable categórica 39 MECHANIC
1 DRINKING 40 BLACKSMITH
2 OTHER DRUGS 41 CARPENTER
3 CALM 42 PREACHER
4 AGITATED 44 HARNESS MAKER
5 OTHER 45 GARDENER
9 UNKNOWN 46 SALESMAN
• Raza del acusado (ACCURACE) 47 TAILOR
Variable categórica 48 STEAMBOAT RUNNER
1 WHITE 49 DISHWASHER
2 HISPANIC 50 PORTER
3 NATIVE AMERICAN 51 LEGISLATOR
4 ORIENTAL 52 RANCH/FARM HAND
5 AFRICAN-AMERICAN 53 OTHER TRADESMAN
9 UNKNOWN 54 BOAT HAND
• Sexo del acusado (ACCUSEX) 55 GAMBLER
Variable categórica 56 PIMP
1 MALE 57 MINISTER
2 FEMALE 58 EDITOR/PUBLISHER
9 UNKNOWN 59 PEDDLER
60 PRISON INMATE
• Edad del acusado (ACCUAGE)
61 WATCHMAN
Variable cuantitativa
62 BOOKKEEPER
• Ocupación del acusado (ACCUOCCU) 63 WELLS FARGO GRD
Variable categórica 64 ASYLUM INMATE
1 LABORER 65 JUDGE/JUSTICE
2 FARMER 66 SEAMSTRESS
10
99 UNKNOWN 10 WOODS
• Estado del acusado (ACCUCOND) 11 HOTEL
Variable categórica 12 WHARF
1 DRINKING 13 SHIP
2 OTHER DRUGS 14 RAILROAD
3 CALM 15 BEACH
4 AGITATED 16 MOUNTAINS
5 OTHER 17 RIVER
9 UNKNOWN 18 OCEAN
• Relación víctima-acusado (RELATION) 19 INDIAN RESERVE
Variable categórica 20 ACCUSED HOME
1 MARRIED 21 CEMETARY
2 IN-LAWS 22 CHURCH
3 FRIENDS 23 MISSION
4 STRANGERS 24 COURTHOUSE
5 ROOMMATES 25 HOSPITAL
8 OTHER 26 MILITARY FORT
9 UNKNOWN 27 BANK
• Causa del homicidio (CAUSE) 28 SAW MILL
Variable categórica 29 STORE
1 DOMESTIC DISPUTE 30 LAKE
2 QUARREL 31 HOSPITAL
3 BRAWL 36 MINE
4 LYNCH MOB 37 BRIDGE
5 KILLED BY POLICE 38 BROTHEL
6 KILLED POLICE 39 CEMETARY
7 ROBBERY 40 RESTAURANT
8 OTHER 41 PRISON
9 UNKNOWN 42 ROOMING HOUSE
43 PARK
• Arma utilizada (WEAPON)
44 OTHER HOUSE
Variable categórica
45 STATE BUILDING
1 HAND GUN
46 BLACKSMITH SHOP
2 RIFLE
47 OTHER BUSINESS
3 SHOTGUN
48 STABLE OR CORRAL
4 GUN UNKNOWN
49 STAGE/RR STATION
5 KNIFE
50 DANCE HALL
6 AXE
51 OTHER BUILDING
7 HANGING
52 CABIN (RURAL)
8 FIRE
53 ASYLUM
9 FALL
99 UNKNOWN
10 STRANGLED
11 FISTS
12 BLUNT INSTRUMENT
13 POISON
14 THROWN DOWN
15 SHARP INSTRUMENT
16 DRUGS
17 KICKED
18 DROWNED
99 UNKNOWN
• Lugar del homicidio (LOCATION)
Variable categórica
1 VICTIM'S HOME
2 STREET
3 SALOON
4 WORK
5 RANCH
6 FARM
7 COUNTRY ROAD
8 DESERT
9 JAIL
11
1. Importar la base de datos al sistema SAS.
2. Asignar las etiquetas a las variables categóricas.
12
3.2.1. Fichero SAS de Sintaxis: Homicidios.Datos
13
3.3. Gastos de publicidad a Europa
En la siguiente tabla se muestra la repartición (en porcentajes) de los gastos publicitarios según
el medio de comunicación de 16 países de Europa. Los datos corresponden al año 1990 y se
extrajeron de la revista Press Landscape update & Eur. Direct Marketing NTC, 1991.
14
3.3.1. Fichero SAS de Sintaxis: Publicidad.Datos
15
3.4. Peso de bebés
El archivo PesoBebes.sav contiene información de 189 nacimientos, siendo el peso del bebé al
nacer la variable principal.
16
3.4.1. Fichero SAS de Sintaxis: Bebes.Datos
PROC FORMAT;
VALUE POCOPESO 0='SUPERIOR A 2500 G'
1='INFERIOR A 2500 G';
RUN;
DATA BEBES;
SET BEBES;
FORMAT POCOPESO POCOPESO.;
RUN;
PROC PRINT LABEL DATA=BEBES;
RUN;
PROC CONTENTS DATA=BEBES POSITION;
RUN;
17
3.5. Caparazón Palletoida
18
3.5.1. Fichero SAS de Sintaxis: Caparazon.Datos
19
3.6. Factores experimentales en la fabricación del plástico
Una determinada fábrica desea conocer la mejor manera de producir un tipo de plástico. Para
ello, realizan un experimento controlado, tomando como variables experimentales:
Nivel de extrusión. 2 niveles (bajo o alto).
Cantidad de aditivo. 2 niveles (bajo o alto).
Creen que una variación en los niveles de estos factores afecta a las características del plástico
finalmente fabricado. Concretamente, están interesados en estudiar la resistencia a la ruptura, el
brillo y la opacidad de los plásticos generados (valorados en una escala de 0 a 10). Su objetivo
es fabricar un tipo de plástico con los máximos valores de estos parámetros. Para resolver esta
cuestión, realizan un experimento factorial 22, con cuatro réplicas para cada condición
experimental. Los datos recogidos son los siguientes:
Nivel de extrusión Cantidad de aditivo Resistencia a la ruptura Brillo Opacidad
1 1 6.5 9.5 4.4
1 1 6.2 9.9 6.4
1 1 5.8 9.6 3.0
1 1 6.5 9.6 4.1
1 1 6.5 9.2 .8
1 2 6.9 9.1 5.7
1 2 7.2 10.0 2.0
1 2 6.9 9.9 3.9
1 2 6.1 9.5 1.9
1 2 6.3 9.4 5.7
2 1 6.7 9.1 2.8
2 1 6.6 9.3 4.1
2 1 7.2 8.3 3.8
2 1 7.1 8.4 1.6
2 1 6.8 8.5 3.4
2 2 7.1 9.2 8.4
2 2 7.0 8.8 5.2
2 2 7.2 9.7 6.9
2 2 7.5 10.1 2.7
2 2 7.6 9.2 1.9
1. Importar los datos del archivo ExperimentoPlastico.sav a un archivo editable con SAS.
2. Revisar la importación de etiquetas.
20
3.6.1. Fichero SAS de Sintaxis: Plastico.Datos
21
4. Estadística descriptiva
2. Comparar la variable salario para las dos submuestras que define la variable sexo
Antes de realizar un PROC UNIVARIATE para distintas submuestras los datos deben estar
ordenados según la variable que define las submuestras
22
23
3. Dibujar un histograma del salario para cada submuestra
4. Resumir mediante una tabla de dos entradas las variables nivel de estudios y sexo
24
25
4.2. Homicidios en California 1850-1900
DATA HOMICIDE;
SET HOMICIDE;
IF ACCUSEX=9 OR VICSEX=9 THEN DELETE;
RUN;
26
4. Crear la tabla de perfiles filas e interpretar los resultados.
27
28
4.3. Gastos de publicidad a Europa
29
4. Realizar gráficos de dispersión y evaluar la linealidad de las relaciones.
30
5. Diferenciar entre los países de la zona mediterránea del resto. Repetir los análisis
31
32
4.4. Peso de bebés
1. Analizar las tablas de contingencia cruzando la variable peso del bebé (superior o
inferior a 2500 gramos) con el resto de variables categóricas.
2. Crear una tabla con los estadísticos descriptivos y gráficos adecuados para analizar la
edad de la madre y el número de visitas al médico.
33
34
3. Crear las tablas anteriores separadamente distinguiendo si el bebé ha presentado un
peso menor o superior a 2500 gramos.
35
4.5. Caparazón Palletoida
AXIS2 LABEL=('LONGITUD');
AXIS1 LABEL=('ALTURA') ORDER=(0.9 TO 2.7 BY 0.3);
PROC GPLOT DATA=caparaz;
PLOT Y*X /haxis=axis1 hminor=0 vaxis=axis2;
SYMBOL1 VALUE=DOT COLOR=BLUE ;
RUN;
36
3. Repetir los apartados anteriores utilizando el logaritmo de la longitud.
37
4.6. Factores experimentales en la fabricación de plástico
38
AXIS2 LABEL=('resistencia' justify=right 'a la ruptura')
ORDER=(6.4 TO 7.1 BY 0.1);
PROC GPLOT DATA=G1;
WHERE _TYPE_=1;
PLOT M1*EXTRUS / HAXIS=AXIS1 VMINOR=0 VAXIS=AXIS2;
RUN;
PROC MEANS DATA=EXP;
CLASS ADITIVO;
VAR RESIST;
OUTPUT OUT=G1 MEAN(RESIST)= M1;
RUN;
PROC GPLOT DATA=G1;
WHERE _TYPE_=1;
PLOT M1*ADITIVO / HAXIS=AXIS1 VMINOR=0 VAXIS=AXIS2;
RUN;
39
40
3. ¿Qué características dependen de la cantidad de aditivo? ¿Cómo?
41
4. ¿Existe interacción entre el nivel de extrusión y la cantidad de aditivo?
42
AXIS2 LABEL=('resistencia' justify=right 'a la ruptura')
ORDER=(6.2 TO 7.4 BY 0.3);
PROC GPLOT DATA=G4;
WHERE _TYPE_=3;
PLOT M4*EXTRUS=ADITIVO / HAXIS=AXIS1 VMINOR=0 VAXIS=AXIS2;
RUN;
A la vista de los gráficos el plástico óptimo tendría un nivel de extrusión y aditivo altos
43
5. Inferencia estadística básica
Statistics
T-Tests
2. Realizar los mismos intervalos distinguiendo para las dos submuestras que define la
variable sexo.
3. Calcular el coeficiente de correlación entre las variables salario y edad. Evaluar su
significación.
PROC CORR DATA=EJ12G;
VAR SALARIO EDAD;
RUN;
salario edad
44
5.2. Homicidios en California 1850-1900
ACCUSEX(SEX OF ACCUSED)
VICSEX(SEX OF VICTIM)
Frequency ‚
Percent ‚
Row Pct ‚
Col Pct ‚1-MALE ‚2-FEMALE‚ Total
‚ ‚ ‚
ƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
1-MALE ‚ 1052 ‚ 87 ‚ 1139
‚ 90.38 ‚ 7.47 ‚ 97.85
‚ 92.36 ‚ 7.64 ‚
‚ 98.23 ‚ 93.55 ‚
ƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
2-FEMALE ‚ 19 ‚ 6 ‚ 25
‚ 1.63 ‚ 0.52 ‚ 2.15
‚ 76.00 ‚ 24.00 ‚
‚ 1.77 ‚ 6.45 ‚
ƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
Total 1071 93 1164
92.01 7.99 100.00
45
5.3. Gastos de publicidad a Europa
Simple Statistics
46
5.4. Peso de bebés
1. Analizar las tablas de contingencia cruzando la variable peso del bebé (superior o
inferior a 2500 gramos) con el resto de variables categóricas. Plantear y resolver la
prueba de independencia de ji-cuadrado.
2. Comparar las medias de las edades de las madres y el número de visitas distinguiendo si
el bebé ha presentado un peso menor o mayor a 2500 gramos.
47
5.5. Caparazón Palletoida
48
5.6. Factores experimentales en la fabricación de plástico
49
5.7. Capacidad de detección de los murciélagos
Los murciélagos son capaces de detectar un objeto sólido mediante un sofisticado sistema de
localización. Se piensa que este sistema presenta un diámetro máximo de 6 metros. Para
confirmar esta hipótesis se seleccionó una muestra aleatoria simple de 16 murciélagos, cada
uno de los cuáles fue liberado en una zona grande que presentaba un único obstáculo. Se
observó la distancia a la que el murciélago era capaz de detectarlo. Los datos recogidos son los
siguientes:
6.2 , 6.8, 6.1, 5.7, 6.1, 6.3, 5.8, 6.3, 5.9, 6.3, 6.4, 6.0, 6.3, 6.2, 5.9, 6.1
50
2. Construir un intervalo de confianza al 95% para el diámetro medio poblacional de
detección de los murciélagos.
DATA MURC;
SET MURC;
CDIST=DISTANCIA-6;
RUN;
PROC PRINT DATA=MURC;
RUN;
PROC TTEST DATA=MURC;
VAR DISTANCIA;
RUN;
Statistics
T-Tests
51
3. Plantear y resolver un contraste de hipótesis que permita analizar la plausibilidad de la
hipótesis apuntada inicialmente por los investigadores.
PROC TTEST DATA=MURC;
VAR CDIST;
RUN;
The TTEST Procedure
Statistics
T-Tests
52
5.8. Velocidad de reacción
Se desea analizar la velocidad de reacción de unas partículas sometidas a una reacción química.
Para realizar este procedimiento se dispone de dos instrumentos de medida.
Instrumento A: 25.4, 27.8, 30.4, 15.2, 33.6, 30.2, 28.7, 40.7, 32.5, 36.8
Instrumento B: 35.6, 59.8, 43.2, 32.5, 26.7, 39.5, 63.4, 45.7, 56.8, 43.2
53
2. Plantear un contraste de hipótesis para comparar las medias de velocidad de reacción
según el instrumento. Construir un intervalo de confianza para la diferencia.
PROC TTEST DATA=REACCION;
CLASS MAQ;
VAR VEL;
RUN;
The TTEST Procedure
Statistics
T-Tests
Equality of Variances
54
6. Modelización estadística
Se desea estudiar el crecimiento de los ficus en función del tiempo. Para ello, se observa el
crecimiento, en centímetros, de un conjunto de 30 plantas hasta los 126 días.
Tabla
ALTURA
„ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ†
‚ ‚ N ‚ Mean ‚ Std ‚ CV ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚DIAS ‚ ‚ ‚ ‚ ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ‰ ‚ ‚ ‚ ‚
‚4 ‚ 30.00‚ 3.40‚ 1.53‚ 45.03‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚23 ‚ 30.00‚ 7.21‚ 2.16‚ 29.99‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚39 ‚ 30.00‚ 9.93‚ 1.94‚ 19.53‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚58 ‚ 30.00‚ 12.99‚ 2.04‚ 15.69‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚73 ‚ 30.00‚ 16.92‚ 2.45‚ 14.51‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚90 ‚ 30.00‚ 22.82‚ 2.82‚ 12.34‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚108 ‚ 30.00‚ 31.12‚ 3.48‚ 11.20‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚126 ‚ 30.00‚ 37.13‚ 3.53‚ 9.51‚
Šƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒŒ
55
data ficus;
set datos.ficus;
laltura=log(altura);
run;
proc reg data=ficus;
model laltura=dias/clb;
output out=r student=st p=p;
title2 'Regresión del logaritmo de la altura';
run;
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t| 95% Confidence Limits
56
proc nlin data=datos.ficus;
parameters alfa=3 beta=.02;
model altura=alfa*exp(beta*dias);
output out=r student=st p=p;
title2 'Regresion no lineal';
run;
Regresion no lineal
Sum of
Iter alfa beta Squares
57
Estimation Summary
Method Gauss-Newton
Iterations 6
R 8.676E-7
PPC(alfa) 4.496E-7
RPC(alfa) 6.927E-6
Object 1.67E-10
Objective 1927.064
Observations Read 240
Observations Used 240
Observations Missing 0
58
59
7. Programación en lenguaje macro
7.1. Validación de una matriz de datos.
Antes de cualquier análisis estadístico es necesario realizar una validación de los datos
disponibles. En este proceso es habitual detectar los valores faltantes y los valores fuera de
rango.
1. Detectar todos los casos con valores faltantes y producir un único listado.
2. Detectar todos los casos con valores fuera de rango y producir un único listado.
Se pueden tener en cuenta los siguientes rangos:
3. Detectar todos los casos con posibles errores de inconsistencia y producir un único
listado.
Se puede validar la siguiente condición:
Irritabilidad Uterina tendría que implicar al menos una visita al médico en el primer
trimestre.
4. Producir un informe conjunto de todas las incidencias detectadas para cada individuo.
60
7.2. Exportación de SPSS a SAS.
En este ejemplo se utilizará la macro spss2sas para exportar las etiquetas de valores de las
variables categóricas.
61
8. Los datos
En este apartado se enumeran, por orden de aparición, los datos utilizados en estas prácticas
así como su precedencia.
GASTOS DE PUBLICIDAD EN EUROPA Press Landscape update & Eur. Direct Marketing NTC,
1991
62
9. Bibliografía
Delwiche, L. D. & Slaughter, S. J. (2002). The Little SAS Book: A Primer. Second ed. SAS
Institute
Gilmore, J. (1999). Painless Windows: A Handbook for SAS® users. Second ed. SAS Institute
Hosmer, D.W. & Lemeshow, S. (2000). Applied Logistic Regression. Second ed. Willey & Sons
63