Está en la página 1de 76

ESTADISTICA APLICADA

(PRIMERA PARTE)

ING. RODOLFO BALTAZAR LAPA

FAIM-UNCP-CURSO DE ACTUALIZACIN I INTRODUCCIN


Es la ciencia que nos proporciona un conjunto de Mtodos, tcnicas y procedimientos, para: Recopilar Organizar(Clasificar , agrupar !resentar y "nalizar

#atos con el fin de descri$ir o de realizar generalizaciones %&lidas' (a in%estigaci)n estad*stica es un proceso que pasa por las siguientes etapas: +ormulaci)n del pro$lema o la tarea' #ise,o del e-perimento' Recopilaci)n de los datos' Clasificaci)n, ta$ulaci)n y descripci)n de resultados' .eneralizaci)n o /nferencia'

(a pala$ra 0estad*stica0 suele utilizarse $ajo dos significados distintos, a sa$er: 12 Como colecci)n de datos numricos'- Esto es el significado m&s %ulgar de la pala$ra estad*stica' 3e so$rentiende que dic4os datos numricos 4an de estar presentados de manera ordenada y sistem&tica' 5na informaci)n numrica cualquiera puede no constituir una estad*stica, para merecer este apelati%o, los datos 4an de constituir un conjunto co4erente, esta$lecido de forma sistem&tica y siguiendo un criterio de ordenaci)n' 62 Como ciencia'- En este significado, (a Estad*stica estudia el comportamiento de los fen)menos de masas' Como todas las ciencias, $usca las caracter*sticas generales de un colecti%o y prescinde de las particulares de cada elemento' "s* por ejemplo al in%estigar el salario de los tra$ajadores, iniciaremos el tra$ajo tomando un grupo numeroso de tra$ajadores y o$tener despus la proporci)n de salarios' !or tanto, el o$jeti%o de la estad*stica es 4allar las regularidades que se encuentran en los fen)menos de masa' 1.1.- POBLACIONES Y MUESTRAS: Cuando se realiza un estudio de in%estigaci)n, se pretende generalmente inferir o generalizar resultados de una muestra a una po$laci)n' 3e estudia en particular a un reducido n7mero de indi%iduos a los que tenemos acceso con la idea de poder generalizar los 4allazgos a la po$laci)n de la cual esa muestra procede' Este proceso de inferencia se efect7a por medio de mtodos estad*sticos $asados en la pro$a$ilidad' (a po$laci)n representa el conjunto grande de indi%iduos que deseamos estudiar y generalmente suele ser inaccesi$le' Es, en definiti%a, un colecti%o 4omogneo que re7ne unas caracter*sticas determinadas'

(a muestra es el conjunto menor de indi%iduos (su$conjunto de la po$laci)n accesi$le y limitado so$re el que realizamos las mediciones o el e-perimento con la idea de o$tener conclusiones generaliza$les a la po$laci)n ' El indi%iduo es cada uno de los componentes de la po$laci)n y la muestra' (a muestra de$e ser representati%a de la po$laci)n y con ello queremos decir que cualquier indi%iduo de la po$laci)n en estudio de$e 4a$er tenido la misma pro$a$ilidad de ser elegido' (as razones para estudiar muestras en lugar de po$laciones son di%ersas y entre ellas podemos se,alar: a' "4orrar tiempo' Estudiar a menos indi%iduos es e%idente que lle%a menos tiempo' $' Como consecuencia del punto anterior a4orraremos costos' c' Estudiar la totalidad de los pacientes o personas con una caracter*stica determinada en muc4as ocasiones puede ser una tarea inaccesi$le o imposi$le de realizar' d' "umentar la calidad del estudio' "l disponer de m&s tiempo y recursos, las o$ser%aciones y mediciones realizadas a un reducido n7mero de indi%iduos pueden ser m&s e-actas y plurales que si las tu%isemos que realizar a una po$laci)n' e' (a selecci)n de muestras espec*ficas nos permitir& reducir la 4eterogeneidad de una po$laci)n al indicar los criterios de inclusi)n y8o e-clusi)n' Ejemplo: (os empleados de una Empresa constituyen una po$laci)n en la que cada empleado (5nidad Estad*stica tienen muc4as caracter*sticas a ser o$ser%adas como por ejemplo: gnero, estado ci%il, lugar de procedencia, grado de instrucci)n, etc' (caracter*sticas cualitati%as o n7mero de 9ijos, ingresos mensuales etc' (caracter*sticas cuantitati%as 1.2.- TIPOS DE DATOS: (o que estudiamos en cada indi%iduo de la muestra son las %aria$les (edad, se-o, peso, talla, salarios, etctera ' (os datos son los %alores que toma la %aria$le en cada caso' (o que %amos a realizar es medir, es decir, asignar %alores a las %aria$les incluidas en el estudio' #e$eremos adem&s concretar la escala de medida que aplicaremos a cada %aria$le' (a naturaleza de las o$ser%aciones ser& de gran importancia a la 4ora de elegir el mtodo estad*stico m&s apropiado para a$ordar su an&lisis' Con este fin, clasificaremos las %aria$les, a grandes rasgos, en dos tipos: %aria$les cuantitati%as o %aria$les cualitati%as' a' Var a!"#$ %&a'( (a( )a$' 3on las %aria$les que pueden medirse, cuantificarse o e-presarse numricamente' (as %aria$les cuantitati%as pueden ser de dos tipos: :aria$les cuantitati%as continuas, si admiten tomar cualquier %alor dentro de un rango numrico determinado (edad, peso, talla '

:aria$les cuantitati%as discretas, si no admiten todos los %alores intermedios en un rango' 3uelen tomar solamente %alores enteros (n7mero de 4ijos, n7mero tra$ajadores, n7mero de 4ermanos, etc '

$' Var a!"#$ %&a" (a( )a$. Este tipo de %aria$les representan una cualidad o atri$uto que clasifica a cada caso en una de %arias categor*as' (a situaci)n m&s sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (4om$re8mujer,

FAIM-UNCP-CURSO DE ACTUALIZACIN
enfermo8sano, fumador8no fumador ' 3on datos dicot)micos o $inarios' Como resulta o$%io, en muc4as ocasiones este tipo de clasificaci)n no es suficiente y se requiere de un mayor n7mero de categor*as (color de los ojos, grupo sangu*neo, profesi)n, etctera ' En el proceso de medici)n de estas %aria$les, se pueden utilizar dos escalas:

E$%a"a$ '*+ 'a"#$: sta es una forma de o$ser%ar o medir en la que los datos se ajustan por categor*as que no mantienen una relaci)n de orden entre s* (color de los ojos, se-o, profesi)n, presencia o ausencia de un factor de riesgo o enfermedad, etctera ' E$%a"a$ *r, 'a"#$: en las escalas utilizadas, e-iste un cierto orden o jerarqu*a entre las categor*as'

1.-.- ESTAD.STICA DESCRIPTIVA: 5na %ez que se 4an recogido los %alores que toman las %aria$les de nuestro estudio (datos , procederemos al an&lisis descripti%o de los mismos' !ara %aria$les categ)ricas, como el se-o, se quiere conocer el n7mero de casos en cada una de las categor*as, reflejando 4a$itualmente el porcentaje que representan del total, y e-pres&ndolo en una ta$la de frecuencias' !ara %aria$les numricas, en las que puede 4a$er un gran n7mero de %alores o$ser%ados distintos, se 4a de optar por un mtodo de an&lisis distinto, respondiendo a las siguientes preguntas: a' ;"lrededor de qu %alor se agrupan los datos< $' 3upuesto que se agrupan alrededor de un n7mero, ;c)mo lo 4acen< ;muy concentrados< ;muy dispersos<

DISTRIBUCIN DE FRECUENCIA (a distri$uci)n de frecuencia es la representaci)n estructurada, en forma de ta$la, de toda la informaci)n que se 4a recogido so$re la %aria$le que se estudia' :aria$le (:alor =1 =6 ''' =n-1 =n +recuencias a$solutas +recuencias relati%as 3imple "cumulada 3imple "cumulada = n1 n1 f1 > n1 8 n f1 n6 n1 ? n6 f6 > n6 8 n f1 ? f6 ''' ''' ''' ''' n1 ? n6 ?''? nnnn-1 fn-1 > nn-1 8 n f1 ? f6 ?''?fn-1 1 @n n fn > nn 8 n f

3iendo = los distintos %alores que puede tomar la %aria$le' 3iendo n el n7mero de %eces que se repite cada %alor' 3iendo f el porcentaje que la repetici)n de cada %alor supone so$re el total

:eamos un ejemplo: Medimos la altura de los ni,os de una clase y o$tenemos los siguientes resultados (cm :

"lumno Estatura "lumno Estatura "lumno Estatura = "lumno 1 1,6A "lumno 11 1,6B "lumno 61 1,61 "lumno 6 1,6C "lumno 16 1,6D "lumno 66 1,6E "lumno B 1,6F "lumno 1B 1,BG "lumno 6B 1,6D "lumno H 1,61 "lumno 1H 1,61 "lumno 6H 1,66 "lumno A 1,66 "lumno 1A 1,6C "lumno 6A 1,6C "lumno D 1,6E "lumno 1D 1,BG "lumno 6D 1,6F "lumno F 1,BG "lumno 1F 1,66 "lumno 6F 1,6D "lumno C 1,6H "lumno 1C 1,6A "lumno 6C 1,6B "lumno E 1,6F "lumno 1E 1,6G "lumno 6E 1,66 "lumno 1G 1,6E "lumno 6G 1,6C "lumno BG 1,61

3i presentamos esta informaci)n estructurada o$tendr*amos la siguiente ta$la de frecuencia: :aria$le (:alor 1,6G 1,61 1,66 1,6B 1,6H 1,6A 1,6D 1,6F 1,6C 1,6E 1,BG +recuencias a$solutas 3imple "cumulada 1 H H 6 1 6 B B H B B 1 A E 11 16 1H 1F 6G 6H 6F BG +recuencias relati%as 3imple "cumulada B,BI 1B,BI 1B,BI D,DI B,BI D,DI 1G,GI 1G,GI 1B,BI 1G,GI 1G,GI B,BI 1D,DI BG,GI BD,DI HG,GI HD,DI AD,DI DD,DI CG,GI EG,GI 1GG,GI

3i los %alores que toma la %aria$le son muy di%ersos y cada uno de ellos se repite muy pocas %eces, entonces con%iene agruparlos por inter%alos, ya que de otra manera o$tendr*amos una ta$la de frecuencia muy e-tensa que aportar*a muy poco %alor a efectos de s*ntesis' (tal como se %er& en la siguiente lecci)n ' DISTRIBUCIONES DE FRECUENCIA AGRUPADA

FAIM-UNCP-CURSO DE ACTUALIZACIN
3upongamos que medimos la estatura de los 4a$itantes de una %i%ienda y o$tenemos los siguientes resultados (cm :

9a$itante Estatura 9a$itante Estatura 9a$itante Estatura 9a$itante 1 1,1A 9a$itante 11 1,AB 9a$itante 61 1,61 9a$itante 6 1,HC 9a$itante 16 1,1D 9a$itante 66 1,AE 9a$itante B 1,AF 9a$itante 1B 1,DG 9a$itante 6B 1,CD 9a$itante H 1,F1 9a$itante 1H 1,C1 9a$itante 6H 1,A6 9a$itante A 1,E6 9a$itante 1A 1,EC 9a$itante 6A 1,HC 9a$itante D 1,BE 9a$itante 1D 1,6G 9a$itante 6D 1,BF 9a$itante F 1,HG 9a$itante 1F 1,H6 9a$itante 6F 1,1D 9a$itante C 1,DH 9a$itante 1C 1,HA 9a$itante 6C 1,FB 9a$itante E 1,FF 9a$itante 1E 1,6G 9a$itante 6E 1,D6 9a$itante 1G 1,HE 9a$itante 6G 1,EC 9a$itante BG 1,G1 3i present&ramos esta informaci)n en una ta$la de frecuencia o$tendr*amos una ta$la de BG l*neas (una para cada %alor , cada uno de ellos con una frecuencia a$soluta de 1 y con una frecuencia relati%a del B,BI' Esta ta$la nos aportar*a escasa informaci)n En lugar de ello, preferimos agrupar los datos por inter%alos, con lo que la informaci)n queda m&s resumida (se pierde, por tanto, algo de informaci)n , pero es m&s maneja$le e informati%a: Estatura Cm 1,G1 - 1,1G 1,11 - 1,6G 1,61 - 1,BG 1,B1 - 1,HG 1,H1 - 1,AG 1,A1 - 1,DG 1,D1 - 1,FG 1,F1 - 1,CG 1,C1 - 1,EG 1,E1 - 6,GG +recuencias a$solutas 3imple "cumulada 1 B B 6 D H B B 6 B 1 H F E 1A 1E 66 6A 6F BG +recuencias relati%as 3imple "cumulada B,BI 1G,GI 1G,GI D,DI 6G,GI 1B,BI 1G,GI 1G,GI D,DI 1G,GI B,BI 1B,BI 6B,BI BG,GI AG,GI DB,BI FB,BI CB,BI EG,GI 1GG,GI

El n7mero de tramos en los que se agrupa la informaci)n es una decisi)n que de$e tomar el analista: la regla es que mientras m&s tramos se utilicen menos informaci)n se pierde, pero puede que menos representati%a e informati%a sea la ta$la' II. MEDIDAS DE TENDENCIA CENTRAL

(as medidas de centralizaci)n %ienen a responder a la primera pregunta' (a medida m&s e%idente que podemos calcular para descri$ir un conjunto de o$ser%aciones numricas es su %alor medio'

FAIM-UNCP-CURSO DE ACTUALIZACIN
2.1.- MEDIA ARITM/TICA: a) Para ,a(*$ $ ' a0r&1ar (a media aritmtica de una %aria$le se define como la suma ponderada de los %alores de la %aria$le por sus frecuencias relati%as y lo denotaremos por e-presi)n: y se calcula mediante la

Ejemplo: Consideremos 1G tra$ajadores de edades 61 a,os, B6, 1A, AE, DG, D1, DH, DG, F1, y CG' (a media de edad de estos sujetos ser& de:

M&s formalmente, si denotamos por (=1, =6,''',=n los n datos que tenemos recogidos de la %aria$le en cuesti)n, el %alor medio %endr& dado por: !) Para ,a(*$ a0r&1a,*$

2 representa el %alor de la %aria$le o en su caso la marca de clase' Pr*1 #,a,#$: 1' 3i multiplicamos o di%idimos todas las o$ser%aciones por un mismo n7mero, la media queda multiplicada o di%idida por dic4o numero' 6' 3i le sumamos a todas las o$ser%aciones un mismo n7mero, la media aumentar& en dic4a cantidad' Ejemplo: 3ea la distri$uci)n de las notas de estad*sticas' 9allar la Media "ritmtica (i-1 6 H D C 1G 16 1H l1 H D C 1G 16 1H 1D -i B A F E 11 1B 1A ni B 6 A E 16 1G 6 -i'ni E 1G BA C1 1B6 1BG BG

1D 35M"

1C

1F

A HC

CA A16

= > A168HC > 1G'DD 2.2.- MEDIANA: (a mediana es el %alor central de la %aria$le, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el %alor que di%ide en dos partes la muestra' a) Para ,a(*$ $ ' a0r&1ar Jendremos en cuenta el tama,o de la muestra'

3i N #$ I+1ar3 4ay un trmino central, el trmino

que ser& el %alor de la mediana'

3i N #$ Par3 4ay dos trminos centrales, dos %alores Ejemplo: !ara @ impar 1,H,D,F,C,E,16,1D,6G, 6H,6A,6F,BG @>1B Jrmino Central el F2 , 16 Me>16 !ara @ par 1,H,D,F,C,E,16,1D,6G, 6H,6A,6F @>16 Jrminos Centrales el D2 y F2 E y 16

la mediana ser& la media de esos

Me> !) Para ,a(*$ a0r&1a,*$ 3i la %aria$le es continua, la ta$la %endr& en inter%alos, por lo que se calcula de la siguiente forma: @os %amos a apoyar en un gr&fico de un 4istograma de frecuencias acumuladas'

FAIM-UNCP-CURSO DE ACTUALIZACIN

#e donde la mediana %ale: donde ai es la amplitud del inter%alo Ejemplo: 3upongamos los pesos de un grupo de AG personas se distri$uyen de la siguiente forma:

(i-1 HA AA DA FA CA AA DA FA CA EA

(i D 1G 1E 11 H

ni D 1D BA HD AG

@i

Como el tama,o de la muestra es @>AG, $uscamos el inter%alo en el que la +recuencia acumulada es mayor que AG86>6A, que en este caso es el B2 y aplicamos la f)rmula anterior' (uego la Mediana ser&

10

Me>

2.-.- MODA: (a moda es el %alor de la %aria$le que tenga mayor frecuencia a$soluta, la que m&s se repite, es la 7nica medida de centralizaci)n que tiene sentido estudiar en una %aria$le cualitati%a, pues no precisa la realizaci)n de ning7n c&lculo' !or su propia definici)n, la moda no es 7nica, pues puede 4a$er dos o m&s %alores de la %aria$le que tengan la misma frecuencia siendo esta m&-ima' En cuyo caso tendremos una distri$uci)n $imodal o polimodal seg7n el caso'

!or lo tanto el c&lculo de la moda en distri$uciones discretas o cualitati%as no precisa de una e-plicaci)n mayorK sin em$argo, de$emos detenernos un poco en el c&lculo de la moda para distri$uciones cuantitati%as continuas' a) Para ,a(*$ $ ' a0r&1ar Ejemplo: #etermine la moda del siguiente conjunto de notas: 1' 6' GBK GAK GCK 16K GCK 1G GH GDK GFK GDK GHK G6K 11K 1BK 1H

4 N

51

56 1

57 2

15 1

12 1

#istri$uci)n unimodal Mo > C

4 N

52 1

58 2

59 2

5:

11 1

11

18 1

#istri$uci)n $imodal Mo1 > GH y Mo6 > GD !) Para ,a(*$ a0r&1a,*$

11

FAIM-UNCP-CURSO DE ACTUALIZACIN

"poy&ndonos en el gr&fico podemos llegar a la determinaci)n de la e-presi)n para la Moda que es:

Lni M ni-1L Mo > (i-1 ? ------------------------------------ ' ai Lni M ni-1L? Lni M ni-1L
Otros autores dan una e-presi)n apro-imada para la moda que %iene dada por la siguiente e-presi)n:

Ejemplo: :eamos su c&lculo mediante un ejemplo, para ello usaremos los datos del apartado anterior

(i-1 HA AA DA FA CA

(i AA DA FA CA EA

ni D 1G 1E 11 H

@i D 1D BA HD AG

12

5tilizando la f)rmula apro-imada

2.8. OTRAS MEDIDAS. a).- LA MEDIA GEOMETRICA.- (a media geomtrica de n %alores positi%os, x1 , x2 , x3 ,...., xn , es el n7mero xG que se define como la ra*z ensima del producto de estos n %alores' Esto es:
xG = n x1 x2 x3 ....xn 1 xn

!or ejemplo, la media geomtrica de los %alores B, E, 6F es igual a:


xG = 3 3 x9 x 27 = 9

(a media geomtrica se utiliza para promediar: razones (a8$ , *ndices (a8$ en I , proporciones (a8(a?$ , tasas de cam$io (a-$ 8$, que %ar*an con el tiempo, entre otros' E;#+1"* 1.3i una producci)n 4a e-perimentado un crecimiento del BGI del primero al segundo a,o y un incremento del BAI del segundo al tercer a,o y un decrecimiento del 1AI del tercer al cuarto a,o' a $ Calcular la tasa promedio de los B 7ltimos a,os' Calcular la producci)n del quinto a,o, si la del primer a,o es 1GG

Solucin: a Jomando como producci)n $ase 1GG para el primer a,o' En el segundo a,o, el porcentaje de crecimiento es de BGI, la producci)n es: 1BG ? G'BG-1GG>1BG y la tasa de crecimiento es 1BG81GG> 1'BG En el tercer a,o, el porcentaje es de BAI, la producci)n es: 1BG?G'BA-1BG>1FA'A y la tasa de crecimiento es 1FA'A81BG>1'BA En el cuarto a,o, el porcentaje de crecimiento es de -1AI, la producci)n es: 1FA'A-G'1A(1FA'A >1HE'1FA y la tasa de crecimiento es 1HE'1FA81FA'A>G'CA

A<*
1

= Cr#% + #'(*
-

Pr*,&%% >'
1GG

Ta$a$
-

13

FAIM-UNCP-CURSO DE ACTUALIZACIN
6 B H BGI 6AI -1AI 1GG?G'B(1GG >1BG 1BG?G'BA(1BG >1FA'A 1FA'A-G'1A(1FA'A >1HE'1FA 1BG81GG>1'BG 1FA'A81BG>1'BA 1HE'1FA81FA'A>G'CA

El promedio de las tasas de aumento durante los tres 7ltimos a,os es la media geomtrica:

xG = 3 1.30 x1.35 x0.85 = 1.1426 = 1 + 14.26 100


Esto es, el porcentaje promedio de crecimiento es de 1H'6DI $ (a producci)n para el quinto a,o es igual a: 1HE'1FA?G'1H6D-1HE'1FA>1FG'HH a).- LA MEDIA ARMNICA.- (a media arm)nica de n %alores no nulos, x1 , x2 , x3 ,...., xn , es el n7mero xH que se define como el rec*proco de la media aritmtica de los rec*procos de esos n %alores'

xH =

x
i =1

1
i

!or ejemplo la media arm)nica de los %alores D, H y B es igual a H' (a media arm)nica se utiliza para o$tener promedios de %alores que est&n en relaci)n in%ersa como la %elocidad y el tiempo' En general, se usa para o$tener el promedio de un conjunto de %alores e-presados en forma de tasas de unidades de un tipo por unidades de otro tipo (por ejemplo Nm84 '

E;#+1"* 2.5na persona manejando su autom)%il recorre los primeros 1G Nm a DG Nm84 y los siguientes 1G Nm a FG Nm84' calcular la %elocidad media' Solucin: !ara recorrer los primeros 1G Nm usa 1G8DG 4oras' !ara recorrer los siguientes 1G Nm usa 1G8FG 4oras' !or lo tanto para cu$rir los 6G Nm (1G?1G se emplearon (1G8DG ?(1G8FG 4oras con un promedio de %elocidad de:

14

xH =

R! corrido total 10 + 10 = = 64.6 Km h 10 10 Tiempo total + 60 70

III. MEDIDAS DE DISPERSIN

Jal y como se adelanta$a antes, otro aspecto a tener en cuenta al descri$ir datos continuos es la dispersi)n de los mismos' E-isten distintas formas de cuantificar esa %aria$ilidad' -.1.- RANGO: Es la primera medida que %amos a estudiar, se define como la diferencia e-istente entre el %alor mayor y el menor de la distri$uci)n,' (o notaremos como R. Realmente no es una medida muy significati%a e la mayor*a de los casos, pero induda$lemente es muy f&cil de calcular' 9emos estudiado %arias medidas de centralizaci)n, por lo que podemos 4a$lar de des%iaci)n con respecto a cualquiera de ellas, sin em$argo, la mas utilizada es con respecto a la media' Ejemplo: 3i las calificaciones del rendimiento en el tra$ajo del .rupo " tiene un alcance de G6K 1E y la del .rupo O GHK 1E ;Cu&l de los .rupos tiene mayor rango< Respuesta El .rupo " tiene un rango mayor que el .rupo O, esto quiere decir que en el .rupo " los rendimientos est&n mas dispersos' -.2.- DESVIACIN MEDIA D.M.: Es la suma de los %alores a$solutos de la des%iaciones de los datos o marcas de clase con respecto a la media aritmtica' a) Para ,a(*$ $ ' a0r&1ar

#onde: =i > Marca de clase = > Media

15

FAIM-UNCP-CURSO DE ACTUALIZACIN
@ > @7mero de o$ser%aciones Ejemplo: 3ean los calificati%os de rendimientos en el tra$ajo del grupos ": GCK 1GK 16K 1H GC ? 1G ? 16 ?1H 9allando = > ------------------------- > 11 H P(GC-11 P ? P(1G-11 P ? P(16-11 P ? P(1H-11 P #'M > ---------------------------------------------------------H B?1?1?B #'M > ---------------------- > 6 H

!) Para ,a(*$ a0r&1a,*$

Ejemplo: Calcular la #'M' de un conjunto de calificaciones de rendimientos en el tra$ajo: Qi-1 Qi GG M GH GH M GC GC M 16 16 M 1D 1D M 6G ni 1G 6 16 C 1C AG =i 6 D 1G 1H 1C =ini 6G 16 16G 116 B6H ACC P=i-= P E,FD A,FD 1,FD 6,6H D,6H P=i-= Pni EF,D 11,A6 61,16 1F,E6 116,B6 6DG,HC

6DG,HC #'M > ----------- > A,61G AG

-.-.- VARIANZA :

16

Es la media de los cuadrados de las des%iaciones, y la denotaremos por ' a) Para ,a(*$ $ ' a0r&1ar

o tam$in por

Esta %arianza muestral se o$tiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la %aria$le estudiada' Ejemplo: 3ean los calificati%os de rendimientos en el tra$ajo del grupos ": GCK 1GK 16K 1H

GC ? 1G ? 16 ?1H 9allando = > ------------------------- > 11 H (GC-11 6 ? (1G-11 6 ? (16-11 6 ? (1H-11 6 36- > ---------------------------------------------------------H E?1?1?E 36- > ---------------------- > A H

!) 1ara ,a(*$ a0r&1a,*$

"unque tam$in es posi$le calcularlo como:

Este estad*stico tiene el incon%eniente de ser poco significati%o, pues se mide en el cuadrado de la unidad de la %aria$le, por ejemplo, si la %aria$le %iene dada en cm' (a %arianza %endr& en cm6'

17

FAIM-UNCP-CURSO DE ACTUALIZACIN
Ejemplo Q1-1 Qi =i 1 B A F E 11 1B 1A @i B A 6 16 C B F 1G AG =ini B 1A 1G CH F6 BB E1 1AG HAC (-i-=
6

(=i-= 6ni 1EE,FAF 1CE,F6C HB,D11 AA,ECF G,6GH 1G,1AD 1GB,66G BH1,GAD EBH,F1E

GG M G6 G6 M GH GH M GD GD M GC GC M 1G 1G M 16 16 M 1H 1H M 1D

DD,ACD BF,EHD 1F,BGD H,DDD G,G6D B,BGD 1H,FHD BH,1GD

EBH,F1E 36- > --------------- > 1C,DEH AG

-.8.- DESVIACIN T.PICA (S) : Es la ra*z cuadrada de la %arianza' E-presa la dispersi)n de la distri$uci)n y se e-presa en las mismas unidades de medida de la %aria$le' (a des%iaci)n t*pica es la medida de dispersi)n m&s utilizada en estad*stica' a) Para ,a(*$ $ ' a0r&1ar

"unque esta f)rmula de la des%iaci)n t*pica muestral es correcta, en la pr&ctica, la estad*stica nos interesa para realizar inferencias po$lacionales, por lo que en el denominador se utiliza, en lugar de n, el %alor n-1' !or tanto, la medida que se utiliza es la cuasides%iaci)n t*pica, dada por:

"unque en muc4os conte-tos se utiliza el trmino de des%iaci)n t*pica para referirse a am$as e-presiones'

Ejemplo:

18

3ean los calificati%os de rendimientos en el tra$ajo del grupos ": GCK 1GK 16K 1H GC ? 1G ? 16 ?1H 9allando = > ------------------------- > 11 H (GC-11 6 ? (1G-11 6 ? (16-11 6 ? (1H-11 6 3- >R ---------------------------------------------------------H E?1?1?E 3- > R---------------------H 3- > >RA > 6'6H

!) Para ,a(*$ a0r&1a,*$

Este estad*stico se mide en la misma unidad que la %aria$le por lo que se puede interpretar mejor' Ejemplo: 3- > R s63- > R1C,DEH 3- > H,B6 -.6.- COEFICIENTE DE VARIACIN (C: ' Es una medida de dispersi)n relati%a de los datos y se calcula di%idiendo la des%iaci)n t*pica muestral por la media y multiplicando el cociente por 1GG' 3u utilidad estri$a en que nos permite comparar la dispersi)n o %aria$ilidad de dos o m&s grupos' "s*, por ejemplo, si tenemos el peso de A tra$ajadores (FG, DG, AD, CB y FE Ng cuya media es de DE,D Sg' y su des%iaci)n t*pica (s > 1G,HH y la J"3 de los mismos (1AG, 1FG, 1BA, 1CG y 1EA mm9g cuya media es de 1DD mm9g y su des%iaci)n t*pica de 61,B' (a pregunta ser*a: ;qu distri$uci)n es m&s dispersa, el peso o la tensi)n arterial< 3i comparamos las des%iaciones t*picas o$ser%amos que la des%iaci)n t*pica de la tensi)n arterial es muc4o mayorK sin em$argo, no

19

FAIM-UNCP-CURSO DE ACTUALIZACIN
podemos comparar dos %aria$les que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de %ariaci)n:

Ejemplo: 3C':' > --------- 1GGI = H,B6 C':' > ------- 1GG > HF,1D (#atos 4eterogneos E,1D

IV. CORRELACION Y REGRESION 8.1.- CORRELACIN: 3e llama correlaci)n a la relaci)n entre dos o m&s %aria$les estad*sticas referidas a una misma muestra. El grado de correlaci)n entre dos %aria$les se mide mediante los coeficientes de correlaci)n C"a$#$ ,# %*rr#"a% >' E-isten %arias clases, %eamos solo algunos: a $ c d Correlaci)n simple: Cuando se realiza entre dos %aria$les Correlaci)n m7ltiple: Cuando inter%ienen tres o m&s %aria$les Correlaci)n lineal: Cuando el diagrama de dispersi)n tiende a formar una cur%a Correlaci)n no lineal: Cuando el diagrama de dispersi)n tiende a formar una cur%a

D a0ra+a$ ,# D $1#r$ >' 3i las %aria$les (= e Q que se relacionan, se lle%an a graficarlas en un plano cartesiano, o$tendremos una nu$e de puntos de di%ersas representaciones y correspondindoles a cada diagrama de dispersi)n su respecti%o coeficiente de correlaci)n el mismo que s)lo %ariar& entre -1'GG T> r T> ?1'GG

20

Gra,*$ ,# C*rr#"a% >' Cuando la correlaci)n es directa, el coeficiente de correlaci)n es positi%a, es decir el diagrama de dispersi)n tiene una orientaci)n de a$ajo 4acia arri$a y de izquierda a derec4a' Cuando la correlaci)n es in%ersa, el coeficiente de correlaci)n es negati%o, es decir el diagrama de dispersi)n tiene una orientaci)n de a$ajo 4acia arri$a pero de derec4a a izquierda

Ta!"a ,# E"*r?a3 @ (1A7:) #e U G,ED a U 1,GG : Correlaci)n perfecta #e U G,CA a U G,EA : Correlaci)n fuerte #e U G,FG a U G,CH : Correlaci)n significati%a #e U G,AG a U G,DE : Correlaci)n moderada #e U G,6G a U G,HE : Correlaci)n d$il #e U G,1G a U G,1E : Correlaci)n muy d$il #e U G,GG a U G,GE : Correlaci)n nula 8.2.- CORRELACIN Y REGRESIN: Cuando $as&ndose en datos muestrales, se desea estimar el %alor, de una %aria$le Q correspondiente a un %alor dado de una %aria$le =, se puede corregir estimando al %alor de Q de la cur%a de m*nimos cuadrados, que ajusta con datos muestrales' (a cur%a resultante se llama C5R:" #E RE.RE3/O@ de Q so$re =, ya que Q se estima a partir de los %alores de ='

21

FAIM-UNCP-CURSO DE ACTUALIZACIN
3e puede resumir , que se puede estimar (regresi)n el %alor de una %aria$le a partir de una o mas %aria$les relacionadas (correlaci)n es decir en que medida una ecuaci)n lineal ( o no lineal , e-plica o descri$e adecuadamente al relaci)n entre %aria$les' La LB'#a R#%(a Q > aG ? a1= #onde aG y a1 son constantes y pueden ser 4allados #ados los puntos cualesquiera (-1,y1 y (-6,y6 de la recta, la ecuaci)n puede e-presarse tam$in Q6-Q1 Q M Q1 > ----------- (=-=1 =6-=1

Q-Q1 > m(=-=1

Q6-Q1 #onde VmW es la pendiente de la l*nea recta > m > ----------=6-=1 R#%(a ,# MB' +*$ C&a,ra,*$ 3ean los puntos: (=1,Q1 ,(-6,y6 X''K(-n,Qn , y la recta de apro-imaci)n por m*nimos cuadrados, tiene la ecuaci)n: Q > aG ? a1= #onde para 4allar las constantes: aG, a1 a partir del sistema de ecuaciones: Ecuaciones normales para la recta de m*nimos cuadrados YQ > aG@?a1Y= Y=Q > aGY= ? a1Y=6 (as constantes aG y a1 se o$tienen:

(YQ (Y=6 -(Y= (Y=Q "G > --------------------------------@Y=6 M (Y= 6 Ejemplo:

@Y=Q-(Y= (YQ a 1 > --------------------------@Y=6-(Y= 6

"justar una recta de m*nimos cuadrados a los datos de la ta$la adjunta, tomando (a = como %aria$le independiente y ($ Q como %aria$le dependiente = Q B 6 A B D H C D E 11 A C

22

= B A D C E 11

Q 6 B H D A C

=6 E 6A BD DH C1 161 BBD

=Q D 1A 6H HC HA CC 66D

Q6 H E 1D BD 6A DH 1AH

Y> H6 6C

(as ecuaciones de la recta y las ecuaciones normales son: Q > aG ? a1= YQ > aG@?a1Y= Y=Q > aGY= ? a1Y=6 DaG ? H6a1 > 6C X'XX(1 H6aG ? BBDa1 > 66D X''(6 Resol%iendo el sistema de ecuaciones se tiene: -6A6aG M 1FDHa1 > -11FD 6A6aG ? 6G1Da1 > 1BAD ----------------------------------G ? 6ADa1 > 1CG a1 > 1CG86A6 > G,F1 aG > -18B > -G,B Y C -53- D 53:14 !ara la ecuaci)n de la recta usar = > $G ? $1Q con las siguientes ecuaciones normales Y= > $G@ ? $1YQ Y=Q > $GYQ ? $1YQ6 3e de$e llegar a la Ec' 4 C 1355 D 132AY

8.-.- COEFICIENTE DE CORRELACIN ErF DE PEARSON Es el coeficiente ideado por Narl !earson, estad*stico ingls, y es el *ndice de correlaci)n m&s usado' (a escala que utiliza es de inter%alo o de raz)n y se define como la media de los productos de las puntuaciones Mz de am$as %aria$les (=KQ 3im$)licamente: YZ-Zy r > ----------------@

23

FAIM-UNCP-CURSO DE ACTUALIZACIN
r > Coeficiente de correlaci)n de !earson Z- > !untuaci)n Z de la %ariaci)n = Zy > !untuaci)n Z de la %ariaci)n Q YZ-Zy > 3umatoria de los productos de las puntuaciones @ > @7mero de las puntuaciones +)rmula directa para el c&lculo del coeficiente r de !earson a partir de las calificaciones $rutas @Y=Q M (Y= (YQ r > -------------------------------------------------R[@Y=6 M (Y= 6\ [@YQ6 M (YQ 6\ #onde: Y= : 3umatoria de las calificaciones $rutas de la %aria$le = YQ : 3umatoria de las calificaciones $rutas de la %aria$le Q Y=Q: 3umatoria del producto de las calificaciones: = e Q Y=6 : 3umatoria de los cuadrados de las calificaciones = YQ6 : 3umatoria de los cuadrados de las calificaciones Q (Y= 6 : Cuadrado de la sumatoria de las calificaciones = (YQ 6 : Cuadrado de la sumatoria de las calificaciones Q @ : @7mero de calificaciones pareadas r : Coeficiente de correlaci)n de !earson Ejemplo: 9allar el coeficiente de correlaci)n r de !earson de las puntuaciones originales de 1H tra$ajadores que o$tu%ieron en dos prue$as de rendimiento la$oral' Jra$aj' 1 6 B H A D F C E 1G 11 16 1B 1H @>1H = 1C 1C 1F 1F 1D 1D 1A 1A 1H 1H 1B 1B 16 16 Y >61G B B 6 6 1 1 G G -1 -1 -6 -6 -B -B -6 E E H H 1 1 G G 1 1 H H E E AD Q 6C BG BG 6D 6C 6H 66 6G 6D 66 6H 6C 6G 1C BBD y H D D 6 H G -6 -H 6 -6 G -D -H -D y6 1D BD BD H 1D G H 1D H H G BD 1D BD 66H Z1,A 1,A 1,G 1,G G,A G,A G,G G,G -G,A -G,A -1,G -1,G -1,A -1,A Zy Z-Zy 1,G 1,AG 1,A 6,6A 1,A 1,AG G,A G,AG 1,G G,AG G,G G,GG -G,A G,GG -1,G G,GG G,A -G,6A -G,A G,6A G,G G,GG -1,A 1,AG -1,G 1,AG -1,A 6,6A 11,AG

YZ-Zy r > ----------------@

24

-] > Y-8@ > 61G81H > 1AK y] > Yy8@ > BBD81H > 6HK

Z- > (- M-^ 83-K 3- > R(Y-68@ > R (AD81H > R H > 6 Zy > (y My^ 83yK 3y > R(Yy68@ > R (66H81H > R 1D > H

Z-A > (1D-1A 8 3- > _ > G,AG K Z-1B >(16-1A 86 > -B86 > -1,AG YZ-Zy r > ----------------- > 11,AG81H > G,C6 @ 8.8.- ERROR ESTGNDAR DE ESTIMACIN (SH2 3i el coeficiente de correlaci)n lineal es 1,GG, o sea la relaci)n entre las dos %aria$les es perfecta, entonces, los %alores de Q o$ser%ados, corresponder&n e-actamente igual a la pre%ista' !ero en in%estigaciones sociales, este tipo de correlaciones perfectas no se dan' (as que si se dan usualmente, son cuando la correlaci)n es nula (r>G e-istir& un error muy grande en toda la predicci)n, en cam$io si el coeficiente de correlaci)n es alto (r>G,EG por ejemplo, el error de predicci)n de las Q o$ser%adas con las puntuaciones y pre%istas ser& m*nimo' !ara 4allar o medir este error, se utiliza el Error Est&ndar de Estimaci)n' El Error Est&ndar de Estimaci)n %ar*a entre G y la des%iaci)n est&ndar de la %aria$le dependiere (Q y es igual a:

S xy =

#Y 2 #Y " 2 N

# XY # X "#Y " N " N 2

# X " 2 N

E;#r% % *: 3eg7n el caso anterior: = B A D C E 11 Q 6 B H D A C =6 E 6A BD DH C1 =Q D 1A 6H HC HA Q6 H E 1D BD 6A DH

161 CC

Y> H6 6C BBD

66D 1AH

3-y > R

[Y=Q M (Y= (YQ 8@ \ [YQ6 - (YQ 68@\ - ------------------------------Y =6 M (Y= 68@ ---------------------------------------------------------@-6 [66D M (H6 (6C 8D \

25

FAIM-UNCP-CURSO DE ACTUALIZACIN
3-y > R [1AH - (6C 8D\ - ------------------------------BBD M (H6 68D ---------------------------------------------------------D-6
6

[6B,B M 61,HB\ 3-y > R -------------------- > G,DCE H

26

ESTAD.STICA APLICADA
CON

(SEGUNDA PARTE)

ING. RODOLFO BALTAZAR LAPA

27

FAIM-UNCP-CURSO DE ACTUALIZACIN
INTRODUCCIN El paquete estad*stico 3!33 (Statistical PacSage for Social Sciences , es un soft`are para ordenadores personales de tipo modular destinado a realizar una gran %ariedad de an&lisis estad*sticos' "unque son muc4os los m)dulos que posee los m&s importantes son: BASE. +orma el n7cleo del sistema y como tal de$e permanecer residente en memoria' En l se encuentran los comandos necesarios para el acceso, la manipulaci)n, el an&lisis y la presentaci)n de datos' @os permite acceder a una gran %ariedad de fuentes de datos, entre las que se encuentran dOase, (otus, E-cel, y a tra%s de O#OC, "ccess !arado-, 3a( 3er%er, Oracle, y muc4os m&s' (os procedimientos estad*sticos $&sicos que incluye, son "n&lisis E-ploratorio de #atos, Ja$las de Contingencia, Comparaci)n de Medias, "n&lisis de la :arianza, !rue$as no !aramtricas, Correlaci)n y Regresi)n (ineal M7ltiple' Esta 7ltima %ersi)n del 3!33 incluye adem&s, "n&lisis +actorial, #iscriminante, de Conglomerados, y C&lculo de !ro-imidades' ESTAD.STICAS PROFESIONALES. Este m)dulo contiene procedimientos estad*sticos tales como Regresi)n log*stica, Regresi)n no lineal restringida y no restringida, Cuadrados m*nimos ponderados, Cuadrados m*nimos en dos fases, Escalado Multidimensional, Modelos (ogit y !ro$it y "n&lisis de +ia$ilidad' ESTAD.STICAS AVANZADAS. En este m)dulo se recogen aquellos an&lisis estad*sticos a%anzados como son el Modelo (ineal .eneral (M(. , el "n&lisis (oglineal, 9iloglineal, y .enlog, la Estimaci)n de componentes de la %arianza, el "n&lisis de 3uper%i%encia, la Estimaci)n Naplan-Meier, la Regresi)n de Co- con co%aria$les dependientes en el tiempo, los Modelos Mano%a y la Oi$lioteca de Macros' TENDENCIAS. Este es el m)dulo dedicado al tratamiento y an&lisis de 3eries Jemporales' !odemos separar las series en sus componentes guardando los factores estacionales, tendencias c*clicas, y componentes de error autom&ticamente' /ncluye las Jcnicas de Oo--benSins y "n&lisis Espectral' CATEGOR.AS. "qu* se incluyen programas relati%os a los !rocedimientos de Escalamiento, "n&lisis de Correspondencias 3imple y M7ltiple' ANGLISIS CONIUNTO. !ermite tra$ajar con medidas del impacto de atri$utos indi%iduales en productos o preferencias de consumidores y genera tarjetas en las que los entre%istadores pueden ordenar para indicar sus preferencias en funci)n de los atri$utos' TABLAS. Este 7ltimo m)dulo contiene los programas encaminados a la ela$oraci)n de Ja$las !i%ote de alta calidad, con una gran cantidad de opciones de formato y presentaci)n' El 3!33 se puede emplear de una manera interacti%a, o como un programa en el que se procesan %arias tareas de una sola %ez' El Mtodo Interactivo consiste en elegir el procedimiento estad*stico que se desea a tra%s de men7s y cuadros de di&logo que recogen los aspectos m&s rele%antes de la tarea que se %aya a realizar' Como programa, el 3!33 est& organizado en $ase a comandos, que constituyen los elementos de un lenguaje' Cada procedimiento tiene asociado una serie de comandos y con la com$inaci)n de los mismos se puede ela$orar un fic4ero de sinta-is para lle%ar a ca$o an&lisis estad*sticos m&s complejos' (os fic4eros de sinta-is se ejecutan directamente mediante la opci)n Ejecutar Proceso dentro del men7 Utilidades' " esta opci)n se la denomina Proceso por lotes'

28

I GENERALIDADES El paquete estad*stico 3!33, responde al funcionamiento de todo programa que lle%a a ca$o an&lisis estad*sticos: pasados los datos a analizar a un fic4ero con las caracter*sticas del programa, ste es analizado con una serie de )rdenes, dando lugar a unos resultados de tipo estad*stico que el in%estigador de$e interpretar' Este camino a seguir es el que guiar& la presentaci)n de 3!33 que efect7a este mini-manual, de$ido a que es el camino m&s natural de aprendizaje del mismo' 1.1.- EL PROCEDIMIENTO GENERAL DE RESOLUCIN DE UN PROBLEMA CON SPSS. (os pasos a seguir para lle%ar a ca$o un an&lisis de tipo estad*stico son los siguientes: 12 Recoger la informaci)n del pro$lema que se desee in%estigar y tenerla organizada generalmente en papelK 62 .ra$ar esa informaci)n en un arc4i%o de datos correspondiente al programa que se %a a usar, en el caso de 3!33 en un arc4i%o que tiene el nom$re que deseemos, pero que posee forzosamente la e-tensi)n .$a) K B2 3o$re tal arc4i%o de datos se lle%ar& a ca$o el an&lisis con 3!33, usando diferentes procedimientos que como %eremos se seleccionan de distintos men7sK H2 (os resultados de tales an&lisis son %olcados a un %isor de resultados en el que su %isualizaci)n y edici)n es m&s c)moda, y desde el que se pueden guardar en un fic4ero de nom$re el que se desee, pero de e-tensi)n .$1* ' A2 El in%estigador interpreta los resultados y e-trae las conclusiones que le parecen rele%antes de los mismos, y con eso se cierra el ciclo so$re el que estamos tra$ajando' El procedimiento que aca$amos de especificar es el que se sigue siempre en este tipo de an&lisis, y es el que su$yace a toda la presentaci)n que aqu* se 4ace, por tanto empezaremos a entrar en detalle de los pasos para lle%arlo a ca$o' 1.2.- LA VENTANA PRINCIPAL DE SPSS: EL EDITOR DE DATOS DE SPSS. El paquete 3!33, desde la %ersi)n F, es un paquete adaptado al entorno c/@#Oc3 con lo cual la forma de ejecutarlo es a tra%s de %entanas en las que se despliegan men7s, de los que se pueden elegir distintas opciones y as* sucesi%amenteK por tanto es a tra%s de un entorno de tipo gr&fico desde donde se sol%entan los pro$lemas, y no a tra%s de comandos (aunque tam$in se puede 4acer as* como se 4ac*a antes en los paquetes estad*sticos m&s usuales' !or lo que aca$amos de decir, la forma de iniciar la ejecuci)n del programa 3!33 es pinc4ando dos %eces con el rat)n (Vpinc4arW lo utilizaremos como sin)nimo de V4acer clicW con el $ot)n principal del rat)n en el icono de 3!33 que es como el de la +igura, y que se suele encontrar en el escritorio en forma de enlace o en el men7 de inicio dentro del apartado de programas' 5na de las primeras tareas que tendr& que 4acer el usuario de 3!33 ser& localizar la posici)n del icono y adaptarlo a su gusto para que la entrada al programa sea f&cil' Cuando se 4a pinc4ado dos %eces so$re el icono, se a$re la %entana principal de 3!33 que es el E, (*r ,# ,a(*$ ,# SPSS, aunque tam$in la llamaremos %entana principal de 3!33' Esta %entana tiene dos %ersiones o %istas: %ista de datos y %ista de %aria$les' En la figura podemos %er la ) $(a ,# ,a(*$K en ella aparecen ya incorporados los datos del fic4ero de datos #;#+1"*.$a) (que es el fic4ero que nos acompa,ar& a lo largo de todo el manual ' En la figura aparece la ) $(a ,# )ar a!"#$K en ella se muestran las caracter*sticas de todas las %aria$les del fic4ero de datos' #e una %ista a otra se cam$ia pinc4ando con el rat)n en la pesta,a correspondiente en la parte inferior izquierda de la %entana #entro de la %ista de datos se pueden distinguir %arias zonas' (a primera zona (parte m&s alta de la %entana, generalmente en color azul est& formada por la $arra que contiene el nom$re de la %entana, incluyendo el nom$re del fic4ero de datos acti%o si e-iste, en nuestro caso el #;#+1"*.$a)' (a segunda zona a destacar (justo de$ajo de la anterior es la zona de los men7s en la que

29

FAIM-UNCP-CURSO DE ACTUALIZACIN
aparecen los nom$res de los men7s desplega$les que nos ser%ir&n para lle%ar a ca$o nuestras tareas'

1.-.- MENU PRINCIPAL (os men7s que se pueden desplegar figuran en la siguiente ta$la con una $re%e descripci)n de lo que se puede 4acer con ellos, descripci)n que corresponde en muc4os casos con la de cualquier programa cindo`s que presenta tales men7s'

30

Ta!"a. M#'J$ ,# "a )#'(a'a 1r '% 1a" ,# SPSS M#'J Ar%K )* F&'% >' Jodas las funciones que se pueden 4acer con arc4i%os: "$rir, cerrar, guardar, importar, e-portar, imprimir, etc' E, % >' Realiza todas las funciones t*picas de la edici)n como son: cortar, copiar, eliminar, $uscar, reemplazar, etc''' V#r !ermite controlar la forma en la que se %e la pantalla principal, controlando las $arras que aparecen en ella as* como la forma en la que se presentan los datos' Da(*$ Contiene el conjunto de acciones que se pueden lle%ar a ca$o con los datos: definir propiedades de las %aria$les, seleccionar casos, ordenar casos y muc4as m&s' Tra'$L*r+ar !ermite realizar cualquier funci)n conducente a crear nue%as %aria$les a partir de otras e-istentes o no: transformar, recodificar, asignar rangos, etc''' A'a" ?ar "cceso al conjunto de programas de 3!33, que %an desde la generaci)n de una ta$la de frecuencias a an&lisis multi%ariantes complejos' GrML %*$ "cceso al conjunto de gr&ficos estad*sticos que %an desde un simple 4istograma al di$ujo de una cur%a ROC' U( " ,a,#$ "cceso a la descripci)n de las %aria$les del fic4ero acti%o, creaci)n de grupos de %aria$les, as* como edici)n de los men7s' V#'(a'a "cceso r&pido a las %entanas de datos, de resultados, de sinta-is' N "yuda en l*nea so$re todo el paquete 3!33' Como se puede o$ser%ar en la ta$la, $ajo una de las letras del r)tulo del men7, aparece un su$rayado, indicando tal cosa que com$inando la tecla "lt con la letra su$rayada se puede desplegar el men7 correspondiente, pudiendo desplazarse uno por l sin m&s que usar las teclas de flec4a presentes en el teclado'

Muc4as de las opciones de estos men7s las %amos a ir estudiando y utilizando a lo largo de este manual' Comentaremos aqu* s)lo algunas opciones $&sicas de uso general' (a opci)n A!r r, del men7 Ar%K )*3 nos permite a$rir un arc4i%o (generalmente de datos para empezar a tra$ajar con l' 9oy d*a, esta opci)n es com7n (y funciona igual en casi todos los programas cindo`s' "l pinc4ar so$re ella se a$re una %entana como la de la +igura' En la primera caja de esta %entana (justo a la derec4a de B&$%ar #' se coloca la carpeta donde est& el arc4i%o que queremos a$rirK pinc4ando en la pesta,a d podemos acceder al

31

FAIM-UNCP-CURSO DE ACTUALIZACIN
&r$ol de carpetas y seleccionar la que corresponda (por defecto aparece la carpeta 3!33 ' En la 7ltima caja y pulsando la pesta,a d, podemos seleccionar el tipo de arc4i%o que queremos a$rir (por defecto aparece arc4i%os de datos de 3!33, esto es, con e-tensi)n .$a) K entonces en la segunda caja (la m&s grande de la %entana aparecer& una lista con todos los arc4i%os del tipo seleccionado que e-isten en la carpeta seleccionada, y de a4* seleccionaremos el que deseemos a$rir, que aparecer& escrito en la tercera caja de la %entana' +inalmente, pulsando el $ot)n A!r r, se a$rir& el arc4i%o' este tam$in se puede a$rir 4aciendo do$le clic so$re su nom$re en la segunda caja' Jam$in en el men7 Ar%K )* tenemos dos opciones para guardar el fic4ero de datos acti%o' (a opci)n G&ar,ar permite almacenar el fic4ero acti%o en un disco' 3i el fic4ero acti%o 4a sido le*do pre%iamente se guardar& con el mismo nom$re que ten*a (el fic4ero original que e-ist*a en el disco se perder& ' !or el contrario si el fic4ero 4a sido creado sin que e-ista ninguna imagen de l en el disco, se nos pedir& que demos un nom$re al nue%o fic4ero en el que se %a a guardar la informaci)n' #e$e quedar claro que esta opci)n siempre guarda un fic4ero de datos de 3!33, es decir, aqul que tiene una e-tensi)n .$a). !or el contrario la opci)n G&ar,ar %*+*... permite guardar el fic4ero acti%o con otro nom$re y8o con formato de otras aplicaciones inform&ticas, como $ases de datos u 4ojas de c&lculo'

Cuando se selecciona la opci)n se a$re una %entana, en la que se seleccionar& la carpeta donde se %a a guardar el arc4i%o, se escri$ir& el nom$re del arc4i%o donde se desea guardar la informaci)n, se seleccionar& el tipo de arc4i%o deseado y se pulsar& el $ot)n G&ar,ar' (a opci)n /mprimir, del men7 Ar%K )*3 nos permite sacar por impresora el fic4ero acti%o (todo o una parte de l y funciona de forma similar a otras aplicaciones cindo`s' +inalmente, la opci)n D#$Ka%#r, del men7 E, % >', nos permite des4acer, si es posi$le, la 7ltima acci)n que 4emos realizado' (a tercera zona de la %entana principal de 3!33, que est& formada por iconos, es la que se denomina $arra de 4erramientas y en ella aparecen los iconos que representan acciones muy comunes que se pueden lle%ar a ca$o con 3!33 (y de las que se desea un acceso m&s r&pido K cuando uno pasea el cursor por encima de los iconos se despliega un te-to que indica la acci)n que lle%a a ca$o' (os iconos aparecer&n resaltados o no seg7n estn o no accesi$les en un momento determinado' (a $arra de 4erramientas puede configurarse y a,adir o eliminar iconos en ella, pero los m&s comunes son los que aparecen en la +igura y que ser&n descritos cuando se utilicen por primera %ez' !or a4ora, s)lo mencionar que los

32

iconos 1, 6, B y A realizan, respecti%amente, las funciones $&sicas de a$rir, guardar, imprimir y des4acer, ya descritas en los p&rrafos anteriores' II TRABAIANDO CON SPSS En todas las situaciones la e-plicaci)n se acompa,ar& de un ejemplo que nos ayudar& a e-plicar de manera aplicada los detalles de los procedimientos que estemos estudiando, tal ejemplo es el que se e-pone a continuaci)n' 2.1.- UN EIEMPLO OUE NOS ACOMPAPARG A LO LARGO DEL MANUAL. El ejemplo que emplearemos tiene sus datos gra$ados en un fic4ero denominado #;#+1"*.$a)K en este fic4ero aparecen los datos referentes a un estudio acerca de los tra$ajadores de una empresa' (a descripci)n de las %aria$les se muestra en la Ja$la, que pretende ser suficientemente e-plicati%a como para que el lector entienda la informaci)n gra$ada all*' El lector de$er*a familiarizarse con las %aria$les presentes en el fic4ero, pues se 4ar& continua referencia en el te-to a tales %aria$les en cada uno de los apartados en los que se estudie' Ta!"a. D#$%r 1% >' H '*+!r# ,# "a$ )ar a!"#$ a &$ar #' "*$ #;#+1"*$ DESCRIPCION DE LAS VARIABLES Edad (a,os Estado ci%il (G>solteroK1>casado ",os en la direcci)n actual /ngresos familiares en miles Categor*a de ingresos en miles (1>menos de 6AK 6>6A a HEK B>AG a FHK H>FA a mas @i%el de educaci)n(1>!rimariaK6>3egundariaKB>Est'3up' H>Oac4illerKA>Jitulado Jiempo en la empresa actual (a,os Jiempo en la categor*a actual (1>menos de AK 6>de A a 1AK B>mas de1A .enero(4>4om$reK m>mujer @umero de personas en el 4ogar Jiene internet (G>@oK 1>3i Jiene J: (G>@oK 1>3i Jiene %ideo (G>@oK 1>3i Jiene computadora (G>@oK 1>3i Jiene telfono (G>@oK 1>3i NOMBRE DE LAS VARIABLES E#"# EC/:/( #/RECC@ /@.RE3O3 C"J/@. E#5C EM!(EO C"JEM! .E@ERO RE3/#E@J /@JER@EJ J: :/#EO !C JE(E+O@O

33

FAIM-UNCP-CURSO DE ACTUALIZACIN

Ta!"a. Da(*$ a &$ar #' "*$ #;#+1"*$ @f 1 6 B H A D F C E 1G 11 16 1B 1H 1A 1D 1F 1C 1E 6G 61 66 6B 6H 6A 6D 6F 6C 6E E#"# AA AD 6C 6H 6A HA HH HD H1 6E BH AA 6C 61 AA BA HA 61 B6 H6 HG BD H6 DA A6 A1 HH 6D H1 EC/:/( 1 G 1 1 1 G 1 1 G G G G G 1 G G G G G G 1 G 1 1 1 1 1 G 1 #/RECC@ 16 6E E H 6 E 1F 6G 1G H G 1F E 6 C C H 1 G E 16 D 1B 1F A 1F 1 D 1E /@.RE3O3 F6,GG 1AB,GG 6C,GG 6D,GG 6B,GG FD,GG 1HH,GG FA,GG 6D,GG 1E,GG CE,GG F6,GG AA,GG 6G,GG 6CB,GG FG,GG HC,GG BF,GG 6C,GG 1GE,GG 11F,GG BE,GG AB,GG H6,GG CB,GG 1HC,GG 6E,GG 6C,GG FG,GG C"J/@. B,GG H,GG 6,GG 6,GG 1,GG H,GG H,GG H,GG 6,GG 1,GG H,GG B,GG B,GG 1,GG H,GG B,GG 6,GG 6,GG 6,GG H,GG H,GG 6,GG B,GG 6,GG H,GG H,GG 6,GG 6,GG B,GG E#5C 1 1 B H 6 B 6 1 1 6 B B H B B B 6 B 1 B 6 6 6 6 1 H 6 H 6 EM!(EO 6B BA H G A 1B 6B 6E C 1G 16 6 1 G 11 E F G 6 6G 1E G D 6H 6H 1G A 1 1F C"JEM! B B 1 1 6 6 B B 6 6 6 1 1 1 6 6 6 1 1 B B 1 6 B B 6 6 1 B .e@ERO m 4 m 4 4 4 4 4 4 m 4 m 4 m m 4 m 4 m m m m 4 4 4 4 4 m m RE3/#E@J A 1 E B A 1 6 H 6 B B 1 1 F 1 1 1 B H 1 H F A 6 H B 6 1 B /@JER@EJ G G G G 1 1 G G E G G G E G G 1 G G G 1 G G G G G G G 1 G J: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 :g#EO 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 !C G G G 1 1 G 1 G G G G G 1 1 1 1 G 1 G 1 G G 1 G G 1 G 1 1 JE(E+ G G G G G G 1 G G G 1 G G 1 1 G G G G G G G G G G 1 G G G

34

BG B1 B6 BB BH BA BD BF BC BE HG H1 H6 HB HH HA HD HF HC HE AG

HE DH BE AB BC HD AC 6A AF HF 61 HA AD 6H H1 66 AH HE HE A1 AC

G G G G 1 1 G G G G G 1 G G G G 1 G G G 1

11 BD C C 1F D 6 G 6C 61 G 61 F 6 1B G E G 16 G 1G

HG,GG 1G6,GG DG,GG FC,GG HB,GG B1,GG DG,GG AC,GG E6,GG HC,GG 1B,GG DF,GG 61B,GG 1E,GG AE,GG HA,GG BA,GG EH,GG BA,GG HF,GG CFB,GG

6,GG H,GG B,GG H,GG 6,GG 6,GG B,GG B,GG H,GG 6,GG 1,GG B,GG H,GG 1,GG B,GG 6,GG 6,GG H,GG 6,GG 6,GG H,GG

1 B H 6 B 1 H B 6 1 B 1 H 6 B H 6 6 1 A 6

C 66 11 1F 11 1A 1 H 6A 6B G 6G BG G 1F G F 1F H B BH

6 B 6 B 6 B 1 1 B B 1 B B 1 B 1 6 B 1 1 B

4 m 4 4 m m 4 m m 4 m m m 4 4 m 4 m 4 m m

H 1 6 1 B 6 1 1 B 1 A 6 1 1 1 B 6 B 1 1 6

G G 1 G 1 G G 1 G G G G G G 1 G 1 G G G G

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 G 1 G G G 1 1 1 G G G 1 G G 1 G G G 1 G

G G 1 G 1 G G 1 G G G 1 G 1 G G G G G 1 G

35

2.2.- INGRESANDO AL SPSS !ara ingresar al 3!33 se tiene que 4acer do$le clic en el icono de mismo y nos presenta el primer cuadro de di&logo que es el siguiente, en la que podemos seleccionar la opci)n apropiada, para nuestro ejemplo salimos de este cuadro de dialogo con cancelar'

Enseguida nos muestra la pantalla completa del 3!33

2.2.- CREACIN DE VARIABLES. Escri$imos los nom$res de las %aria$les en la columna N*+!r# de la pantalla 3!33, como se muestra en el siguiente grafico'

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

Enseguida definimos el tipo de dato en la Columna T 1*'

El siguiente pasa es completar con las columnas A'%K&ra3 D#% +a"#$ H E( Q&#(a

37

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

!ara definir la columna Va"*r#$ 4acemos la celda de la columna Va"*r#$ y la fila E% ) "

9acemos clic en X y mostrar& el siguiente cuadro de dialogo donde completamos los %alores G > soltero y 1 casado, as* como se muestra a continuaci)n

#e la misma manera completamos los %alores para todas las %aria$les:

+inalmente la %ista de %aria$les del 3!!! de$e %erse como en la siguiente figura:

38

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

2.-.- DEFINICIN DE LAS VARIABLES. Cuando se a$re 3!33 aparece la matriz de datos %ac*a indicando en ese caso que no 4ay ning7n fic4ero seleccionado para tra$ajar con lK es en esta situaci)n en la que de$emos estar para proceder a crear la estructura (definir las %aria$les de un nue%o fic4ero de datos de 3!33' " esa situaci)n tam$in se puede llegar despus de 4a$er tra$ajado con 3!33 sin m&s que desplegar el men7 "rc4i%o y elegir de l la opci)n @ue%o y dentro de ella datos (ArchivohiNuevohiDatos), lo que 4ar& que se elimine el fic4ero acti%o y se deje limpia la matriz de datos' "4ora cada columna ser& una nue%a %aria$le en potencia 4asta que sea definida, en cuyo caso pasar& a ser una %aria$le en la nue%a matriz de datos' 2.-.1. E" '*+!r# ,# "a$ )ar a!"#$. 3e pinc4a (o se 4ace do$le clic so$re la casilla correspondiente al nom$re de la %aria$le que se est& definiendo, y se escri$e el nom$re que deseemos que tenga, con un m&-imo de DH caracteres, sin espacios en $lanco, empezando siempre por una letra o con el car&cter j y no terminando con un punto' (os caracteres que formen el nom$re de$en ser: cualquier letra o d*gito, o los signos k'jlm(ste 7ltimo no es recomenda$le como 7ltimo car&cter '

2.-.2. E" ( 1* ,# "a$ )ar a!"#$.

5na %ez escrito el nom$re de la %aria$le, si se pinc4a en la casilla correspondiente al tipo de %aria$le (o en cualquier otro sitio , aparecer&, para dic4a %aria$le, VnumricoW en la columna Jipo3 un C en la columna "nc4ura y un 6 en la columna #ecimales' Esto es lo que 3!33 ofrece por defecto para esa %aria$le' !ara cam$iar el tipo de la %aria$le se pinc4a en la

39

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

casilla de tipo de %aria$le y se pinc4a so$re el peque,o recuadro gris situado en dic4a casilla, aparece entonces una %entana como la de la +iguraK en ella se puede definir el tipo de la %aria$le de entre los que aparecen: numrico, cadena, fec4a, etc'''' ' El formato de la %entana es muy simple, a la izquierda aparecen los diferentes tipos que pueden tener las %aria$les y a la derec4a aparece el tama,o o caracter*sticas particulares de cada tipo que tam$in son defini$lesK as* en la figura, el tipo es numrico y la %aria$le tendr& una anc4ura total de C caracteres, dos de los cuales son decimales: esto es lo que por defecto coloca 3!33' !ero descri$amos los diferentes tipos' El tipo N&+Rr %* es para una %aria$le cuyos %alores son n7meros' (os %alores se muestran en el formato numrico est&ndar, utilizando como delimitador decimal el especificado en la Configuraci)n Regional del !anel de control de cindo`s' El tipo C*+a define una %aria$le numrica cuyos %alores se muestran con la coma de separaci)n de miles y con un punto como separador de la parte decimal' El tipo P&'(* define una %aria$le numrica cuyos %alores se muestran con el punto de separador de miles y con una coma como separador de la parte decimal' El tipo N*(a% >' % #'(BL %a ,efine una %aria$le numrica cuyos %alores se muestran con una E intercalada y un e-ponente con signo que representa una potencia de $ase diez' El e-ponente puede ir precedido de E o # con un signo opcional, o por el signo solamente' !or ejemplo, 16B, 1,6BE6, 1,6B#6, 1,6BE?6, o incluso 1,6B?6' El tipo F#%Ka define una %aria$le numrica cuyos %alores se muestran en uno de los diferentes formatos de fec4a-calendario u 4ora-reloj' !ara ello, 4a$r& que seleccionar un tipo de fec4a de la lista desplega$le que aparece a la derec4a cuando se selecciona el tipo fec4a' 3e pueden introducir las fec4as utilizando como delimitadores: $arras, guiones, puntos, comas o espacios en $lanco' El tipo D>"ar sir%e para definir una %aria$le numrica (con diferentes formatos cuyos %alores contienen un signo de d)lar y una coma para la separaci)n de los miles' M*'#,a 1#r$*'a" ?a,a sir%e para definir una %aria$le numrica cuyos %alores se muestran en uno de los formatos de moneda personalizados que se 4ayan definido pre%iamente en la pesta,a M*'#,a del cuadro de di&logo O1% *'#$ dentro del men7 E, % >'' (os caracteres definidos en la moneda personalizada no pueden emplearse para la introducci)n de datos, pero s* los mostrar& el Editor de #atos' !or 7ltimo el tipo Ca,#'a define una %aria$le cuyos %alores no son numricos y, por ello, no se utilizan en los c&lculos' !ueden contener cualesquiera caracteres 4asta la longitud definida' !or 7ltimo, la anc4ura y n7mero de decimales se pueden cam$iar igualmente en las columnas "nc4ura y #ecimales de la %ista de %aria$les' 2.-.-. La$ #( Q&#(a$ ,# "a$ )ar a!"#$.

.eneralmente el nom$re de las %aria$les suele tener pocos caracteres, lo que 4ace que dic4o nom$re sea en muc4os casos un acr)nimo de dif*cil traducci)n para el que no lo 4a

40

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

escrito (as*, no es f&cil de adi%inar que con el nom$re "CR16H estoy representando a la %aria$le aclaramiento de creatinina en el primer d*a de seguimiento en orina de 6H4' K por ello se suele poner una etiqueta de %aria$le a la %aria$le, que la identifique de una manera m&s precisa y que nos permita reconocerla cuando se presentan los resultados' Esa etiqueta puede ser como m&-imo de 1BG caracteres' !ero no s)lo se puede poner una etiqueta general para la %aria$le, sino que en las %aria$les que sean cualitati%as y cuyas categor*as suelen estar representadas por c)digos numricos, pueden esta$lecerse etiquetas de %alor que permitan identificar a las categor*as con ellas (4acindolas m&s e-plicati%as en %ez de con los c)digos numricos' Estas etiquetas pueden ser de 4asta DG caracteres' Estas etiquetas no son %ia$les para %aria$les de cadena de m&s de C caracteres de amplitud' 2.-.8. L*$ ,a(*$ La"(a'(#$ ()a"*r#$ 1#r, ,*$). 3e produce un dato faltante cuando la informaci)n de una %aria$le de un indi%iduo no e-isteK ello puede ser de$ido a %arias causas: a que tal informaci)n se 4a perdido, a que por las caracter*sticas particulares del indi%iduo no puede e-istir o a que el indi%iduo no 4a querido proporcionar dic4a informaci)n' Cuando para una %aria$le e-isten datos faltantes frecuentemente se escoge un c)digo para representarlos, de$iendo proporcionarle tal c)digo a 3!33 para que l no los incluya en los an&lisis posterioresK a esta representaci)n de los datos faltantes se le denomina ,a(*$ La"(a'(#$ ,#" &$&ar *, para distinguirlos de los ,a(*$ La"(a'(#$ ,#" $ $(#+a (que se consiguen sin m&s que dejar en $lanco el espacio reser%ado para ellos, donde, si la %aria$le es numrica, 3!33 colocar& una VcomaW para identificarlos ' @o o$stante, estas reglas tienen e-cepciones: en las %aria$les de cadena no e-isten datos faltantes del sistema puesto que el $lanco lo interpreta 3!33 como un %alorK tampoco se pueden definir datos faltantes del usuario en las %aria$les de cadena de longitud superior a C caracteres' Es importante que el usuario sepa que la identificaci)n de datos faltantes es crucial pues, si no se identifican, estos ser&n empleados con los %alores que tengan, dando lugar a resultados err)neos' (os datos faltantes (%alores perdidos del usuario se especifican pinc4ando so$re la casilla correspondiente de la columna !erdidos en la %ista de %aria$les, y %ol%iendo a pinc4ar so$re el peque,o recuadro gris que aparece en dic4a casillaK se despliega entonces una %entana'

Como se %e 4ay tres formas de indicar la presencia de datos faltantes' (a primera es la de indicar que no e-isten datos faltantes o perdidos empleando la opci)n N* KaH )a"*r#$ 1#r, ,*$S esta es la opci)n que de oficio ofrece 3!33 indicando que no 4ay datos faltantes por parte del usuario, pudiendo 4a$er datos faltantes del sistema sin m&s que 4ayamos dejado en $lanco el espacio oportuno' (a segunda manera de identificar los %alores que representan a los datos faltantes es presentarlos como Va"*r#$ 1#r, ,*$ , $%r#(*$, indicando con ello que son %alores aislados los que representar&n a los datos faltantes, 4a$iendo 4asta tres posi$ilidades para ello' Es posi$le, tam$in, que los datos faltantes estn representados por %alores que aparezcan seguidos, de manera que sea m&s f&cil identificarlos a tra%s de un m&-imo y un m*nimo quedando caracterizados como datos

41

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

faltantes todos los que est&n en medio' Esto es lo que permite 4acer la 7ltima opci)n, Ra'0* +M$ &' )a"*r 1#r, ,* , $%r#(* opcional, en la que adem&s tenemos la posi$ilidad de indicar un %alor perdido discreto adicional' !ulsando el $ot)n A%#1(ar %ol%eremos a la %ista de %aria$les' 2.8.- GRABACIN Y EDICIN DE DATOS. 5na %ez que el usuario 4a definido las %aria$les de su fic4ero de datos, tendr& una rejilla en la que por columnas aparecer&n dic4as %aria$les con el nom$re de cada una de ellas' Es claro que tal rejilla estar& %ac*a y que el siguiente paso ser& el rellenarla a $ase de gra$ar la informaci)n de los diferentes casos (que aparecen en el Editor de #atos por filas ' !or ello lo primero que e-plicaremos es c)mo se gra$an los datos' #esde luego que antes de la gra$aci)n de casos se de$er*a conocer c)mo se mue%e uno dentro de la rejilla de datos' El mo%imiento m&s simple es desplazar el cursor mediante el rat)n a la posici)n deseada y pinc4ar en ella con el $ot)n izquierdo' Otras formas m&s lentas es usando las teclas de flec4as en las cuatro direcciones que funcionan como ellas indican' 2.6.- INTRODUCCIN DE LOS DATOS POR CASILLAS3 POR FILAS Y POR COLUMNAS. (a primera forma en que se puede gra$ar un dato es situarse en una casilla (cruce de una %aria$le, columna, con un caso, fila pinc4ando en ella con el $ot)n izquierdo del rat)n y escri$ir el %alor deseado seguido de la tecla I'(r*. Jras ello, el cursor aparecer& en la casilla inmediatamente de$ajo' E%identemente esto nos permitir& la gra$aci)n de los datos por columnas (o %aria$les : cuando lleguemos al final de una columna pasamos al principio de la siguiente' 3in em$argo, esta forma de gra$ar los datos, no es la m&s com7n para proceder a la gra$aci)n de un fic4ero de datos' (a forma m&s com7n es gra$ar los datos por filas, es decir, por casos' !ara ello se coloca el cursor en la casilla m&s a la izquierda de una fila (de un caso y se introduce el dato correspondiente a esa casilla, seguido de la pulsaci)n de la tecla de flec4a 4acia la derec4a, o pulsando la tecla Ta!' O$sr%ese que si se pulsa la tecla /ntro el cursor $ajar& una fila a$ajo con lo que estar& fuera del caso, 4a$iendo que %ol%er a l mediante la tecla 4acia arri$a, lo que alarga claramente la gra$aci)n' Cuando uno 4aya gra$ado un caso, puede saltar al siguiente pulsando la tecla I'(r*3 y as* aparecer& al final del nue%o caso, tras lo cual pulsando la tecla I' % * estar& colocado en la primera %aria$le del nue%o caso' Cuando se procede as*, 3!33 identifica cada caso con un n7mero que es interno y que no e-iste como %aria$le del fic4ero, por lo que si el usuario desea una identificaci)n para cada caso de$e crear, y gra$ar, una %aria$le a tal efecto, lo cual es con%eniente' 2.9.- INTRODUCCIN DE DATOS AL SPSS #epuse de 4a$er definido las %aria$les proseguimos con la introducci)n de los datos para cada %aria$le, para esto 4acemos clic en %ista de datos'

Q se mostrar& la pantalla sigueinte

42

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

En la pantalla actual tipeamos los datos para cada %aria$le, a lfinal la pantalla de la %ista de datos de$e quedar de la siguiente manera

2.:.- IMPORTANDO DATOS DESDE UNA @OIA DE CGLCULO En lugar de escri$ir todos los datos directamente en el Editor de datos, puede leer datos desde aplicaciones como Microsoft E-cel' Jam$in puede leer enca$ezados de columnas como nom$res de %aria$les Elija en los men7s: "rc4i%o-"$rir-#atos

43

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

3eleccionamos el arc4i%o de Microsoft E-cel ejemplo'-ls de la direcci)n c:nejemplo, de la misma forma en la que se muestra en la siguiente figura:

"parecer& el cuadro de di&logo "pertura de fuente de datos de E-cel, que permite especificar si se incluyen los nom$res de %aria$les en la 4oja de c&lculo

En E-cel A o posterior, tam$in se pueden especificar las 4ojas de c&lculo que se desea importar'

44

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

"seg7rese de que est& acti%ada la opci)n L##r '*+!r# ,# )ar a!"#$ ,# "a 1r +#ra L "a ,# ,a(*$' Esta opci)n lee los enca$ezados 3i desea importar s)lo una parte de la 4oja de c&lculo, especifique el rango de casillas que se %an a importar en el campo Rango' !ulse en A%#1(ar para leer el arc4i%o de E-cel' (os datos aparecer&n en el Editor de datos, con los enca$ezados de columnas utilizados como nom$res de %aria$les'

3i utiliza una aplicaci)n de 4ojas de c&lculo distinta E-cel y (otus, de$er*a poder e-portar los datos a un formato admitido que a continuaci)n pueda ser le*do' (uego editamos las %aria$les igual como en el item 6'6 2.7.- MODIFICAR VALORES INTRODUCIDOS: CORTAR3 COPIAR Y PEGAR. (a gra$aci)n de datos se acoge a unos tipos de acci)n que 4a familiarizado cindo`s que son C*r(ar3 C*1 ar H P#0ar. Estas tres acciones se $asan en la selecci)n del o$jeto so$re el que %an a ser aplicadas' En el caso que nos ocupa el o$jeto puede ser una casilla, %arias casillas, una fila, %arias filas, una columna o %arias columnasK una casilla se selecciona sin m&s que colocarse en ella (pulsando el $ot)n izquierdo del rat)n so$re ella o mediante una serie de desplazamientos con las flec4as K %arias casillas se seleccionan sin m&s que pinc4ar con el rat)n en una de ellas y arrastrar el mismo (mo%erlo con el $ot)n izquierdo pulsado 4asta la 7ltima casilla que deseemos seleccionar, apareciendo estas remarcadas para indicar que est&n seleccionadasK es claro que el arrastrado que 4emos mencionado puede ser en cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera siempre que sea en forma rectangular' (a forma de seleccionar una fila (caso es pulsar con el rat)n so$re el n7mero de caso que le 4a asignado 3!33, mientras que si se desean seleccionar %arios casos consecuti%os de$er& arrastrarse el rat)n so$re ellos' #e manera an&loga, la selecci)n de una %aria$le se 4ar& como en los casos pero pulsando so$re la fila de nom$res de las %aria$les' Resumiendo, supongamos que 4emos seleccionado el o$jeto de nuestras acciones y pasemos a descri$irlas' (a acci)n de C*r(ar 4ace desaparecer el o$jeto seleccionado que es guardado en el !ortapapeles para estar disponi$le en una acci)n de !egado' (a acci)n de C*1 ar mantiene el o$jeto seleccionado a nuestra %ista pero es simult&neamente lle%ado al !ortapapeles para estar disponi$le en una acci)n de !egado' (a acci)n P#0ar trae desde el !ortapapeles el o$jeto all* colocado y lo presenta a partir de la zona seleccionada' (a forma de in%ocar esas acciones, siempre a partir de un o$jeto seleccionado, es desplegar el men7 E, (ar y seleccionar de l la acci)n deseada' 9ay una manera alternati%a que ser*a desplegando un llamado men7 conte-tual, que aparece cuando se pulsa el $ot)n derec4o

45

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

del rat)n so$re el o$jeto seleccionado' Cuando se lle%a a ca$o dic4a acci)n so$re un dato o conjunto de datos seleccionados, el men7 conte-tual que aparece es como el de la +igura H'1' En este men7 aparecen las acciones antes citadas adem&s de la funci)n B*rrar que permite $orrar el o$jeto seleccionado (en este caso los datos sin colocarlo en el !ortapapeles por lo que no estar& disponi$le para ser pegado' (a eliminaci)n, tam$in, se puede lle%ar a ca$o, a partir del o$jeto seleccionado, pulsando la tecla S&1r' (a com$inaci)n de las acciones C*r(ar3 C*1 ar3 P#0ar H B*rrar permite lle%ar a ca$o acciones complejas con pocos toques de rat)n' "s* por ejemplo, para $orrar un conjunto de datos 4a$r& que seleccionarlos y elegir B*rrar, y para repetir el mismo dato a partir de una posici)n determinada 4a$r& que copiar el dato en el !ortapapeles (acci)n C*1 ar , seleccionar la zona en la que se de$e repetir el dato y elegir la opci)n P#0ar. 2.A. E, % >' ,# %a$*$ %*+1"#(*$. !ara lle%ar a ca$o las acciones que %amos a descri$ir se necesita seleccionar un caso o un conjunto de casos' (a selecci)n se 4ace como aca$amos de %er en el apartado anterior' Como se %io, las acciones se lle%an a ca$o o con el men7 E, % >', o con el men7 conte-tual, el m&s c)modo' El men7 conte-tual que se despliega en la selecci)n de casos aparecen las cuatro opciones que aparec*an para los datos como son Cortar, Copiar, !egar y OorrarK tales acciones 4an sido suficientemente e-plicadas anteriormente por lo que lo 7nico que diremos aqu* es que se comportan de manera an&loga a lo %isto y el lector ya sa$e como funcionan' @o o$stante aparece de$ajo una acci)n que es propia de los casos: I'$#r(ar %a$*$. Cuando se selecciona aparece un caso nue%o inmediatamente antes del caso seleccionado en el que toda la informaci)n estar& en $lanco esperando para ser rellenadaK si no lo fuera se entender*a que en ese nue%o caso todas las %aria$les numricas tienen datos faltantes' 2.15.- EDICIN DE VARIABLES COMPLETAS. !ara lle%ar a ca$o las acciones que %amos a descri$ir se necesita seleccionar una %aria$le o un conjunto de %aria$les' (a selecci)n de una %aria$le se 4ace pulsando el $ot)n izquierdo so$re el nom$re de la misma y as* quedar& seleccionada' !ara seleccionar una serie de %aria$les consecuti%as $astar& con seleccionar la primera y arrastrar el rat)n 4asta la 7ltima, ese arrastre se puede 4acer con el $ot)n izquierdo (en cuyo caso para lle%ar a ca$o las acciones 4a$r& que desplegar el men7 E, (ar o el men7 Da(*$), o con el $ot)n'

46

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

III FASE DE ANGLISIS DE DATOS -.1.- ANGLISIS DE MEDIAS DE DISTRIBUCIN CENTRAL3 MEDIAS DE DISPERSIN Y GRGFICOS Este cap*tulo descri$e medidas de resumen sencillas y la influencia del ni%el de medida de una %aria$le en los tipos de estad*sticos que se de$en utilizar' 5tilizaremos el arc4i%o de datos #;#+1"*.$a) 9ay diferentes medidas de resumen adecuadas a diferentes tipos de datos dependiendo del ni%el de medida Ca(#0>r %a' #atos con un n7mero limitado de %alores o categor*as distintas (por ejemplo, gnero o estado ci%il ' Jam$in se 4ace referencia a estos datos como datos cualitati%os' (as %aria$les categ)ricas pueden ser %aria$les de cadena (alfanumricas o %aria$les numricas que utilizan c)digos numricos para representar las categor*as (por ejemplo, G>3oltero8a y 1>Casado8a ' 9ay dos tipos $&sicos de datos categ)ricos:

N*+ 'a"' #atos categ)ricos en los que las categor*as no tienen un orden in4erente' !or ejemplo, la categor*a la$oral de 0%entas0 no es superior o inferior a la categor*a la$oral de 0marSeting0 o 0in%estigaci)n0' Or, 'a"' #atos categ)ricos en los que las categor*as tienen un orden con significado, pero sin una distancia medi$le entre las categor*as' !or ejemplo, 4ay un orden para los %alores alto, medio y $ajo pero no se puede calcular la 0distancia0 entre los %alores' E$%a"a' #atos medidos en una escala de inter%alo o de raz)n en los que los %alores de los datos indican el orden de los %alores y la distancia entre ellos' !or ejemplo, un salario de F6'1EAl es superior a un salario de A6'BECl y la distancia entre am$os %alores es 1E'FEFl' Jam$in se 4ace referencia a estos datos como datos cuantitati%os o continuos'

47

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

!ara los datos categ)ricos, la medida de resumen m&s 4a$itual es el n7mero o el porcentaje de casos de cada categor*a' (a +*,a es la categor*a que contiene el mayor n7mero de casos' !ara los datos ordinales, la +#, a'a (el %alor por de$ajo y por encima del cual se encuentran la mitad de los casos tam$in puede ser una medida de resumen 7til si 4ay un gran n7mero de categor*as' El procedimiento +recuencias genera ta$las de frecuencias que muestran el n7mero y el porcentaje de los casos de cada %alor o$ser%ado de una %aria$le' Elija en los men7s: A'a" ?ar-E$(a,B$( %*$ ,#$%r 1( )*$-Fr#%&#'% a$

3eleccione Jiene /nternet (I'(#r'#() y T #'# TV (()) y mu%alas 4asta la lista Var a!"#($)' !ulse en A%#1(ar para ejecutar el procedimiento'

48

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

(as ta$las de frecuencias aparecen en la %entana :isor' (as ta$las de frecuencias re%elan que s)lo alrededor del 1CI de las personas poseen internet, pero todos poseen un tele%isor (EE,6I ' Esta puede que no sea una gran re%elaci)n, aunque puede ser interesante descu$rir algo m&s acerca del peque,o grupo de personas que no poseen tele%isores'

!ude %isualizar gr&ficamente la informaci)n en una ta$la de frecuencias con un gr&fico de $arras o con un gr&fico de sectores' :uel%a a a$rir el cuadro de di&logo +recuencias' ((as dos %aria$les de$en estar seleccionadas a7n '

49

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

!uede utilizar el $ot)n Rellamada de cuadros de di&logo de la $arra de 4erramientas para regresar r&pidamente

!ulse en GrML %*$'

!ulse en GrML %*$ ,# !arra$ y, a continuaci)n, pulse en C*'( '&ar' !ulse en A%#1(ar en el cuadro de di&logo principal para ejecutar el procedimiento'

50

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

"dem&s de las ta$las de frecuencias, la misma informaci)n aparece a4ora en forma de gr&ficos de $arras, con lo que puede sa$er, o$ser%ando r&pidamente, que la mayor*a de las personas no poseen /nternet y en cam$io casi todos poseen un tele%isor'

9ay muc4as medidas de resumen disponi$les para %aria$les de escala, incluyendo: M#, ,a$ ,# (#',#'% a %#'(ra"' (as medidas de tendencia central m&s comunes son la +#, a (media aritmtica y la +#, a'a (%alor por de$ajo y por encima del cual se encuentran la mitad de los casos ' M#, ,a$ ,# , $1#r$ >'' (os estad*sticos que miden la dispersi)n o %ariaci)n en los datos incluyen la des%iaci)n t*pica, m*nimo y m&-imo :uel%a a a$rir el cuadro de di&logo +recuencias' !ulse en R#$(a!"#%#r para $orrar cualquier configuraci)n anterior' 3eleccione I'0r#$*$ La+ " ar#$ #' + "#$ ( '0r#$*$) y mu%ala 4asta la lista Var a!"#($)' !ulse en E$(a,B$( %*$'

51

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

!ulse en M#, a, M#, a'a, M*,a, D#$) a% >' TB1 %a, Var a'?a, A$ +#(rBa H C&r(*$*$ !ulse en C*'( '&ar'

MB' +*3 MM2 +*,

"nule la selecci)n (marca de M*$(rar (a!"a$ ,# Lr#%&#'% a$ en el cuadro de di&logo principal' (!or lo general, las ta$las de frecuencias no son especialmente 7tiles para %aria$les de escala ya que de$e 4a$er casi tantos %alores diferentes como casos en el arc4i%o de datos ' !ulse en A%#1(ar para ejecutar el procedimiento'

(a ta$la +recuencias: Estad*sticos aparece en la %entana :isor' En este ejemplo, e-iste una gran diferencia entre la media y la mediana, siendo la media en torno a 6C'GGG mayor que la mediana' Esto indica que los %alores no est&n normalmente distri$uidos' !odemos compro$ar %isualmente la distri$uci)n con un 4istograma'

52

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

:uel%a a a$rir el cuadro de di&logo +recuencias' !ulse en GrML %*$'

!ulse en @ $(*0ra+a y C*' %&r)a '*r+a"' !ulse en C*'( '&ar y en A%#1(ar en el cuadro de di&logo principal para ejecutar el procedimiento'

53

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

(a gran mayor*a de casos se agrupan en la parte inferior de la escala, estando incluidos la mayor*a de ellos por de$ajo de 1GG'GGG' 3in em$argo, 4ay algunos casos en el rango AGG'GGG e incluso m&s all& (demasiado escasos para que sean %isi$les sin modificar el 4istograma ' Estos %alores demasiado altos para s)lo unos pocos casos tienen un efecto importante so$re la media y muy escaso o casi nulo so$re la mediana, lo que 4ace que la mediana sea un indicador m&s e-acto de la tendencia central en este ejemplo'

54

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

IV CREACION Y EDICION DE GRAFICOS 9ay una gran %ariedad de tipos de gr&ficos disponi$les y muc4os de ellos, en dos formatos diferentes:

GrML %*$ '*r+a"#$' .r&ficos creados desde el men7 principal .r&ficos y gr&ficos creados mediante procedimientos estad*sticos' GrML %*$ '(#ra%( )*$' .r&ficos creados desde el su$men7 /nteracti%os del men7 .r&ficos y gr&ficos creados desde las ta$las pi%ote'

8.1.- CREAR GRGFICOS En este ejemplo, crearemos un gr&fico de sectores simple que muestre cu&ntos encuestados disponen de ser%icio de /nternet en casa' Elija en los men7s: .r&ficos - 3ectores

!ulse en R#$J+#'#$ 1ara 0r&1*$ ,# %a$*$ y, a continuaci)n, pulse en D#L ' r

Qa que deseamos $asar el gr&fico en una %aria$le 7nica, 4emos seleccionado R#$J+#'#$ 1ara 0r&1*$ ,# %a$*$' (os elementos de gr&ficos ($arras, sectores del gr&fico tam$in se pueden $asar en res7menes de %aria$les distintas o en %alores de casos indi%iduales del arc4i%o de datos' 3eleccione Internet como la %aria$le que define los sectores (D#L ' r $#%(*r#$ 1*r ' !ulse en A%#1(ar para crear el gr&fico de sectores' '

55

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

#el gr&fico de sectores se concluye que la mayor*a de los encuestados no disponen de ser%icio de /nternet en casa' "l o$ser%ar el gr&fico, parecer*a que s)lo un cuarto de los encuestados apro-imadamente dispone de ser%icio de /nternet

8.2.- EDITAR GRGFICOS !uede editar gr&ficos de di%ersas formas' Con este gr&fico de sectores de muestra, podr*amos: ",adir un t*tulo' Eliminar la peque,a categor*a de datos 0perdidos0' Mostrar porcentajes para las dos categor*as restantes del gr&fico (o primero que 4aremos ser& a,adir un t*tulo: !ulse dos %eces en el gr&fico de sectores para a$rirlo en el Editor de gr&ficos' En los men7s del Editor de gr&ficos, seleccione: GrML %* - TB(&"*

56

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

En TB(&"* 1, introduzca S#r) % * ,# I'(#r'#( #' %a$a y, a continuaci)n, pulse en A%#1(ar'

"4ora aparecer& un t*tulo descripti%o so$re el gr&fico de sectores

57

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

"4ora eliminaremos la peque,a categor*a de datos perdidos' 3i desea o$tener informaci)n so$re los datos perdidos, consulte Jratamiento de los datos perdidos' En los men7s del Editor de gr&ficos, seleccione: 3erie M :isualizada

#esplace Perdido desde la lista M*$(rar 4asta la lista O+ ( r y pulse en A%#1(ar'

3e 4a eliminado la categor*a de datos perdidos del gr&fico de sectores, dejando s)lo dos categor*as

El gr&fico de sectores muestra claramente que la mayor*a de los encuestados no dispone de ser%icio de /nternet en casa y parece que casi tres cuartos de los encuestados se encuentran en la categor*a No, pero puede resultar 7til consultar los porcentajes e-actos'

58

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

!ulse dos %eces en una de las dos etiquetas de las categor*as (No o S ' 3eleccione (marque P*r%#'(a;#$

Mientras nos encontremos aqu*, mo%amos las etiquetas de categor*as del e-terior al interior del gr&fico de sectores' !ulse en F*r+a(*

3eleccione I'(#r *r de la lista desplega$le' "nule la selecci)n (marca de E( Q&#(a$ '(#r *r#$ para eliminar el marco de %isualizaci)n' !ulse en C*'( '&ar y, a continuaci)n, pulse en A%#1(ar'

"4ora los porcentajes aparecen junto a las etiquetas de categor*a y am$os aparecen en el interior de los sectores del gr&fico de sectores'

59

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

(os porcentajes se $asan en las dos categor*as mostradas (C1,D ? 1C,H > 1GG ' 3i %uel%e a colocar la categor*a que contiene los %alores perdidos en el gr&fico de sectores, cam$iar&n los porcentajes 8.-. GRGFICOS INTERACTIVOS (os gr&ficos interacti%os se crean seleccionando un tipo de gr&fico en el su$men7 /nteracti%os del men7 .r&ficos' Elija en los men7s: .r&ficos - /nteracti%os - Oarras

"rrastre y coloque Tiene telfono (telef) (dispone de Telfono) en la lista del eje (4orizontal ' "rrastre y coloque ate!ora de in!resos en "iles (catin!) en la lista C*"*r'

!ulse en A%#1(ar para crear el gr&fico'

60

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

"d%ertir& que no se trata de un gr&fico particularmente atracti%o' Esto se de$e a que los gr&ficos interacti%os tratan de forma distinta las %aria$les categ)ricas y las de escala y Tiene Telfono (telefono) se encuentra definida como %aria$le de escala' Qa que se trata realmente de una %aria$le categ)rica, podemos cam$iar la definici)n de %aria$le en el Editor de datos o simplemente indicar al procedimiento de gr&ficos interacti%os que la trate como una %aria$le categ)rica'

61

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

:uel%a a a$rir el cuadro de di&logo del gr&fico de $arras interacti%o' !ulse con el $ot)n derec4o del rat)n en Tiene telfono (telefono) en la lista del eje (4orizontal ' 3eleccione Ca(#0>r %a en el men7 conte-tual emergente y, a continuaci)n, pulse en A%#1(ar para crear el gr&fico'

"4ora el gr&fico de $arras agrupadas tiene un aspecto m&s agrada$le'

62

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

"unque puede realizar modificaciones en los gr&ficos interacti%os de igual forma que en los gr&ficos normales, la edici)n de gr&ficos interacti%os se 4a dise,ado para que sea m&s directa y sencilla' !ulse dos %eces en el gr&fico para acti%arlo' (os gr&ficos interacti%os se acti%an y editan en su lugar en la %entana :isor (a diferencia de los gr&ficos normales, que se a$ren en una %entana distinta para su edici)n

!ara cam$iar el color de una $arra, por lo general, s)lo tiene que pulsar en una $arra para seleccionarla y, a continuaci)n, seleccionar otro color de la paleta Color de relleno en la $arra de 4erramientas %ertical' !ero en este ejemplo de $arras agrupadas, los colores se

63

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

asocian a pares de $arras y por eso se cam$ia el color seleccionando la categor*a de $arra en la leyenda' !ulse en el cuadrado de color pr)-imo a la categor*a 6A - HE de la leyenda'

!ulse en la fec4a 4acia a$ajo pr)-ima al icono Color de relleno en la $arra de 4erramientas %ertical y seleccione un nue%o color'

El color se aplica a las dos $arras que representan la categor*a 6A - HE'

64

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

En este ejemplo, no es necesario el te-to de las cla%es que se encuentra $ajo la leyenda puesto que el eje de la escala ya tiene la etiqueta #ecuentos' !ara eliminar el te-to de las cla%es: !ulse con el $ot)n derec4o del rat)n en el te-to y seleccione O%&"(ar "a %"a)# en el men7conte-tual emergente'

"4ora el te-to de las cla%es est& oculto' 8.8. Cr#a% >' ,# &' 0rML %* a 1ar( r ,# &'a (a!"a 1 )*(# !uede crear gr&ficos interacti%os a partir de datos contenidos en una ta$la pi%ote

"cti%e (pulse dos %eces en la ta$la pi%ote' !ulse y arrastre el rat)n para seleccionar las casillas de datos que desea utilizar en el gr&fico

65

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

!ulse con el $ot)n derec4o del rat)n en cualquier punto del &rea seleccionada' 3eleccione en el men7 conte-tual emergente: Crear gr&fico - Oarras

3e crear& un gr&fico interacti%o con los datos seleccionados'

66

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

V. REGRESIN Y CORRELACIN LINEAL SIMPLE CON SPSS E;#+1"* ,# R#0r#$ >' L '#a" S +1"# %*' SPSS 1 En un estudio so$re gastos mensuales (Q e ingresos econ)micos mensuales (= , una muestra de 1G familias dio la siguiente informaci)n ( en d)lares 53" ' =: 6CG 6AG BAG HGG HAG AGG AGG BAG AAG DGG Q: 6AG 6GG B6G BFG HGG HGG HAG BGG HEG AAG a $ c d Jrazar e interpretar el diagrama de dispersi)n' Calcular y analizar el coeficiente de correlaci)n lineal de !earson Estimar y comentar la ER! lineal simple de m*nimos cuadrados ;Cu&l ser& el gasto y a4orro de una familia cuyo ingreso sea BGG, AGG y FGG d)lares< "dem&s, ;cu&l ser*a el gasto y a4orro si una familia no tiene ingresos econ)micos<

S*"&% >' a) D a0ra+a ,# , $1#r$ >' Creamos las %aria$les e introducimos los datos en 3!33 de la siguiente manera:

T'1+(' (!, F+&)4)$,' 7 (! E&*+(4&*-)+ D!&)%-2*-7+ C'0 SPSS, CENCAP-UNCP-2004

67

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

3e sigue la secuencia GrML %*$ T D $1#r$ >' en el men7 principal 3e elige la opci)n S +1"# 3E pulsa el $ot)n D#L ' r

3e eligen y se transfieren las %aria$les /@.RE3O3 (%aria$les independientes a la casilla E;# 4 y ."3JO3 (%aria$le dependiente a la casilla E;# Y

68

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

3e pulsa A%#1(ar 3i se desea mostrar los %alores perdidos, se pulsa el $ot)n O1% *'#$ del cuadro D a0ra+a ,# D $1#r$ >' $ +1"#3 accediendo al cuadro O1% *'#$ en donde se marca la opci)n M*$(rar "*$ Gr&1*$ ,#L ' ,*$ 1*r "*$ )a"*r#$ 1#r, ,*$

69

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

I'(#r1r#(a% >' (a nu$e de puntos y la l*nea recta creciente so$re ella re%elan que e-iste una relaci)n lineal creciente significati%a entre gastos e ingresos econ)micos de las familias' !) C*#L % #'(#$ ,# %*rr#"a% >' " '#a" ,# P#ar$*' 3igue la secuencia A'a" ?ar T C*rr#"a% *'#$ - B )ar a,a$ del men7 principal

3e elige y se transfieren las %aria$les /@.RE3O3 y ."3JO3 a la casilla Var a!"#$ 3e acti%a la opci)n B "a(#ra" de la secci)n Pr&#!a$ ,# $ 0' L %a% >' para e%aluar la significaci)n de dos colas ($ilateral del coeficiente' 3e acti%a la opci)n Mar%ar "a$ %*rr#"a% *'#$ $ 0' L %a( )a$ para mostrar la significaci)n del cociente

3e pulsa aceptar

70

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

A'M" $ $ El coeficiente de correlaci)n lineal de !earson entre ingresos econ)micos y gastos es muy alto (G,ECD y altamente significati%o (pTG,GG1 ' Este resultado permite afirmar que la correlaci)n entre estas %aria$les es positi%aK por tanto, la relaci)n entre gastos e ingresos es lineal y creciente' %) E$( +a% >' ,# "a ERP " '#a" $ +1"# 3e sigue la secuencia A'a" ?ar T R#0r#$ >' T L '#a"

3e eligen y se transfieren las %aria$les /@.RE3O3 a la casilla I',#1#', #'(#$ y ."3JO3 a la casilla D#1#', #'(#$ 3e elige el mtodo de regresi)n lineal I'(r*,&% r

71

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

3e pulsa el $ot)n O1% *'#$ 3e marca la opci)n I'%"& r %*'$(a'(# #' "a #%&a% >' para estimar la ordenada en el origen $% adem&s de la pendiente $&'

3e pulsa el $ot)n C*'( '&ar 3e pulsa el $ot)n E$(a,B$( %a 3e marcan las opciones E$( +a% *'#$ y A;&$(# ,#" +*,#"* de la secci)n C*#L % #'(#$ ,# r#0r#$ >'

72

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

3e pulsa los $otones C*'( '&ar y A%#1(ar' Cuando se desea estimar el modelo si el coeficiente OG (constante o trmino independiente se desmarca la opci)n I'%"& r %*'$(a'(# #' "a #%&a% >' del cuadro R#0r#$ >' " '#a": O1% *'#$' 3i se desea calcular algunas medidas de resumen, se pulsa el $ot)n E$(a,B$( %a$ del cuadro R#0r#$ >' " '#a", ingresando al cuadro R#0r#$ >' " '#a": E$(a,B$( %*$, donde se marcan las opciones +a(r ? ,# %*)ar a'?a y D#$%r 1( )*$. 3i se desea e-cluir las parejas de %alores perdidos o los %alores perdidos de cada %aria$le, se pulsa el $ot)n O1% *'#$ del cuadro R#0r#$ >' " '#a", ingresando al cuadro R#0r#$ >' " '#a": O1% *'#$' En este cuadro, se marca las opciones #2%"& r %a$*$ 1#r, ,*$ $#0J' 1ar#;a$ o E2%"& r %a$*$ $#0J' " $(a de la secci)n Va"*r#$ 1#r, ,*$.

73

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

C*+#'(ar * En la primera ta$la (resumen del modelo se aprecia el coeficiente de correlaci)n lineal de !earson o, el coeficiente de determinaci)n (R cuadrado , el coeficiente de determinaci)n corregido a ajustado (R cuadrado corregido y el error t*pico o est&ndar de la estimaci)n (error t*p' de la estimaci)n ' El coeficiente de correlaci)n de !earson es G,ECD, el coeficiente de determinaci)n es G,EF6 y el coeficiente de determinaci)n corregido es G,ECD' Estos *ndices re%elan que la correlaci)n entre las %aria$les es positi%a y muy alta, casi perfectaK y que el EF,6I de la %aria$ilidad de los gastos se e-plican por los ingresos (casi total ' El error est&ndar de la estimaci)n es 1E, BHD' En la segunda ta$la ("@O:" se aprecia el an&lisis de %arianza ("n&lisis Of :ariante ' Con esta tcnica se e%al7a la significaci)n estad*stica del modelo de regresi)n, esto es, se e%al7a la significaci)n estad*stica de los par&metros $% y $& son muy significati%os en forma conjunta o simultanea' Como S 0 C 5, se deduce que el MR(3 es altamente significati%o (pTG,GG1 , es decir, los par&metros $% y $& son muy significati%os en forma conjunta' El 4ec4o de decir que son significati%os, significa que los %alores de los par&metros son diferentes de G' 3i 3ig p G,GA, entonces el modelo no es significati%o y, por tanto, no e-iste una relaci)n lineal entre las %aria$les'

74

C$%&' (! A)*$+,-.+)-/0 (! C'0')-1-!0*'& 2+%+ T-*$,+)-/0 P%'3!&-'0+, ------------------------------------------------------------------------------------

En la tercera ta$la (Coeficientes se o$ser%an las estimaciones de los par&metros $% y $& y su significaci)n estad*stica indi%idual' (a estimaci)n de $% es -1A,ADA (Constantes o trmino independiente , el cual no es significati%o ( 3ig > G,ABE , ppG,GA ' (a estimaci)n de O1 es G,E1E (/@.RE3O3 , el cual es altamente significati%o (3ig > G,GGG, pTG,G1 ' Con estos resultados, la estimaci)n de la ecuaci)n del MR(3 ser*a' Q > -1A,ADA ? G,E1E = Es decir, .astos > -1A,ADA ? G,E1E /ngresos 3in em$argo, como el coeficiente $%, no es significati%o, se %uel%e a correr el programa ajustado un MR(3 sin el trmino independiente (regresi)n lineal a tra%s del origen ' (o resultados son los siguientes'

75

E&*+(4&*-)+ A2,-)+(+ ------------------------

I05. RODOLFO 6ALTAZAR LAPA -----------------------------------------------

Con estos resultados, la estimaci)n de la ecuaci)n del MR(3 es: Q > G,CCH = Es decir' .astos > G,CCH /ngresos Como (&pG, entonces la tendencia lineal es creciente, es decir a mayores ingresos econ)micos correspondes mayores gastosK y a menores ingresos econ)micos correspondes menores gastos' (a recta de regresi)n corta al eje Q (ingresos en l G( $% > G es decir, la recta pasa por el punto (GKG , por cada d)lar 53" que cam$ia los ingresos econ)micos, los gastos cam$ian en CC cntimos de d)lar (l G,CC ,) Pr*'>$( %*$ * 1r#, %% *'#$ 3i el ingreso de una familia es l BGG, entonces el gasto se o$tiene sustituyendo BGG en .astos > G,CCH /ngresos, dic4o gasto ser*a l 6DA,6G' El a4orro es el gasto menos el ingreso , el cual ser*a l BH,CG' 3i el ingreso de una familia es l AGG, entonces el gasto ser*a l HH6 y el a4orro, l AC' 3i el ingreso de una familia es l FGG, entonces el gasto ser*a l D1C,C y el a4orro, C1,6 3i una familia no tiene ingresos, entonces el gasto ser*a l G y el a4orro, l G'

76