Está en la página 1de 31

ANLISIS UNIVARIANTE Y

BIVARIANTE
INDICE
1. INTRODUCCION....................................................................................2
2. DISTRIBUCIN DE FRECUENCIAS..................................................2
3. MEDIDAS DE TENDENCIA CENTRAL.............................................3
3.1. LA MODA.................................................................................................4
3.2. LA MEDIANA..........................................................................................4
3.3. LA MEDIA................................................................................................4
4. MEDIDAS DE DISPERSIN........................................................5
4.1. EL RANGO...............................................................................................5
4.2. EL RECORRIDO INTERCUARTILICO.................................................6
4.3. LA DESVIACIN TIPICA.......................................................................6
4.4. EL COEFICIENTE DE VARIACIN......................................................6
5. ANLISIS GRAFICO UNIVARIANTE................................................7
6. ANLISIS BIVARIANTE.....................................................................10
6.1. TABLAS DE CONTINGENCIA............................................................10
6.2. TABULACION DE VALORES MEDIOS Y ANLISIS DE LA
VARIANZA........................................................................................14
6.3. COEFICIENTES DE CORRELACION.................................................16
7. ANLISIS GRAFICO BIVARIANTE........................................17
. EL ANLISIS UNIVARIANTE Y BIVARIANTE EN SPSS...20
.1. ANALISIS UNIVARIANTE EN SPSS..................................................20
.2. EL ANALISIS BIVARIANTE EN SPSS...............................................26
.3. ANALISIS DE CORRELACION EN SPSS...........................................2!
.4. ANALISIS GRAFICO EN SPSS............................................................31
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
1. INTRODUCCION
Antes de abordar la aplicacin de cualquier tcnica multivariante es necesario que se
realice una exploracin previa de los datos mediante anlisis univariante y bivariante. De
hecho, en una gran mayora de los informes que entregan los nstitutos de investigacin a
sus clientes slo se utili!a este tipo de tcnicas, siendo ms utili!adas las tcnicas
multivariantes en la investigacin acadmica que en la prctica empresarial.
"n este tema vamos a reali!ar un breve recorrido por las tcnicas univariantes y bivariantes
ms utili!adas. "mpe!aremos con la distribucin de frecuencias, que es la primera medida
que se observa cuando se tienen datos secundarios o procedentes de una encuesta. "l
siguiente apartado se dedicar a las medidas de tendencia central, haciendo especial nfasis
en la media aritmtica que no slo es una medida descriptiva, sino tambin ob#eto de
inferencia estadstica. "l cuarto apartado se dedica a las medidas de dispersin.
$osteriormente, veremos el anlisis grfico univariante que suele ser una herramienta muy
%til cuando complementa al anlisis univariante. "l quinto y sexto apartados se centran en
la explicacin de las tcnicas y anlisis grficos bivariantes ms usados en investigacin
comercial. &erminaremos el captulo ilustrando cmo obtener estas medidas en '$'' con
varios e#emplos.
2. DISTRIBUCIN DE FRECUENCIAS
"n la mayora de los libros de estadstica, la distribucin de frecuencias es uno de los
primeros temas que se abordan puesto que proporciona un mtodo de organi!acin de
datos que se anali!arn posteriormente con otras tcnicas. (a distribucin de frecuencias es
una relacin de categoras o intervalos de medida y el n%mero de medidas observado en
cada intervalo )frecuencia*.
(a frecuencia absoluta es el n%mero de veces que se encuentran mediciones para el
intervalo, es decir, el n%mero de veces que se repite cada valor de la variable. (a
frecuencia relativa se calcula como el cociente entre la frecuencia y el n%mero total de
datos. (a utilidad de la frecuencia relativa se debe a que permite comparaciones
homogneas entre diferentes mediciones, al expresarlas en tanto por ciento o tanto por uno.
(a frecuencia absoluta acumulada expresa el n%mero de datos que hay igual al intervalo o
n%mero considerado y los inferiores a l. (a frecuencia relativa acumulada es el resultado
de dividir cada frecuencia acumulada por el n%mero total de datos. "n los programas de
ordenador suele aparecer adems el porcenta#e de casos vlidos que es aquel en el que se
han eliminado los datos perdidos.
"n la tabla +.,. se observa la distribucin de frecuencias de una muestra de -- personas.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
Tabla 2.1. Ejemplo de distribucin de frecuencias
Edad Frecuencia Frecuencia
relativa
Frecuencia
Relativa
acumulada
17,0 3 3,9 3,9
18,0 2 2,6 6,5
19,0 2 2,6 9,1
20,0 5 6,5 15,6
21,0 2 2,6 18,2
22,0 4 5,2 23,4
23,0 6 7,8 31,2
24,0 4 5,2 36,4
25,0 7 9,1 45,5
26,0 6 7,8 53,2
27,0 8 10,4 63,6
28,0 8 10,4 74,0
29,0 9 11,7 85,7
30,0 1 1,3 87,0
31,0 1 1,3 88,3
32,0 1 1,3 89,6
34,0 1 1,3 90,9
35,0 1 1,3 92,2
37,0 1 1,3 93,5
39,0 2 2,6 96,1
43,0 1 1,3 97,4
47,0 1 1,3 98,7
51,0 1 1,3 100,0
Total 77 100,0
3. MEDIDAS DE TENDENCIA CENTRAL
(as tablas de frecuencias nos ofrecen toda la informacin disponible, pero en muchas
ocasiones el analista encuentra dificultades en interpretar toda esa extensa informacin, por
lo que intenta resumirla en una serie de expresiones, denominadas medias de posicin. "n
concreto, estas medidas son de tendencia central, de dispersin, de asimetra y de curtosis.
(as medidas de posicin son valores sintticos que fi#an el comportamiento global de una
variable a partir de los datos individuales recogidos y que presentan las siguientes
caractersticas.
/ ntervienen en su determinacin todos y cada uno de los valores de la distribucin
/ 'iempre se pueden calcular
/ 'on %nicos para cada distribucin de frecuencias.
0on las medidas de tendencia central tratamos de saber cul es el centro de los datos.
1ormalmente, estas medidas describen el total de los datos. (os valores de tendencia
central que ms se utili!an son la moda, la mediana y la media. A su ve!, esta %ltima es
uno de los ob#etivos de la inferencia estadstica.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"l clculo de medidas de tendencia central con datos agrupados ha sido un rea importante
en la estadstica descriptiva, debido a la necesidad de simplificar los clculos que se iban a
reali!ar. 1o obstante, con el uso extensivo de los programas estadsticos, su importancia en
la actualidad es casi nula, ya que no es necesario agrupar los datos, introduciendo siempre
las observaciones de cada individuo u ob#eto para cada variable y no las tablas de
frecuencias que luego son calculadas por el programa. $or ello, en la explicacin de las
medidas de posicin vamos a centrarnos en los datos individuales.
3.1. LA MODA
(a moda es el valor que se repite ms veces, es decir, el valor con mayor frecuencia en un
con#unto de datos. 0uando slo hay una moda, nos encontramos con una distribucin
unimodal. 'i hay dos valores con mxima frecuencia, la distribucin es bimodal.
"n la distribucin que hemos expuesto en la tabla +.,, el valor con mayor frecuencia ),,.-*
es +2, por tanto, esa es la moda de esa distribucin.
3.2. LA MEDIANA
"s el valor de la distribucin que ocupa el lugar medio de todos los valores ordenados de
menor a mayor o al contrario. $or tanto, aquel valor cuya frecuencia acumulada es el
n%mero total de datos entre dos. (a mediana divide los datos previamente ordenados en
dos partes con el mismo n%mero de casos a cada lado. 3na parte tendr los datos con
menor valor que la mediana y la otra los datos que son mayores.
"n el caso anterior )tabla +.,*, el valor que divide a los datos en dos es +4, puesto que
tenemos +5 datos y este valor es el que ocupa el lugar ,+, de#ando ,, valores a cada lado.
0uando tenemos un n%mero par de dato, no es posible que un valor divida la distribucin
en dos partes iguales. $or tanto, para el clculo de la mediana se tomar la media aritmtica
)medida que veremos en el siguiente apartado* de los dos valores centrales.
3.3. LA MEDIA
(a media aritmtica se utili!a para variables cuya escala es, al menos, de intervalos. 'e
expresa de la siguiente forma.
x 6 =
=

x n N i i
i
n
,
'iendo 7
i
el valor de la variable observada y n
i
el n%mero de observaciones tienen ese
valor. "n el e#emplo expuesto en la tabla +.,., el clculo de la media ser el siguiente.
8
7 9
),-:5;,4:+;,2:+;+<:=;+,:+;++:>;+5:?;+>:>;+=:-;+?:?;+-:4;+4:4;+2:2;5<:,
;5,:,;5+:,;5>:,;5=:,;5-:,;52:+;>5:,;>-:,;=,:,*6-- 9 +?,>4
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"stas son las medidas de tendencia central ms utili!adas, aunque existen otras medidas
como la media geomtrica, que se utili!a para calcular el valor central de variables
acumulativas, porcenta#es, tasas y n%meros ndices y la media armnica, que se usa para
promediar velocidades y tiempos.
4. MEDIDAS DE DISPERSIN
(as medidas de dispersin nos ayudan a comprender si las medidas de tendencia central
son verdaderamente representativas de los datos que hemos obtenido y anali!ado. $uede
ser que tengamos dos distribuciones cuya media, mediana y moda sea la misma, pero
cuyos datos sean muy diferentes. (a simple utili!acin de las medidas de tendencia central
nos podra hacer creer que estamos ante la misma distribucin y, sin embargo, no es as.
$or e#emplo, tenemos estas dos distribuciones.
7
,
9 >, =, ?, 4, 4, ,<, ,,, ,+
7
+
9 ,, +, =, 4, 4, ,,, ,>, ,=
$ara ambas, la media, la mediana y la moda es 4. 1o obstante, la primera distribucin est
mucho ms concentrada que la segunda. $or ello, acompa@aremos a la medida de
tendencia central con una medida de la dispersin de los datos.
(as medidas de dispersin ms utili!adas son el rango, el recorrido intercuartlico, la
desviacin tpica y el coeficiente de variacin.
4.1. EL RANGO
"l rango es la medida de dispersin ms fcil de calcular. "s la resta entre el valor mximo
y el valor mnimo de la distribucin. $or e#emplo, en el caso anterior, el rango para cada
una de las distribuciones es.
A
,
9 ,+/> 9 4
A
+
9 ,=/, 9 ,>
Babiendo una mayor dispersin en la segunda variable.
"n el e#emplo de la tabla +.,. el rango es 5>, diferencia entre ,- y =,.
'in embargo, el rango es una medida bastante inestable porque slo se necesitan los
valores extremos. $ara superar esta inestabilidad, se puede utili!ar el rango modificado.
"sta medida se utili!a eliminando un determinado porcenta#e de valores extremos. (os
rangos modificados ms utili!ados son el del 2<C )se elimina un =C de los valores ms
ba#os y un =C de los ms altos*, el del 4<C )se elimina un ,<C de los valores ms ba#os y
un ,<C de los ms altos* y el del =<C )se elimina un +=C de los ms altos y un +=C de los
ms ba#os*.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
4.2. EL RECORRIDO INTERCUARTILICO
(os cuartiles son aquellos valores que dividen a la distribucin en cuatro partes con igual
n%mero de casos en cada una de ellas. "l primer cuartil toma el +=C de los casos por
deba#o de su lugar, el segundo es la mediana y toma el =<C de los casos por deba#o, el
tercero de#a el -=C de los casos por deba#o. 'e puede aproximar su lugar con las frmulas
<,+=:n;<,= para el primer cuartil, <,=:n;<,= para el segundo y <,-=:n;<,= para el tercero.
"l recorrido intercuartlico se define como la diferencia entre el primer y el tercer cuartil. A
diferencia del rango, es una medida de dispersin que se ve poco afectada por los valores
extremos de la distribucin.
4.3. LA DESVIACIN TIPICA
A diferencia del rango, considera todos los valores de la variable. 'e calcula como la ra!
cuadrada del sumatorio de las diferencias al cuadrado de cada valor de la variable y la
media. "n concreto es.
=
=

)) x*D * 6 x n N i i
i
n
,
siendo.
x
i
9 valor de la variable para el su#eto i
x = media aritmtica
n
i
9 frecuencia absoluta para el valor i
1 9 n%mero total de datos
"n el caso de la tabla +.,. la desviacin tpica es ?,+?.
&ambin es frecuente, utili!ar la varian!a en ve! de la desviacin tpica que es
simplemente su cuadrado.
4.4. EL COEFICIENTE DE VARIACIN
(as medidas de dispersin que hemos expuesto hasta ahora tienen un problema. estn
ntimamente relacionadas con las unidades de medida. As si una variable se encuentra
medida en unidades, las medidas de dispersin sern diferentes que si se encuentran
medidas en miles. (o mismo ocurre cuando tenemos un con#unto de variables que recogen
aspectos diferentes )renta, edad, metros*. "n estos casos, no podremos decir qu variable
tiene ms dispersin.
"l coeficiente de variacin soluciona este problema, pues es una medida relativa de
dispersin que consiste en dividir la desviacin tpica entre la media. "s adimensional y
por tanto, cuanto mayor sea ms n%mero de veces la desviacin contendr a la media y por
tanto, menor representatividad tendr esta %ltima medida.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"n el caso de la tabla +.,. el coeficiente de variacin es de <,+5.
5. ANLISIS !A"I#$ %NI&A!IANTE
Aunque la distribucin de frecuencias representa toda la informacin disponible, siempre
es %til traducirla a grficos de modo que la referencia visual sirva para explicar me#or el
fenmeno o sea un punto de partida para el anlisis estadstico con tcnicas que emplean
dos o ms variables. "sta etapa puede parecer insignificante a primera vista, pero es crucial
en el anlisis de datos, por si misma y como introduccin a cualquier anlisis bivariante o
multivariante. Aepresenta una primera aproximacin al fenmeno que se va a anali!ar y
facilita la interpretacin de resultados. Euchos investigadores tienden a obviar esta etapa
que, sin embargo, sirve para hacer una estimacin ptima de los resultados cuando
posteriormente se aplica mtodos ms sofisticados.
0on la inspeccin grfica de los datos univariantes observamos la forma de la distribucin.
(os tipos de grficos son muy variados. $ara fenmenos cuantitativos se suelen utili!ar las
grficas de barras, los histogramas y los polgonos de frecuencias. $ara fenmenos ms
cualitativos, existen los diagramas sectoriales, cartogramas y pictogramas, aunque estos
%ltimos se utili!an muy poco, ya que la mayora de los programas de ordenador facilitan
esta tarea, representando sobre todo histogramas y grficas de barras para ver la forma de
la distribucin.
(os histogramas se utili!an para representar generalmente frecuencias agrupadas. &ienen
dos e#es perpendiculares. 1ormalmente, en el e#e de ordenadas )F* se sit%an los valores de
las frecuencias y en el de abscisas )7*, los lmites del intervalo o marcas de clase. "l
histograma est formado por una serie de rectngulos de igual base. $or el contrario, la
altura de los mismos es diferente, dependiendo del valor de la frecuencia correspondiente.
0omo resultado de ello, mayores valores de frecuencia significarn mayores reas del
rectngulo asociado y menores valores de frecuencias se traducirn en reas menores.
$or e#emplo, para la distribucin de frecuencias de la tabla , el histograma es el siguiente
)figura +.,.*.
"I%!A 2.1. 'IST$!A(A )E "!E#%EN#IAS
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
edad
50,0 45,0 40,0 35,0 30,0 25,0 20,0 15,0
40
30
20
10
0
Desv. tp. = 6,26
Media = 26,5
N = 77,00
"n este grfico se han agrupado las frecuencias de edad y adems se ha obtenido una curva
para ver si la distribucin se a#usta a una normal.
0omo se puede observar en el grfico, la curva no se a#usta a una normal. (a normalidad
es un requisito esencial en la aplicacin de muchas de las tcnicas multivariantes. "n
general, no slo se observa mediante estos grficos. "xisten medidas univariantes, como la
asimetra y la curtosis y test de normalidad, disponibles en la mayora de programas
estadsticos, que nos ayudarn a decidir si los valores de la variable se distribuyen como
una normal. $ero la inspeccin grfica del histograma nos da una idea previa sobre este
supuesto.
(a grfica de barras es similar al histograma, aunque en este caso no se pueden agrupar los
datos. "n la figura +.+. se puede observar una grfica obtenida de la misma encuesta en la
que se muestra la preocupacin por la apariencia que tienen los individuos a los que se ha
preguntado.
"I%!A 2.2. !A"I#A )E *A!!AS
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
preocpaci!" aparie"cia
#c$o %asta"te re&lar poco
'
r
e
c

e
"
c
i
a
26
24
22
20
18
16
"l polgono de frecuencias o grfico de lneas es otra de las formas habituales de
representar la distribucin de frecuencias. "l e#e de ordenadas representa las frecuencias
relativas y el de abscisas representa las marcas de clases. 0ada punto del polgono de
frecuencias coincide con el punto medio del lado superior del rectngulo correspondiente
en el histograma. "n la figura +.5 tenemos un polgono de frecuencias.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.+. ,$L-$N$ )E "!E#%EN#IAS
preocpaci" aparie"cia
#c$o %asta"te re&lar poco
'
r
e
c

e
"
c
i
a
26
24
22
20
18
16
(os pictogramas o diagramas pictricos utili!an dibu#os ms o menos artsticos para
representar valores de las categoras relacionndolas con el tama@o.
6. ANLISIS BIVARIANTE
(as tcnicas de anlisis bivariante expresan el grado de relacin entre dos variables.
$ueden considerarse, en algunos supuestos, como casos especiales o simplicados de
algunas tcnicas de anlisis multivariante. "ntre las ms utili!adas en investigacin
comercial, cabe destacar.
/ &ablas de contingencia )o tabulacin cru!ada* y 7D
/ &abulacin de valores medios y anlisis de varian!a
/ 0orrelacin entre rangos de 'pearman y de correlacin lineal
6.1. TABLAS DE CONTINGENCIA
"n cualquier investigacin de mercados basada en la encuesta como tcnica de obtencin
de informacin y con variables cualitativas, despus de reali!ar un anlisis univariante se
procede a llevar a cabo una serie de cruces entre variables con el fin de observar la relacin
entre dichas variables. 1ormalmente, se suelen cru!ar variables de clasificacin )sexo,
edad, clase social, estado civil...* con variables relacionadas con el tema general de la
encuesta )consumo del producto, lugares de compra, hbitos de compra*. &ambin se
pueden hacer cruces entre dos preguntas relacionadas con el tema de la encuesta )consumo
del producto y lugar de compra*. (a %nica condicin para reali!ar el cruce es que las
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
variables sean no mtricas )categricas* o cualitativas )con escalas nominal u ordinal*.
(os cruces son tablas de doble entrada conocidas como tablas de contingencia y suelen
acompa@arse de dos subndices )rxc* que indican el n%mero de niveles de las variables
anali!adas )r filas y c columnas*. "l caso ms simple es el de las tablas +x+, que es con el
que empe!aremos explicando esta tcnica.
"n las distribuciones bidimensionales se consideran simultneamente dos caracteres de una
misma muestra )por e#emplo, consumo de un producto y sexo*. (os pares que contienen los
valores de las variables #unto con sus correspondientes frecuentas constituyen una tabla de
doble entrada )+x+*. 1uestro inters consiste en que se reali!a un anlisis simultneo de
ambos atributos o caractersticas y mediante su distribucin con#unta, tratamos de
establecer si existe relacin entre ambas.
"l esquema de una tabla de contingencia +x+ es el siguiente.
TA*LA 2.2. ES.%E(A )E %NA TA*LA )E #$NTINEN#IA
GAAAH(" H
GAAAH("
A
1G"( , 1G"( + &I&A(
EAAJ1A(
1G"( , n
,,
n
,+
n1.
1G"( + n
+,
n
++
n2.
&I&A(
EAAJ1A(
n.1 n.2 &I&A(
1
'iendo.
n
,,
9 n%mero de veces que se repite el nivel , de la variable A #unto con el nivel , de la
variable H
n
,+
9 n%mero de veces que se repite el nivel , de la variable A #unto con el nivel + de la
variable H
n
+,
9 n%mero de veces que se repite el nivel + de la variable A #unto con el nivel , de la
variable H
n
++
9 n%mero de veces que se repite el nivel + de la variable A #unto con el nivel + de la
variable H
n,.9 n%mero de veces que se repite el nivel , de la variable A sin importar el nivel de la
variable H
n+.9 n%mero de veces que se repite el nivel + de la variable A sin importar el nivel de la
variable H
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
n.,9 n%mero de veces que se repite el nivel , de la variable H sin importar el nivel de la
variable A
n.+9 n%mero de veces que se repite el nivel + de la variable H sin importar el nivel de la
variable A
19 n%mero total de observaciones
Jeneralmente es conveniente que la variable expresada como filas sea considerada como la
independiente y en columnas est la que consideremos dependiente.
(a hiptesis nula asociada a las tablas de contingencia es de independencia. 'e dice que
hay independencia entre dos variables cuando los valores que toma una de ellas no se ven
influidos por los que adopte la otra. "l contraste ms utili!ado para probar la
independencia entre dos variables cualitativas es el de la 7D, cuya hiptesis nula es la
independencia poblacional entre las variables. "l estadstico calculado se basa en la suma
de los cuadrados de la diferencia entre las frecuencias observadas y las esperadas )si las
variables fueran completamente independientes*, dividida entre las frecuencias esperadas.
D ) *D 6 =
=

n E E ij ij ij
i
n
,
siendo.
n
i#
9 frecuencia observada de la fila i y la columna #
"
i#
9 frecuencia esperada de la fila i y la columna #
(as estimaciones de las frecuencias esperadas utili!an la estimacin mximo verosmil en
la que la probabilidad se define como.
$
i
. 9 n
i
.61
$or tanto, la independencia entre dos sucesos implica.
$)i,#* 9 $ )i* : $ )#* 9 )n
i
.61* : )n.
#
61*
0omo ")i,#* 9 1 : $)i,#*
"ntonces
")i,#* 9 )n
i
.:n.
#
*61
Aespecto a la 7D cuanto mayor sea la diferencia entre las frecuencias observadas y las
esperadas mayor ser la frecuencia.
'i el valor del estadstico calculado supera al valor crtico )0* , obtenido de la b%squeda en
unas tablas para unos grados de libertad )r/,*:)c/,* y para un nivel de significacin, se
recha!a la hiptesis nula y se dice que las variables no act%an de forma independiente. 'i
ocurre lo contrario, no se recha!a la hiptesis nula y se dice que las variables act%an de
forma independiente.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
0omo ya explicamos en el tema anterior, gracias a los programas de ordenador, obtenemos
un valor de la probabilidad de recha!ar la hiptesis nula siendo cierta )p/valor*. 'i esta
probabilidad es inferior al nivel de significacin fi#ado ),C o =C* entonces se recha!a la
hiptesis nula.
$ara poder calcular el estadstico, se debe cumplir una condicin. no debe existir ninguna
frecuencia terica inferior a = individuos. 'i se da ese caso, el resultado obtenido no se
puede interpretar, es decir, aunque obtuviramos un estadstico calculado superior al valor
crtico, no estaramos en condiciones de recha!ar la hiptesis nula y no podramos llegar a
ninguna conclusin.
'i no se cumple este requisito de que todas las frecuencias esperadas sean superiores a
cinco, en las tablas +x+ se puede utili!ar el test exacto de Kischer, que utili!a la
distribucin de probabilidad exacta de la configuracin de las frecuencias observadas. "n
el caso de las tablas con ms filas y columnas, algunos investigadores permiten que si hay
menos de un +<C de celdas con frecuencia esperada menor que cinco, se pueda interpretar
la 7D.
"xisten una serie de medias de asociacin basadas en el estadstico 7D como el coeficiente
de $earson, el de contingencia y la G de 0ramer. "stas tres medidas y algunas otras, nos
permiten ver el grado de asociacin entre las dos variables estudiadas
,
.
Gamos a exponer el clculo de la 7D con un e#emplo. 'upongamos que un investigador
quiere saber si hay relacin entre el consumo de un producto light y el sexo. $ara ello,
entrevista a +<< personas y despus de recoger datos los resultados expuestos en una tabla
+x+ son los siguientes.
TA*LA 2.+. E/E(,L$ )E %NA TA*LA )E #$NTINEN#IA
'"7I
0I1'3EI
D"
$AID30&I
(JB&
BIEHA" E3L"A &I&A(
EAAJ1A(
' n
,,
9 +< n
,+
9 4< n,. 9 ,<<
1I n
+,
9 4< n
++
9 +< n+. 9 ,<<
&I&A(
EAAJ1A(
n., 9 ,<< n.+ 9 ,<< 1 9 +<<
'i el sexo no influyera en el consumo del producto, las proporciones de consumidores y no
consumidores seran del =<C independientemente del sexo. 'e quiere contrastar, con un
nivel de significacin del =C la hiptesis nula de independencia poblacional en el efecto
del consumo de un producto light sobre el sexo, siendo los resultados de la frecuencia
esperada )terica* los siguientes.
TA*LA 2.0. "!E#%EN#IAS TE$!I#AS
,
!E"E!EN#IA *I*LI$!A"I#A
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
BIEHA" E3L"A
' "
,,
9 =< "
,+
9 =<
1I "
+,
9 =< "
++
9 =<
"stas frecuencias se obtienen de multiplicar las frecuencias marginales de cada fila y
columna en la celda correspondiente y dividirlas por el n%mero total de datos. "n concreto.
"
,,
9 ,<<:,<<6+<<
F lo mismo para todas las dems.
$ara calcular el estadstico 7D habr que restar cada frecuencia con#unta observada de la
tabla +.5. de la frecuencia esperada de la tabla +.>. en cada celda, elevarla al cuadrado y
dividirla otra ve! por la frecuencia terica. (a suma de todas las celdas ser el valor del
estadstico calculado. $ara el e#emplo.
7D9 )+</=<*D6=<;)4</=<*D6=<;)4</=<*D6=<;)+</=<*D6=< 9 -+
"l valor crtico de una distribucin 7D con un grado de libertada al =C es 5,4>. $or tanto, al
ser mayor el estadstico calculado que el de las tablas, recha!amos la hiptesis nula y
decimos que el sexo influye en el consumo del producto light.
6.2. TABULACION DE VALORES MEDIOS Y ANLISIS DE LA VARIAN!A
"l anlisis de la varian!a trata de estudiar la relacin entre una variable mtrica y una
variable no mtrica. (a prueba de hiptesis se hace mediante la K de 'nedecor. (a
hiptesis nula es que hay igualdad de medias. (as variables que se suelen cru!ar son las
que provienen de una encuesta en la que se valoran determinados atributos o caractersticas
del producto mediante escalas mtricas y las de clasificacin u otras relacionadas con el
tema general de la encuesta.
Antes de explicar cmo se reali!a el clculo del estadstico, vamos a observar de forma
grfica cmo sera el anlisis de varian!a. "n la figura +.>., representamos la media de la
valoracin del aroma de una colonia respecto de las personas que eligen su propia marca
de colonia y las que no la eligen. 0omo se puede observar, las medias son bastante
diferentes. "n el caso de la valoracin del envase, sin embargo, no hay grandes diferencias
entre los dos grupos. (os crculos representan la dispersin entre los grupos.
"n el primer caso )figura +.>.*, las medias son diferentes para los que eligen y para los que
no eligen. "n el segundo )figura +.=.*, no. Adems, en el primer caso, no hay demasiada
dispersin entre las respuestas de los individuos y en el segundo s. "l anlisis de la
varian!a, nos permitir ver si esas medias son estadsticamente diferentes o no.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.0. &AL$!A#I1N )EL A!$(A "I%!A 2.5. &AL$!A#I1N )EL EN&ASE
"l anlisis de la varian!a se basa en que la dispersin total se descompone en dispersin
intra grupos y dispersin entre grupos o lo que es lo mismo, diferencias de respuesta de los
individuos con respecto a su grupo y diferencias de respuesta entre los distintos grupos.
(as dispersiones se miden como suma de cuadrados de la siguiente forma.
'0 &I&A( 9 '0 1&AA ; '0 "1&A"
) x..*D ) x. *D )x.. x. *D x x k ij ij j j
j
m
i
n
j
m
i
n
j
m
= +
= = = = =

, , , , ,
siendo.
xij
= valo !" la o#$"va%&'( & )aa "l *+)o ,
x.. = -"!&a .o.al
x. j
= -"!&a !"l *+)o ,
/ = (0-"o !" *+)o$
(a K de 'nedecor se calcular como el cociente entre la '0 entre y la '0 intra, divididas
ambas por sus grados de libertad )el n%mero de niveles menos uno y el n%mero de
observaciones menos el n%mero de niveles, respectivamente*. 0uanto mayor sea la K,
mayor ser la diferencia entre grupos y la menor la diferencia intra grupos.
'i el valor del estadstico calculado supera al valor crtico )0* , obtenido de la b%squeda en
unas tablas para unos grados de libertad )M/,* y )n/,* y para un nivel de significacin, se
recha!a la hiptesis nula y se dice que las variables tienen medias diferentes para cada
grupo. 'i ocurre lo contrario, no se recha!a la hiptesis nula y se dice que las variables
tienen medias iguales en los dos grupos.
0omo en el apartado anterior, con el programa de ordenador, obtenemos un valor de la
probabilidad de recha!ar la hiptesis nula siendo cierta )p/valor*. 'i esta probabilidad es
inferior al nivel de significacin fi#ado ),C o =C* entonces se recha!a la hiptesis nula.
"l clculo del estadstico se puede ver con un e#emplo. Gamos a suponer que tenemos ocho
datos de personas a las que preguntamos cunto valoran el aroma de una colonia )en una
El"%%&'( -a%a
El"%%&'( -a%a S&
S&
No No
M"!&a = 1.22
M"!&a = 3.34
M"!&a = 4.56
M"!&a = 4.52
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
escala del < al ,<* y si eligen ellos su propia marca. De estas ocho personas, cuatro eligen
marca y cuatro no. (os resultados son.
TA*LA 2.5. &AL$!A#I1N A!$(A 2 ELE##I1N )E (A!#A
"("00I1 GA(IAA0N
1 AAIEA
, ' 4
+ ' 2
5 ' -
> ' 4
= 1I =
? 1I >
- 1I ?
4 1I >
(a media total es de ?,5-=. $ara los que eligen marca, la media es 4 y para los que no la
eligen >,-=. Oson estadsticamente diferentes estas mediasP. $ara probar la hiptesis de
igualdad de medias, calculamos la K que ser.
'0 entre 9 ))4/?,5-=*D;)>,-=/?,5-=*D*:+ 9 ,<,=?
'0 intra 9 )4/4*D;)2/4*D;)-/4*D;)4/4*D;)=/>,-=*D;)>/>,-=*D;)?/>,-=*D;)>/>,-=*D 9 >,-=
K 9 ),<,=?6,*6)>,-=6-* 9 ,=,=?
"l estadstico de tablas para , y - grados de libertad y un nivel de significacin del =C es
de....*%S#A! ESTA)-STI#$. 0omo el estadstico calculado es mayor que el terico,
recha!amos la hiptesis nula de igualdad de medias.
6.3. COEFICIENTES DE CORRELACION
(a correlacin es la tcnica estadstica bivariante que se usa con mayor frecuencia para
resumir la fuer!a de la asociacin entre dos variables mtricas. "n investigacin comercial
se suele utili!a para medir la intensidad de la relacin entre dos variables como, por
e#emplo, ventas y gasto publicitario, cuota de mercado y n%mero de puntos de distribucin,
percepciones de calidad y de precio, etc.
(a correlacin producto3momento es el estadstico que se suele emplear en mayor
medida cuando se trata de medir la fuer!a de la asociacin entre dos variables mtricas. 'i
denominamos 7 e F a dichas variables, la correlacin lineal entre ambas indica el grado en
el que la variacin de la variable 7 se relaciona con la variacin de la variable F. 'e
conoce tambin con el nombre de coeficiente de correlacin de $earson. F se expresa
como.
r x y y x y y
i
n
i
i
n
i
i
n
=
=

=

) x*) * 6 ) x* D ) *D i i / /
, , ,
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
0uando queremos calcular la fuer!a de la relacin entre dos variables no mtricas existen
otras posibles medidas como la rho de 'pearman 7( y la tau de Qendall 7(. Ambas
medidas utili!an clasificaciones en ve! de valores absolutos de las variables. &ambin
varan entre /, y ,. 0omo regla general la de Qendall se prefiere cuando hay un n%mero
relativamente peque@o de categoras y existen muchos casos. $or el contrario, el uso de la
de 'pearman rd ms aconse#able cuando tenemos un n%mero relativamente alto de
categoras )Ealhotra, ,22-*.
7. ANLISIS GRAFICO BIVARIANTE
"l anlisis grfico bivariante trata de ver las relaciones entre las variables y las diferencias
entre grupos de variables. $ara ello contamos con los grficos de ca#as y bigotes
)representar las diferencias entre dos o ms grupos de variables* y con los grficos 7F
)comprobar la relacin entre las variables*. 'on un complemento del anlisis de varian!a y
del anlisis de correlacin.
"n cuanto a las diferencias entre dos o ms variables mtricas para grupos distintos de
individuos, necesitamos entender cmo se distribuyen los valores para cada uno de ellos y
si existen suficientes diferencias como para tener significacin estadstica. Itro aspecto
importante es identificar los atpicos que pueden resultar slo aparentes cuando los valores
se separan en grupos. "l mtodo que se utili!a para anali!ar estas diferencias es el grfico
de ca#as )box plot*. (os lmites superior e inferior de la ca#a marcan los cuartiles superior e
inferior de los datos. $or tanto, la longitud de la ca#a es la distancia entre el primer y el
tercer cuartil, de forma que la ca#a contiene los datos centrales de la distribucin. (a lnea
dentro de la ca#a se@ala la posicin de la mediana. 'i esta cae cerca del final de la ca#a, se
indica la presencia de asimetra. (as lneas que se extienden desde cada ca#a )llamadas
bigotes* representan la distancia entre la mayor y la menor de las observaciones que estn a
menos de un cuartil de la ca#a. (os casos atpicos )marcados con asterisco* son
observaciones que se sit%an a ms de , cuartil fuera de los lmites de la ca#a.
"n la figura +.? se muestra el grfico de ca#as para dos grupos de individuos. los que eligen
marca y los que no. (os dos grupos tienen un con#unto de valores muy diferente, lo que
indica que existen diferencias entre los grupos de la valoracin del aroma. Adems existen
en el segundo grupo dos casos atpicos. "l investigador debe examinar estas observaciones
y ver qu solucin aplica.
"I%!A 2.4. )IA!A(A )E #A/AS 2 *I$TES
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
27 50 N =
elecci" #arca
"o si
a
r
o
#
a
12
10
8
6
4
2
0
21 72
63
$ara ver la relacin entre dos variables, podemos utili!ar los grficos de dispersin, de
forma que el patrn de puntos representa la relacin. cuando los puntos se organi!an a lo
largo de una recta, tenemos una relacin lineal de correlacin, mientras que un con#unto de
puntos curvados puede indicar relacin no lineal o incluso puede haber ausencia de
relacin cuando el con#unto de puntos es aleatorio.
$or e#emplo, el grfico de dispersin de las variables )figura +.-* indica que los puntos
estn alineados alrededor de una lnea recta, ya que tienen una correlacin elevada de
<,452.
"I%!A 2.5. !A"I#$ )E )IS,E!SI$N ENT!E A!$(A 2 #ALI)A)
calidad
12 10 8 6 4 2 0
a
r
o
#
a
11
10
9
8
7
6
5
4
3
'in embargo, la valoracin del envase y del precio presentan una ausencia casi total de
correlacin como evidencia de la amplia dispersin de los puntos )correlacin de <,,,>*,
como se muestra en la figura +.4.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.6.7 !A"I#$ )E )IS,E!SI$N ENT!E EN&ASE 2 ,!E#I$
precio
12 10 8 6 4 2 0
e
"
v
a
s
e
10
8
6
4
2
0
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
. EL ANLISIS UNIVARIANTE Y BIVARIANTE EN SPSS
.1. ANALISIS UNIVARIANTE EN SPSS
"l mdulo de '$'' que permite anali!ar la informacin se encuentra en el men% de
anlisis. 'on varios los sub/men%s que nos permitirn aplicar las tcnicas univariantes y
bivariantes que hemos explicado hasta ahora. (a distribucin de frecuencias se encuentra
en el men% "stadsticos Descriptivos, Krecuencias )Kigura +.2*.
"I%!A 2.8. ($)%L$ ESTA)ISTI#$S )ES#!I,TI&$S
0uando se acepta el submen% de frecuencias, al menos se debe introducir una variable para
que sea anali!ada. $or defecto, la salida nos dar las frecuencias absolutas, relativas,
vlidas y acumuladas. 'i queremos pedir otras medidas descriptivas, como las de posicin
central, de dispersin o de deformacin, tendremos que marcar aquellas que queramos que
apare!can en la salida en la opcin de "stadsticos. &ambin podemos pedir grficos
)histogramas, sectores o grficas de barras* en la opcin Jrficos. $or %ltimo, podemos
cambiar la organi!acin de la informacin )que apare!ca de forma ascendente,
descendenteR por valores o por frecuencias* en la opcin Kormato. "n la figura +.,<. se
muestra cmo es el submen% frecuencias.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.19. S%*(EN% )E "!E#%EN#IAS
$ara anali!ar las salidas del '$'', vamos a utili!ar una base de datos que proviene de una
de las encuestas reali!adas en los a@os 2< por el 0'. "n esta base de datos, tiene +>2,
individuos y ,>< variables. (as variables provienen de un amplio cuestionario que contiene
preguntas sobre posesin de bienes, actitudes y valores, as como variables socio/
demogrficas que permiten clasificar a los su#etos entrevistados.
Gamos a anali!ar las salidas referentes a tres preguntas con diferentes tipos de escala.
,. $ara la escala nominal, estudiaremos las respuestas a la pregunta Otiene ordenador
personalP, cuyas respuestas son 'i o 1o.
+. $ara la escala ordinal, estudiaremos las respuestas a la pregunta S0mo utili!a el
ordenador personalT, cuyas respuestas van desde , S'in ninguna dificultadT hasta =
S1o sabe utili!arloT.
5. $ara la escala de intervalos, estudiaremos las respuestas a la pregunta S(os
ordenadores son difciles de mane#arT, cuyas respuestas se determinan en una
escala del , al 2 siendo , Stotalmente de acuerdoT y 2 Stotalmente en desacuerdoT.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"n la tabla +.?. se muestra la salida a la primera pregunta. 0omo de las +>2, personas
encuestadas, 4 no contestan a esta pregunta, el porcenta#e vlido es distinto a la frecuencia
relativa que aparece en la tercera columna. Del total de casos vlidos, el +?,5C )?=>
personas sobre +>45 casos vlidos* posee ordenador.
TA*LA 2.4. "!E#%EN#IAS )E LA ,!E%NTA
:;TIENE $!)ENA)$! ,E!S$NAL<=
Ordenador personal
654 26,2 26,3 26,3
1829 73,4 73,7 100,0
2483 99,7 100,0
8 ,3
2491 100,0
)*
No
Total
+,lidos
)iste#a -erdidos
Total
'rece"cia -orce"ta.e
-orce"ta.e
v,lido
-orce"ta.e
ac#lado
"n esta pregunta no nos interesa obtener una medida descriptiva. 'i puede ser interesante
pedir un grfico )de sectores o de barras*. (os grficos de '$'' no son visualmente
atractivos. $or ello, si lo que nos interesa es hacer una inspeccin rpida se pueden solicitar
estos grficos, pero si vamos a presentar un informe o un traba#o acadmico es mucho
me#or preparar grficos en una ho#a de clculo o con un programa de presentaciones. 1o
obstante, en la figura +.,,. presentamos el grfico de sectores que se obtendra cuando se
marcara esta opcin en '$''.
"I%!A 2.11. !A"I#$ )E SE#T$!ES )E LA ,!E%NTA
;TIENE $!)ENA)$! ,E!S$NAL<
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
/rde"ador perso"al
0asos po"derados por -1)/
-erdido
No
)*
(a siguiente pregunta, con escala ordinal, permite un anlisis de frecuencias y obtener
ciertas medidas descriptivas, como la mediana y la moda. 'in embargo, estas medidas no
a@aden gran informacin a la inspeccin visual de las frecuencias. "stas se pueden
observar en la tabla +.-. "n este caso, los valores ausentes son ,+5 por lo que el porcenta#e
vlido cambia en mayor medida que en el e#emplo anterior. "l dato que ms se puede
destacar es que casi un ?<C de la muestra )el =4,2C* no sabe utili!ar el ordenador,
mientras que un +5,?C afirma mane#arlo sin dificultad.
TA*LA 2.5. "!E#%EN#IAS )E LA ,!E%NTA
:;#$($ %TILI>A EL $!)ENA)$! ,E!S$NAL<=
Ordenador personal
558 22,4 23,6 23,6
214 8,6 9,1 32,6
113 4,6 4,8 37,4
86 3,5 3,6 41,1
1395 56,0 58,9 100,0
2368 95,1 100,0
123 4,9
2491 100,0
)i" di2icltad
0o" al&"a di2icltad
0o" %asta"te di2icltad
0o" #c$a di2icltad
No sa%e tili3arlo
Total
+,lidos
)iste#a -erdidos
Total
'rece"cia -orce"ta.e
-orce"ta.e
v,lido
-orce"ta.e
ac#lado
(a %ltima pregunta que vamos a exponer se basa en una escala de intervalos de nueve
posiciones. 0on las variables mtricas )escalas de intervalos o de ra!n* no es necesario
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
anali!ar las frecuencias, sobre todo si tienen un rango muy amplio. Eucho ms ilustrativo
ser el anlisis de medidas de tendencia central y de dispersin.
$ara obtener estas medidas descriptivas, podemos pedir que no apare!can las frecuencias
en el submen% que hemos ilustrado y marcar la opcin de descriptivos o podemos acudir a
otro submen% dentro del mdulo de "stadsticos Descriptivos, concretamente Descriptivos
)figura +.,+*. "n este submen%, debemos introducir las variables con escala de intervalo o
de ra!n que queremos anali!ar. $or defecto, se obtendr la misma informacin que en el
men% de frecuencias, es decir, media, desviacin tpica, mximo y mnimo. 'i queremos
alguna otra medida hay que marcarla en Ipciones. &ambin este submen% nos permite
crear variables estandari!adas )nuevas variables que se denominan como las antiguas con
una U delante* que pueden ser ob#eto de anlisis posteriores.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.12. S%*(EN% )ES#!I,TI&$S
(a salida de '$'' muestra por defecto los resultados que aparecen en la tabla +.4. 'eg%n la
escala utili!ada ),/2*, la media de las respuestas se concentra en torno al acuerdo con esta
afirmacin, aunque hay una elevada dispersin, ya que la desviacin tpica arro#a un valor
de +,>>.
TA*LA 2.6. (E)I)AS )ES#!I,TI&AS )E LA ,!E%NTA
:L$S $!)ENA)$!ES S$N )I"I#ILES )E (ANE/A!=
Estadsticos descriptivos
2489 1 9 2,58 2,448
2489
4os orde"adores so"
di2iciles de #a"e.ar
N v,lido 5se&6" lista(
N M"i#o M,7i#o Media Desv. tp.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
.2. EL ANALISIS BIVARIANTE EN SPSS
(a tabulacin cru!ada se anali!a en '$'' en el submen% de tablas de contingencia, que se
encuentra tambin en el mdulo de "stadsticos Descriptivos. Babr que introducir las
variables que consideremos fila )o que dependen de otra* y las variables que consideremos
columna )las que condicionan a las variables fila*. "n el e#emplo que desarrollamos en el
apartado =, pondramos el consumo del producto light por filas y el sexo por columnas.
&ambin habr que marcar en la opcin de "stadsticos la 0hi/cuadrado y en la opcin de
0asillas el porcenta#e por columna. "n la figura +.,5. se muestra la pantalla que reproduce
una tabulacin para la base de datos de la encuesta del 0' en que se trata de ver la
relacin de dependencia entre la posesin de antena parablica y el tipo de residencia en la
que vive en el encuestado.
"I%!A 2.1+. TA*%LA#I$N #!%>A)A EN S,SS
(a salida que proporciona el programa muestra en primer lugar las tablas de contingencia
)&abla +.2.*. "l porcenta#e por columna nos indica que parece haber un mayor porcenta#e
de usuarios de antenas en los chalets y en los pisos. $ara probar que realmente hay una
relacin de dependencia acudimos al estadstico 0hi/cuadrado )&abla +.,<.*. "l valor de
esta prueba es de >?,24. 'i nos fi#amos en su p/valor y lo comparamos con un nivel de
significacin del ,C, podemos recha!ar la hiptesis nula de independencia y concluir que
hay una relacin entre la posesin de antena y el tipo de residencia. "s importante observar
que no hay ninguna celda con frecuencia esperada menor que =. 'i hubiera ms de un +<C
de celdas con frecuencias esperadas menores que =, no podramos interpretar los resultados
que nos arro#ara esta prueba.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
TA*LA 2.8. TA*%LA#I$N #!%>A)A TI,$ )E !ESI)EN#IA 2 ANTENA
,A!A*$LI#A
Tabla de contingencia Antena parabolica de TV (personal o colectiva) * PIO
210 29 27 3 269
13,78 12,98 4,08 6,18 10,98
1322 195 641 46 2204
86,38 87,18 96,08 93,98 89,18
1532 224 668 49 2473
100,08 100,08 100,08 100,08 100,08
9ece"to
8 de -:)/
9ece"to
8 de -:)/
9ece"to
8 de -:)/
)*
No
;"te"a para%olica de T+
5perso"al o colectiva(
Total
-iso
0$alet o
casa 5"ivel
#edio < alto(
0asa
"i2a#iliar
53o"a
reside"cial
depri#ida o
rral( No co"sta
-:)/
Total
TA*LA 2.19. ESTA)ISTI#$ #'I3#%A)!A)$
Pruebas de c!i"cuadrado
46,986
a
3 ,000
55,357 3 ,000
25,470 1 ,000
2473
0$i=cadrado de -earso"
9a3!" de verosi#ilitd
;sociaci!" li"eal por
li"eal
N de casos v,lidos
+alor &l
)i&. asi"t!tica
5%ilateral(
0 casillas 5,08( tie"e" "a 2rece"cia esperada i"2erior a 5.
4a 2rece"cia #"i#a esperada es 5,33.
a.
"n cuanto al anlisis de la varian!a, hay varias opciones en '$'' para reali!arlo, pero
nosotros aconse#amos el mdulo de 0omparar medias, Anova de un factor. "ntre las
opciones, habr que marcar descriptivos para que apare!can las medias y desviaciones
tpicas. $ara desarrollar un e#emplo vamos a utili!ar otra base de datos. "n este caso la que
proviene de una encuesta a traba#adores sobre marMeting interno. 0ru!aremos la categora
profesional con la opinin que tiene el encuestado sobre el ambiente laboral. (os mdulos
y opciones se pueden ver en las figuras +.,>. y +.,=.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.10. ($)%L$ )E AN$&A
"I%!A 2.15. AN$&A )E %N "A#T$!. $,#I$NES
(os resultados se muestran en las tablas +.,,. y +.,+. "n la primera, se observa que las
medias parecen diferentes en funcin de la categora profesional, ya que las categoras ms
elevadas punt%an me#or el ambiente laboral. (a prueba de que las medias son
estadsticamente diferentes se basa en la K/'nedecor. "l valor de este estadstico es de 4,>-
y tiene un p/valor de <.<<<, lo que nos indica que para un nivel de significacin del ,C
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
podemos recha!ar la hiptesis nula de igualdad de medias.
TA*LA 2.11. )ES#!I,TI&$S )E A(*IENTE LA*$!AL
,$! #ATE$!IA ,!$"ESI$NAL
#escriptivos
;M>:1NT1 4;>/9;4
501 3,80 ,963 ,043 3,72 3,89 1 5
106 3,68 1,091 ,106 3,47 3,89 1 5
259 4,06 ,887 ,055 3,95 4,17 1 5
51 4,25 ,683 ,095 4,06 4,44 2 5
916 3,89 ,956 ,032 3,82 3,95 1 5
1
2
3
4
Total
N Media
Desviaci!"
tpica 1rror tpico 4#ite i"2erior
4#ite
sperior
:"tervalo de co"2ia"3a para
la #edia al 958
M"i#o M,7i#o
TA*LA 2.12. ANALISIS )E &A!IAN>A ?A(*IENTE LA*$!AL
,$! #ATE$!IA ,!$"ESI$NAL@
A$OVA
;M>:1NT1 4;>/9;4
22,699 3 7,566 8,479 ,000
813,798 912 ,892
836,496 915
:"ter=&rpos
:"tra=&rpos
Total
)#a de
cadrados &l
Media
cadr,tica ' )i&.
.3. ANALISIS DE CORRELACION EN SPSS
La %o"la%&'( #&va&a!a $" a(al&8a "( SPSS "( "l $+#-"(0 !" Co"la%&o("$ 79&*+a 5.:3;.
Co(%".a-"(.", $" !"#" "l"*& la o)%&'( D&va&a!a$ )+"$.o <+" la$ o.a$ o)%&o("$ $" "9&""( a la$
%o"la%&o("$ )a%&al"$ o a la$ !&$.a(%&a$. Po !"9"%.o $" %al%+la la %o"la%&'( !" P"a$o(, a+(<+"
.a-#&=( $" )+"!"( -a%a lo$ o.o$ "$.a!>$.&%o$ <+" &(!&%a( %o"la%&'( )aa va&a#l"$ (o -=.&%a$,
%o-o la .a+ !" ?"(!all o la @o !" S)"a-a(. A!"-A$, "l )o*a-a )"-&." o#."(" a<+"llo$
%o"9&%&"(."$ <+" .&"("( +(a %o"la%&'( "$.a!>$.&%a-"(." $&*(&9&%a.&va.
E( "l %a$o !" la #a$" !" !a.o$ <+" "$.a-o$ a(al&8a(!o va-o$ a o#."(" la$ %o"la%&o("$
!&va&a!a$ "(." la$ )"*+(.a$ <+" @"-o$ "$.a!o a(al&8a(!o a(."&o-"(." "9"&!a$ a lo$
o!"(a!o"$. Co-o $" )+"!" v" "( la .a#la 5.:4., la $al&!a "$ +(a -a.&8 %+Ba !&a*o(al )&(%&)al "$
la +(&!a!. La$ %o"la%&o("$ "(." la$ va&a#l"$ a)a"%"( "( lo$ !"-A$ "l"-"(.o$ !" la -a.&8. E(
"l ","-)lo, .o!a$ la$ va&a#l"$ .&"("( +(a %o"la%&'( "$.a!>$.&%a-"(." $&*(&9&%a.&va al 66C.
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
"I%!A 2.15. ($)%L$ )E #$!!ELA#I$NES *I&A!IA)AS
TA*LA 2.1+. SALI)A )E #$!!ELA#I$NES *I&A!IA)AS
ESTOS APUNTES HAN SIDO ELABORADOS POR MONICA GOMEZ SUAREZ, PROF. TITULAR DE INVESTIGACION DE MERCADOS DE
LA UAM. QUEDA PROHIBIDA LA REPRODUCCION TOTAL O PARCIAL SIN PERMISO EXPRESO DE LA AUTORA
%orrelaciones
1 ,412?? ,409??
. ,000 ,000
2489 2486 2487
,412?? 1 ,579??
,000 . ,000
2486 2486 2485
,409?? ,579?? 1
,000 ,000 .
2487 2485 2487
0orrelaci!" de -earso"
)i&. 5%ilateral(
N
0orrelaci!" de -earso"
)i&. 5%ilateral(
N
0orrelaci!" de -earso"
)i&. 5%ilateral(
N
4os orde"adores so"
di2iciles de #a"e.ar
0o" los orde"adores se
reselve" #as 2acil#e"te
al&"os pro%le#as de la
vida cotidia"a
4os orde"adores $ace"
@e las perso"as se
co#"i@e" cada ve3
#e"os e"tre si
4os
orde"adores
so" di2iciles
de #a"e.ar
0o" los
orde"adores
se reselve"
#as
2acil#e"te
al&"os
pro%le#as de
la vida
cotidia"a
4os
orde"adores
$ace" @e las
perso"as se
co#"i@e"
cada ve3
#e"os e"tre
si
4a correlaci!" es si&"i2icativa al "ivel 0,01 5%ilateral(.
??.
.4. ANALISIS GRAFICO EN SPSS
(os grficos explicados en el apartado - )histogramas, grficas de barras, polgono de
frecuencias, dispersin y ca#as* se pueden encontrar en la mayora de los programas
existentes. (a opcin del men% que permite llevar a cabo todos estos anlisis es la de
Jrficos. Dentro de ella, se debe elegir el tipo de plot que queremos para representar los
datos. "n histogramas, hay que indicar la variable y si se quiere representar la curva
normal, marcar dicha opcin. "n dispersin se deben escoger, al menos, las dos variables
que sern representadas. F en ca#as se debe indicar la variable de referencia )categrica*
para dividir entre grupos y la variable mtrica que se representar en la ca#a.

También podría gustarte