Está en la página 1de 21

UNIVERSIDAD PABLO DE OLAVIDE

Facultad de Ciencias Empresariales

DEPARTAMENTO DE ECONOMÍA, MÉTODOS


CUANTITATICOS E HISTORIA ECONÓMICA

ÁREA DE MÉTODOS CUANTITATIVOS

ASIGNATURA:

TÉCNICAS DE INVESTIGACIÓN CUANTITATIVA


Y CUALITATIVA EN CRIMINOLOGÍA
Grado en Criminologı́a

Profesores:

Antonio Miguel Márquez Durán


Manuel Martı́nez Blanes
Manuela Segovia González
2
Capı́tulo 1

Técnicas Cualitativas

1. Utilización de las técnicas cualitativas en Criminologı́a

2. Contrastes de Bondad de Ajuste

3. Tablas de Contingencia

4. Contrastes de Independencia

5. Contrastes de homogeneidad

6. Análisis de correspondencia simple

3
4 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

1.1. Utilización de las técnicas cualitativas en


Criminologı́a

En este capı́tulo vamos a centrar nuestro interés en las variables cualitativas


del análisis estadı́stico criminológico, es decir, en aquellos aspectos de dicho
análisis que no son cuantificables en número. Se trata de información acerca
de un determinado fenómeno cuyos resultados vienen referidos a cualidades o
caracterı́sticas no medibles. Por poner algunos ejemplos, podrı́amos mencionar
los siguientes: tipos de conductas en delincuentes o criminales, caracterı́stica
de su aspecto fı́sico, caracterı́sticas psicológicas, factores sociales influyentes
en la conducta criminal, ...
Nos preocuparemos sobre todo por el tipo de distribución que siguen este tipo
de variables (contrastes de bondad de ajuste), del estudio de la asociación o
dependencia de variables de este tipo (contrastes de independencia), ası́ como
del análisis de la homogeneidad de diferentes muestras de una misma variable
(contrastes de homogeneidad), todo ello, por supuesto, haciendo uso de la
teorı́a de los contrastes de hipótesis.
1.2. CONTRASTES DE BONDAD DE AJUSTE 5

1.2. Contrastes de Bondad de Ajuste

Un contraste de bondad de ajuste se emplea para verificar si una muestra


aleatoria procede de una población con una cierta distribución de probabilidad.
Existen diferentes test de bondad de ajuste.

Kolmogorov y Smirnov (1933), proponen un nuevo test de bondad de ajuste


que utiliza la función de distribución empı́rica de la muestra1 . Si deseamos
saber si una muestra se rige por una determinada función de distribución cono-
cida, es lógico que se compare dicha distribución con la función de distribución
empı́rica de la muestra, que puede considerarse como el estimador de la fun-
ción de distribución2 . La medida de la diferencia entre función de distribución y
función de distribución empı́rica de la muestra que dan Kolmogorov y Smirnov
es la distancia máxima, medida en dirección vertical, entre las gráficas corre-
spondientes a dichas distribuciones.

También puede aplicarse esta misma idea cuando queremos saber si dos
muestra aleatorias provienen de la misma distribución. En este caso se com-
pararan entre sı́ las dos funciones de distribución empı́ricas de las muestras.

No desarrollaremos este tipo de contrastes en este tema y nos centraremos


exclusivamente en el test χ2 de Pearson, que luego utilizaremos en las tablas
de contingencia.



 0 x ≤ x(1)



 .. ..

 . .

1 k
Fn (x) = x(k) < x ≤ x(k+1) , k = 1, 2, . . . , n − 1


n

 .. ..

 . .



1 x ≥ x(n)
2
Teorema de Glivenco Cantelli
6 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

1.2.1. Test χ2 de Pearson

Introducido por Pearson, 1900, se utiliza para contrastar si una muestra


aleatoria procede o no de una población con una determinada distribución. Si
denotamos por F0 (x) a dicha distribución, el test puede escribirse:
)
H0 : F (x) = F0 (x)
H1 : F (x) 6= F0 (x)

La distribución F0 (x) se supone totalmente definida. Si alguno de sus parámet-


ros fuera desconocido, se utiliza el estimador de máxima verosimilitud.

Una vez distribuidos los datos muestrales en k categorı́as, se trata de ver la


diferencia entre las frecuencias observadas en cada categorı́a y las frecuencias
que se esperan bajo H0 , es decir, cuando se supone que la muestra proviene
de una distribución con función de distribución F0 (x). Si esta diferencia es
grande se rechaza la hipótesis nula y si, en cambio, dicha diferencia es pequeña
no habrá motivos para rechazar y entenderemos que la muestra ha sido extraı́da
de la distribución F0 (x).

El estadı́stico que se utiliza en este test es el estadı́stico χ2 que se obtiene


sumando las diferencias cuadráticas entre frecuencias observadas y esperadas,
divididas por las frecuencias esperadas:

k
X (ni − npi )2
χ2exp =
i=1
npi

donde:

k es el número de categorı́as que consideramos

pi es la probabilidad, bajo H0 , de que una observación esté en la categorı́a


i. Ası́ npi son las frecuencias esperadas.
1.2. CONTRASTES DE BONDAD DE AJUSTE 7

ni son las frecuencias observadas, es decir, las observaciones de la muestra


que caen en cada categorı́a.

Teóricamente, el estadı́stico χ2 tiene una distribución ji- cuadrado con k −


h − 1 grados de libertad, siendo h el número de parámetros poblacionales esti-
mados por el método de máxima verosimilitud. Esta distribución es asintótica,
por lo que se exige en la aplicación del test que npi sea mayor que 5.

El contraste, al nivel de significación α dado, para contrastar la hipótesis


nula H0 , tiene la siguiente región crı́tica:

Pk (ni −npi )2
χ2exp = i=1 npi
> χ21−α

siendo χ21−α tal que P [χ2k−h−1 > χ21−α ] = α

Ejemplo 1.2.1 A continuación mostramos unos resultados preliminares del


proyecto ((Estadı́sticas sobre la delincuencia en Andalucı́a)) subvencionado por
la Junta de Andalucı́a y realizado en colaboración con el Departamento de
Estadı́stica de la Universidad de Málaga:

Categorı́as de delincuentes Porcentaje


Ladrones 35 0/0
Homicidas 30 0/0
Violadores 20 0/0
Otros 15 0/0

Para tratar de comprobar estos porcentajes se realiza una análisis a 250 delin-
cuentes seleccionados al azar obteniéndose los siguientes resultados:
8 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

Categorı́as de delincuentes Frecuencias


Ladrones 90
Homicidas 72
Violadores 52
Otros 36

A un nivel de significación del 5 0/0 , contrastar si la muestra obtenida se ajusta


a los datos que maneja la Junta de Andalucı́a.

Solución: Definimos la variable aleatoria:

X : Tipo de delincuente

Esta variable tiene, desde el punto de vista de la Junta de Andalucı́a, la sigu-


iente distribución de probabilidad:

Categorı́as de delincuentes, xi Probabilidad, P [X = xi ]


Ladrones 0’35
Homicidas 0’30
Violadores 0’20
Otros 0’15

Se trata de contrastar, con la información obtenida en la muestra, si la Jun-


ta de Andalucı́a está en lo cierto y ésta es efectivamente la distribución de
probabilidad de la variable aleatoria X, o si, en cambio, la distribución de
probabilidad de la variable es otra distinta. Este contraste puede escribirse:
)
H0 : p1 = 00 35 , p2 = 00 3 , p3 = 00 2 , p4 = 00 15
H1 : Al menos una pi , i = 1, 2, 3, 4, toma un valor distinto a los anteriores

El estadı́stico que se utiliza en este test es el estadı́stico χ2 que se obtiene


sumando las diferencias cuadráticas entre frecuencias observadas y esperadas,
1.2. CONTRASTES DE BONDAD DE AJUSTE 9

divididas por las frecuencias esperadas:

k
X (ni − npi )2
χ2exp =
i=1
npi

Realizamos los cálculos en la siguiente tabla:

(ni −npi )2
Delincuentes, ni pi npi (ni − npi )2 npi

Ladrones 90 0’35 87’5 6’25 0’07


Homicidas 72 0’30 75 9 0’12
Violadores 52 0’20 50 4 0’08
Otros 36 0’15 37’5 2’25 0’06
n = 250 1 χ2exp = 00 33

La distribución del estadı́stico bajo H0 es χ24−0−1 ≡ χ23 y la región crı́tica:

00 33 = χ2exp > χ200 95

donde χ200 95 es tal que P [χ23 ≤ χ200 95 ] = 00 95, es decir, χ200 95 = 70 81. Por tanto,
no hay motivos para rechazar la hipótesis nula y aceptamos que la distribución
de la variable aleatoria X es la que maneja la Junta de Andalucı́a.

Esto podrı́amos haberlo hecho con el programa estadı́stico SPSS, escribiendo


las frecuencias observadas y utilizando Analizar\ Pruebas no Paramétricas\
Chi Cuadrado e introduciendo las frecuencias esperadas en el siguiente cuadro
de diálogo:
10 CAPÍTULO 1. TÉCNICAS CUALITATIVAS
1.2. CONTRASTES DE BONDAD DE AJUSTE 11

La salida en la ventana de resultados serı́a:

Como podemos observar se obtiene el resultado que antes hemos obtenido de


forma manual. ¢
12 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

1.3. Tablas de Contingencia

El estadı́stico χ2 de Pearson se utiliza también en inferencia estadı́stica con


variables cualitativas.

Para estas variables los datos se agrupan en tablas de contingencia, que son
tablas de doble entrada en las que en la casilla (i, j) se representa la frecuencia
conjunta, nij correspondiente a que se presente la caracterı́stica de la fila i-
ésima con la caracterı́stica de la columna j-ésima.

A continuación se representa una tabla de contingencia con dos variables


cualitativas, X (que tiene r posibles categorı́as) e Y (con s posibles categorı́as).

Y Total Marginal
X B1 B2 ··· Bj ··· Bs ni·
A1 n11 n12 ··· n1j ··· n1s n1·
A2 n21 n22 ··· n2j ··· n2s n2·
.. .. .. .. .. .. .. ..
. . . . . . . .
Ai ni1 ni2 ··· nij ··· nis ni·
.. .. .. ... .. .. .. ..
. . . . . . .
Ar nr1 nr2 ··· nrj ··· nrs nr·
Total Marginal
n·j n·1 n·2 ··· n·j ··· n·s n

Las tablas de contingencia pueden obtenerse automáticamente con SPSS


cruzando dos variables con Analizar\Estadı́sticos Descriptivos\Tablas de
contingencia
1.3. TABLAS DE CONTINGENCIA 13

1.3.1. Contrastes de Independencia

Vamos a estudiar si existe independencia entre dos caracterı́sticas de una


población, X e Y , en donde cada una de ellas presentan r y s categorı́as respec-
tivamente. Para ello seleccionamos una muestra de tamaño n de la población
y clasificamos los elementos de la muestra según las categorı́as de las carac-
terı́sticas X e Y en una tabla de contingencia.

El contraste serı́a:

H0 : X e Y son independientes
H1 : X e Y no son independientes.

Si designamos por pij a la probabilidad de que un elemento de la muestra


presente las caracterı́sticas Ai y Bj , entonces la hipótesis nula de independencia
se puede expresar como:

pij = P [Ai ∩ Bj ] = P [Ai ]P [Bj ] = pi· p·j .

Entonces, bajo H0 , para medir la diferencia entre frecuencias observadas y


esperadas consideraremos la suma:
X r Xs Xr X s
(nij − npij )2 (nij − npi· p·j )2
=
i=1 j=1
npij i=1 j=1
npi· p·j

Como los estimadores de máxima verosimilitud de pi· y p·j son respectiva-


mente:

ni· n·j
p̂i· = n
y p̂·j = n
,

el estadı́stico χ2 de Pearson para contrastar la independencia será:


Xr X s ¡ ni· n·j ¢2
n ij −
χ2 = ni· n·j
n
,
i=1 j=1 n
14 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

que se distribuye asintóticamente según una χ2 con (r − 1)(s − 1) grados de


libertad3 .

La región crı́tica del test es χ2 > χ21−α , donde χ21−α es tal que

P [χ2(r−1)(s−1) > χ21−α ] = α.

Este contraste puede realizarse con SPSS de la siguiente forma. En Analizar\Estadı́sti-


cos Descriptivos\Tablas de contingencia introducimos en los espacios cor-
respondientes las variables del problema

pulsamos la pestaña Estadı́sticos y en la nueva ventana de diálogo pulsamos


Chi Cuadrado:

3
rs − [(r − 1) + (s − 1)] − 1 = rs − r − s + 1 = r(s − 1) − (s − 1) = (r − 1)(s − 1)
1.3. TABLAS DE CONTINGENCIA 15

Ejemplo 1.3.1 Para comprobar si el rendimiento de las distintas comisarı́as


de una determinada comunidad a la hora de resolver los distintos casos que
se le plantean depende o no del número de policı́as que conforma las mismas
se toma al azar una muestra de 300 casos clasificando el rendimiento en una
tabla de eficiencia de la siguiente forma:

Eficiencia en el trabajo policial


Número de policı́as Poco eficientes Eficientes Muy eficientes
(0,15] 2 85 14
(15,30] 3 80 14
(30,90] 10 75 17

Con los datos obtenidos ¿Puede asegurarse que exista tal dependencia?. Con-
trastar al 1 %.

Solución: El contraste serı́a:


16 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

H0 : Las variables son independientes


H1 : Las variables no son independientes.

El estadı́stico χ2 de Pearson para contrastar la independencia será:


3 ¡
3 X
X ni· n·j ¢2
2 nij − n
χ = ni· n·j ,
i=1 j=1 n

que se distribuye asintóticamente según una χ2 con (3 − 1)(3 − 1) = 4 grados


de libertad.

Construimos la tabla adjunta el la que cada celda posee la siguiente estruc-


tura:

ni· n·j
nij n
ni· n·j 2
(nij − n )
ni· n·j
n

Eficiencia en el trabajo policial


Número de policı́as Poco eficientes Eficientes Muy eficientes ni·
(0,15] 2 5’05 85 80’8 14 15’15 101
(15,30] 3 4’85 80 77’6 14 14’55 97
(30,90] 10 5’1 75 81’6 17 15’3 102
n·j 15 240 45 n = 300

Como se observa una frecuencia teórica inferior a 5, habrá que realizar agru-
paciones. Para tratar de discriminar entre las comisarı́as con un número de
miembros moderado y las que disponen de un número de miembros elevado,
agruparemos las dos primeras categorı́as, resultando la siguiente tabla:
1.3. TABLAS DE CONTINGENCIA 17

Eficiencia en el trabajo policial


Número de policı́as Poco eficientes Eficientes Muy eficientes ni·
(0,30] 5 9’9 165 158’4 28 29’7 198
2’43 0’275 0’1
(30,90] 10 5’1 75 81’6 17 15’3 102
4’71 0’53 0’19
n·j 15 240 45 n = 300

El estadı́stico experimental serı́a:

χ2exp = 20 43 + 00 275 + 00 1 + 40 71 + 00 53 + 00 19 = 80 235.

Si miramos en las tablas de la χ22 , tenemos que χ200 99 = 90 21. Como χ2exp =
80 235 < 90 21 = χ200 99 , no se rechaza la hipótesis de independencia, es decir, los
datos no señalan dependencia significativa entre el número de policı́as de una
comisaria y su eficiencia.

Si lo realizamos utilizando el programa SPSS obtenemos los siguientes re-


sultados:

Como el P-valor obtenido es 00 016 superior a 00 01 no existen evidencias


para rechazar la independencia de las dos variables estudiadas. ¢
18 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

1.3.2. Contrastes de Homogeneidad

Consideremos ahora r muestras de observaciones independientes, clasifi-


cadas en las s categorı́as de una determinada caracterı́stica. Los resultados
pueden expresarse en una tabla semejante a la anterior:

Categorı́as de la caracterı́stica estudiada Total Marginal


Muestras B1 B2 ··· Bj ··· Bs ni
1 n11 n12 ··· n1j ··· n1s n1
2 n21 n22 ··· n2j ··· n2s n2
.. .. .. .. .. .. .. ..
. . . . . . . .
i ni1 ni2 ··· nij ··· nis ni
.. .. .. ... .. .. .. ..
. . . . . . .
r nr1 nr2 ··· nrj ··· nrs nr
Total Marginal
mj m1 m2 ··· mj ··· ms n

Ahora queremos contrastar la homogeneidad de las r poblaciones, es decir,


si todas las muestras proceden de la misma población, y por tanto tienen la
misma distribución con respecto a las caracterı́sticas B1 , B2 , . . ., Bs .

El contraste serı́a:

H0 : Las r muestras son homogéneas


H1 : Las r muestras no son homogéneas.

Si designamos por pij a la probabilidad de que un individuo de la muestra


i presente la caracterı́stica Bj , entonces la hipótesis nula de independencia se
puede expresar como:

H0 : p1j = p2j = · · · = pij = · · · = prj ∀ j = 1, 2, . . . , s.


1.3. TABLAS DE CONTINGENCIA 19

Entonces, bajo H0 , para medir la diferencia entre frecuencias observadas y


esperadas consideraremos la suma:
Xr X s
(nij − ni pj )2
.
i=1 j=1
ni pj

Como, admitiendo que la hipótesis H0 es cierta, el estimador de máxima


verosimilitud de pij es:

mj
p̂ij = n
,

el estadı́stico χ2 de Pearson para contrastar la homogeneidad de las muestras


será:
s ¡
r X
X ni mj ¢2
nij −
χ2 = ni mj
n
,
i=1 j=1 n

que se distribuye asintóticamente según una χ2 con (r − 1)(s − 1) grados de


libertad4 .

La región crı́tica del test es χ2 > χ21−α , donde χ21−α es tal que

P [χ2(r−1)(s−1) > χ21−α ] = α.

Este contraste con el programa estadı́stico SPSS se harı́a exactamente igual que
los contrastes de independencia donde en las filas pondrı́amos la variable que
nos indica a las distintas muestras y como columna las distintas caracterı́sticas
de la variable estudiada.

Ejemplo 1.3.2 Los órganos de gobierno de un determinado paı́s pretenden


analizar el ı́ndice de satisfacción de los cuerpos de seguridad del estado, la GC
y la PN con respecto a la actuación de los jueces en ese paı́s. Para ello toma
una muestra de 125 miembros de la GC y otra de 75 miembros de la PN. Una
4
r(s − 1) − (s − 1) = (r − 1)(s − 1)
20 CAPÍTULO 1. TÉCNICAS CUALITATIVAS

vez analizados los datos obtenidos, los resultados obtenidos se muestran en la


siguiente tabla:

Satisfacción de los miembros de los distintos cuerpos de seguridad


Cuerpos de seguridad Poco Satisfechos Satisfechos Muy satisfechos
GC 20 78 27
PN 14 40 21

¿Presentan estos dos cuerpos de seguridad diferencias significativas en cuanto


al grado de satisfacción con respecto a la actuación de los jueces? Contrastar
a un nivel de significación del 1 0/0 .

Solución: El contraste serı́a:

H0 : Las dos muestras son homogéneas


H1 : Las dos muestras no son homogéneas.

El estadı́stico χ2 de Pearson para contrastar la homogeneidad de las muestras


será:
2 ¡
2 X
X ni mj ¢2
nij −
χ2 = ni mj
n
,
i=1 j=1 n

que se distribuye asintóticamente según una χ2 con (2 − 1)(3 − 1) = 2 grado


de libertad.

Construimos la tabla adjunta el la que cada celda posee la siguiente estruc-


tura:

ni mj
nij n
ni mj 2
(nij − n )
ni mj
n
1.3. TABLAS DE CONTINGENCIA 21

Satisfacción de los miembros de los distintos cuerpos de seguridad


Cuerpos de seguridad Poco satisfechos Satisfechos Muy satisfechos ni
GC 20 21,3 78 73,8 27 30 125
0,08 0,24 0,3
PN 14 12,8 40 44,3 21 18 75
0,11 0,42 0,5
mj 34 118 48 n = 200

ni mj
En la tabla podemos comprobar que n
> 5 en todos los casos y que
n = n1 + n2 = 200 > 30.

El estadı́stico experimental serı́a:

χ2exp = 0, 08 + 0, 24 + 0, 3 + 0, 11 + 0, 42 + 0, 5 = 1, 65.

Si miramos en las tablas de la χ22 , tenemos que χ20,99 = 9, 21. Como χ2exp =
1, 65 < 9, 21 = χ20,99 , no se rechaza la hipótesis de homogeneidad de mues-
tras, es decir, los datos no señalan diferencias significativas en el grado de
descontento para ambos cuerpos de seguridad del Estado.

Si utilizamos el programa SPSS obtenemos:

El P-valor obtenido es igual a 0, 438 mayor a 0, 01, luego podemos concluir


que las muestras son homogéneas. ¢

También podría gustarte