Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clasificación de Individuos Violentos Mediante Modelo de Grado de Membresía
Clasificación de Individuos Violentos Mediante Modelo de Grado de Membresía
La Habana, 2014
A mis padres.
A mis hermanas.
A mi maravillosa familia.
AGRADECIMIENTOS
A mi madre por ser mi guía incansable; y a mi padre, por ser mi ídolo. A mis
hermanas, mis primas, mis tías, mi tío y mis abuelos por enseñarme el verdadero
concepto de familia.
A Ana María y Marifelis, excelentes profesoras que incentivaron mi gusto por las
matemáticas. A todos los profesores de la facultad por ayudar a mi formación
profesional.
Los modelos de estructuras latentes, tales como los modelos de clases latentes y
los de rasgos latentes [2], no son adecuados cuando las tablas de contingencia
son sparse, debido a la alta dimensionalidad de los datos. En la última década se
han desarrollado nuevas alternativas a partir del modelo de estructuras latentes
1
introducido por Max Woodbury, en los años 1970, denominado modelo de Grado
de Membresía (GoM).
Las extensiones desarrolladas [2] por Stephen Fienberg y Elena Erosheva han
permitido obtener un modelo (GoM mixto) que estima la probabilidad de
clasificación del individuo dado un vector de scores de membresía en 𝐾𝐾 clases no
necesariamente predefinidas. Además, estima la distribución probabilística de
cada variable observada en la 𝐾𝐾-ésima subpoblación, denominándolo perfiles
extremos. Los scores de membresía permiten determinar la pertenencia del
individuo al menos a uno de los perfiles extremos.
2
genotipos, de artículos científicos, de respuestas individuales en una encuesta,
entre otros.
Para darle solución a estos problemas, una alternativa es utilizar los métodos
MCMC. Los métodos de estimación bayesiana, en particular el MCMC para
modelos de estructuras latentes, han demostrado que son eficientes, ya que no se
necesita elegir trabajar con la probabilidad conjunta o con la probabilidad marginal.
Otra ventaja es que el intervalo de confianza posterior para los valores del
parámetro se puede estimar fácilmente de las salidas del MCMC.
3
Este trabajo tiene dos objetivos fundamentales. Primero, se propone la
implementación de una metodología para estimar el modelo GoM mixto utilizando
diferentes métodos de estimación: EM, MLE y MCMC con Gibbs sampler. En
segundo lugar, la aplicación de la metodología implementada para dar solución a
la problemática actual en el campo de las neurociencias y las ciencias forenses de
clasificar a los sujetos de conducta violenta y la estimación de sus perfiles de
comportamiento. Este trabajo forma parte del proyecto desarrollado en nuestro
país por un equipo multidisciplinario compuesto por el Centro de Neurociencias de
Cuba, Medicina Legal y el MININT denominado “Bases biológicas de la violencia”.
El estudio fue llevado a cabo en una población de reos cubanos, presos por
cometer crímenes de alta violencia, a los cuales se les recogieron una serie de
instrumentos que miden factores biosociales.
4
CAPÍTULO 1. MARCO TEÓRICO
En este capítulo se presenta el marco teórico, que brinda los antecedentes del
modelo de Grado de Membresía. En la sección 1.1 se discuten dos modelos
importantes que constituyeron el inicio del análisis de variables latentes para el
caso de datos categóricos: el modelo de Clases Latentes y el modelo de Teoría
de Respuesta al Ítem. En la sección 1.2 se desarrolla el modelo de Grado de
Membresía, que establece un marco teórico unificador de los modelos para el
análisis de variables latentes con el objetivo de determinar subpoblaciones. La
generalización de este modelo para la clasificación de los individuos según estas
subpoblaciones es también introducida. Finalmente, en la sección 1.3 se exponen
los métodos más populares para estimar los modelos de Grado de Membresía:
estimación por Máxima Verosimilitud, algoritmo Esperanza-Maximización y
métodos bayesianos.
5
Estos modelos consideran 𝐼𝐼 individuos, 𝐽𝐽 ítems y 𝑄𝑄 variables latentes (𝑧𝑧1 , … , 𝑧𝑧𝑄𝑄 ),
para 𝑄𝑄 < 𝐽𝐽. Se denota por 𝑥𝑥𝑖𝑖𝑖𝑖 la respuesta del 𝑖𝑖-ésimo individuo al 𝑗𝑗-ésimo ítem,
por 𝑥𝑥𝑗𝑗 el vector de respuestas al 𝑗𝑗-ésimo ítem y por 𝑥𝑥𝑖𝑖 el vector de respuestas del
individuo 𝑖𝑖-ésimo. 𝑍𝑍 representa la variable aleatoria latente, 𝑋𝑋 la variable aleatoria
de respuesta y 𝑥𝑥 una realización de ésta. Sean la distribución de probabilidad
condicional 𝑚𝑚(𝑥𝑥|𝑧𝑧) = 𝑃𝑃(𝑋𝑋 = 𝑥𝑥|𝑍𝑍 = 𝑧𝑧 ) y la función de densidad de 𝑍𝑍, representada
por ℎ(𝑧𝑧). Entonces, el modelo de variables latentes está dado por la siguiente
expresión:
𝑓𝑓(𝑥𝑥) ≝ 𝑃𝑃(𝑋𝑋 = 𝑥𝑥) = ∫ 𝑚𝑚(𝑥𝑥|𝑧𝑧)ℎ(𝑧𝑧)𝑑𝑑𝑑𝑑. (1.1)
Este supuesto implica que las variables latentes son las responsables de la
relación observada en las variables manifiestas, por lo tanto, no existe una
relación directa entre las variables manifiestas, estas están correlacionadas entre
sí, pero esta correlación desaparece si las variables latentes permanecen
constantes. En otras palabras, toda la asociación observada entre las variables
manifiestas, está medida o explicada por las variables latentes.
6
variables que toman valores en el conjunto de los números reales, pudiendo ser
tanto discretas como continuas; y variables categóricas a aquellas variables que
están formadas por un conjunto de categorías. Las variables categóricas no
necesitan ser nominales, también pueden considerarse variables ordinales o
variables de intervalo discretizadas.
Existe una extensa lista de trabajos que relacionan diversas conexiones entre los
modelos referidos anteriormente y otros modelos. En Lazarsfeld y Henry (1968)
[5], se enfatizan las diferencias entre el Análisis Factorial y el Análisis de
Estructuras Latentes. En Heinen (1996) [6] aparece un estudio de las relaciones
existentes entre el Modelo de Clases Latentes, el Modelo de Rasgos Latentes y
los Modelos log-lineales. En Bartholomew (1987) [7] y Bartholomew y Knott (1999)
[4] encontramos un excelente desarrollo de los modelos de variables latentes en
general, siendo estas fuentes de gran importancia para entender los conexiones
que existen entre los diferentes modelos y sus generalizaciones. En Uebersax
(1997) [8] se encuentra un extenso desarrollo del modelo de clases latentes,
aplicaciones del modelo en diversas áreas, múltiples referencias bibliográficas, y
se expone, mediante una aplicación, una de las tantas situaciones en las cuales el
supuesto de independencia condicional no es apropiado para explicar la estructura
de los datos.
7
En particular, en esta sección centramos la atención al caso de cuando las
variables manifiestas y latentes son categóricas. Los modelos de Clases Latentes
y de análisis de Teoría de Respuestas al Ítem son descritos a continuación.
Otro de los supuestos en un MCL es el que las clases latentes son internamente
homogéneas, es decir, todos los miembros de una clase latente tienen la misma
distribución de probabilidades con respecto a la variable latente, y ésta será
distinta a la distribución de probabilidades para los individuos pertenecientes a otra
clase, por lo que individuos de diferentes clases presentarán características
diferentes. Este hecho sirve para diferenciar a los individuos pertenecientes a
diferentes clases y poder caracterizar tanto la variable latente como las clases
latentes.
8
𝑥𝑥11 ⋯ 𝑥𝑥1𝑗𝑗
𝑋𝑋 = � ⋮ ⋱ ⋮ �,
𝑥𝑥𝑖𝑖1 ⋯ 𝑥𝑥𝑖𝑖𝑖𝑖
donde cada fila de la matriz contiene el conjunto de respuestas de un individuo
dado para cada uno de los ítems, conocido como respuesta o patrón de respuesta.
Dependiendo de si las variables manifiestas son binarias o politómicas (más de
dos niveles de respuesta), existirá un número distinto de patrones de respuesta.
Esta matriz también se puede presentar en forma de una tabla de contingencia.
Una de las ventajas del MCL es el hecho de que para el desarrollo teórico del
modelo es suficiente considerar sólo una variable latente, ya que modelos con
más de una variable latente (𝑄𝑄 > 1) pueden ser desarrollados considerando 𝑄𝑄 = 1
bajo adecuadas restricciones a los parámetros del modelo [9]. En base a la
afirmación anterior, se presentará el MCL considerando una única variable latente
𝑍𝑍 con 𝐶𝐶 categorías o clases latentes.
9
𝐽𝐽
Donde 𝜋𝜋𝑋𝑋 𝑗𝑗 |𝑍𝑍(𝑐𝑐) �𝑥𝑥𝑗𝑗 � ≝ 𝑃𝑃�𝑋𝑋𝑗𝑗 = 𝑥𝑥𝑗𝑗 �𝑍𝑍 = 𝑐𝑐�, 𝑥𝑥𝑗𝑗 = 1, … , 𝐿𝐿𝑗𝑗 ; 𝑐𝑐 = 1, … 𝐶𝐶.
𝜋𝜋𝑋𝑋 (𝑥𝑥) = ∑𝐶𝐶𝑐𝑐=1 𝜋𝜋𝑍𝑍 (𝑐𝑐)𝜋𝜋𝑋𝑋|𝑍𝑍(𝑐𝑐) (𝑥𝑥) = ∑𝐶𝐶𝑐𝑐=1 �𝜋𝜋𝑍𝑍 (𝑐𝑐) ∏𝐽𝐽𝑗𝑗 =1 𝜋𝜋𝑋𝑋 𝑗𝑗 |𝑍𝑍(𝑐𝑐) (𝑥𝑥𝑗𝑗 )� , (1.4)
𝐶𝐶 𝐿𝐿𝑗𝑗
𝑥𝑥𝑗𝑗 = 1, … , 𝐿𝐿𝑗𝑗 .
10
variables manifiestas puede ser obtenida sumando sobre la dimensión latente. En
este sentido, esta expresión implica la existencia de una variable latente.
Figura 1.1: Representación gráfica de un MCL formado por una variable latente y 𝐽𝐽 ítems.
El análisis posterior del modelo de clases latentes está relacionado con lo que se
puede decir acerca de los individuos que pertenecen a una clase determinada. A
partir de considerar la distribución a posteriori, los individuos se clasifican dentro
de la clase latente más probable, toda la información relevante en cuanto a este
tema está contenida en esta distribución. Aplicando la definición de probabilidad
condicional se tiene,
11
En la práctica, para cada patrón de respuesta 𝑥𝑥 se inspecciona este conjunto de
probabilidades, y se asigna el individuo a la clase latente en la cual esta
probabilidad es mayor.
El modelo logístico de tres-parámetros expuesto por Lord (1980) [11] asume que
𝑃𝑃�𝑥𝑥𝑖𝑖𝑖𝑖 = 1�𝜃𝜃𝑖𝑖 , 𝑎𝑎𝑗𝑗 , 𝑏𝑏𝑗𝑗 , 𝑐𝑐𝑗𝑗 ) = 𝑐𝑐𝑗𝑗 + �1 − 𝑐𝑐𝑗𝑗 �𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑡𝑡 −1 �𝑎𝑎𝑗𝑗 �𝜃𝜃𝑖𝑖 − 𝑏𝑏𝑗𝑗 ��,
𝑒𝑒𝑒𝑒𝑒𝑒
(𝑥𝑥)
donde 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑡𝑡 −1 (𝑥𝑥) = 1+𝑒𝑒𝑒𝑒𝑒𝑒 (𝑥𝑥) , 𝑎𝑎𝑗𝑗 , 𝑏𝑏𝑗𝑗 , 𝑐𝑐𝑗𝑗 se definen respectivamente como los
12
y el modelo logístico de dos-parámetros descrito por Birnbaum (1968) [12], es
Los tres modelos anteriores son los más populares en psicometría y las
compañías de prueba alrededor del mundo usan estos modelos operacionalmente.
El modelo GoM asume que la población puede ser caracterizada por perfiles
extremos (subpoblaciones). Los perfiles extremos se definen a partir de la
probabilidad de respuesta condicional para cada ítem. Los sujetos están
13
caracterizados por los scores de membresía, los cuales indican porcentajes de
pertenencia a cada uno de los perfiles extremos.
Sean 𝑥𝑥𝑖𝑖𝑖𝑖𝑖𝑖 las respuestas discretas al considerar 𝐽𝐽 ítems politómicos (con más de
dos niveles de respuesta) para 𝐼𝐼 individuos, definiendo en la variable binaria:
14
4. Los scores de membresía, 𝑔𝑔𝑖𝑖𝑖𝑖 , son realizaciones de las componentes de un
vector aleatorio con alguna distribución 𝐷𝐷(𝑔𝑔).
15
sujeto; mientras que en el nivel de sujeto, se especifica la distribución de las
respuestas observadas dados los scores de membresía individual. En el nivel de
variable latente, se declara si los scores de membresía son considerados fijos o
aleatorios con alguna distribución. En el nivel de esquema de muestreo, se
especifica el número de las distintas características observadas y el número de
replicaciones para cada característica.
16
2. Si los scores de membresía 𝑔𝑔 son realizaciones de variables latentes de
alguna distribución 𝐷𝐷𝛼𝛼 , parametrizada por 𝛼𝛼, entonces la probabilidad
marginal de observar 𝑥𝑥𝑗𝑗 dados los parámetros, tiene la forma:
𝐾𝐾
Este marco del modelo de Membresía Mixta unifica varios modelos que han sido
desarrollados independientemente en las ciencias sociales y en genética. Cada
uno corresponde a diferentes elecciones de 𝐽𝐽 y 𝑅𝑅, y diferentes suposiciones de
variables latentes. Por ejemplo, el modelo GoM estándar de Woodbury y Clive
(1974) [15] y Manton (1994) [16] asume la observación de respuestas a 𝐽𝐽
preguntas reconocidas sin replicaciones (𝑅𝑅 = 1), y trata los scores de membresía
como constantes fijas desconocidas [13].
17
1.3 Métodos de estimación
1.3.1 MLE
18
En la práctica, se suele utilizar el logaritmo de esta función:
𝐼𝐼
1.3.2 EM
19
puede valer 0 bajo la distribución condicionada a 𝜃𝜃 (𝑚𝑚 ) , en esa región log(𝑓𝑓(𝑧𝑧|𝑥𝑥, 𝜃𝜃))
no existe por lo que no es posible calcular la esperanza.
En Goodman (1974) [9] se muestra una forma para obtener los estimadores de los
parámetros, en efecto: de las definiciones de 𝜋𝜋𝑍𝑍 (𝑐𝑐) y 𝜋𝜋𝑋𝑋,𝑍𝑍 (𝑥𝑥, 𝑐𝑐) se tiene,
𝐿𝐿 𝐿𝐿 𝐿𝐿
𝜋𝜋𝑍𝑍 (𝑐𝑐) = ∑𝑥𝑥 𝜋𝜋𝑋𝑋,𝑍𝑍 (𝑥𝑥, 𝑐𝑐) = ∑𝑥𝑥11 =1 ∑𝑥𝑥22 =1 … ∑𝑥𝑥𝐽𝐽𝐽𝐽 =1 𝜋𝜋𝑋𝑋,𝑍𝑍 (𝑥𝑥, 𝑐𝑐). (1.6)
Utilizando la definición de probabilidad condicional 𝜋𝜋𝑋𝑋 𝑗𝑗 |𝑍𝑍(𝑐𝑐) (𝑥𝑥𝑗𝑗 ) se puede ver que,
𝐿𝐿 𝐿𝐿 𝐿𝐿 𝐿𝐿
= ∑𝑥𝑥11 =1 … ∑𝑥𝑥𝑗𝑗𝑗𝑗 −1 ∑𝑥𝑥𝑗𝑗 +1 =1 … ∑𝑋𝑋𝐽𝐽 =1 𝜋𝜋𝑋𝑋,𝑍𝑍 (𝑥𝑥, 𝑐𝑐) (1.7)
−1 =1 𝑗𝑗 +1 𝐽𝐽
donde la notación {𝑋𝑋 − 𝑋𝑋𝑗𝑗 } significa que se suma sobre los niveles de respuesta de
todas las variables menos sobre los niveles de la variable 𝑋𝑋𝑗𝑗 .
𝐿𝐿 𝐿𝐿 𝐿𝐿
𝜋𝜋𝑍𝑍 (𝑐𝑐) = ∑𝑥𝑥11 =1 ∑𝑥𝑥22 =1 … ∑𝑥𝑥𝐽𝐽𝐽𝐽 =1 𝜋𝜋𝑋𝑋 (𝑥𝑥)𝜋𝜋𝑍𝑍|𝑋𝑋(𝑥𝑥) (𝑐𝑐) , (1.8)
𝐿𝐿 𝐿𝐿 𝑗𝑗 −1 𝐿𝐿 𝑗𝑗 +1 𝐿𝐿 𝐽𝐽
∑𝑥𝑥 1 =1 … ∑𝑥𝑥 ∑𝑥𝑥 … ∑𝑋𝑋 =1 𝜋𝜋 𝑋𝑋 (𝑥𝑥)𝜋𝜋 𝑍𝑍|𝑋𝑋 (𝑥𝑥 ) (𝑐𝑐)
1 𝑗𝑗 −1 =1 𝑗𝑗 +1 =1 𝐽𝐽
𝜋𝜋𝑋𝑋 𝑗𝑗 |𝑍𝑍(𝑐𝑐) �𝑥𝑥𝑗𝑗 � = . (1.9)
𝜋𝜋 𝑍𝑍 (𝑐𝑐)
20
𝐿𝐿 𝐿𝐿 𝐿𝐿
∑𝐿𝐿𝑥𝑥11 =1 … ∑𝑥𝑥𝑗𝑗 −1 =1 ∑𝑥𝑥𝑗𝑗 +1 =1 … ∑𝑋𝑋𝐽𝐽 =1 𝑝𝑝𝑋𝑋 (𝑥𝑥)𝜋𝜋𝑍𝑍|𝑋𝑋(𝑥𝑥) (𝑐𝑐)
𝑗𝑗 −1 𝑗𝑗 +1 𝐽𝐽
𝜋𝜋�𝑋𝑋 𝑗𝑗 |𝑍𝑍(𝑐𝑐) �𝑥𝑥𝑗𝑗 � = .
𝜋𝜋�𝑍𝑍 (𝑐𝑐)
21
Idealmente, el proceso de estimación converge a la mejor solución global (Máximo
Global), un conjunto de parámetros con el mayor valor en la función de
verosimilitud. Pero a veces el algoritmo puede converger a un Máximo Local, la
mejor solución en una vecindad del espacio paramétrico. Los Máximos Locales
están relacionados con la complejidad del modelo, son más comunes a medida
que el número de clases aumenta. Para garantizar la obtención de Máximos
Globales, se debe realizar el algoritmo de estimación en reiteradas ocasiones con
distintos valores iniciales y verificar que se alcance igual solución o, si las
soluciones son diferentes, elegir aquella que proporcione la mejor bondad de
ajuste o, equivalentemente, el mayor valor en el logaritmo de la función de
verosimilitud. Si se encuentra el mismo valor para el estadístico de bondad de
ajuste, pero los estimadores de los parámetros son diferentes, existe un problema
de identificación del modelo: no existe solución única. Tomando las precauciones
adecuadas, la existencia de posibles Máximos Locales, no debería ser un
inconveniente para el uso del ACL.
22
modelo GoM. El método bayesiano aproximado más utilizado es el de Monte Carlo
con Cadenas de Markov (MCMC).
𝑔𝑔 ~ 𝐷𝐷𝐷𝐷𝐷𝐷(𝛼𝛼0 , 𝜉𝜉),
𝜉𝜉 ~ 𝐷𝐷𝐷𝐷𝐷𝐷(𝜁𝜁),
𝑝𝑝(𝑥𝑥, 𝑧𝑧, 𝑔𝑔, 𝜆𝜆, 𝛼𝛼) = 𝑝𝑝(𝜆𝜆, 𝛼𝛼) ∏𝐼𝐼𝑖𝑖=1[𝑝𝑝(𝑧𝑧𝑖𝑖 |𝑔𝑔𝑖𝑖 ) 𝑝𝑝(𝑥𝑥𝑖𝑖 |𝜆𝜆, 𝑧𝑧𝑖𝑖 ) ∙ 𝐷𝐷𝐷𝐷𝐷𝐷(𝑔𝑔𝑖𝑖 | 𝛼𝛼)], (1.10)
donde
𝐽𝐽 𝑧𝑧
𝑝𝑝(𝑧𝑧𝑖𝑖 |𝑔𝑔𝑖𝑖 ) = ∏𝑗𝑗 =1 ∏𝐾𝐾𝑘𝑘=1 𝑔𝑔𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 , (1.11)
𝐽𝐽 𝑥𝑥 1−𝑥𝑥 𝑖𝑖𝑖𝑖 𝑧𝑧 𝑖𝑖𝑖𝑖𝑖𝑖
𝑝𝑝(𝑥𝑥𝑖𝑖 |𝜆𝜆, 𝑧𝑧𝑖𝑖 ) = ∏𝑗𝑗 =1 ∏𝐾𝐾𝑘𝑘=1 �𝜆𝜆𝑘𝑘𝑘𝑘𝑖𝑖𝑖𝑖 �1 − 𝜆𝜆𝑘𝑘𝑘𝑘 � � , (1.12)
23
Γ(∑𝑘𝑘 𝛼𝛼𝑘𝑘 ) α −1 α −1
𝐷𝐷𝐷𝐷𝐷𝐷(𝑔𝑔𝑖𝑖 | 𝛼𝛼) = g 1 ⋯ g iKK ,
Γ(α1 ) ⋯ Γ(αK ) i1
y los indicadores de la clasificación latentes 𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 son tales que 𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 = 1, si 𝑧𝑧𝑖𝑖𝑖𝑖 = 𝑘𝑘, y
𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 = 0 en otro caso [20].
Gibbs Sampler
24
(𝑚𝑚 + 1)-ésimo paso de inicialización, una realización de la clasificación latente
(𝑚𝑚 +1)
𝑧𝑧𝑖𝑖 se obtiene para cada observación de la distribución condicional predictiva,
dado los valores de los parámetros del paso 𝑚𝑚-ésimo. Durante el (𝑚𝑚 + 1)-ésimo
(𝑚𝑚 +1) (𝑚𝑚 +1)
paso posterior, las realizaciones de los parámetros 𝜆𝜆𝑘𝑘𝑘𝑘 y 𝑔𝑔𝑖𝑖𝑖𝑖 se obtienen de
la distribución posterior incrementada, dados los valores de los parámetros del
paso 𝑚𝑚-ésimo.
• Paso de inicialización
Dados los valores de los parámetros para el paso 𝑚𝑚-ésimo, para una distribución
multinomial,
(𝑚𝑚 +1)
𝑧𝑧𝑖𝑖𝑖𝑖 ~ 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀(1, 𝑝𝑝1 , … , 𝑝𝑝𝐾𝐾 ),
𝑥𝑥 1−𝑥𝑥 𝑖𝑖𝑖𝑖
𝑝𝑝𝑘𝑘 ∝ 𝑔𝑔𝑖𝑖𝑖𝑖 𝜆𝜆𝑘𝑘𝑘𝑘𝑖𝑖𝑖𝑖 �1 − 𝜆𝜆𝑘𝑘𝑘𝑘 � ,
• Paso posterior
Dados los valores de los parámetros para el 𝑚𝑚-ésimo paso, de una distribución
beta,
𝐼𝐼 𝐼𝐼
(𝑚𝑚 +1)
𝜆𝜆𝑘𝑘𝑘𝑘 ~ 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 �1 + � 𝑥𝑥𝑖𝑖𝑖𝑖 𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 , 1 + ��𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 − 𝑥𝑥𝑖𝑖𝑖𝑖 𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 ��,
𝑖𝑖=1 𝑖𝑖=1
Dados los datos incrementados y los valores de los parámetros para el paso 𝑚𝑚-
ésimo, de una distribución Dirichlet,
𝐽𝐽 𝐽𝐽
(𝑚𝑚 +1)
𝑔𝑔𝑖𝑖 ~ 𝐷𝐷𝐷𝐷𝑟𝑟𝐾𝐾 �𝛼𝛼1 + � 𝑧𝑧𝑖𝑖𝑖𝑖 1 , … , 𝛼𝛼𝐾𝐾 + � 𝑧𝑧𝑖𝑖𝑖𝑖𝑖𝑖 �,
𝑗𝑗 =1 𝑗𝑗 =1
25
CAPÍTULO 2. APLICACIÓN
26
En los estudiosos de la materia existe la opinión consensuada de que los
psicópatas no son iguales en sus manifestaciones sociales, afectivas y
conductuales [25, 26]. No obstante, hay criterios disímiles para clasificarla.
En los últimos años del pasado siglo y hasta el presente ha existido una explosión
en estudios de la psicopatía [1], pero identificar al psicópata ha sido difícil por las
características propias que presenta y porque no existe hasta el momento un
instrumento que pudiera utilizarse para su diagnóstico fuera del medio carcelario.
La muestra estuvo compuesta por un total de 123 sujetos, presos por cometer
crímenes violentos (asesinatos y homicidios) cuyas edades estaban comprendidas
entre 18 y 62 años (𝑥𝑥̅ = 31.14, 𝑑𝑑𝑑𝑑 = 9.09). El tiempo en prisión debía de ser
menos de dos años y no podían tener antecedentes psiquiátricos del Eje I
(basados en los criterios del SCAN versión 2.1), ni ser portadores de Retraso
Mental en alguna de sus clasificaciones. La escolaridad se distribuyó de la
siguiente forma: nivel primario 17 (14,6%) sujetos; secundario: 70 (56,5%); Pre
Universitario: 29 (23,3%) y Técnico Medio: 7 (5,6%) sujetos. En cuanto al estado
civil de los reos, 73 (59,7%) eran solteros, 34 (27,4%) casados y 16 (12,9%) se
encontraban viviendo en concubinato con sus parejas.
27
La población estudiada en cuanto a su composición étnica estuvo constituida por
48 (38,7%) sujetos afroamericanos, 42 (33,9%) mestizos y 33 (27,4%) caucásicos.
Basado en los expedientes de los reos, se pudo clasificar a los sujetos acorde a
sus antecedentes delictivos en reincidentes y sin antecedentes. De los 123 sujetos
estudiados, 38 (30,6%) ya habían estado en prisión y 85 (69,4%) no tenían
antecedentes penales.
Para iniciar la investigación se les explicó a los sujetos los objetivos de la misma,
enfatizando que tenían la opción de abandonar el estudio en cuanto lo deseasen y
que los resultados de la misma, no influirían en sus condenas ni apelaciones.
Todos firmaron un Consentimiento informado.
Esta investigación fue dirigida y aprobada por el Comité de Ética del Centro de
Neurociencias de Cuba y del Ministerio de Salud Pública.
28
psicométricas permiten diferenciar los siguiente trastornos de personalidad:
Paranoide, Esquizoide, Esquizotípico, Antisocial, Borderline, Histriónico,
Narcisista, Evitativo, Dependiente, Obsesivo-Compulsivo y No especificado.
29
Para el estudio que se quiere realizar, se consideran once de las variables
tabuladas. Estas variables son categóricas binarias; y miden agresividad física
(CAF), agresividad verbal (CAV), ira (CIRA), hostilidad (CHOST), conducta
agresiva (CAGRE), escala del control de los impulsos (CCOIMP), búsqueda de
sensaciones (CBSTOT), búsqueda de emociones (BEM), búsqueda de excitación
(BEX), desinhibición (DES) y susceptibilidad al aburrimiento (SAB).
30
CAPÍTULO 3. ALGORITMOS
IMPLEMENTADOS
31
• T (necesario): número de clases latentes.
• maxiter (necesario): máximo número de iteraciones.
• eps (necesario): límite de convergencia.
• c0 (opcional): valor inicial para las probabilidades de clase.
• p0 (opcional): valor inicial para las probabilidades condicionales.
Los parámetros de entrada de esta función, anotando entre paréntesis los valores
que toma por defecto, son:
32
• K (necesario): número de clases.
• problevels (necesario): vector de niveles de probabilidad para las funciones
de membresía.
• model (necesario): tipo de modelo GOM (model=”GOM” estima por el
modelo GoM).
• max.increment (opcional): incremento máximo (0.3).
• numdiff.parm (opcional): parámetro de diferenciación numérica (0.001).
• maxdevchange (opcional): criterio de convergencia para cambios en la
desviación relativa (10-5).
• globconv (opcional): criterio de convergencia global para cambios de
parámetros (0.001).
• maxiter (opcional): máximo número de iteraciones (1000).
• msteps (opcional): número de iteraciones dentro del m-ésimo paso (4).
• mstepconv (opcional): criterio de convergencia dentro del m-ésimo paso
(0.001).
33
• probs: arreglo con las probabilidades de respuesta (grid de las lambdas).
• n.ik: frecuencias esperadas.
• iter: número de iteraciones.
• I: número de ítems.
• K: número de clases.
• TP: número de puntos del grid.
• theta.k: grid de las funciones de membresía (fórmula1.13).
34
• g: tabla de datos de los scores de membresía individuales 𝑔𝑔𝑖𝑖𝑖𝑖 .
• g.mean: media de los scores de membresía.
• gcut: scores de membresía discretizados.
• gcut.distr: distribución de los scores de membresía discretizados.
• K: número de clases.
• deviance: índice de bondad de ajuste.
• ic: criterio de información.
• N: número de individuos.
• score: probabilidad condicional de la verdad dados los scores de
membresía: 𝑃𝑃�𝑥𝑥𝑖𝑖𝑖𝑖𝑖𝑖 = 1| 𝑔𝑔𝑖𝑖 � = ∑𝐾𝐾𝑘𝑘=1 𝑔𝑔𝑖𝑖𝑖𝑖 ∙ 𝜆𝜆𝑘𝑘𝑘𝑘𝑘𝑘 .
• iter: número de iteraciones.
35
Figura 3.1: Diagrama gráfico del modelo GoM.
36
Los parámetros de salida de la implementación son:
37
CAPÍTULO 4. RESULTADOS Y
DISCUSIÓN DE LA APLICACIÓN
Análisis exploratorio
A partir del criterio del grupo multidisciplinario que evaluaron a los reos,
utilizando los instrumentos aplicados y los expedientes, se estableció una
clasificación en psicópatas y no psicópatas. En la tabla 4.1 se muestra la
distribución por cada subpoblación.
38
El comportamiento de la distribución de las escalas estudiadas tomando en
cuenta la clasificación brindada se muestra en la figura 4.1 para el caso de los
sujetos psicópatas y la figura 4.2 para los no psicópatas.
39
d) Las probabilidades de respuesta condicional de cada una de las variables
manifiestas dentro de cada clase latente:
40
Figura 4.4: Perfiles extremos para el MCL con K=2 clases.
41
Figura 4.5: Perfiles extremos para el modelo GoM con K=2 clases.
42
0.48 y no psicópatas en 0.52. Los perfiles extremos de cada clase son graficados
en la figura 4.6. En esta figura se observa resultados similares a los obtenidos con
el método de estimación EM. Los perfiles de comportamiento con presencia de
conductas extremas en el caso de los sujetos no psicópatas también están entre el
ítem 6 hasta el ítem 9, como se espera.
Figura 4.6: Perfiles extremos para el modelo GoM con K=2 clases.
43
En figura 4.7 se muestra la distribución de los scores 𝑔𝑔𝑖𝑖𝑖𝑖 , y se observa en los
extremos las dos clases correspondiente a psicópatas y no psicópatas. Los
valores alrededor de 0.5 corresponderían a los individuos con membresía mixta.
44
Figura 4.8: Perfiles extremos para el modelo GoM con K=2 clases.
45
CONCLUSIONES
46
RECOMENDACIONES
4- Validar los resultados obtenidos con los criterios de expertos a partir de escalas
o valoraciones que indiquen un grado de psicopatía, como por ejemplo la escala
de Hare.
47
REFERENCIAS BIBLIOGRÁFICAS
[1] Calzada Reyes, Ana A.; Centro de Neurociencias de Cuba. Evaluación
Electrofisiológica y Morfométrica en Reos Violentos con Trastorno de
Personalidad Antisocial y con Psicopatía, 2014.
[2] Erosheva, E. A.; Department of Statistics, Carnegie Mellon University,
Pittsburgh. Grade of Membership and Latent Structure Models with
Application to Disability Survey Data, 2002.
[3] Fienberg, S. E.; Department of Statistics, Machine Learning Department and
Cylab, Carnegie Mellon University, Pittsburgh. Patricia Hersh; Department of
Mathematics Indiana University, Bloomington. Alessandro Rinaldo,
Department of Statistics, Carnegie Mellon University, Pittsburgh. Yi Zhou;
Machine Learning Department, Carnegie Mellon University, Pittsburgh.
Maximum Likelihood Estimation in Latent Class Models for Contingency
Table Data, 2007.
[4] Bartholomew, D. J.; Knott, M.; London Arnold. Latent Variable Models and
Factor Analysis, 1999 (1987, Second edition).
[5] Lazarsfeld, P. F., Neil W. Henry; Boston: Houghton Mifflin. Latent Structure
Analysis, 1968.Structure Analysis, Boston: Houghton Mifflin.
[6] Heinen, T.; Sage, Newbury Park, CA. Latent Class and Discrete Latent Trait
Models: Similarities and Differences, 1996.
[7] Bartholomew, D. J.; London Arnold. Variable Models and Factor Analysis,
1987.
[8] Uebersax, J. S. (1997). Analysis of Student Problem Behaviors with Latent
Trait, Latent Class, and related Probit Mixture Models. In: Rost J, Langeheine
R, eds. Applications of Latent Trait and Latent Class Models in the Social
Sciences. New York, NY: Waxmann; 188-195, 1997.
[9] Goodman, L. A. Exploratory Latent Structure Analysis Using Both Identifiable
and Unidentifiable models, Biometrika, 61, 215–231, 1974.
48
[10] Rasch, G.; Danish Institute for Educational Research, Copenhagen,
Denmark. Probabilistic Models for Some Intelligence and Attainment Test,
1960.
[11] Lord, F. M.; Erlbaum, Hillsdale, NJ. Applications of Item Response Theory to
Practical Testing Problems, 1980.
[12] Birnbaum, A. Some Latent Trait Models, and Their Use in Inferring an
Examinee’s Ability. In F. M. Lord & M. R. Novick, Statistical theories of mental test
scores (pp. 397-479). Reading, MA: Addison-Wesley, 1968.
[13] Erosheva, E. A.; Statistics and Social Work, University of Washington,
Seattle; Fienberg, S. E.; Statistics and Social Science, Department of
Statistics, Carnegie Mellon University, Pittsburgh. Bayesian Mixed
Membership Models for Soft Classification, 2004.
[14] Erosheva, E. A.; Department of Statistics, School of Social Work, Center for
Statistics and the Social Sciences, University of Washington, Seattle;
Fienberg, S. E.; Department of Statistics, Center for Automated Learning and
Discovery, Center for Computer and Communications Security, Carnegie
Mellon University, Pittsburgh. Bayesian Mixed Membership Models for Soft
Clustering and Classification, 2005.
[15] Woodbury, M. A.; Clive, J. Clinical Pure Types as a Fuzzy Partition. Journal of
Cybernetics 4, 111-121, 1974.
[16] Manton, K. G.; Woodbury, M. A.; Tolley, H. D. Statistical Applications Using
Fuzzy Sets. Wiley, New York.1994.
[17] Goodman, L. A. Analysing Qualitative/Categorial Data. Log-Linear Models
and Latent-Structure Analysis. Addison-Wesley Publ. Comp., London-
Amsterdam-Sydney-Tokyo 471, 1978.
[18] Hagenaars, J. A. Categorical Longitudinal Data - Loglinear Analysisof Panel,
Trend and Cohort Data. Newbury Park: Sage, 1990.
[19] Sepúlveda, R. A.; Departamento de Estadística - USAL. Análisis de Clases
Latentes, 2001.
49
[20] Erosheva, E. A.; Fienberg, S. E.; Joutard, C. Describing Disability through
Individual Level Mixture Models for Multivariate Binary Data, Annals of
Applied Statistics, 1, 502-537, 2007.
[21] Tanner, M. A.; Tools for Statistical Inference. Methods for the Exploration of
Posterior Distributions and Likelihood Functions (Third Edition), Springer-
Verlag, 1996.
[22] Hicks, B. M.; Patrick, C. J. Psychopathy and Negative Emotionality: Analyses
of Suppressor Effects Reveal Distinct Relations with Emotional Distress,
Fearfulness, and Anger–Hostility. Journal of Abnormal Psychology,115, 276–
287, 2006.
[23] Hare, R.D. Manual for the Hare Psychopathy Checklist—Revised (2nd ed.).
Toronto: Multi-Health Systems, 2003.
[24] Laurell, J.; Däderman, A. M. Psychopathy (PCL-R) in a Forensic Psychiatric
Sample of Homicide Offenders: Some Reliability Issues. International Journal
of Law and Psychiatry, 30, 127–135, 2007.
[25] Hare, R. D. Psychopathy: A Clinical and Forensic Overview. Psychiatric Clinic
of North America, 29, 709-724, 2006.
[26] Cooke, D. J.; Michie, C. Refining the Construct of Psychopathy: Towards a
Hierarchical Model. Psychological Assessment, 13, 171-1 88, 2001.
[27] SCAN: Cuestionario para la Evaluación Clínica en Neuropsiquiatría. OMS.
Madrid, 1992.
[28] Hare, R. D. The Hare Psychopathy Checklist - Revised. Toronto, ON: Multi-
Health Systems. 1991.
[29] Forth, A.E.; Kosson, D.S. ; Hare, R. D. Psychopathy Checklist Youth Version:
Technical Manual. Toronto: Multi-Health Systems, 2003.
[30] American Psychiatric Association. Diagnostic and Statistical Manual of Mental
Disorders - Text revision. Fourth edition. Washington, DC, American
Psychiatric Association. 2000.
[31] Buss, A.H.; Perry, M. The Aggression Questionnaire. Journal of Personality
and Social Psychology. Vol 63. No.3, 1992.
50
[32] Ramos Brieva, J. A.; Gutiérrez Zotes, A.; Saíz-Ruíz, J.Escala de Control de
los Impulsos “Ramón y Cajal” (ECIR y C). Actas Españolas de Psiquiatría,
30, 160-174, 2002.
[33] Rosenberg, M. Self-esteem Scale. Society and Adolescent self-image.
Princeton. N. J. Princeton. University Press, 1965.
[34] Zuckerman, M. Behavioural Expressions and Biosocial Bases of Sensation
Seeking. Cambridge University Press, 1994.
51
ANEXOS
dbstop ifwarning;
f0 = n;
n = n / sum(n(:));
sz = size(n);
if nargin < 6
p0 = cell(1, length(sz));
for i=1:length(p0)
A = rand(sz(i), T);
A = A ./ kron(ones(sz(i),1), sum(A, 1));
p0{i} = A;
end
end
if nargin < 5
c0 = rand(1,T);
c0 = c0 ./ sum(c0);
end
c00 = c0;
p00 = p0;
nn = zeros([sz, T]);
c = c0;
p = p0;
iter = 0;
devbuf = [];
llk = 0;
while iter < maxiter
% paso E
for idx=1:prod(size(nn))
subv = ind2subv(size(nn), idx);
nn(idx) = c(subv(end));
for i=1:length(sz)
nn(idx) = nn(idx) * p{i}(subv(i), subv(end));
end
end
nnhat = sum(nn, length(sz)+1);
nnhat = catrep(length(sz)+1, T, nnhat);
nnhat = nn ./ nnhat;
% paso M
for t=1:T
A = subarray(length(sz)+1, t, nnhat);
A = n .* A;
c(t) = sum(A(:));
for i=1:length(sz)
for k=1:sz(i)
B = subarray(i, k, A);
52
p{i}(k, t) = sum(B(:)) / c(t);
end
end
end
% mle
f = zeros([sz, T]);
for idx=1:prod(size(f))
subv = ind2subv(size(f), idx);
f(idx) = c(subv(end));
for i=1:length(sz)
f(idx) = f(idx) * p{i}(subv(i), subv(end));
end
end
f = sum(f, length(sz)+1);
llk(end+1) = sum( f0(:) .* log(f(:)) );
% si converge
maxdev = max(abs(c-c0));
for i=1:length(p)
A = abs(p{i}-p0{i});
maxdev = max(maxdev, max(A(:)));
end
devbuf = [devbuf, maxdev];
if maxdev < eps
disp(['algorithm converges in ', int2str(iter), ' steps.']);
break;
end
c0 = c;
p0 = p;
iter = iter + 1;
end
% estimación de frecuencias
f = zeros([sz, T]);
for idx=1:prod(size(f))
subv = ind2subv(size(f), idx);
f(idx) = c(subv(end));
for i=1:length(sz)
f(idx) = f(idx) * p{i}(subv(i), subv(end));
end
end
m = f; % tabla ajustada
f = sum(f, length(sz)+1);
f = f .* sum(f0(:));
% cociente de verosimilitud
f0 = f0(:);
f1 = f(:);
llr = f0./f1;
llr( find(llr==0) ) = 1;
llr = 2 * sum( f0.*log(llr) );
% grados de libertad
df = (prod(size(n))-1) - (T-1+T*sum(size(n)-1));
llk = llk(2:end);
end
53
Anexo B. Código en WinBUGS para el modelo de Grado de Membresía
estimado mediante Monte Carlo con Cadenas de Markov.
54