Paper Exposición 9 Traducción

Machine Translated by Google
Obtención de preferencias por pares en sistemas de recomendación

Saikishore Kalloori, Francesco Ricci y Rosella Gennari Universidad
Libre de Bozen - Bolzano, Italia Piazza Domenicani
3, I - 39100, Bolzano, Italia ksaikishore @ unibz.it, fricci
@ unibz.it, gennari @ inf.unibz.it
RESUMEN a partir de evaluaciones absolutas de elementos, por ejemplo, calificaciones de
Los datos de preferencia en forma de calificaciones o me gusta de los elementos usuarios o gustos [31]. Sin embargo, este tipo de preferencias tienen pocas
se utilizan ampliamente en muchos sistemas de recomendación. Sin embargo, desventajas, ilustradas en la literatura previa [5, 22, 23]. Por ejemplo, si un usuario
investigaciones anteriores han demostrado que incluso las comparaciones de ha asignado la calificación más alta a un elemento y, posteriormente, el usuario
elementos, que generan datos de preferencias por pares, se pueden utilizar para descubre que prefiere otro elemento al primero, el usuario no tiene más remedio
modelar las preferencias de los usuarios. Además, las preferencias por pares se que otorgar también a este nuevo elemento la calificación más alta [11] . Además, si
pueden combinar de manera efectiva con las calificaciones para calcular las la mayoría de los elementos tienen la calificación más alta, entonces es difícil
entender qué elementos le gustan más al usuario.
recomendaciones. En tales enfoques híbridos, el Sistema de recomendación
requiere obtener ambos tipos de datos de preferencia del usuario. En este Por tales razones, pocos investigadores [5, 11, 22] han desarrollado técnicas de
trabajo, nuestro objetivo es identificar cómo y cuándo obtener preferencias por recomendación que aprovechan una forma alternativa de recopilar las preferencias
pares, es decir, cuándo esta forma de datos de preferencia del usuario es más del usuario, a saber, las comparaciones por pares, como el elemento i se prefiere al
significativa para que el usuario la exprese y más benéfica para el sistema. elemento j. En estos escenarios, los usuarios brindan sus preferencias al expresar
Realizamos una prueba A/B en línea y comparamos una variante del sistema qué elemento prefieren en un par (i, j).
basada solo en calificaciones con otra variante que permite al usuario ingresar En [24, 25], se demostró que las preferencias por pares se pueden usar de
ambos tipos de preferencias. Nuestros resultados demuestran que las manera efectiva para entrenar la factorización de matrices y los enfoques del
preferencias por pares son valiosas y útiles, especialmente cuando el usuario se vecino más cercano y, en última instancia, para calcular recomendaciones efectivas.
enfoca en un tipo específico de elementos. Al incorporar preferencias por pares, Vale la pena señalar que las preferencias por parejas surgen naturalmente y
el sistema puede generar mejores recomendaciones que una solución de última son expresadas por los usuarios (directa o indirectamente) en muchos escenarios
generación basada únicamente en calificaciones. Además, nuestros resultados de toma de decisiones. De hecho, en la vida cotidiana, existen situaciones en
indican que parece haber una dependencia entre la personalidad del usuario, la las que calificar opciones alternativas no es el mecanismo más natural para
usabilidad percibida del sistema y la satisfacción con el procedimiento de expresar preferencias y tomar decisiones. Por ejemplo, no calificamos los
elicitación de preferencias, que varía si solo se obtienen calificaciones o una suéteres cuando queremos comprar uno. Es más probable que los comparemos
combinación de calificaciones y preferencias por pares . y compremos el preferido. Sin embargo, comprender qué preferencias por pares
debe expresar el usuario, para conocer su modelo de usuario y cuándo adquirir
CONCEPTOS CCS estas comparaciones, es un tema fundamental en el diseño de RS efectivos
basados en esta forma de datos de preferencia.
•Sistemas de información ÿ Sistemas de recomendación;
Por esta razón, en este trabajo, nuestro objetivo es comprender cuándo es

PALABRAS CLAVE
significativo y beneficioso obtener preferencias por pares. Presumimos que las
Preferencias por parejas; Calificaciones; Sistemas de recomendación
preferencias por pares son más efectivas, si se comparan con las calificaciones,
Formato de referencia ACM: en situaciones y escenarios donde el usuario tiene un objetivo bastante claro y
Saikishore Kalloori, Francesco Ricci y Rosella Gennari. 2018. Obtención de preferencias está buscando un tipo específico de elementos ( recomendación). Por ejemplo,
por pares en sistemas de recomendación. En las Actas de la Duodécima Conferencia
cuando un usuario quiere disfrutar de un resort de playa junto a su familia
ACM sobre Sistemas de Recomendación, Vancouver, BC, Canadá, del 2 al 7 de octubre
durante un fin de semana, es más probable que elija la mejor opción comparando
de 2018 (RecSys '18), 9 páginas.
las disponibles en lugar de calificarlas. Nos enfocamos en tales situaciones de
DOI: 10.1145 / 3240323.3240364
usuario que tienen un objetivo/contexto especí co, y modelamos sus preferencias.
Nuestra intuición es que para hacer una comparación, el usuario requiere un
1. INTRODUCCIÓN (conjunto de) criterios para formular un juicio. Además, también planteamos la
La mayoría de los sistemas de recomendación (RS) actuales generan hipótesis de que los elementos a comparar no deberían ser demasiado
sugerencias personalizadas aprovechando la información de preferencia derivada diferentes; un comprador puede comparar dos autos pero no un auto y una
bicicleta. De hecho, incluso el adjetivo “comparable” significa que los objetos
Se otorga permiso para hacer copias digitales o impresas de todo o parte de este trabajo
para uso personal o en el aula sin cargo, siempre que las copias no se hagan o distribuyan comparados son algo similares.
con fines lucrativos o comerciales y que las copias lleven este aviso y la cita completa en la
primera . página. Deben respetarse los derechos de autor de los componentes de este
trabajo que no pertenezcan a los autores. Se permite hacer resúmenes con crédito. Copiar También pretendemos abordar el problema de qué elementos específicos
de otro modo, o volver a publicar, publicar en servidores o redistribuir a listas, requiere un debe comparar el usuario. De hecho, además del problema mencionado
permiso especí co previo y/o una tarifa. Solicite permisos de permisos@acm.org.
anteriormente (es decir, que los elementos comparados deberían ser algo
RecSys '18, Vancouver, BC,
Canadá © 2018 Copyright del propietario/autor. Derechos de publicación licenciados a
similares), una desventaja adicional de obtener información sobre las preferencias
ACM. 978-1-4503-5901-18/6/10. . . $15,00 DOI: 10.1145/3240323.3240364 del usuario a partir de la comparación por pares es que el número de
comparaciones posibles en un conjunto 2 de N elementos es N
. A pesar de que se ha demostrado
329
RecSys '18, del 2 al 7 de octubre de 2018, Vancouver, BC, Canadá Saikishore Kalloori, Francesco Ricci y Rosella Gennar
que en la práctica los RS basados en preferencias por pares no requieren más datos una discusión exhaustiva de los resultados obtenidos. Finalmente, formulamos nuestras
de preferencia que los sistemas basados en calificaciones [5], sigue siendo importante conclusiones y discutimos el trabajo futuro.
y crítico identificar, para cada usuario, un conjunto conveniente de comparaciones que

debe expresar. Para obtener de manera efectiva las preferencias por pares, el RS 2. TRABAJO RELACIONADO
necesita una GUI utilizable y un método de aprendizaje activo que pueda identificar qué 2.1 Preferencias por pares
pares de elementos pueden y deben comparar los usuarios.
Las preferencias por pares (preferencias relativas o comparaciones) se utilizan
ampliamente incluso fuera del área de investigación de RS, por ejemplo, en la toma de
Por lo tanto, en este artículo, desarrollamos un modelo de interacción especí co,
decisiones y el marketing. Por ejemplo, las técnicas populares, como el procesamiento
componentes GUI, una estrategia de aprendizaje activo para preferencias por pares
jerárquico analítico (AHP) [34] o el análisis conjunto [37], utilizan la comparación relativa
y un algoritmo de clasificación personalizado que usa preferencias por pares para
entre las características del producto para comprender o despertar el interés de los
validar las siguientes hipótesis: (H1) Las preferencias por pares pueden conducir a
usuarios. En la economía del comportamiento, según la teoría de la inversión de
una mayor facilidad de uso del sistema en comparación con las calificaciones.
preferencias [40], las preferencias del usuario al evaluar elementos individualmente
(evaluación separada) difieren de las preferencias expresadas al comparar elementos
(H2) El uso de preferencias por pares puede conducir a una mayor satisfacción del juntos (evaluación conjunta). Los usuarios tienden a expresar preferencias de manera
usuario por el proceso de elicitación de preferencias en comparación con el diferente en estas dos situaciones [1] y, por lo tanto, es importante que los RS analicen
uso de calificaciones, cuando el conjunto de opciones ya se ha reducido. la calidad de las recomendaciones generadas por modelos de preferencia alternativos
(p. ej., calificaciones frente a preferencias por pares). Además, la comparación por
pares ha demostrado ser útil para obtener evaluaciones confiables de los docentes [19]
(H3) Las preferencias por pares pueden conducir a una mayor precisión y calidad
y evaluaciones entre pares de los estudios de pregrado [21].
de RS en comparación con las calificaciones cuando el usuario tiene un
objetivo claro para la toma de decisiones.
En investigaciones anteriores, ya se ha demostrado que los juicios de preferencia
Modelar las preferencias de los usuarios en forma de preferencias por pares e por pares también se expresan más rápido que las calificaciones, y los usuarios
identificar qué situación es la más adecuada para obtener preferencias por pares prefieren proporcionar sus preferencias de esta forma [12, 22]. Además , los autores
no se ha explorado hasta ahora en los RS. Por lo tanto, para validar nuestras de [22] demostraron que las preferencias por pares son más estables que las
hipótesis de investigación, hemos implementado técnicas para la elicitación de calificaciones. Más en general, algunos trabajos de investigación en RS, en lugar de
preferencias por parejas y la generación de recomendaciones en un RS móvil, modelar las preferencias de los usuarios mediante calificaciones, intentaron modelar
llamado South Tyrol Suggests (STS). STS recomienda lugares de interés (PDI) las preferencias de los usuarios de otras formas, como el enfoque de obtención
interesantes en la región de Tirol del Sur en Italia [7]. STS es un RS basado en basado en grupos utilizando grupos de elementos [32, 39] y la obtención de
Android que brinda a los usuarios recomendaciones contextuales. Implementamos preferencias basada en la elección [18]. . Se ha demostrado que estos enfoques
dos variantes de RS, utilizando STS, y realizamos un estudio de usuario en vivo. ofrecen un buen rendimiento en términos de reducción del esfuerzo y el tiempo del
Una variante se basa solo en las calificaciones, mientras que la otra emplea usuario y de mejora de la satisfacción del usuario en comparación con las calificaciones.
nuestros algoritmos recientemente desarrollados, recopila las preferencias del Centrándonos en los algoritmos de recomendación, si bien existen numerosos
usuario en forma de preferencias por pares y hace recomendaciones utilizándolas RS que generan recomendaciones utilizando las preferencias de los usuarios en
junto con un conjunto de datos de calificación posiblemente preexistente. forma de calificaciones, recientemente, pocos autores desarrollaron técnicas de
recomendación que combinen calificaciones y preferencias por pares [11, 13, 14, 16,
Realizamos una prueba A/B de usuario en vivo usando estas dos variantes 25]. En [24], los autores también explotaron las preferencias de características como
del sistema. Nuestros resultados indican que las preferencias por pares son una fuente adicional de información para mejorar la recomendación en frío para un
valiosas y útiles cuando el usuario está buscando un tipo especí co de PDI (en RS basado en preferencias por pares.
nuestro caso, un restaurante para una ocasión especí ca) y que, al incorporar las Sin embargo, observamos que estos RS no combinan el algoritmo de
preferencias por pares, el sistema es capaz de capturar las preferencias del recomendación propuesto con una GUI adecuada para soportar la interacción
usuario. preferencias de manera efectiva y producir mejores recomendaciones completa del usuario con el sistema. En nuestro trabajo, hemos desarrollado un
que una solución de última generación basada solo en calificaciones. Nuestros modelo de interacción especí co, componentes GUI, una estrategia de
resultados también sugieren que este tipo de preferencias puede mejorar la aprendizaje activo y una técnica de recomendación para apoyar la interacción
usabilidad del sistema de recomendación, que pedirles a los usuarios que completa del usuario con el sistema y, además, hemos identificado condiciones
comparen elementos los haga sentir más felices de usar el sistema y que el importantes que influyen en la elicitación y efectividad de los RS en función de
sistema pueda recopilar más preferencias (comparaciones por pares versus calificaciones).
las ).
preferencias por parejas.
Además, nuestros resultados también indican una dependencia entre la
personalidad del usuario y la usabilidad del sistema y la satisfacción del usuario 2.2 Aprendizaje activo Muchos
para el procedimiento de elicitación de preferencias. El resto de este documento investigadores han propuesto utilizar estrategias de aprendizaje activo para permitir que
está estructurado de la siguiente manera. En la siguiente sección el RS decida activamente qué datos (de preferencia) deben adquirirse antes de
discutimos el estado del arte. A continuación, ilustramos la interacción entre el comenzar la fase de aprendizaje y, en consecuencia, mejorar el rendimiento del sistema
sistema y el usuario con la aplicación móvil que usamos para probar nuestra [33]. Por ejemplo, uno de los enfoques más comunes para abordar el problema del
hipótesis de investigación. Luego, explicamos el algoritmo implementado que se nuevo usuario en RS es presentar a los usuarios una selección de elementos para
utiliza para obtener preferencias por pares y describimos la técnica de calificar que han sido identificados a propósito por un algoritmo de aprendizaje activo.
recomendación para calcular la clasificación de elementos. A esto le sigue la Por ello, se propusieron numerosas estrategias de aprendizaje activo.
descripción de la estrategia de evaluación utilizada en nuestros experimentos y
330
Obtención de preferencias por pares en sistemas de recomendación RecSys '18, del 2 al 7 de octubre de 2018, Vancouver, BC, Canadá
para RS basados en calificaciones [15]. Las estrategias de aprendizaje activo de calificaciones disponibles. Notamos que un nuevo usuario de STS, aunque no
para RS basadas en preferencias por pares es un tema que aún no se ha explorado. haya ingresado ninguna calificación, aún puede obtener recomendaciones. Estos
En este artículo, proponemos una nueva estrategia de aprendizaje activo para son generados por el modelo CAMF sobre la base de otros datos del usuario,
obtener preferencias por pares y describimos su implementación en una aplicación a saber, la personalidad del usuario. La personalidad del usuario se adquiere
móvil. Además, mostramos que las calificaciones se pueden combinar de manera pidiéndole que complete el Inventario de personalidad de cinco elementos (FIPI)
óptima con las preferencias por pares para calcular recomendaciones efectivas. [17]. Los detalles sobre la estrategia de aprendizaje activo STS-R y su algoritmo
Por lo tanto, este documento inicia un tema de investigación novedoso, es decir, de recomendación se pueden encontrar en [7]. La segunda variante se llama STS-
algoritmos de aprendizaje activo para RS utilizando datos de preferencias mixtas RC. Extiende STS-R al permitir que el usuario ingrese calificaciones y
(calificación y preferencias por pares) o datos de preferencias múltiples. preferencias por parejas.
Por lo tanto, STS-RC difiere de STS-R solo: a) en una GUI adicional, que permite
2.3 Interfaces de usuario al usuario comparar elementos identificados por un nuevo procedimiento de
La obtención de preferencias requiere que las GUI presenten elementos o pares aprendizaje activo, y b) en el algoritmo de recomendación que genera
de elementos para que los usuarios den sus preferencias. La mayoría de las clasificaciones personalizadas de los recomendados . puntos de interés
interfaces actuales para evaluar artículos se basan en calificaciones, por ejemplo, explotando tanto las calificaciones como las preferencias por parejas (puntuaciones por parejas).
5 estrellas o pulgar arriba/abajo. Algunos investigadores propusieron soluciones
para mejorar las interfaces de calificación y apoyar mejor el proceso de calificación.
En [29], los autores sugirieron incluir etiquetas personalizadas y ejemplares para
relacionar las decisiones de calificación con las anteriores. Por lo tanto, si bien las
interfaces de calificación son bastante populares y ampliamente utilizadas en la
actualidad, se ha realizado poco trabajo de investigación sobre las interfaces de
elicitación de preferencias por pares y la construcción de RS basadas en
preferencias por pares [5, 22, 30]. Como consecuencia, la investigación reciente
en el campo de la RS que utiliza preferencias por pares solo consideró puntajes
por pares, que miden cuánto se prefiere un elemento a otro, obtenidos al
transformar las calificaciones en puntajes por pares, es decir, tomando la diferencia
de las calificaciones. . Sin embargo, una verdadera interfaz de adquisición de
puntajes de pares necesita una GUI que permita a los usuarios comparar
elementos e ingresar en qué medida se prefiere uno sobre el otro. En [5], los
autores presentaron una GUI para un recomendador de películas que utiliza
controles deslizantes: cuanto más se arrastra el puntero del control deslizante a
un elemento, más se prefiere este elemento al otro. En este trabajo, además de
construir un modelo de recomendación basado en la combinación de calificaciones
y preferencias por pares, también desarrollamos una interfaz de usuario novedosa
para obtener puntajes de pares binarios que se adapta al escenario móvil.
Figura 1: Interfaz de clasificación
3 RECOMENDADOR BASADO EN PARES

Para probar las hipótesis enumeradas en la sección introductoria, hemos
utilizado una aplicación móvil RS consciente del contexto completamente
funcional, a saber, STS1 . STS se ha utilizado con éxito como prototipo de
prueba para muchos enfoques de recomendación [6–9, 28]. STS está disponible
públicamente en Google Play Store2 . Permite al usuario registrarse, ingresar
preferencias en forma de calificaciones y obtener recomendaciones contextuales
para puntos de interés.
Hemos implementado dos variantes de RS utilizando la aplicación principal
STS. La primera variante, a la que llamamos STS-R, es nuestra línea de base
y es la aplicación preexistente. STS-R usa solo calificaciones para calcular las
recomendaciones. La figura 1 muestra la interfaz de clasificación utilizada en STS-
R. En STS-R, la estrategia de aprendizaje activo implementada, que identifica los
puntos de interés que se presentan al usuario para calificar, se denomina "
predicción binaria" [8]. Elen
algoritmo de recomendación
la factorización utilizado en
matricial consciente delSTS se basa
contexto
(CAMF) [2]. El modelo genera recomendaciones utilizando la personalidad
evaluada
por el usuario, la edad y el sexo del usuario (si está disponible), información
contextual, como el clima, la sensación, el objetivo de viaje o la temperatura, y el
conjunto completo.
1h p://rerex.inf.unibz.it/ Figura 2: Interfaz de preferencia por pares

2h ps://play.google.com/store/apps/details?id=it.unibz.sts.android
331
3.1 Adquisición de preferencias de STS-RC La obtención 3.2 Predicción de preferencias por pares de STS-RC
de preferencias por pares en un entorno móvil requiere una GUI que presente y clasificación de artículos
un par de elementos a los usuarios y les permita comparar estos pares. La En [25] propusimos un enfoque de vecino más cercano (NN) basado en el
, experimento.
figura 2 muestra las GUI reales que hemos diseñado y utilizado
El usuario
en nuestro
puede usuario para predecir preferencias por parejas desconocidas. Utiliza la gamma
ingresar preferencias por pares marcando 'Prefiero esta opción' para señalar el de Goodman y Kruskal (GK) como medida de similitud de usuario a usuario [25].
PDI preferido entre los dos que se presentan. Además, el usuario puede hacer PÿQ
GK se calcula como , donde P es el número de pares de elementos para
clic en una imagen de PDI para explorar los detalles del PDI (consulte la Figura P+Q
2, a la derecha) y también puede calificar el PDI si así lo desea. que los dos usuarios han expresado la misma preferencia ( pares concordantes)
y Q es el número de pares de ítems para los que los dos usuarios tienen
Para identificar los pares de elementos que se presentan al usuario para su preferencias diferentes (pares discordantes). Notamos que GK no explota la
comparación, hemos implementado un procedimiento de aprendizaje activo información contextual mientras calcula la similitud entre dos usuarios. Por lo
que satisface los siguientes requisitos: • Para simplificar la comparación por tanto, en este trabajo, hemos modificado y adaptado GK para que también pueda
pares, los elementos comparados deben ser similares (comparables). tener en cuenta la preferencia por pares dada en situaciones contextuales. Por
ejemplo, una preferencia contextual por pares puede expresar: “Prefiero el
artículo i sobre el artículo j cuando viajo con la familia”.
• Al menos uno de los elementos a comparar debe ser predicho como
altamente relevante para el usuario por el algoritmo de recomendación Sea Pu el conjunto de preferencias por pares dadas por un usuario u sin
C
para que el usuario encuentre más plausible y más fácil compararlo ninguna referencia a un contexto especí co y P sea eltuconjunto
por parejas
de preferencias
dadas por el
con otro. usuario u al comparar elementos en una condición contextual particular, por
ejemplo, cuando el usuario está buscando un PDI para visitar en un “viaje de
• Para mejorar la precisión de la RS, los pares de elementos seleccionados
negocios” o cuando “viaja con la familia”. En nuestros experimentos, los usuarios
para comparar deben expresar la información de preferencia del usuario
sobre los elementos relevantes. proporcionaron ambos tipos de preferencias, y para usarlas apropiadamente,
modificamos el cálculo de la similitud GK de usuario a usuario de la siguiente
Para comprender mejor el procedimiento de aprendizaje activo propuesto para
manera: si la preferencia por pares, que se compara en el dos per les de
obtener preferencias por pares, supongamos que un turista se ha registrado en
usuarios, es de P y se refiere a la situación contextual del usuario cuando U está
STS-RC y el sistema ha generado una lista de recomendaciones personalizada C
solicitando una recomendación, lepesamos
damos
(Q)En si nuestros experimentos
es (des)concordante enlolos dos permás
les importancia
dos veces,
de alPor
ponderarlo
es decir,
usuarios. ejemplo, más.
sumamos si2 el
aP
en la pantalla de sugerencias utilizando el algoritmo CAMF descrito
usuario está buscando recomendaciones para un contexto de fiesta de
anteriormente. Utilizando la lista clasificada R generada, le proponemos al
cumpleaños, ponderamos dos veces todas las preferencias por parejas
usuario que compare algunos de los elementos más recomendados con otros
concordancias y discordancias, que se evalúan en las comparaciones realizadas
elementos que son similares a ellos y que también se predicen como los
en esta situación contextual. Las otras concordancias y discordancias de
elementos más relevantes (posición más alta en la lista clasificada).
preferencias por pares se ponderan una, como de costumbre.
En última instancia, para cada elemento superior i en la lista clasificada R,
identificamos el elemento ji en la lista R que maximiza la Ecuación 1. Luego,
formamos los pares (i,ji ) y se los presentamos al usuario en el mismo orden. de
los elementos i en la lista ordenada R.
Finalmente, la fórmula de predicción NN para la predicción de puntuación por pares
1
ji = arämaxj {(V (i) · V (j)) ÿ} (1) desconocidos es:
R(j)
1
*r = (2)
Por la presente, R(i) es la posición de rango del elemento i en la lista de uij X sim (u, v) ÿ rvij
|Uij |
recomendaciones , V (i) = (v1,. . . ,vn ) denota el vector de características en ÿUi j
booleano n dimensional que representa el elemento i y n es el número de donde ruij es la puntuación real por pares otorgada por el usuario u al par (i,j)
ÿ
características. Por ejemplo, si V (i) = (0,1,0,1) esto significa que el elemento i con valores posibles +1 o -1, y r es el valor predicho, uij
expresado
cuando el
esausuario
Uij es el conjunto decomparación.
no ha
usuarios
posee la segunda y la cuarta características, pero no la primera y la tercera.
que han comparado los ítems i y j, y sim(u,v) es la puntuación de similitud, que
Investigaciones anteriores han demostrado que representar un elemento aquí se calcula con GK.
mediante un número fijo de n características booleanas es útil en turismo [4, 10, 28].
Para construir la representación vectorial de los elementos disponibles, hemos Después de predecir las puntuaciones por pares que faltan, es decir, las
utilizado varias fuentes de información, incluidas las categorías de elementos, que no expresa el usuario, las agregamos para calcular una puntuación de
ÿ
como "museo" u "hotel", y palabras clave extraídas del nombre del elemento. elemento personalizada ÿui promediando las predicciones
[5, 24, 25]:
r , como lo hace uij
Todas las características del artículo se obtienen a través de un servicio web
proporcionado por la Asociación Regional de Organizaciones de Turismo del ÿ
PAGS j ÿI \ {i }r uij
Tirol del Sur3 . Después de eliminar la redundancia, cada ui = (3)
|yo |
elemento está representado por 145 características. Observamos que la técnica
de adquisición de preferencias anterior requiere un algoritmo de recomendación Tenga en cuenta que, si se conoce ruij , entonces en la fórmula anterior la predicción
para clasificar los elementos. En nuestra aplicación, como mencionamos *r se reemplaza con el valor verdadero ruij . Finalmente, para cada usuario u el
uij
anteriormente, usamos el algoritmo CAMF que se implementa en STS. Luego, los elementos se clasifican y recomiendan según los valores descendentes de las
3h p://www.lts.it. puntuaciones de ÿui .
332
4 ESTRATEGIA EXPERIMENTAL Los pares de ítems para calificar o comparar se identifican utilizando la
Usamos STS-R y STS-RC para validar nuestras hipótesis de investigación, estrategia de aprendizaje activo descrita en la Sección 3. No solicitamos a los
dadas en la sección introductoria. Realizamos un estudio de usuarios en usuarios que proporcionaran un número preciso de preferencias: eran libres
directo, a modo de test A/B (entre grupo). El conjunto de datos inicial de de ingresar tantas preferencias como quisieran. Después de proporcionar
calificaciones STS4 es común para ambos sistemas y contiene 2534 estas preferencias, a los usuarios se les presentaron recomendaciones
calificaciones otorgadas por 325 usuarios. En STS-RC, estas calificaciones se adicionales . En el segundo paso de la fase I, se pidió a los usuarios que
utilizan para generar un conjunto inicial de puntajes por pares (diferencias de evaluaran la usabilidad del sistema y la calidad de recomendación percibida
calificaciones). De hecho, como ya hemos mencionado, uno puede considerar mediante cuestionarios. Adoptamos cuestionarios utilizados en experimentos
fácilmente dos calificaciones del mismo usuario, rui y ruj , y, si tienen un valor similares [5, 28]. En concreto, para evaluar la usabilidad del sistema se utilizó
diferente, convertirlas en una puntuación por pares como ruij = sän(rui ÿ ruj ), el cuestionario System Usability Scale (SUS) [3]. SUS es uno de los
donde sän() es la función de signo , que asigna valores positivos a +1 y cuestionarios estandarizados posteriores al estudio más populares y también
valores negativos a -1. Ambos sistemas se inician con la información de permite medir la usabilidad percibida del sistema con una población de
preferencia contenida en este conjunto de datos y luego se aumentan con las muestra pequeña (es decir, 8-12 usuarios) [36]. SUS contiene 10 afirmaciones,
preferencias adicionales que ingresaron los usuarios en las dos variantes la mitad positivas y la mitad negativas, que se muestran en la Tabla 1. Los
durante el experimento. usuarios juzgan cada afirmación con una escala Likert de cinco puntos, que
Con el fin de comprender la eficacia de modelar las preferencias de los va desde totalmente en desacuerdo (1) hasta totalmente de acuerdo (5) con la afirmación.
usuarios en forma de preferencias por parejas para situaciones en las que un
Tabla 1: Declaraciones del SUS sobre la capacidad de uso del sistema percibida
usuario tiene un objetivo específico y está buscando un tipo específico de
recomendaciones de artículos, llevamos a cabo un diseño de estudio entre
grupos, comparando dos enfoques de elicitación de preferencias, es decir,
calificaciones (en STS-R) o preferencias y calificaciones por pares (en STS- 1 Creo que me gustaría usar este sistema con frecuencia.
RC), y las técnicas de recomendación que utilizan esas preferencias. La 2 Encontré el sistema innecesariamente complejo.
estrategia de evaluación comprende las siguientes etapas y pasos (iguales
3 Pensé que el sistema era fácil de usar.
para ambos grupos):
4 Creo que necesitaría el apoyo de un técnico
• Fase I: Obtención de preferencia inicial sin ningún tipo de
para poder utilizar este sistema.
meta.
- Obtención de preferencias del 5 Descubrí que las diversas funciones del sistema estaban bien integradas .
usuario; - Evaluación de la usabilidad del sistema y la calidad de la
recomendación por parte del usuario mediante un cuestionario. 6 Pensé que había demasiada inconsistencia en este sistema.
• Fase II: Obtención de preferencias y recomendaciones para 7 Me imagino que la mayoría de la gente aprendería a usar este sistema muy
un usuario con un objetivo especí co. rápidamente.
- Recomendación que coincida con el objetivo especí co del usuario; 8 Encontré el sistema muy engorroso de usar.
- Entrada del usuario de preferencias adicionales para comprender mejor
9 Me sentí muy seguro usando el sistema.
las necesidades del usuario y mejorar las recomendaciones; - Evaluación
del usuario del procedimiento de elicitación de preferencias y la calidad 10 Necesitaba aprender muchas cosas antes de poder ponerme en marcha
de la recomendación. con este sistema
Los pasos anteriores se describen con más detalle a continuación. Un

usuario es asignado aleatoriamente a STS-R o STS-RC para proporcionar Para puntuar un SUS seguimos el procedimiento recomendado para calcular la
sus preferencias y recibir recomendaciones. 58 usuarios se registraron para puntuación SUS general, que oscila entre 0 y 100 [35]. Se han publicado varios
el experimento (29 usaron STS-R y 29 usaron STS-RC). Tienen entre 20 y 50 puntos de referencia para el SUS en diferentes sistemas y la puntuación media del
años (la media es 28), 17% mujeres y 55% hombres. La mayoría eran SUS calculada en un punto de referencia popular de 500 estudios es 67 [35]. En
estudiantes universitarios, estudiantes de doctorado o empleados en activo. nuestros experimentos, usamos este valor como punto de referencia para la
Los participantes del experimento, por lo tanto, se encuentran entre los usabilidad de nuestro sistema. En cambio, la calidad de la recomendación percibida
usuarios típicos de las aplicaciones de turismo. se evaluó utilizando las seis declaraciones relacionadas del cuestionario
El proceso de registro es el mismo para ambos sistemas: cada usuario presentado en [26] y que se muestran en la Tabla 2. Las declaraciones se juzgan
ingresa su nombre, contraseña, fecha de nacimiento, sexo y llena el como en SUS y se calcula una puntuación acumulada de manera similar.
cuestionario FIPI . Después de eso, cada usuario recibe inmediatamente
algunas recomendaciones generales, para varios tipos diferentes de puntos En la Fase II del experimento, a cada usuario se le dio una descripción del
de interés (p. ej., restaurantes, eventos, museos, etc.) que se predicen escenario para tener una situación específica orientada a una meta (objetivo)
utilizando el algoritmo CAMF.
preferencias
es, en una
(Fase
etapa
I), inicial
las preferencias
de elicitación
del de
usuario y se le pidió que completara la tarea descrita en el escenario. El escenario
se recopilan en forma de calificaciones (en STS-R) o preferencias y exacto de la tarea del usuario es el siguiente. Se supone que el usuario
calificaciones por pares (en STS-RC), según el sistema al que pertenece el tiene una noche para llevar a sus colegas a un restaurante para su fiesta de
usuario. fue asignado. Elementos cumpleaños en Tirol del Sur. Se solicita al usuario que use el sistema para
encontrar un restaurante adecuado para este evento. Primero se solicita al
4h ps://www.researchgate.net/publication/305682479 Conjunto de datos contextual STS -
Tirol del Sur sugiere datos de aplicaciones móviles. usuario que especifique este evento (objetivo) en la configuración del STS.
Luego, al usuario se le presentan recomendaciones de restaurantes que se predicen como
333
Tabla 2: ítems del cuestionario sobre la calidad percibida de la Tabla 4: Resultados de varias métricas y porcentaje de mejora de STS-RC sobre
recomendación. STS-R (un asterisco significa que
STR-RC es significativamente mejor que STR-R, p<0,05).
1 Me gustaron los artículos sugeridos por el sistema.

STS-R STS-RC RC-R %
2 Los artículos sugeridos eran de mi preferencia.
3
Puntaje SUS 71.93 76,29ÿ 6%
Los artículos sugeridos fueron bien elegidos.
4
puntuación de educación física 54,96 60,24 9,6%
Los ítems sugeridos fueron relevantes.
MRR (Fase II) 0,210 0,271ÿ 29%
5 El sistema sugirió demasiados elementos defectuosos.
Preferencias recopiladas Fase I 9.37 13.44 43%
6 No me gustó ninguno de los artículos sugeridos.
(en promedio por usuario) Fase II 12.65 15.24 20%
adecuado para el evento (paso 1 de la fase II). A continuación, con el fin de comprender
STS-RC y STS-R es signi cativo (test de Mann-Whitney, p = 0,048).
mejor las necesidades del usuario y brindar mejores recomendaciones, el También analizamos las respuestas de los usuarios a cada cuestionario individual.
Luego se le pide al usuario que ingrese algunas preferencias más en la búsqueda
declaraciones. En particular, encontramos que STS-RC se percibe como
artículos (restaurantes) centrándose en sus necesidades específicas de información ser signi cativamente menos complejo que STS-R es: el acuerdo del usuario
(paso 2 de la fase II). Finalmente, se le presenta al usuario una versión mejorada
con la declaración 2 del SUS, evaluando la complejidad percibida de
conjunto de recomendaciones basadas en todas las preferencias ingresadas. mi
el sistema, es signi cativamente diferente entre STS-RC y STS-R
se supone que el usuario busque estas recomendaciones y seleccione un (p < 0,01). En general, los resultados de este experimento respaldan nuestra primera
restaurante de la lista de sugerencias y agregarlo a favoritos. hipótesis de investigación (H1): las preferencias por pares pueden ser efectivamente
Finalmente, en el paso tres de la Fase II, se pidió a los usuarios que llenaran un utilizado en aplicaciones móviles.
encuesta sobre la satisfacción del usuario con la elicitación de preferencia (PE)
procedimiento y en la calidad de la recomendación percibida. Las declaraciones que 5.2 Satisfacción del Usuario por las Preferencias
usamos para evaluar el proceso de elicitación de preferencias.
Proceso de elicitación
[26] se muestran en la Tabla 3. Las declaraciones se juzgan como en SUS y un
Como explicamos anteriormente, en la segunda fase del experimento, el
la puntuación acumulada se calcula de manera similar.
la tarea del usuario se centra en buscar un restaurante y el adicional
Tabla 3: Las preferencias insertadas por el usuario están relacionadas con restaurantes. Nosotros
ítems del cuestionario relativos a la satisfacción del usuario con
han medido la satisfacción del usuario para la obtención de preferencias
el procedimiento de elicitación de preferencias.
(PE) procedimiento para entender cuál es más efectivo en este
situación.
1 Me divierto usando el sistema. Analizando las respuestas de la encuesta, encontramos que el STS-RC
y las puntuaciones STS-R son 60,24 y 54,96, respectivamente, aunque el
2 Usar el sistema es una experiencia placentera.
la diferencia no es estadísticamente significativa (p = 0,06). Falta de estadística
3 El sistema mejoró la calidad de la recomendación cuando
La importancia probablemente se deba al pequeño número de participantes.
se agregan preferencias adicionales.
Nuestros resultados, por lo tanto, solo respaldan marginalmente nuestra segunda investigación.
4 El sistema me hace más consciente de mis opciones de elección. hipótesis (H2), es decir, que las preferencias por pares pueden conducir a una mayor
satisfacción del usuario por el procedimiento de elicitación de preferencia cuando el
5 Me siento aburrido cuando estoy usando el sistema.
el usuario se está enfocando en una necesidad/recomendación de información especí ca.
Además, cuando analizamos las respuestas de los usuarios a cada declaración
individual del cuestionario, encontramos que STS-RC tiende a
5 RESULTADOS hacer que los usuarios se sientan más felices de usar el sistema, aunque no significativamente
Las tablas 4 y 5 muestran los resultados de los cuestionarios relativos a entonces: para la afirmación 1, relativa a la elicitación de preferencias, los usuarios tenían
la usabilidad percibida del sistema (ver Tabla 1), la recomendación una mayor concordancia para STS-RC que para STS-R (p = 0,094). Sin embargo,
calidad (ver Tabla 2), la satisfacción con la obtención de preferencia
para la declaración 3, los usuarios sintieron que STS-RC, en comparación con STS-R,
proceso (ver Tabla 3), el rango recíproco medio del PDI5 elegido mejoró la calidad de las recomendaciones cuando se
y el número de preferencias recopiladas en promedio por usuario (calificaciones se sumaron las preferencias, y de forma signi cativa (p = 0,035).
en STS-R o preferencias por parejas en STS-RC). Hablaremos de cada
de ellos en los siguientes subapartados. 5.3 Recomendación percibida
La Tabla 5 muestra los resultados de la calidad de recomendación percibida en
5.1 Usabilidad del sistema el final de la primera y segunda fase. Analizando las respuestas a la
Analizando los resultados del cuestionario SUS sobre la cuestionario al final de la primera fase, encontramos que el STS-RC
usabilidad percibida del sistema (segundo paso de la Fase I), encontramos que y las puntuaciones STS-R son 58,14 y 63,63 (p= 0,19), respectivamente, pero no
la puntuación SUS de STS-RC es más alta que la puntuación SUS de STS-R, signi cativamente diferente. Esto significa que cuando no hay un especí co
76,29 frente a 71,93, y la puntuación SUS de ambas variantes está muy por encima objetivo de la recomendación, STS-R puede ser capaz de generar mejores
el punto de referencia de 67. es la diferencia entre la puntuación del SUS de recomendaciones en comparación con STS-RC, pero la afirmación debe ser
5
La definición exacta de esta métrica se informa más adelante en el documento. apoyado por otros experimentos.
334
Tabla 5: Resultados de la calidad de la recomendación percibida (un doble Para nosotros, ambos sistemas recogieron más preferencias en la segunda
asterisco significa que STR-RC es significativamente mejor en la segunda fase en comparación con la primera fase. También observamos que los
fase en comparación con la primera, p<0,01). usuarios ingresaron más preferencias al usar STS-RC que al usar STS-R en
ambas fases del experimento, aunque la diferencia no es estadísticamente significativa.
Fase I Fase II (Fase II - Fase I) %
STS-R 63.63 64.52 1,4% 5.4 Impacto de la personalidad del usuario
STS-RC 58.14 65,51ÿÿ 12,6% Finalmente, queríamos entender si existe alguna dependencia entre la
personalidad del usuario con la usabilidad percibida del sistema y la
evaluación del usuario para el procedimiento de elicitación de preferencias.
Por lo tanto, nuestros resultados sugieren que las preferencias por pares no Recordamos que cada usuario, cuando se registró en el sistema (tanto STS
son particularmente efectivas en situaciones en las que el usuario no tiene un R como STS-RC), llenó el cuestionario FIPI, utilizado para evaluar los cinco
objetivo específico. Sin embargo, en la segunda fase del estudio, es decir, grandes rasgos de personalidad: apertura, escrupulosidad, extroversión,
cuando los usuarios se centran en un objetivo particular y solicitan al sistema amabilidad, neuroticismo. Los usuarios respondieron en una escala de Likert de
que proporcione recomendaciones dirigidas a este objetivo, STS-RC y STS-R siete puntos que va desde "totalmente en desacuerdo" (1) hasta "totalmente de acuerdo" (7).
tienen una calidad de recomendación percibida similar: 65,51 frente a 64,52. En investigaciones anteriores, se demostró que existe una relación entre la
Curiosamente, observamos que STS-R tiene una calidad de recomendación personalidad del usuario y: los métodos de elicitación de preferencias [20], el
percibida similar en la primera fase (sin un objetivo particular) 63,63 y la segunda comportamiento del usuario en línea y las redes sociales [27]. Por lo tanto,
fase (con un objetivo particular) 64,52. Por el contrario, hay una mejora signi tratamos de identificar si existe alguna dependencia entre los rasgos de
cativa de esta puntuación para STS-RC entre la primera y la segunda fase: personalidad del usuario y las puntuaciones SUS o PE. Las tablas 6 y 7 muestran
58,14 frente a 65,51 (prueba de Mann-Whitney y prueba t pareada, p < 0,01). las puntuaciones medias de PE y SUS de usuarios con rasgos de personalidad
Por lo tanto, dado que STS-RC es significativamente mejor en la segunda etapa bajos y altos en los sistemas STS-R y STS-RC. Utilizamos una división mediana
que en la primera, esto muestra claramente que las comparaciones son más para dividir a los usuarios en grupos de rasgos de personalidad bajos (usuarios
efectivas para modelar las preferencias del usuario si el usuario tiene un objetivo con una puntuación de rasgos de personalidad inferior a la mediana) y altos
específico y está buscando un tipo específico de recomendaciones Vale la pena (usuarios con una puntuación de rasgos de personalidad igual o superior a la
señalar que los usuarios informaron que comparar pares de elementos les hizo mediana). Luego verificamos dos veces si hay alguna diferencia significativa en
imaginar una clasificación de los elementos comparados y también sintieron que las puntuaciones SUS o PE entre los grupos de rasgos de personalidad bajos y altos.
la lista de recomendaciones generada por STS-RC era atractiva ya que estaba Observando las Tablas 6 y 7, podemos afirmar que a los usuarios que poseen
cerca de su clasificación ideal de los elementos recomendados. Sin embargo, alta extroversión les suele gustar más el procedimiento de elicitación basado en
debemos tener en cuenta que puede haber efectos de arrastre en la segunda rating que a los usuarios que poseen baja extroversión (p = 0,043). Esto significa
fase debido al uso de la aplicación en la primera fase; los usuarios podrían que a los extrovertidos altos, que son socialmente más activos, enérgicos y
haberse beneficiado en la segunda fase. Los experimentos futuros podrían comunicativos, les gusta más usar las calificaciones para expresar sus
probarlo con un diseño de experimento diferente. Sin embargo, este efecto es preferencias en comparación con los usuarios que poseen una extroversión baja.
independiente de la variante utilizada por el usuario, por lo que no influye en la Los extrovertidos altos tienden a ser buenos para juzgar y tomar decisiones [41]
observación de que STS-RC mejoró más la calidad de la recomendación que y, posiblemente, este comportamiento asertivo los hace sentir cómodos para
STS-R cuando el objetivo de la recomendación es más específico. hacer evaluaciones de calificación más que aquellos que no son extrovertidos.
También podemos observar que a los usuarios que poseen una gran simpatía
Además, recordamos que hemos pedido a cada usuario, al final de la tiende a gustarles más el mecanismo de elicitación de preferencias basado en
segunda fase, que marque una sugerencia que crea que se ajusta a sus la preferencia por parejas que a los usuarios que poseen una simpatía baja (p =
preferencias. Luego medimos el error de clasificación del sistema utilizando la 0,016). Además, los usuarios que poseen una amabilidad alta tienden a otorgar
clasificación recíproca media (MRR) [38] suponiendo que este elemento marcado puntajes de usabilidad significativamente más altos en comparación con los
es el relevante. MRR calcula, para cada usuario, el inverso de la posición de usuarios que poseen una amabilidad baja (p = 0,027).
usuarios
Esto muy
significa
agradables
que los ,
rango en la lista recomendada, del elemento marcado (los valores MRR más que son amables, simpáticos y cálidos por naturaleza, expresan sus preferencias
altos son mejores). Encontramos que el MRR de STS-RC es 0,271 y es utilizando preferencias por pares y usan más RS basadas en preferencias por
estadísticamente significativamente más alto que el MRR de STS-R, que es pares en comparación con los usuarios que poseen poca amabilidad. También
0,210 (p = 0,039). Estos resultados apoyan la tercera hipótesis (H3) que hicimos, realizamos análisis de correlación entre la personalidad del usuario de ambos
es decir, las preferencias elicitadas en forma de preferencias por pares mejoran sistemas y la puntuación SUS o puntuaciones PE. Encontramos que entre los
más la precisión y calidad de la recomendación, cuando hay un objetivo claro usuarios de STS-RC, la amabilidad tiene una correlación significativamente
para las recomendaciones. positiva con la usabilidad percibida del sistema (coeficiente de correlación de
rangos de Spearman = 0,413, p=0,02) y el procedimiento de elicitación de
Finalmente, también observamos el número de preferencias ingresadas preferencias (coeficiente de correlación de rangos de Spearman = 0,429,
en las dos variantes en las dos fases experimentales. En el primero, en p=0,026) . Este resultado respalda aún más las observaciones anteriores
promedio por usuario, se proporcionaron 9.37 calificaciones y 13.44 realizadas para las comparaciones por parejas y la personalidad.
preferencias por pares en STS-R y STS-RC, respectivamente. En la segunda
fase, en promedio por usuario, los usuarios que utilizaron STS-R y STS-RC 6. CONCLUSIONES
proporcionaron 12,65 calificaciones y 15,24 preferencias por pares6, respectivamente.
En este trabajo nos propusimos comprender cuándo es significativo y benéfico
6
Además de las preferencias por pares, los usuarios de STS-RC ingresaron muy pocas calificaciones, 28. obtener preferencias por parejas y, más en general, cuándo
335
Tabla 6: Comparación de puntajes de PE entre los dos grupos de usuarios con puntajes bajos y altos para la personalidad fipi ve
rasgos (un asterisco significa p < 0,05). Los dos sistemas, STS-R y STS-RC, se consideran por separado.
STS-RC STS-R
Bajo valor Alto valor Bajo valor Alto valor
Franqueza 61.78 58.82 49.99 53.74
Escrupulosidad 57.46 61.39 51.33 56.53
Extroversión 56.86 61.59 48.19 57,84ÿ
simpatía 50.58 67,97ÿ 51.47 55.74
neuroticismo 61.49 58.49 53.43 55.36
Tabla 7: Comparación de puntajes SUS entre los dos grupos de usuarios con puntajes bajos y altos para la personalidad ve FIPI
rasgos (un asterisco significa p < 0,05). Los dos sistemas, STS-R y STS-RC, se consideran por separado.
STS-RC STS-R
Bajo valor Alto valor Bajo valor Alto valor
Franqueza 75.62 72.72 71.25 68.52
Escrupulosidad 77.50 74.84 70.00 72.63
Extroversión 74.37 77.21 71.13 71.94
simpatía 71.25 79,55ÿ 72.18 69.18
neuroticismo 63.87 62.86 71.25 71.91
proporcionando una con rmación empírica de que los RS basados en pares para la elicitación de preferencias por pares, algoritmo de clasificación novedoso y un
preferencias ofrecen una alternativa válida a los sistemas tradicionales basados en GUI específicamente diseñado.
calificaciones También reconocemos las limitaciones del trabajo presentado. Primero de
Mediante la realización de un test A/B, hemos demostrado que, cuando el usuario todos, notamos que hemos considerado un solo ejemplo de centrado
está buscando una recomendación especí ca, los RS con preferencias por pares buscar, es decir, buscar un tipo especí co de recomendaciones de artículos
pueden desempeñarse igual o mejor que la calificación de vanguardia (restaurante). De hecho, muchas de estas situaciones pueden identificarse durante la
soluciones basadas. En general, nuestros resultados con rman nuestra principal interacción del usuario con el RS en su uso diario. Además, nosotros
hipótesis de investigación: las preferencias por parejas son un enfoque viable de la preferencia. han diseñado dos sistemas que solicitan al usuario que califique o
elicitación en RS; especialmente en situaciones y escenarios donde un comparar. Pero los dos enfoques pueden ser mixtos. Por ejemplo,
usuario tiene un objetivo claro, un sistema que utiliza preferencias por pares puede imagine que se recomienda un artículo al usuario y el usuario tiene
ofrecer una mejor experiencia de recomendación al usuario. experimentado. es con el fin de obtener conocimiento adicional sobre las preferencias del
En particular, hemos demostrado que las preferencias por pares pueden conducir usuario, puede ser útil entender si calificar esto
a una mayor usabilidad de la RS y también a una mayor satisfacción del usuario el artículo es efectivo o sería mejor pedirle al usuario que lo compare
para el procedimiento de elicitación de preferencia, cuando el usuario se está enfocando a otros similares experimentados anteriormente.
en una necesidad especí ca de información y, en consecuencia, la elección Nuestros resultados también sugieren otras futuras líneas de investigación. Para
establecido para tomar la decisión es pequeño. Además, hemos mostrado ejemplo, un análisis de las personalidades de los usuarios y si son
que las preferencias por pares hacen que los usuarios se sientan más felices de usar el RS objetivo dirigido en su búsqueda podría ayudar a decidir sobre el mecanismo de
en comparación con las calificaciones, y el RS usando preferencias por pares recomendación relacionado, por ejemplo, esto podría basarse en pares
es capaz de recopilar más preferencias de este tipo que calificaciones. También tenemos preferencias si los usuarios son muy agradables o están orientados a objetivos. Futuro
demostrado que existe una dependencia entre la personalidad del usuario, El trabajo también intentará ampliar nuestros hallazgos sobre la personalidad.
y la usabilidad del sistema y la evaluación del usuario por la preferencia rasgos y preferencias por los mecanismos de recomendación.
proceso de elicitación. Esto sugiere que la personalidad de los usuarios puede ser Finalmente, planeamos explorar los datos de la sesión y usarlos en nuestro
útil para decidir qué tipo de elicitación de preferencia se puede utilizar, modelos De hecho, las preferencias por pares, que se obtienen en el
y al hacerlo, uno puede recopilar más preferencias, lo que a su vez presencia de un objetivo de usuario, puede contener información que puede ser útil
puede conducir a mejores recomendaciones y una mayor usabilidad de la RS. por un corto tiempo, es decir, recomendaciones basadas en sesiones. En ese sentido,
Destacamos que hemos obtenido estos resultados desarrollando se necesita más trabajo para profundizar en cómo explorar los datos de sesión y
técnicas novedosas para implementar efectivamente un RS que combina incorporarlos a nuestros modelos y mejorar las recomendaciones.
Preferencias y valoraciones por pares: una nueva estrategia de aprendizaje activo
336
REFERENCIAS [25] Saikishore Kalloori, Francesco Ricci y Marko Tkalcic. 2016. Factorización matricial basada en preferencias
por pares y técnicas de recomendación del vecino más cercano. En Actas de la 10.ª Conferencia ACM
[1] Dan Arieli. 2009. Predeciblemente irracional. HarperCollins Nueva York.
[2] Linas Baltrunas, Bernd Ludwig, Stefan Peer y Francesco Ricci. 2012. Evaluación y sobre sistemas de recomendación.
explotación de la relevancia del contexto en sistemas de recomendación móvil. ACM, 143–146.
Informática personal y ubicua 16, 5 (2012), 507–526. [26] Bart P Knijnenburg, Martijn C Willemsen, Zeno Gantner, Hakan Soncu y Chris Newell. 2012.
Explicando la experiencia del usuario de los sistemas de recomendación.
[3] Aaron Bangor, Philip T Kortum y James T Miller. 2008. Una evaluación empírica de la escala de usabilidad
Modelado de usuario e interacción adaptada al usuario 22, 4-5 (2012), 441–504.
del sistema. internacional Revista de interacción humano-computadora 24, 6 (2008), 574–594.
[27] Michal Kosinski, Yoram Bachrach, Pushmeet Kohli, David Stillwell y ore Graepel. 2014. Manifestaciones
de la personalidad del usuario en la elección de sitios web y comportamiento en las redes sociales
[4] Henry Blanco y Francesco Ricci. 2013. Adquisición de perfiles de usuario a partir de comentarios
online. Aprendizaje automático 95, 3 (2014), 357–380. [28] uy Ngoc Nguyen y Francesco Ricci. 2017.
implícitos en un sistema de recomendación conversacional. En Actas de la 7.ª conferencia ACM sobre
Un sistema de recomendación grupal basado en chat para turismo. En Tecnologías de la información y la
sistemas de recomendación. ACM, 307–310.
´ ´
[5] Laura Bledaite y Francesco Ricci. 2015. Obtención y explotación de preferencias por parejas para filtrado comunicación en el turismo 2017. Springer, 17–30.
colaborativo conversacional. En Actas de la 26ª Conferencia ACM sobre Hipertexto y Medios Sociales.
[29] Tien T Nguyen, Daniel Kluver, Ting-Yu Wang, Pik-Mai Hui, Michael D Ekstrand, Martijn C Willemsen y
ACM, 231–236.
[6] Mahias Braunhofer, Mehdi Elahi y Francesco Ricci. 2014. STS: Un Sistema Móvil de John Riedl. 2013. Interfaces de soporte de calificación para mejorar la experiencia del usuario y la
Recomendación Consciente del Contexto para Lugares de Interés. En Talleres UMAP. precisión del recomendador. En Actas de la 7.ª conferencia ACM sobre sistemas de recomendación.
[7] Mahias Braunhofer, Mehdi Elahi y Francesco Ricci. 2014. Evaluación de la usabilidad ACM, 149–156.
de un sistema de recomendación móvil basado en la personalidad y el contexto. En [30] Syavash Nobarany, Louise Oram, Vasanth Kumar Rajendran, Chi-Hsiang Chen, Joanna
McGrenere y Tamara Munzner. 2012. Espacio de diseño electrónico
mediciónde delas interfaces de
opinión:
Congreso internacional sobre comercio electrónico y tecnologías web. Saltador,
exploración del soporte de recuperación para calificación y clasificación. En Actas de la
77–88. Conferencia SIGCHI sobre factores humanos en sistemas informáticos.
[8] Mahias Braunhofer, Mehdi Elahi y Francesco Ricci. 2015. Personalidad del usuario y el nuevo problema
MCA, 2035–2044.
del usuario en un sistema de recomendación de puntos de interés consciente del contexto . En
[31] Francesco Ricci, Lior Rokach y Bracha Shapira. 2015. Sistemas de recomendación: Introducción y
Tecnologías de la Información y la Comunicación en el Turismo 2015. Springer,
537–549. desafíos. En Manual de sistemas de recomendación. Saltador.
[9] Pero hias Braunhofer, Mehdi Elahi, Francesco Ricci y omas Schievenin. [32] Silvia Rossi, Francesco Barile, Sergio Di Martino y Davide Improta. 2017. Una comparación de dos
2013. Sugerencia de puntos de interés sensibles al contexto con gestión dinámica de enfoques de obtención de preferencias para las recomendaciones de museos . Concurrencia y
datos meteorológicos. En Tecnologías de la información y la comunicación en el turismo 2014. Cómputo: Práctica y Experiencia 29, 11 (2017).
[33] Neil Rubens, Mehdi Elahi, Masashi Sugiyama y Dain Kaplan. 2015. Aprendizaje activo
Springer, 87–100. en sistemas de recomendación. En Manual de sistemas de recomendación. Saltador,
[10] Derek Bridge y Francesco Ricci. 2007. Apoyo a la selección de productos con recomendaciones de
809–846.
edición de consultas. En Actas de la conferencia ACM de 2007 sobre sistemas de recomendación. omas l saaty. 2008. Toma de decisiones con el proceso de jerarquía analítica.
[34]
ACM, 65–72.
Revista internacional de ciencias de los servicios 1, 1 (2008), 83–98.
[11] Armelle Brun, Ahmad Hamad, Olivier Bu et y Anne Boyer. 2010. Hacia las relaciones de preferencia en
[35] Je Sauro. 2011. Medición de la usabilidad con la escala de usabilidad del sistema (SUS),
los sistemas de recomendación. En Workshop on Preference Learning, European Conference on
hp://www.measuringusability.com/sus.php. (2011).
Machine Learning y Principle and Practice of Knowledge Discovery in Databases (ECML-PKDD 2010).
[36] Je Sauro y James R. Lewis. 2016. anticipándose a la experiencia del usuario: Práctica
Citeseer.
, Estadísticas para la investigación de usuarios. Morgan Kaufman.
[12] Ben Cartere e, Paul N Benne David Maxwell Chickering y Susan T Du mais. 2008. Aquí o allá: juicios de
[37] Michael Scholz. 2008. De las preferencias del consumidor a las decisiones de compra. 21st Bled
preferencia por relevancia. En Avances en la Recuperación de Información 2008. Springer, 16–27.
eConference eCollaboration: Overcoming Boundaries rough Multi-Channel Interaction (2008), 223–235.
[13] Maunendra Sankar Desarkar y Sudeshna Sarkar. 2012. Predicción de rating usando factorización matricial ¨
[38] Hinrich Schutze, Christopher D. Manning y Prabhakar Raghavan. 2008
basada en relaciones de preferencia. En Talleres UMAP. Citeseer. Introducción a la recuperación de información. vol. 39. Prensa de la Universidad de Cambridge.
[14] Maunendra Sankar Desarkar, Roopam Saxena y Sudeshna Sarkar. 2012. Factorización matricial basada
[39] Loren Terveen Shuo Chang, F. Maxwell Harper. 2015. Uso de grupos de elementos para obtener
en relaciones de preferencia para sistemas de recomendación. En Conferencia internacional sobre
preferencias en sistemas de recomendación. En CSCW '15 Actas de la 18.ª Conferencia de la ACM
modelado, adaptación y personalización de usuarios. Springer, 63–75.
sobre trabajo cooperativo asistido por computadora e informática social (2015-03-11). ACM, 1258–
1269. hp://dl.acm.org/citation.cfm?id= 2675210
[15] Mehdi Elahi, Francesco Ricci y Neil Rubens. 2016. Una encuesta de aprendizaje activo en sistemas de
recomendación de filtrado colaborativo. Revisión de Ciencias de la Computación 20 (2016), 29–50.
[40] Paul Slovic y Sarah Lichtenstein. 1983. Reversiones de preferencias: una perspectiva más amplia. e
American Economic Review 73, 4 (1983), 596–605.
[16] David F. Gleich y Lek-heng Lim. 2011. Agregación de rangos a través de la minimización de normas
[41] Joshua Wilt y William Revelle. 2009. Extraversión. (2009).
nucleares. En Actas de la 17.ª conferencia internacional ACM SIGKDD sobre descubrimiento de
conocimiento y minería de datos. ACM, 60–68.
[17] Samuel D. Gosling, Peter J. Rentfrow y William B. Swann. 2003. Una medida muy breve de los cinco
grandes dominios de la personalidad. Revista de Investigación en personalidad 37, 6 (2003), 504–528.
[18] Mark P Graus y Martijn C Willemsen. 2015. Mejora de la experiencia del usuario durante el arranque en
frío a través de la obtención de preferencias basadas en elecciones. En Actas de la 9.ª Conferencia
ACM sobre sistemas de recomendación. ACM, 273–276.
[19] Sandra Heldsinger y Stephen Humphry. 2010. Uso del método de comparación por pares para obtener
evaluaciones docentes confiables. e Australian Educational Researcher 37, 2 (2010), 1–19.
[20] Rong Hu y Pearl Pu. 2009. Un estudio comparativo de usuarios sobre la calificación frente a los métodos
de obtención de preferencias basados en cuestionarios de personalidad. En Actas de la 14ª conferencia
internacional sobre interfaces de usuario inteligentes. ACM, 367–372.
[21] Ian Jones y Lara Alcock. 2014. Evaluación por pares sin criterios de evaluación.
Estudios de Educación Superior 39, 10 (2014), 1774–1787.
[22] Nicolás Jones, Armelle Brun y Anne Boyer. 2011. Comparaciones en lugar de calificaciones: Hacia
preferencias más estables. En Web Intelligence and Intelligent Agent Technology (WI-IAT), Conferencia
internacional IEEE/WIC/ACM de 2011, vol. 1.IEEE, 451–456.
[23] Saikishore Kalloori. 2017. Preferencias por parejas y sistemas de recomendación. En Actas de la 22ª
Conferencia Internacional sobre Interfaces de Usuario Inteligentes Companion. ACM, 169–172.
[24] Saikishore Kalloori y Francesco Ricci. 2017. Mejora de la recomendación de arranque en frío mediante
la asignación de preferencias basadas en funciones a las comparaciones de artículos. En Actas de las
25 Jornadas sobre Modelado, Adaptación y Personalización de Usuarios. ACM, 289–293.
337

Paper Exposición 9 Traducción

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Paper Exposición 9 Traducción

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

Obtención de preferencias por pares en sistemas de recomendación

RESUMEN a partir de evaluaciones absolutas de elementos, por ejemplo, calificaciones de

Por esta razón, en este trabajo, nuestro objetivo es comprender cuándo es

y crítico identificar, para cada usuario, un conjunto conveniente de comparaciones que

3 RECOMENDADOR BASADO EN PARES

1h p://rerex.inf.unibz.it/ Figura 2: Interfaz de preferencia por pares

3h p://www.lts.it. puntuaciones de ÿui .

Los pasos anteriores se describen con más detalle a continuación. Un

1 Me gustaron los artículos sugeridos por el sistema.

Bajo valor Alto valor Bajo valor Alto valor

Franqueza 61.78 58.82 49.99 53.74

Escrupulosidad 57.46 61.39 51.33 56.53

Extroversión 56.86 61.59 48.19 57,84ÿ

simpatía 50.58 67,97ÿ 51.47 55.74

neuroticismo 61.49 58.49 53.43 55.36

Bajo valor Alto valor Bajo valor Alto valor

Franqueza 75.62 72.72 71.25 68.52

Escrupulosidad 77.50 74.84 70.00 72.63

Extroversión 74.37 77.21 71.13 71.94

simpatía 71.25 79,55ÿ 72.18 69.18

neuroticismo 63.87 62.86 71.25 71.91

También podría gustarte