Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TESIS
PRESENTA:
DIRECTORES:
ustedes.
todo su apoyo.
3053).
vii
Resumen
embargo, los usuarios pueden sentirse cohibidos o ser incapaces de decidir cuando las
percepción del producto por parte del usuario mediante la incorporación de medidas
la utilización del ritmo cardíaco (HR, por sus siglas en inglés) para la valoración de
que interactuaban dos interfaces para realizar consultas a una base de datos.
de decisión con el afán de buscar posibles patrones que pudiesen predecir la percepción
Los resultados mostraron evidencia de que los valores de HR podrían ser utilizados
para predecir una calicación de usabilidad y que el análisis de las medidas siológicas
tiene un gran potencial para mejorar la comprensión sobre la usabilidad del sistema.
ix
Resumen
la opinión del usuario. Se conrmó que las medidas siológicas al generarse de manera
x
Abstract
information (user opinion) into objective information. However, users may feel self-
conscious or unable to decide when the dierences between products are very subtle.
There are other techniques that can contribute to increase the understanding of the
In this paper we present the results of an exploratory study about the use of heart
rate (HR) to assess the user's appreciation of the system. Firstly, an application has
been carried out in a SmartWatch to obtain the physiological response, which has been
rened by carrying out an exploratory study. This signal was acquired from 14 people
This was done in order to obtain a set of variables to characterize the physiological
signal through basic statistics. To later use this characterization as input to a decision
tree learning algorithm with the aim of looking for possible patterns that could predict
The results showed evidence that HR values could be used to predict a usability
score and that the analysis of physiological measures has a great potential to improve
the understanding of the usability of the system. although more extensive studies are
During the last decades, techniques and methodologies have been developed to
opinion of the user. It was identied that the physiological measures to be generated
xi
Índice
Agradecimientos vii
Resumen ix
Abstract xi
1. Introducción 1
1.1. Usabilidad del Software . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Trabajos Relacionados 7
2.1. Usabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1. Denición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
xiii
Índice
2.2.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3. Marco Metodológico 35
3.1. Diseño experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Participantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3. Materiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.6. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
xiv
Índice
4. Resultados y discusión 47
4.1. Caracterización de los datos recolectados . . . . . . . . . . . . . . . . . 47
4.3. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Bibliografía 63
A. Instrumentos de medición 67
A.1. Cuestionario - Demográco . . . . . . . . . . . . . . . . . . . . . . . . . 67
xv
Índice de guras
xvii
Índice de figuras
xviii
Índice de Tablas
4.3. Relación puntaje SUS y escala Sauro y Lewis (2016) para VQI por
participante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4. Relación puntaje SUS y escala Sauro y Lewis (2016) para CLQI por
participante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
xix
Capítulo 1
Introducción
alcanzar sus objetivos. Estos sistemas juegan un papel importante porque apoyan al
usuario a realizar sus tareas de forma rápida y cómoda. Sin embargo, como arman
Martín et al. (2017), muchas veces estos sistemas tienen un bajo nivel de usabilidad y
interacción.
producto se puede usar por determinados usuarios para conseguir objetivos especícos
es tan importante, que como lo arma Aguilar (2017), está relacionada con el éxito o
fracaso de un producto.
software. En este contexto han surgido un número importante de métodos para evaluar
inspección, métodos de indagación y métodos de evaluación por test (Cruz et al., 2015).
1
Capítulo 1. Introducción
Cuando se utiliza este tipo de métodos se confía en la opinión y los informes de los
evaluadores y de los usuarios. Por otro lado, los métodos de indagación contemplan a
una interacción directa con el usuario para obtener respuestas a preguntas formuladas
que proporcionan información que sirve para realizar una medición de usabilidad. Sin
embargo, Lazar et al. (2017) describen las numerosas formas en que los cuerpos de
los usuarios pueden actuar como dispositivos de generación de datos, dado que en el
son conocidas como señales siológicas. De igual forma, expresa que estas medidas
que los usuarios trabajan con una interfaz, sin que intervengan de forma directa con
sistema.
por variables subjetivas (Cruz et al., 2015). Las primeras ayudan a medir de forma
la realización de una tarea, así como la eciencia del mismo, como el tiempo empleado
por el usuario para la consecución de una tarea. Las variables subjetivas, por su parte,
miden el grado de satisfacción del usuario al utilizar el producto, para esto se utilizan:
La evaluación de satisfacción trae consigo respuestas por parte del usuario que
son subjetivas. Esto representa un problema porque ese tipo de datos no apoyan
2
1.2. Denición del problema
Una opción es incluir medidas siológicas, como el ritmo cardíaco (HR), la respuesta
y Shi et al. (2007) indican que es posible que las respuestas siológicas del usuario
que causan cambios en el nivel de activación del usuario al percibir estímulos. Estos
¾Es posible medir qué tan satisfecho está un usuario al usar un software a partir de
siológicos son apropiadas? ¾De qué manera se pueden relacionar los datos siológicos
Con respecto a estas preguntas, trabajos como Sauro y Lewis (2016); J. Hernández
(2015); Foglia et al. (2014), han explorado medidas como el ritmo cardíaco (HR) o la
respuesta galvánica de la piel (GSR). Tales medidas han sido comunmente medidas
Los trabajos mencionados son importantes porque fueron los primeros en abordar
ejemplo, del uso de sensores corporales que si bien son exactos, resultan invasivos para
los usuarios porque les impiden realizar una actividad de forma natural. Además, se
hacen entonces necesarios trabajos que aporten soluciones considerando tales aspectos.
3
Capítulo 1. Introducción
1.3. Hipótesis
Una solución de cómputo basada en sensores poco invasivos y en técnicas de
inteligentes (smartwatches) para el monitoreo del ritmo cardiaco como señal siológica,
como lo sugieren Shahmohammadi et al. (2017). Estos dispositivos son muy populares
para llevar a cabo tareas de descripción o predicción. En este trabajo se ha optado por
utilizar un algoritmo de inducción de árboles de decisión, de tipo CART, dado que éste
4
1.5. Objetivos
1.5. Objetivos
El objetivo general de este trabajo es:
a partir de datos del ritmo cardiaco del usuario obtenidos por un sensor empotrado en
clasicación.
al ritmo cardiaco así como una forma de medir la satisfacción del usuario.
En la etapa de diseño se denió la forma de las pruebas para recopilar los datos. Se
de consultas en SQL (Structured Query Language) a una base de datos relacional, uno a
través de una interfaz visual y otro basado en línea de comandos. Así, se obtuvieron los
y visualizar los datos del ritmo cardíaco captados por un smartwatch. Además, se
5
Capítulo 1. Introducción
En la etapa de análisis, se prepararon los datos colectados por cada interfaz y después
se pasaron como entrada árbol de decisión. Los datos del ritmo cardiaco fueron tratados
mínimo, máximo) así como su tiempo de duración para caracterizarlas. Por su parte,
valores categóricos utilizando la escala de Sauro y Lewis (2016). Los datos combinados
de ritmo cardiaco y satisfacción fueron la entrada del algoritmo CART, que utiliza datos
históricos para construir arboles de clasicación o de regresión los cuales son usados para
clasicar o predecir nuevos datos. Estos árboles pueden manipular fácilmente variables
numéricas y/o categóricas. Para validar la precisión del árbol se utilizó la técnica de
validación cruzada.
así como también la caracterización del cuestionario y los resultados obtenidos en este
trabajo de tesis.
6
Capítulo 2
Trabajos Relacionados
2.1. Usabilidad
2.1.1. Denición
Comúnmente cuando se habla acerca del término usabilidad las personas se reeren a
él como la facilidad de uso. Diversos autores Nielsen (2012); Preece (2000); Shneiderman
nalmente cada denición del enfoque con el que pretende ser medida.
Según Nielsen (2012) el término de usabilidad se dene como un atributo que sirve
para diagnosticar qué tan fácil le resulta al usuario utilizar una interfaz. La palabra
7
Capítulo 2. Trabajos Relacionados
realizar una tarea de una manera fácil, eciente e intuitiva. Por ejemplo, reducir los
pasos para realizar una tarea puede disminuir el número de clics para su conclusión.
Por su lado, Arroyo Vázquez (2011) dene que la usabilidad es la medida para evaluar
el diseño de interfaces para lograr que los usuarios interactúen de forma más fácil e
intuitiva, y agrega que la forma más viable para desarrollar un software es conociendo las
características y preferencias del usuario. Chipantiza et al. (2015) denen que dentro de
y tasas de error. Estos factores son situaciones que presenta un usuario al momento
de interactuar con alguna interfaz y que pueden ser cuanticados para evaluar la
usabilidad.
estandarizada ofrecida por la norma ISO 9241:11, que dene usabilidad como el
grado de ecacia, eciencia y satisfacción con la que usuarios especícos pueden
lograr objetivos especícos, en contextos de uso especícos . Cabe señalar que, para
especicar o medir la usabilidad, es necesario identicar las metas y descomponer la
efectividad, eciencia y satisfacción, así como los componentes del contexto de uso en
humanos.
mencionadas, es necesario revisar los criterios que según (Nielsen, 2012) denen a la
usabilidad y que están relacionados a la interacción entre las personas y los sistemas.
8
2.1. Usabilidad
usuario que nunca ha visto una interfaz puede aprender a usarla bien y realizar
operaciones básicas.
signicativamente menor que el caso del usuario que nunca haya utilizado dicho
sistema.
Tasas de error: la capacidad del sistema para ofrecer una tasa baja de errores,
apoyar a los usuarios a cometer pocos errores durante el uso del sistema, y en
y la facilidad de aprendizaje son los atributos de mayor peso para determinar el grado
usabilidad proporcionadas por la W3C expresan que estos paramentos no son sucientes
para detectar diferencias sutiles. Por esa razón, se han propuesto otros métodos que
9
Capítulo 2. Trabajos Relacionados
Evaluación Heurística
Según Nielsen (2005), la evaluación heurística es un método de inspección y
cada elemento de una interfaz sigue los principios de usabilidad. El objetivo de este
la usabilidad.
continuación;
los usuarios mediante palabras, frases y conceptos que sean familiares al usuario,
más que con términos relacionados con el sistema. Seguir las convenciones del
3. Control y libertad del usuario. Hay ocasiones en que los usuarios elegirán
las funciones del sistema por error y necesitarán una salida de emergencia
claramente marcada para dejar el estado no deseado al que accedieron, sin tener
que pasar por una serie de pasos. Se deben apoyar las funciones de deshacer y
rehacer.
6. Reconocimiento antes que recuerdo. Se deben hacer visibles los objetos, acciones
parte del proceso, para seguir adelante. Las instrucciones para el uso del sistema
10
2.1. Usabilidad
por los usuarios novatos, puede ofrecer una interacción más rápida a los usuarios
expertos que la que el sistema puede proveer a los usuarios de todo tipo. Se debe
10. Ayuda y documentación. Incluso en los casos en que el sistema pueda ser usado
información debería ser fácil de buscar, estar enfocada en las tareas del usuario,
pero este tipo de pruebas se realiza comúnmente cuando la interfaz esta en fase de
prototipado. Lo que hace que los costos de desarrollo aumenten, puesto que solo detecta
Recorridos cognitivos
Un recorrido cognitivo consiste en realizar tareas dentro de un sistema para
etapa del diseño debido a que se necesita de un prototipo, ya sea a papel o de software,
así como un escenario controlado y la lista de tareas a realizar. Este método es utilizado
porque debe encontrar los errores más evidentes de una primera mirada. También la
empatía, ya que se trata de ponerse en la piel del usuario. Son necesarios conocimientos
11
Capítulo 2. Trabajos Relacionados
de diseño para identicar errores y áreas de mejora, y los textos y toda la comunicación
Este tipo de prueba suele realizarse junto con la evaluación heurística. Puede llevarse
a cabo por uno o más expertos (lo ideal que sean varios), y es uno de los recursos más
Cuestionarios
El uso de cuestionarios en la evaluación de la usabilidad permite obtener información
sobre las opiniones, deseos y expectativas de los usuarios potenciales (Sauro y Lewis,
equipo de diseñadores considera útil para desarrollar el producto o aplicación Web. Los
cuestionarios tendrán que ser rellenados por los usuarios y enviarlos de vuelta. Este
tipo de herramientas, son útiles e informativas en todas las fases de diseño y desarrollo
Para la realizacion del test (Lazar et al., 2017) denen los siguientes puntos para
Reclutar participantes.
Las ventajas que poseen este tipo de herramientas son las siguientes:
Son baratos.
12
2.1. Usabilidad
participantes.
resultados errados.
Según Sauro y Lewis (2016), las técnicas anteriores ayudan a los evaluadores de
Factores de pantalla, esto hace referencia a las características del nivel léxico de
13
Capítulo 2. Trabajos Relacionados
Capacidades del sistema, referido a las experiencias del usuario con respecto a la
Inicialmente QUIS (Lewis, 1995) fue una herramienta manual basada en una escala
de valoración de nueve puntos de escala likert (Sauro y Lewis, 2016). Después de crear
versiones iniciales basadas en computadora, se creó una versión de QUIS que permitiera
migrar de las versiones iniciales. Esto se logró mediante un formulario basado en Web
ayudando a reducir las limitaciones de las versiones previas con el uso de formularios
CSUQ
2
El cuestionario de usabilidad del sistema(CSUQ, ) es una herramienta de evaluación
Pude completar las tareas y los escenarios rápidamente usando este sistema", pero el
este sistema". El cálculo de los puntajes de CSUQ es el mismo que para los puntajes de
14
2.1. Usabilidad
2017; Sauro y Lewis, 2016). SUS representó el 43 % del uso de cuestionarios posteriores a
De acuerdo con (Lazar et al., 2017; Sauro y Lewis, 2016) , los participantes deben
cualquier sesión informativa u otra discusión. Las instrucciones para los participantes
deben incluir pedirles que registren su respuesta inmediata a cada elemento en lugar de
elementos de los que consta. Si por algún motivo los participantes no pueden responder
de puntaje es la posición de la escala menos 1 (xi − 1). Para los elementos redactados
la escala (5 − xi). Para obtener el puntaje total de SUS, se debe multiplicar la suma de
las contribuciones del puntaje del ítem por 2.5. Por lo tanto, las puntuaciones generales
cuestionarios SUS, CSUQ, QUIS FIDELITY Y WORDS, para saber cuál de estos
estudio, asignados al azar a uno de los métodos, que utilizaron para evaluar su
satisfacción después de completar dos tareas en dos sitios Web nancieros. Las tareas
fueron:
15
Capítulo 2. Trabajos Relacionados
Encontrar el precio más alto en el último año para una acción de una compañía
especíca.
El orden en que los participantes visitaron los sitios Web fue aleatorio. El análisis de
los resultados generales para todos los métodos mostró una preferencia signicativa por
de dos sitios Web en función del tamaño de la muestra (una variable de importancia
práctica para los profesionales de la usabilidad), donde correctos signicaban una prueba
el Sitio Web 1 fue más útil que el Sitio 2. Como se muestra en la Figura 2.1.
De los cinco métodos evaluados por Tullis y Stetson (2004)), el SUS fue más rápido
del PSSUQ) fue la segunda más rápida, alcanzando un 75 % de acuerdo con un tamaño
En contraste, incluso cuando n = 14, los otros métodos estuvieron abajo del 75 % de
acuerdo con la decisión correcta. Esta es una evidencia convincente para utilizar SUS
16
2.2. Medidas Fisiólogicas
en el experimento exploratorio. Dado que Tullis y Stetson (2004) recomienda, que los
profesionales deberían preferir SUS como un método para evaluar la satisfacción con
2.2.1. Generalidades
Está sección sirve como una introducción general al estudio de las respuestas
que son responsables de las diferentes partes del cuerpo. El sistema nervioso central
control del cuerpo. La médula espinal es responsable de reejos simples y sirve como
un camino entre el cerebro y otras partes del cuerpo (L. S. L. Hernández, 2016).
comunicación del cuerpo y actúa principalmente por debajo del nivel de conciencia
(Quintanilla et al., 2017). El SNP es responsable de llevar las señales del SNC al resto
del cuerpo, pero también transere información sensorial de los órganos (por ejemplo,
ojos, oídos y piel) al cerebro, donde se procesa e interpreta. De especial relevancia para
este estudio es el sistema nervioso autónomo (ANS, por sus siglas en inglés), cuya tarea
17
Capítulo 2. Trabajos Relacionados
activada, la división simpática de ANS prepara al cuerpo para una crisis que puede
2017). Esto se conoce como la respuesta de lucha o huida", y puede ser experimentado
mentales ha estado disponible desde el siglo XIX (Andreassi, 2013). Se ha informado que
Por lo tanto, se ha propuesto que los datos siológicos podrían ser una herramienta
valiosa para las pruebas de usabilidad, ya que podrían ayudar a identicar elementos y
a saber, que las condiciones de prueba deben ser lo más parecidas posible al uso del
18
2.2. Medidas Fisiólogicas
mundo real". Por lo tanto, si se deben aplicar medidas siológicas a las condiciones
obtuvieron los datos. Para comprender mejor los resultados, es aconsejable registrar
observaciones adicionales junto con las mediciones siológicas, como los comentarios,
las conductas observadas y las valoraciones subjetivas de los eventos (Lazar et al., 2017).
ciones son:
Actividad Cardiovascular.
Actividad Electrodérmica.
Actividad Cerebral.
como el ritmo cardíaco (en inglésHeart Rate -HR), la variabilidad del ritmo cardíaco (en
inglés Heart Rate Variability -HRV), y el volumen de pulso sanguíneo (en inglés Blood
19
Capítulo 2. Trabajos Relacionados
latidos del corazón y durante un periodo de tiempo y las diferencias de duración de los
de volumen sanguíneo en las venas del dedo índice. Esta medida indica la cantidad de
sangre que circula actualmente en las venas, lo cual permite calcular la vasoconstrucción,
vasoconstricción son altos se puede estar en estados de furia o estrés, si los valores se
ma (ECG, por sus siglas en inglés) y Fotopletismografía (PPG, por sus siglas en inglés)
(Rodriguez, 2016). El ECG mide el pulso eléctrico producido por el corazón cada vez
que se contrae para bombear sangre. Este método requiere al menos tres electrodos,
que se pueden unir en ambos brazos, ambas piernas o encima del pecho. La colocación
del brazo o la pierna se considera más práctica para el área de Interacción Humano
Computadora (IHC), pero la distancia al corazón hace que la señal sea más vulnerable
interno.
agentes químicos o biológicos ajenos al organismo. Por otra parte, tiene la capacidad de
20
2.2. Medidas Fisiólogicas
Figura 2.3). La epidermis es la capa más externa y contiene varias capas de piel
anterior debido a que contiene más terminales nerviosas y numerosos vasos sanguíneos.
regulan la temperatura corporal a través del sudor. Esta capa actúa como una interfaz
entre la piel y los órganos como los huesos o los músculos (Correo, 2014). Sin embargo,
la piel puede contener un gran número de glándulas sudoríparas, hay un mayor número
de éstas en las palmas de las manos, en los pies, las axilas y la frente (Correo, 2014).
piel, dado que observa los cambios de las glándulas sudoríparas (Carranza y Gajardo,
sudoríparas con respecto de una región de menor concentración, los valores obtenidos
21
Capítulo 2. Trabajos Relacionados
que está formada por biopotenciales. Estas señales eléctricas son de naturaleza iónica
se detecta con los electrodos que cumplen la función de transductores, convirtiendo las
Reiriz, 2012).
La electroencefalografía (EEG, por sus siglas en inglés) es una técnica que sirve
por diez minutos. GSR, BVP y HRV fueron utilizadas como medidas siológicas. Para
la medición de GSR dos sensores fueron colocados en los dedos de la mano izquierda.
derecha de cada participante, por lo que que no debía mover los dedos ni las manos para
no interferir con los datos recogidos por el sensor, la Figura 2.4 muestra el experimento.
22
2.3. Usabilidad y Señales Fisiológicas
El estudio tuvo varios resultados. Primero, las medidas de BVP y de HRV no fueron
evidencia que la señal GSR está relacionada con el nivel de dicultad de la tarea, pero
no es posible concluir una relación causa-efecto. Finalmente, se pudo observar que las
medidas siológicas son consistentes con medidas subjetivas y muestran una sensibilidad
Los hallazgos sugieren que los diferentes niveles de rendimiento de la tarea pueden
frustración. Estos resultados muestran el valor potencial de los datos siológicos como
Los datos siológicos no solo proporcionan una forma de medir objetivamente las
sino que también proporcionan algunas pistas para explicar las diferencias en el
Computadora.
23
Capítulo 2. Trabajos Relacionados
Este trabajo describe un proyecto que utilizó el análisis siológico para cuanticar la
combinaciones de colores en los procesos corporales del usuario. Las pruebas realizadas
revelaron que existe una correlación denida entre los resultados del análisis siológico
y las encuestas subjetivas de satisfacción del usuario. Por lo tanto, los resultados del
análisis siológico se pueden utilizar en lugar de los valores articiales para evaluar la
usabilidad de un sistema.
Sperry y Fernandez (2008), al igual que Lin et al. (2005), establecieron una línea
segundos. Durante este tiempo, el sistema simplemente grabó datos mientras el sujeto
al nal de la prueba.
Los sensores fueron colocados en los dedos de la mano izquierda de cada participante.
mientras que los sensores GSR se sujetaron con velcro a los dedos anulares, la Figura
24
2.3. Usabilidad y Señales Fisiológicas
base inicial del HR y GSR con el promedio durante la prueba. Los autores identicaron
que, aunque toda la investigación parece indicar que la frecuencia cardíaca aumenta
con el estrés mental, la mayoría de las diferencias con respecto al cuestionario subjetivo
fueron todo lo contrario ya que algunos usuarios expresaron que podían leer bien
utilizando fondo animado y letra de color blanco, pero al comparar con los datos
cuerpo humano, y que afectan parámetros como la VFC, HRV, GSR, EEG y el
tamaño de la pupila. El problema, sin embargo, es que las MF no solo capturan los
cambios relacionados con la cognición y las emociones humanas, sino que pueden
estar inuenciadas por un gran número de variables, como la postura corporal, los
25
Capítulo 2. Trabajos Relacionados
Antes de recolectar los datos, Forne (2012) sugiere que deben eliminarse todos los
factores que pueden provocar una interferencia no deseada en los resultados, y que una
vez recopilados los datos, los investigadores deberían reconsiderar si hay lugar para
en Voz Alta (RTA, por sus siglas en ingles) para sincronizarlo con estudios de MF. De
este modo, combinando datos siológicos con la interacción del usuario, tal vez se podrá
Figura 2.6
El estudio consistió en dos partes, una en la que los sujetos realizaban problemas
participantes se les dio 10 segundos para resolver cada problema, después del cual
26
2.3. Usabilidad y Señales Fisiológicas
una solución, los sujetos recibieron instrucciones de decirlo en voz alta. Los datos de
rendimiento podrían ser utilizados para vericar las supuestas variaciones de dicultad
De igual forma, estableció una línea base para propósitos de comparación entre el
estado inicial del HR y el estado nal para comparar la media y la desviación estándar
Yao et al. (2014) realizaron una investigación sobre medición de la experiencia del
por usuarios. Por otro lado, demostraron que las MF son buenos indicadores de la
cuestionario (CSUQ).
que los participantes mostraban un mayor cambio en la respuesta GSR en las tareas
fallidas que en las tareas exitosas. Los autores midieron GSR y BVP directamente
sensor colocado alrededor del tórax. El HR se calculó a partir de los datos del sensor
rawBVP. Todos los datos fueron recolectados a 64 HZ. Como el sensor BVP se movía
demasiado, se les pidió a los participantes que no movieran la mano izquierda. Cabe
señalar que los datos EEG y los datos de expresión facial también se recogieron. El
27
Capítulo 2. Trabajos Relacionados
software SPSS 20.0 para realizar correlación entre las distintas señales y los atributos
y Novedad)
Los autores explican que los resultados del experimento dependen de la experiencia
de interacción de los usuarios con los productos y que las señales varían mucho según
el contexto y las medidas siológicas y que estas son sensibles al movimiento, por lo
que deben extenderse a un contexto más válido y tomar en cuenta una variedad de
tareas. Además, ellos encontraron correlaciones entre GSR y los datos del cuestionario
MF como una fuente de datos para la evaluación de la experiencia del usuario. Sin
las tareas, así como sensores menos invasivos ya que uno de los problemas fue también
la sincronización.
28
2.3. Usabilidad y Señales Fisiológicas
con GSR, ya que la HRV está relacionada con el estado emocional que presenta el usuario
tiempo para esto. J. Hernández (2015) indica que hay que asegurar los electrodos para
tener un buen contacto con la piel, y que es muy importante para obtener registros
el riesgo de desequilibrio entre los electrodos y reducir el ruido. Por lo cual, utilizó crema
hipo-alergénico y transpirable.
29
Capítulo 2. Trabajos Relacionados
EMGz y SM). Para ello se realizó un modelo común con los siguientes factores: las
realizó un análisis de correlaciones entre los factores y las variables subjetivas generales
para denir un modelo de usabilidad, asignando una calicación a las MF ligadas a una
Así mismo, el autor expresa que para asegurar un buen contacto entre el electrodo
crema conductora para mejorar la conductividad. Fijó los electrodos con esparadrapo
hipo-alergénico para evitar que los electrodos se mojaran con el sudor. Además, pidió al
participante quitarse la playera para poder colocar los electrodos, así como que hablara
durante la prueba.
sensor Shimmer3 ligero, pequeño y compacto. Desarrolló una aplicación completa con
almacenamiento en una base de datos para clasicar las emociones de los participantes
30
2.4. Resumen
máquina de soporte vectorial (SVM, por sus siglas en inglés) y k vecinos más cercanos
multiusuario para comparar los resultados. Reportaron que obtuvo mejores valores
(A, H, SP y SN) son emocionalmente negativas y las otras dos carpetas (N y
Matlab.
Este proceso se repitió 9 veces usando diferentes sujetos como conjuntos de datos
de prueba, hasta que las 10 sesiones se usaron como conjuntos de datos de prueba. La
precisión total para el modelo después de haber aplicado KNN obtuvo 86.7 % y para
SVM 80.5 % Udovivic et al. (2017) concluyen que es mas rápido y mejor utilizar KNN,
2.4. Resumen
En este capítulo se denieron los tópicos relevantes para este trabajo de tesis,
tales como la usabilidad y sus técnicas de evaluación, las generalidades de las medidas
siológicas así como las más utilizadas en el ámbito de usabilidad. En cada denición se
Así mismo, se describieron seis trabajos que utilizan MF para tratar de relacionarlas
con atributos de usabilidad al igual que este tema de investigación. Sin embargo, estos
31
Capítulo 2. Trabajos Relacionados
trabajos proponen puntos importantes a considerar como Lin et al. (2005) quienes
son unos de los pioneros en este tipo de investigaciones, quienes arman que las
medidas siológicas son consistentes con medidas subjetivas y muestran una sensibilidad
relación causa-efecto.
Por otro lado, el trabajo de Sperry y Fernandez (2008), dene una forma sencilla de
medir la variación de la señal siológica cuando el participante realiza una tarea. Estos
autores restan la línea base de la señal después de realizar la tarea con la línea base
antes de realizarla. A lo que concluye que en toda la investigación parece indicar que
realizar una tarea. De este trabajo se observa que es importante considerar la línea base
De igual forma Forne (2012), realizó una investigación que proporciona evidencia de
cuerpo humano, y que afectan parámetros como la VFC, HRV, GSR, EEG y el tamaño
de la pupila. Además, indica que una forma de causar mayores niveles de activación es
realizando tareas más complejas, al igual, sugiere que la desviación estándar es un buen
elemento a considerar.
respuesta galvánica de la piel (GSR) en las tareas fallidas que en las tareas exitosas.
datos para la evaluación de la experiencia del usuario. Sin embargo, se requieren más
hacen una propuesta para analizar los datos de las MF después de haber participado
parámetros ayudan a obtener la linea base antes de iniciar la prueba para compararlos
con la MF nal para observar que tanto cambió al realizar algunas tareas en la interfaz.
32
2.4. Resumen
estadísticos (media, desviación estándar, valor mínimo, valor máximo y el tiempo) como
Por otra parte, se puede observar que cada una de estas investigaciones indica que
Por tal motivo, se detectó la necesidad de utilizar sensores menos invasivos en este
caso se decidió utilizar un smartwath que según Shahmohammadi et al. (2017) expresan
que a diferencia de los teléfonos inteligentes que son voluminosos y no siempre usados
pueden fácilmente ser usados durante altos niveles de actividad para proporcionar
que no se detectaron propuestas en la literatura que logren unir las MF y una medida
33
Capítulo 3
Marco Metodológico
en una prueba de usabilidad, para ello se contaba con dos interfaces, una donde se
podía realizar consultas SQL de manera gráca y la segunda donde podían realizar las
Cada uno de los 14 participantes realizó tres tareas en las dos interfaces. Luego
de cada prueba contestaron un cuestionario SUS que sirvió para asociar la respuesta
35
Capítulo 3. Marco Metodológico
3.2. Participantes
En este estudio participaron catorce (14) estudiantes de la Universidad Veracruzana
de entre 23 y 28 años. De esos 14, siete son mujeres y siete son hombres. Los participantes
Cabe señalar que para obtener los datos demográcos de los participantes se
les aplicó un cuestionario (ver apendice A.1). Para conocer la experiencia de los
participantes con SQL, se aplicó otro cuestionario (ver apéndice A.2) con 5 preguntas
para recopilar esta información. Para cada pregunta, hubo 4 respuestas diferentes, entre
las cuales el participante tuvo que elegir solo una. El cuestionario ofrece una evaluación
porcentual (de 0 a 100 %), asignando 20 puntos por cada respuesta correcta. Como
3.3. Materiales
Se usaron diferentes materiales en este estudio: tanto de hardware (smartwatch)
como de software (dos prototipos de interfaces de usuario, una aplicación para registrar
datos del smartwatch y otra para visualizar grácamente los datos), una lista de tareas
que debían realizar los participantes y un cuestionario para medir usabilidad. Estos se
describen a continuación.
1 Siglas en inglés de Structured Query Language
36
3.3. Materiales
Se han realizado pocos estudios que se hayan centrado en utilizar los SmartWatch
(Shahmohammadi et al., 2017). La falta de atención hacia estos dispositivos puede ser
debido a varias razones. Primero, no ha sido hasta los últimos años que los SmartWatch
segundo, Rawassizadeh et al. (2014) expresa que los smartwatches se han limitado
características (ver en Tabla 3.1) que ayuda a romper la limitante expresada por
Hardware Descripción
Pantalla circular de 1.2"sAMOLED 360 x 360 (302 ppi)
RAM 512 MB
Protección IP68
por lo que no es invasivo. Según Free et al. (2010), un smartwath está presente en
37
Capítulo 3. Marco Metodológico
samsung R HR
SmartWatches pueden fácilmente ser usados durante altos niveles de actividad para
38
3.3. Materiales
consultas en SQL: una Interfaz de consulta visual (VQI) y una Interfaz de consulta
de línea de comandos (CLQI). La VQI (ver Figura 3.5) tiene elementos grácos que
permiten al usuario construir una consulta de acuerdo con la sintaxis de SQL. Las
consultas que se pueden realizar van desde un Select-From-Where básico hasta un Inner
Join. Una vez formada una consulta, el usuario puede enviarla a ejecución a un sistema
manejador de bases de datos.
Por otro lado, la CLQI, que se muestra en la Figura 3.6, permite al usuario escribir
expresiones SQL en modo comando y los envia a un servidor de base de datos para
obtener resultados. Esta interfaz tiene dos botones, uno para ejecutar consultas y el
39
Capítulo 3. Marco Metodológico
Tarea Descripción
T1 Seleccionar nombre, apellido y fecha de nacimiento de los estudiantes de nombre EDGAR
T3 Seleccionar de la tabla Notas las calicaciones que corresponden a cada alumno en la tabla Alumno
Dadas estas tareas, los usuarios debían ejecutarlas utilizando los elementos grácos
Usability Scale) es una herramienta que se usa para medir la usabilidad de un sistema.
Aunque esta escala es simple de usar, diferentes pruebas y tests han demostrado que los
resultados obtenidos a partir de la misma suelen ser conables y acertados, razón por
40
3.4. Procedimiento de recolección de datos
(Lin et al., 2005): fase de bienvenida, fase inicial, fase de ejecución y fase nal.
Durante la fase de bienvenida, cada participante rmó un formulario de consenti-
cia SQL.
41
Capítulo 3. Marco Metodológico
obtener una línea base de referencia (Sperry y Fernandez, 2008). Posteriormente, los
participantes hicieron las tres tareas usando cada interfaz. Después de completar una
En la fase nal del estudio, los participantes completaron un cuestionario SUS por
tipo CART. Esta técnica utiliza datos históricos para construir árboles de clasicación
o de regresión los cuales son usados para clasicar o predecir nuevos datos. CART
(2011).
.csv, para después construir un tipo de tabla utilizando las librerías pandas y numpy,
clase del árbol de clasicación y se dene la profundidad para que el modelo sea más
42
3.5. Procedimiento de análisis de datos
preciso, y evitar el sobreajuste. Esto se debe a que dejamos crecer el árbol hasta que
cada hoja estuviera pura (es decir que solo contenga datos de una sola clase a predecir).
Una alternativa para reducir el sobreajuste y ver si podemos lograr que generalice
mejor y por tanto tenga más precisión para datos nunca vistos, es tratar de reducir la
complejidad del modelo por medio de controlar la profundidad que puede alcanzar el
43
Capítulo 3. Marco Metodológico
conjunto de estadísticas para verlo de manera gráca, esto se realizó con la ayuda de
la librería graphviz.
cada uno de estos etiquetados por un valor de la clase. Se hace entonces necesario
pre-procesar los datos para obtener los datos de entrada requeridos. En cuanto a los
datos del ritmo cardiaco, en este trabajo se trataron como series temporales. Cada
caso fueron mediciones estadísticas como: media, desviación estándar, mínimo, máximo
que utilizan medidas siologicas (Wagner et al., 2005; Sperry y Fernandez, 2008; Lazar
A cada serie, representada por los atributos antes señalados, se le asoció un valor de
clase, que fue el resultado de la evaluación de usabilidad del participante para la interfaz
dada. Se decidió transformar los datos provenientes del cuestionario SUS en valores
la Tabla 3.3.
Puntaje SUS Escala Sauro y Lewis (2016) Puntaje SUS Escala Sauro y Lewis (2016)
84.1-100 A+ 71.1-72.5 C+
80.8-84 A 65-71 C
78.9-80.7 A- 62.7-64.9 C-
77.2-78.8 B+ 51.7-62.6 D
74.1-77-1 B 0-51.7 F
72.6-74 B-
44
3.6. Resumen
3.6. Resumen
En este capítulo se describieron los elementos de un experimento para obtener
donde podían realizar las mismas consultas a la base datos por línea de comandos.
Del mismo modo, se desarrolló una aplicación para enviar los datos del ritmo cardiaco
obtenidos por reloj a una base de datos donde eran almacenados. Cabe señalar que se
se obtenía el grado de experiencia con SQL. Por otro lado, se desarrolló una aplicación
Web donde se podía visualizar los datos en forma de grácas. Esto se realizó para que
Cada uno de los 14 participantes realizó tres tareas en las dos interfaces. Luego de
cada prueba contestó un cuestionario SUS qué sirvió para asociar la respuesta subjetiva
por Sauro y Lewis (2016), estos valores pasaron a formar parte del conjunto de datos,
así como las estadísticas básicas. El conjunto de datos generado fue cargado al árbol de
45
Capítulo 4
Resultados y discusión
encontrar si existe una relación entre una medida siológica como el ritmo cardiaco y
nalmente, se describen los resultados de la aplicación del árbol de decisión tipo CART
los 14 participantes del estudio mientras interactuaban con VQI y CLQI. La recolección
de estos datos se hizo en tres estados: reposo (tomado como la linea base o referencia
(Sperry y Fernandez, 2008; Shi et al., 2007)), durante la ejecución de tareas con VQI
Como ejemplo, la Figura 4.1 muestra un resumen de los datos obtenidos del
constantemente por encima de la línea base de referencia mientras se usaba VQI. Por el
47
Capítulo 4. Resultados y discusión
contrario, su HR durante el uso de CLQI fue superior a la linea base normal al comienzo
Después de haber obtenido el ritmo cardíaco de cada participante cuando realizó las
cada participante.
P1 65.0810074 1.28864191 75 70
P2 84.7693926 1.40741004 88 83
P3 60.7043108 0.84835626 61 59
P4 64.682913 1.65269478 65 61
P5 76.934157 4.08018477 77 70
P6 70.6031716 0.06426228 73 71
P9 90.4395007 5.55363821 93 83
48
4.1. Caracterización de los datos recolectados
Se puede observar, que cada participante esta caracterizado, por la media, desviación
Tabla 4.2 muestra las estadísticas básicas por cada usuario para CLQI.
P1 64.6087529 2.73555911 67 62
P2 70.2523544 3.55911734 63 57
P3 85.728466 3.3846284 88 79
P4 83.6394984 4.14062658 90 80
P5 81.9286016 7.48952748 71 89
P6 72.7956743 1.68195451 69 77
P7 91.3090278 6.4901295 98 80
P9 88.8995306 6.4750755 80 97
La Figura 4.2 presenta un gráco de barras que resume los datos de HR recopilados
Fernandez, 2008; Shi et al., 2007), lo que hace posible comparar el resultado de la
ejecución de las tareas con la linea base de la señal. La barra azul representa el estado
con VQI, mientras que no fue el caso para los participantes 1, 3, 4, 5, 6, 8, 10 y 14 que
elementos grácos para estructurar una consulta SQL y/o el aumento en el nivel de
esto podría deberse a que los participantes debían de recordar la sintaxis de SQL.
49
Capítulo 4. Resultados y discusión
Al nal del uso de cada interfaz, se les pidió a los participantes que contestaran un
cuestionario SUS con preguntas subjetivas sobre la usabilidad. Los datos recolectados
representa una medida compuesta de la usabilidad general del sistema. Este puntaje
Figura 3.7).
Los resultados del cuestionario para VQI por cada usuario se pueden ver en la Figura
4.3.
50
4.1. Caracterización de los datos recolectados
Los resultados del cuestionario para CLQI por cada usuario se pueden ver en la
Figura 4.4.
promedio para VQI fue 77.14, que equivale a 80 %, mientras que el puntaje promedio
51
Capítulo 4. Resultados y discusión
para CLQI fue 73, que equivale a 67 %. Entonces se podría decir que los participantes,
valoraron más a VQI que a CLQI, y esto se ve reejado en los resultados, dado que la
del cuestionario SUS y la escala de Sauro y Lewis (2016) correspondiente a cada valor,
obteniendo para VQI los resultados que se muestran en la Tabla 4.3 y para CLQI en la
Tabla 4.4.
Tabla 4.3: Relación puntaje SUS y escala Sauro y Lewis (2016) para VQI por
participante
P1 65 C P8 87.5 A+
P2 57.5 D P9 65 C
P3 82.5 C- P10 90 A+
P4 67.5 C P11 75 B
P5 80 A- P12 80 A-
P6 60 D P13 82.5 A
P7 70 C P14 65 C
Del mismo modo, se realizó para CLQI obteniendo los resultados que se muestran
en la Tabla 4.4.
Tabla 4.4: Relación puntaje SUS y escala Sauro y Lewis (2016) para CLQI por
participante
P1 60 D P8 82.5 A
P2 85 A+ P9 65 C
P4 75 B P11 87.5 A+
P5 85 A+ P12 77.5 B+
52
4.2. Predicción de usabilidad a partir del ritmo cardiaco
los datos del ritmo cardiaco de cada participante al usar dicha interfaz, así como la
P1 65.0810074 1.28864191 75 70 D
P2 84.7693926 1.40741004 88 83 A+
P3 60.7043108 0.84835626 61 59 B+
P4 64.682913 1.65269478 65 61 B
P5 76.934157 4.08018477 77 70 A+
P6 70.6031716 0.06426228 73 71 C-
P9 90.4395007 5.55363821 93 83 C
53
Capítulo 4. Resultados y discusión
P1 64.6087529 2.73555911 67 62 C
P2 70.2523544 3.55911734 63 57 D
P3 85.728466 3.3846284 88 79 C-
P4 83.6394984 4.14062658 90 80 C
P5 81.9286016 7.48952748 71 89 A-
P6 72.7956743 1.68195451 69 77 D
P7 91.3090278 6.4901295 98 80 C
P9 88.8995306 6.4750755 80 97 C
Cada conjunto de datos fue utilizado como entrada en el árbol de decisión. Para ello
La Figura 4.5 describe los elementos de cada nodo del árbol resultante.
54
4.2. Predicción de usabilidad a partir del ritmo cardiaco
Por el ejemplo, donde se observa value = [1, 5, 1, 2, 1, 2, 2], el primer valor indica
Estas pruebas se realizaron utilizando el 100 % del conjunto de datos. Por cada
atributo del conjunto de datos VQI Y CLQI, el algoritmo CART divide el conjunto
55
Capítulo 4. Resultados y discusión
56
4.2. Predicción de usabilidad a partir del ritmo cardiaco
57
Capítulo 4. Resultados y discusión
al. (2011). Se puede apreciar en la Figura 4.10 la precisión de clasicación adquirida del
conjunto de datos VQI fue de 88.88 % y de igual forma en la Figura 4.11, se observa que
la precision para CLQI fue de 91.66 %. Por otro lado, el iterador StratiedKFold es una
para mantener las proporciones entre las clases del conjunto de datos original, lo que
suele dar mejores estimaciones del sesgo y la varianza del modelo. El porcentaje para
VQI fue 86.7 % de igual forma se puede ver en la Figura 4.10 y el porcentaje para CLQI
4.3. Resumen
En este capítulo se presentaron los resultados del estudio exploratorio con el objetivo
la utilización de cada una de las dos interfaces que se prepararon para el estudio.
cuestionario SUS para cada interfaz y por cada participante. Los datos anteriores fueron
58
Capítulo 5
5.1. Conclusiones
Como se ha visto, no existe un estándar"para la medición siológica y las pruebas
de usabilidad. En cambio, se encontró que el ritmo cardiaco, puede ser útil, según el
contexto de estudio.
para recuperar los datos del ritmo cardíaco y obtener datos cuantitativos para
obtenido el conjunto de datos e ingresarlos como entrada al árbol de decisión tipo CART,
entre los datos siológicos y una calicación tradicional de evaluación de usabilidad. Sin
embargo, los investigadores de usabilidad deben ser conscientes de que, las respuestas
59
Capítulo 5. Conclusiones y Trabajo Futuro
recopilaron los datos, así como también con la descripción que los usuarios hacen de su
experiencia.
Por otro lado, se puede decir que la técnica utilizada no sustituye al especialista de
usabilidad, sin embargo, si constituyen una herramienta para facilitar el análisis de este
tipo de pruebas.
la respuesta siológica.
para dar continuidad al esfuerzo invertido. Por esto, esta sección pretende mostrar el
trabajo futuro que es necesario realizar para seguir avanzando en la relación de las
participantes. Esto implica que los datos pudieran no ser sucientes para la extracción
60
5.2. Trabajo Futuro
información que puede relacionarse con la calicación nal del usuario. Sin
61
Referencias
Arroyo Vázquez, N. (2011). Informe apei sobre usabilidad. Gijón: APEI, Asociación
Chipantiza, C., Lewis, V., Mazón Olivo, B. E., Calva, C., y Jeorwin, J. (2015). La
usabilidad en el desarrollo de software. Machala: Ecuador.
Cruz, Y. P., Collazos, C. A., y Granollers, T. (2015). The thin red line between usability
63
Bibliografía
Foglia, P., Zanda, M., y Trading, I. (2014). Towards relating physiological signals
Forne, M. (2012). Physiology as a tool for ux and usability testinga comparative study
of pupil size and other physiological measures.
Free, C., Phillips, G., Felix, L., Galli, L., Patel, V., y Edwards, P. (2010). The
Lin, T., Omata, M., Hu, W., y Imamiya, A. (2005). Do physiological data relate
computer-human interaction: Citizens online: Considerations for today and the future
(pp. 110).
Martín, A. E., Gaetán, G., Saldaño, V. E., Pires, A., Miranda, G., Villagra, S., . . . Sosa,
64
Bibliografía
senales eeg en el contexto de sistemas bci (brain computer interface) (Tesis de Master
no publicada).
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., . . .
Rawassizadeh, R., Price, B. A., y Petre, M. (2014, diciembre). Wearables: Has the
Sauro, J., y Lewis, J. R. (2016). Quantifying the user experience: Practical statistics
for user research. Morgan Kaufmann.
65
Bibliografía
Shi, Y., Ruiz, N., Taib, R., Choi, E., y Chen, F. (2007). Galvanic skin response (gsr)
Shneiderman, B., Plaisant, C., Cohen, M. S., Jacobs, S., Elmqvist, N., y Diakopoulos,
Udovivic, G., Derek, J., Russo, M., y Sikora, M. (2017). Wearable emotion recognition
system based on gsr and ppg signals. En Mmhealth 2017: Workshop on multimedia
for personal health and health care.
Wagner, J., Kim, J., y André, E. (2005). From physiological signals to emotions:
Implementing and comparing selected methods for feature extraction and classica-
tion. En Multimedia and expo, 2005. icme 2005. ieee international conference on (pp.
940943).
Yao, L., Liu, Y., Li, W., Zhou, L., Ge, Y., Chai, J., y Sun, X. (2014). Using physiological
66
Apéndice A
Instrumentos de medición
de los participantes.
67
Formato de Consentimiento
Pruebas con usuarios - Sistema “EASYBD”
Fecha: 12 de junio de 2017 Lugar: Facultad de Informática – Salón MSICU
El propósito de este estudio de usabilidad es evaluar la interfaz del sistema de base de datos que se
ha desarrollado. Como voluntario del estudio, su participación será anónima. Se le pedirá realizar
una serie de tareas, así como contestar un cuestionario al terminar su ejecución. La prueba podrá
ser videograbada, en cuyo caso se garantiza que el uso de la grabación será únicamente para
estudiar las características del sistema y estrictamente confidencial. La prueba tomará
aproximadamente un total de 50 minutos. Si alguno de los participantes por alguna razón está
inconforme con la prueba, podrá dar por terminada su participación en el momento que lo desee.
________________________ ________________________
69
Datos del usuario
Pruebas con usuarios - Sistema “EASYBD”
Fecha: 12 de junio de 2017 Lugar: Facultad de Informática – Salón MSICU
SELECT * FROM tabla1 INNER JOIN SELECT atributo1,.. FROM tabla1 INNER JOIN
tabla2 WHERE tabla1.columna1 = tabla2 WHERE tabla1.columna1 =
tabla2.columna1 tabla2.columna1
SELECT * FROM tabla1 INNER JOIN SELECT FROM tabla1 INNER JOIN tabla2 WHERE
tabla2; tabla1.columna1 = tabla2.columna1
Bibliografía
71
Cuestionario SUS
Pruebas con usuarios - Sistema “EASYBD”
Fecha: 12 de junio de 2017 Lugar: Facultad de Informática – Salón MSICU
Instrucciones: Por cada pregunta selecciona una opción que consideres es la adecuada.
Completamente Completamente
de acuerdo en desacuerdo
1. Creo que me gustaría utilizar este sistema 1 2 3 4 5
frecuentemente