Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aclaración: No se requiere ser abogada/o para razonar estos casos, más allá de que se trata
de sentencias dictadas en los juicios de personas que se accidentan en la vía pública. Esto
puede ser razonado en términos de datos. Es importante comprender la lógica para
encontrar patrones en los datos para etiquetar los datasets, que luego será el insumo del
equipo de programación.
1) Realizar una lectura exploratoria de los documentos adjuntos que se refieren a la temática
de accidentes de tránsito. En algunos de ellos se acredita la existencia de nexo causal1 y en
otras se produce la ruptura del nexo.
TIP: En este primer paso, es importante tener en cuenta no sólo el contenido del texto en sí
mismo, sino el documento en su totalidad: cómo se estructura, cómo aparece determinada
información, relevancia de fragmentos, etc.
2) Una vez realizada la lectura exploratoria, es necesario comenzar a leer documento por
documento con más detalle.
TIP: Resulta conveniente comenzar a marcar en los documentos los párrafos que parecen ser
importantes para ubicar los criterios a detectar. Esto puede hacerse resaltando con un color
llamativo o subrayando dichos fragmentos.
CONCEPTO: Palabras o frases claves: También denominadas “keywords”; éstas pueden consistir
en un conjunto de frases o palabras que pueden representar un patrón. Es decir, cuando una
keyword se encuentra en una sentencia, se convierte en la materialización del criterio buscado
en el texto.
1
Nexo causal: Expresión utilizada en derecho para referir a la relación existente entre una acción o una
omisión ilícita y el daño que ésta provoca y, como consecuencia, la obligación de indemnizar.
4) Una vez identificadas las keywords, es necesario volcarlas a una base de clasificación por
criterios. Es necesario ser muy prolijo/a en esta etapa porque la base será la que recibirá el
equipo de programación para cargar al sistema predictivo.
a) Una base denominada “de verificación”: Esta base también deberá ser entregada al
equipo de programación y resulta de gran importancia porque permite comparar el
análisis humano con lo que arroje el sistema al ser testeado.
En función de esta base, logramos obtener las tasas de acierto.
En ella se coloca el nombre del documento que se está analizando, y se completa con
SI o con NO según corresponda.
b) Una base denominada “de keywords”. En ella, como su nombre lo indica, se incluyen
todas las palabras o frases clave que fueron detectadas humanamente según el criterio
al que correspondan.
La columna a completar es la figura con el nombre de "keywords".