Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Plan
• Proyecto POSTDATA
• Corpus
• Herramientas de análisis
– Métrica
– Encabalgamiento
• Resultados
– Métrica
– Encabalgamiento
• Discusión
2
Proyecto POSTDATA
3
Proyecto POSTDATA
• Proyecto POSTDATA
• Corpus
• Herramientas de análisis
– Métrica
– Encabalgamiento
• Resultados
– Métrica
– Encabalgamiento
• Discusión
5
Corpus (sonetos)
8
Corpus (sonetos)
9
Corpus DISCO
10
Corpus DISCO
11
Corpus DISCO: HTML original
12
Corpus DISCO: HTML original
13
Corpus DISCO: HTML original
14
Corpus DISCO: Extracción de metadatos
• Género
• Fechas de nacimiento y fallecimiento
• Origen: lugar, país, continente
• Identificador de VIAF
15
Corpus DISCO: Extracción de metadatos
16
Corpus DISCO: Extracción de metadatos
+
17
Corpus DISCO: Metadatos
18
Corpus DISCO: Metadatos
19
Corpus DISCO: Metadatos
20
Corpus DISCO: Metadatos
1
2
21
Corpus DISCO: Metadatos
1
2
22
Corpus DISCO: Metadatos
1
2
3
4
23
Corpus DISCO: Metadatos
1
2
3
4
24
Corpus DISCO: Metadatos
1
2
3
4
25
Corpus DISCO: Metadatos
1
2
3
4
26
Plan
• Proyecto POSTDATA
• Corpus
• Herramientas de análisis
– Métrica
– Encabalgamiento
• Resultados
– Métrica
– Encabalgamiento
• Discusión
27
Análisis métrico (ADSO, Navarro 2017)
28
Ambigüedad métrica (Navarro 2017)
31
Análisis métrico (ADSO, Navarro 2017)
32
Análisis métrico (ADSO, Navarro 2017)
33
Análisis métrico (ADSO, Navarro 2017)
34
Análisis métrico (ADSO, Navarro 2017)
35
Trabajo en curso sobre escansión
36
Plan
• Proyecto POSTDATA
• Corpus
• Herramientas de análisis
– Métrica
– Encabalgamiento
• Resultados
– Métrica
– Encabalgamiento
• Discusión
37
Encabalgamiento: definición
38
Encabalgamiento: definición
EJEMPLO
1. Prefiero
2. quedarme desnuda //
3. de amigo insincero
INTERPRETACIONES
a) desnuda (sin ropa)
b) desnuda de amigo insincero (sin tal persona)
39
Encabalgamiento: definición
EJEMPLO
1. Prefiero
2. quedarme desnuda //
3. de amigo insincero
INTERPRETACIONES
a) desnuda (sin ropa)
b) desnuda de amigo insincero (sin tal persona)
40
Encabalgamiento: definición
EJEMPLO
1. Prefiero
2. quedarme desnuda //
3. de amigo insincero
INTERPRETACIONES
a) desnuda (sin ropa)
b) desnuda de amigo insincero (sin tal persona)
41
Encabalgamiento: debates actuales
42
Contribución de la automatización
Ruiz et al (2017); Martínez et al. (2018)
• Recopilar ejemplos sistemáticamente, a
partir de grandes corpus
• Ejemplos que puedan dar luz sobre los
debates actuales en torno al fenómeno
• Proporcionar evidencia cuantitativa sobre el
uso del fenómeno en distintos géneros y
periodos
43
El encabalgamiento en español
44
El encabalgamiento en español
46
Encabalgamiento: tipología
Algunos tipos sirremáticos
Sintagmas nominales Sintagmas verbales
o adjetivos
• determinante + sustantivo • verbo + adverbio
• sustantivo o adjetivo + • clítico + verbo
complem. preposicional • tiempos compuestos
• adj + sustantivo • verbo + suplemento
• adj + adverbio
TIPOLOGÍA COMPLETA
• https://sites.google.com/site/spanishenjambment
47
Encabalgamiento: detección automática
48
Encabalgamiento: detección automática
IXA Pipes
(Agerri et al, 2014)
49
Encabalgamiento: detección automática
Reglas +
diccionarios
50
Encabalgamiento: reglas
• Aproximadamente 30 reglas
• Basadas en secuencias de categorías
gramaticales
• Su aplicación puede estar restringida a
ciertos elementos léxicos (lemas o formas)
• Pueden estar basadas en funciones
sintácticas (dependencias)
51
Encabalgamiento: ejemplo de regla
52
Detección automática: evaluación
• Corpus de referencia:
– 1000 versos del siglo XX
– 100 sonetos (1400 versos) de los siglos XV a XIX
(con 30% del XIX)
– Cubre una variedad de tipos de encabalgamiento
53
Evaluación: tareas
• Detección
– Los pares de versos propuestos por el sistema
deben estar en la referencia
• Clasificación
– Tanto los pares de versos propuestos por el
sistema como el tipo propuesto deben coincidir
con la referencia
54
Evaluación: resultados
N P R F1
detección 277 84.19 88.45 86.27
S. XX
clasificac. 277 78.50 83.03 80.70
N P R F1
Dia- detección 260 74.18 87.64 80.35
crónico clasificac. 260 61.24 72.31 66.31
55
Evaluación: resultados
N P R F1
detección 277 84.19 88.45 86.27
S. XX
clasificac. 277 78.50 83.03 80.70
N P R F1
Dia- detección 260 74.18 87.64 80.35
crónico clasificac. 260 61.24 72.31 66.31
56
Fuentes de error
• Diferentes patrones de error en el siglo XX y
en el corpus diacrónico
• S. XX: Además de errores por las reglas,
errores comunes del motor de PLN fueron:
– Análisis de sintagmas preposicionales
– Confusión entre el sujeto y el objeto directo
ANJA
Automatic enNJambment
Analysis
http://prf1.org/anja/index/
58
Plan
• Proyecto POSTDATA
• Corpus
• Herramientas de análisis
– Métrica
– Encabalgamiento
• Resultados
– Métrica
– Encabalgamiento
• Discusión
59
Resultados
• Comparación y enriquecimiento de los
resultados de:
60
Resultados
• Comparación y enriquecimiento de los
resultados de:
61
Resultados
• Mismos tipos de análisis que BN16
• Aplicados al corpus DISCO
• Aplicados a:
– métrica
– encabalgamiento
– la interacción entre los dos
• Según permiten los metadatos de DISCO
– fechas
62
Resultados: interés
• Mismos tipos de análisis que BN16
• Aplicados al corpus DISCO
• Aplicados a:
– métrica
– encabalgamiento
– la interacción entre los dos
• Según permitan los metadatos de DISCO
– ¿fechas?
• Autores conocidos vs. poco estudiados
63
Resultados: plan
Comparación entre DISCO y ADSO
65
Comparaciones posibles
• En DISCO_SO tenemos el SIGLO, no fechas
exactas de vida, para una proporción
importante de los autores
66
Comparaciones posibles
• En DISCO_SO tenemos el SIGLO, no fechas
exactas de vida, para una proporción
importante de los autores
67
Comparaciones posibles
• Comparar todo DISCO_SO con todo ADSO y
DISCO_XIX
– unigramas y bigramas métricos
– combinaciones de patrones binarios y ternarios
– encabalgamiento
68
Patrones métricos por (sub)corpus
69
Patrones métricos por (sub)corpus
70
Patrones métricos por (sub)corpus
71
Patrones métricos por (sub)corpus
72
Correlaciones: unigramas métricos
73
Correlaciones: unigramas métricos
74
Bigramas métricos por subcorpus
DISCO_SO ADSO
3-6-10 | 3-6-10 0.55 2-4-8-10 | 2-4-8-10 0.87
2-6-10 | 3-6-10 0.52 2-6-10 | 2-6-10 0.73
2-6-10 | 2-6-10 0.46 2-6-10 | 3-6-10 0.67
3-6-10 | 2-6-10 0.45 3-6-10 | 3-6-10 0.66
2-4-8-10 | 2-4-8-10 0.44 3-6-10 | 2-6-10 0.66
2-6-10 | 2-4-6-10 0.42 2-4-8-10 | 2-6-10 0.60
2-4-8-10 | 2-4-6-10 0.42 2-6-10 | 2-4-8-10 0.59
2-4-6-10 | 2-4-8-10 0.41 3-6-10 | 2-4-8-10 0.56
2-4-6-10 | 2-6-10 0.35 2-6-10 | 2-4-6-10 0.54
2-4-6-10 | 2-4-6-10 0.35 2-4-8-10 | 3-6-10 0.54
75
Bigramas métricos por subcorpus
DISCO_SO ADSO
3-6-10 | 3-6-10 0.55 2-4-8-10 | 2-4-8-10 0.87
2-6-10 | 3-6-10 0.52 2-6-10 | 2-6-10 0.73
2-6-10 | 2-6-10 0.46 2-6-10 | 3-6-10 0.67
3-6-10 | 2-6-10 0.45 3-6-10 | 3-6-10 0.66
2-4-8-10 | 2-4-8-10 0.44 3-6-10 | 2-6-10 0.66
2-6-10 | 2-4-6-10 0.42 2-4-8-10 | 2-6-10 0.60
2-4-8-10 | 2-4-6-10 0.42 2-6-10 | 2-4-8-10 0.59
2-4-6-10 | 2-4-8-10 0.41 3-6-10 | 2-4-8-10 0.56
2-4-6-10 | 2-6-10 0.35 2-6-10 | 2-4-6-10 0.54
2-4-6-10 | 2-4-6-10 0.35 2-4-8-10 | 3-6-10 0.54
76
Bigramas métricos por subcorpus
DISCO_SO ADSO
3-6-10 | 3-6-10 0.55 2-4-8-10 | 2-4-8-10 0.87
2-6-10 | 3-6-10 0.52 2-6-10 | 2-6-10 0.73
2-6-10 | 2-6-10 0.46 2-6-10 | 3-6-10 0.67
3-6-10 | 2-6-10 0.45 3-6-10 | 3-6-10 0.66
2-4-8-10 | 2-4-8-10 0.44 3-6-10 | 2-6-10 0.66
2-6-10 | 2-4-6-10 0.42 2-4-8-10 | 2-6-10 0.60
2-4-8-10 | 2-4-6-10 0.42 2-6-10 | 2-4-8-10 0.59
2-4-6-10 | 2-4-8-10 0.41 3-6-10 | 2-4-8-10 0.56
2-4-6-10 | 2-6-10 0.35 2-6-10 | 2-4-6-10 0.54
2-4-6-10 | 2-4-6-10 0.35 2-4-8-10 | 3-6-10 0.54
77
Bigramas métricos por subcorpus
DISCO_SO ADSO
3-6-10 | 3-6-10 0.55 2-4-8-10 | 2-4-8-10 +0.39
2-6-10 | 3-6-10 0.52 2-6-10 | 2-6-10 +0.37
2-6-10 | 2-6-10 0.46 2-6-10 | 3-6-10 +0.21
3-6-10 | 2-6-10 0.45 3-6-10 | 3-6-10 +0.11
2-4-8-10 | 2-4-8-10 0.44 3-6-10 | 2-6-10 +0.22
2-6-10 | 2-4-6-10 0.42 2-4-8-10 | 2-6-10
2-4-8-10 | 2-4-6-10 0.42 2-6-10 | 2-4-8-10
2-4-6-10 | 2-4-8-10 0.41 3-6-10 | 2-4-8-10
2-4-6-10 | 2-6-10 0.35 2-6-10 | 2-4-6-10 +0.12
2-4-6-10 | 2-4-6-10 0.35 2-4-8-10 | 3-6-10 78
Bigramas métricos por subcorpus
79
Bigramas métricos por subcorpus
80
Bigramas métricos por subcorpus
81
Bigramas métricos por subcorpus
82
Correlaciones: bigramas métricos
83
Correlaciones: bigramas métricos
84
Secuencias ternario-binario
• A examinar:
– Si este patrón es típicamente áureo
– Si está relacionado con ciertas posiciones en
el soneto
85
Secuencias ternario-binario
86
Secuencias ternario-binario
• Binario
– (2 y 6) o (4 y 8 pero no 1)
• Ternario
– (3 y 6) y (ni 2 ni 4)
• No clasificado
87
Secuencias ternario-binario
• Binario
– (2 y 6) o (4 y 8 pero no 1)
• Ternario
– (3 y 6) y (ni 2 ni 4)
• No clasificado
88
Secuencias ternario-binario
89
Secuencias ternario-binario
90
Secuencias ternario-binario
92
Resumen características métricas
93
Encabalgamiento
94
Distribución de versos con encabalgamiento
por período en sonetos
ADSO DISCO_SO
95
Distribución de versos con encabalgamiento
por período en sonetos
ADSO DISCO_SO
96
Distribución de versos con encabalgamiento
por período en sonetos
Siglos XV a XVII DISCO_XIX
97
Distribución de versos con encabalgamiento
por período en sonetos
DISCO_SO DISCO_XIX
98
Herrera, 1580. Anotaciones (Obras de Garcilaso de
la Vega.). Sevilla, Alonso de la Barrera., pp. 68-69
99
Encabalgamiento: Herrera sobre Garcilaso
Encabalgamiento: Herrera sobre Garcilaso
Herrera, 1580. Anotaciones (Obras de Garcilaso de
la Vega.). Sevilla, Alonso de la Barrera., pp. 68-69
100
Encabalgamiento: Herrera sobre Garcilaso
102
Distribución de versos con encabalgamiento
por período en sonetos
DISCO_SO DISCO_XIX
103
¿Interacción métrica/encabalgamiento?
104
¿Interacción métrica/encabalgamiento?
105
¿Interacción métrica/encabalgamiento?
106
Resumen
107
Resumen: generalizaciones
108
Resumen: generalizaciones
• Encabalgamiento:
– poco usado a través de frontera de estrofa
– si bien en el Siglo XIX esto se empieza a ver
109
Resumen: limitaciones
110
¡Gracias!
111
pablo.ruiz@linhd.uned.es
@prf1z
http://postdata.linhd.es/
http://linhd.uned.es