Documentos de Académico
Documentos de Profesional
Documentos de Cultura
=====================================
0 Propósito
1 El corpus documental
2 Los niveles del TDC
A) Organización de núcleos
B) Explotación de núcleos
B1) Representaciones de los núcleos organizados
B2) Interrogación del corpus QUIJ completo.
Archivo de resultados (de esa interrogación)
0 Propósito
[…]
1 El Corpus documental
Nuestro corpus documental (QUIJ) está constituido por el texto completo del libro (El
ingenioso hidalgo don Quijote de la Mancha), en versión del proyecto Gutenberg
(Project Gutenberg Etext of Don Quixote, by Cervantes, in Spanish).
El texto del libro se organiza en:
1.1 Texto completo. En dos versiones:
1a) Un directorio con la versión completa en ANSI del texto, llamado TC_ANSI;
El archivo se denomina QUIJANSI.TXT
Eventualmente se trabajará con un archivo en formato *.DOC (de
Microsoft) – QUIJANSI.DOC
1b) Un directorio con la versión completa en ASCII del texto, llamado
TC_ASCII.
El archivo se denomina QUIJASCI.TXT
- 1 Título
- 2 Tasa
- 3 Testimonio de las erratas
- 4 El Rey
- 5 Al Duque de Béjar
- 6 PRÓLOGO
- 7 Al Libro de Don Quijote de la Mancha
- 8 Amadís de Gaula a Don Quijote de la Mancha (soneto)
- 9 Don Belianís de Grecia a D.Q. de la M. (soneto)
- 10 La Señora Oriana a Dulcinea del Toboso (soneto)
- 11 Gandalín escudero de Amadís de Gaula, a Sancho Panza, escudero
de D.Q. (soneto)
- 12 Del donoso, poeta entreverado, a Sancho Panza y Rocinante
- 13 Orlando Furioso a D.Q. de la M. (soneto)
- 14 El caballero del Febo a D. Q. de la M. (soneto)
- 15 De Solisdán a D. Q. de la M. (soneto)
- 16 Diálogo entre Babieca y Rocinante (soneto).
1) Tasa
2) Fe de erratas
3) Aprobación (de Gutierre de Cetina)
4) Aprobación (de Josef de Valdivielso)
5) Aprobación (de Márquez Torres)
6) Privilegio
7) PRÓLOGO al lector
8) Dedicatoria – Al Conde de Lemos
A) Organización de núcleos.
Terminología de emergencia:
►Núcleo de indización = sistema de términos de indización derivados (à
Proceso de derivación) de un texto (documento) concreto. A ese núcleo se le
aplica una Organización.
B) Explotación de núcleos:
ààà
3.2.1 Terminología
3.2.2 Teclas rápidas y funciones
3.2.3 Primer paseo por MicroConcord
DGSIRD-2005
categoremas
MICROSEMÁNTICA DEFINICIONAL
sincategoremas
[2] Pues bien, cuando consideramos una línea de concordancia y, con mayor precisión,
dentro de ella el horizonte izquierdo y derecho de la palabra-de-búsqueda, observamos
que hay una notable analogía con el definiente de una definición léxica.
En efecto, las palabras co-locadas, e.d., las palabras que coaparecen varias veces dentro
del horizonte izquierdo y derecho de (toda) una concordancia --a una distancia, por
defecto, de 3,3 (un máximo de 3ª palabra por la izquierda y 3ª palabra por la derecha)--
guardan una relación semántica con la palabra-de-búsqueda.
Por lo común, esa relación es meramente asociativa.
[3] Esa analogía entre la definición y la concordancia encuentra su fundamento en un
hecho semántico: El acceso al significado de un término, hemos repetido, puede ser : 1)
etimológico, 2) léxico (o semántico), y 3) usual o contextual (o pragmático). Pues bien,
la definición (más precisamente) el definiente representa el segundo tipo de acceso
(semántico) , y la concordancia representa el tercero (pragmático)
[4] Con todo, esa analogía estaría más ajustada si, en el diseño del concordador, la
selección de una línea de concordancia no estuviera construida desde lo que llamaremos
el principio aleatorio sino desde el principio oracional, que proponemos. El principio
aleatorio decide que: a) la palabra-de-búsqueda está en el centro de la línea, y b) los
límites del texto de la línea de concordancia están definidos por el número máximo de
caracteres en ésta; o, si se prefiere, b-bis) que los límites para el número de palabras del
horizonte por la izquierda y del horizonte por la derecha se fijen uniformemente para
todas las líneas. A diferencia de esto, el principio oracional establece que: a’) la
palabra-de-búsqueda está en el interior de una oración gramatical, y b’) los límites del
texto de la línea son los límites de dicha oración gramatical.
El principio oracional lo apliqué años atrás como macro del procesador de texto
WordPerfect 5.1, “KWIF-CLA.WPM” (dentro del software TRATADOC vers.
0.1), en mi comunicación “Elaboración de documentos ‘asistida’ por ordenador:
avance de un microsistema para la organización del conocimiento”, recogida en
Fco. Javier García Marco (Ed.): Organización del Conocimiento en Sistemas de
Información y Documentación. Actas del I Encuentro de ISKO-España. Madrid,
4 y 5 de Nov. De 1993. Zaragoza, 1995, 229-245; p. 240.:
[5] Uno de los argumentos en pro de principio oracional vs. pincipio aleatorio consiste
en ponernos en uno de estos dos supuestos: 1º) un conjunto de líneas de concordancia
en las que la palabra-de-búsqueda es la primera palabra de una oración; 2º) un conjunto
de líneas de concordancia en las que la palabra-de-búsqueda es la última palabra de una
oración. En el primer supuesto, ninguna de las palabras co-locadas en el horizonte por la
izquierda tiene por qué mantener una relación semántica relevante con la palabra de
búsqueda. Lo mismo ocurre en el segundo supuesto, con las palabras co-locadas en el
horizonte por la derecha…
Mantener otra actitud sería análogo a sostener que rige relación semántica relevante
entre dos términos pertenecientes a dos definientes distintos de una misma forma de
palabra; e.d., pertenecientes a dos acepciones definicionales distintas de un mismo
definiendo (definiendum).
[…]
3.2.1.2 Terminología
A) Concordancia
Una concordancia de una palabra es una lista o índice de todas las apariciones de esa
palabra en un texto dado o grupo de textos (un ‘Corpus’) junto con algún contexto antes
y/o después de esa palabra.
B) Palabra-de-búsqueda
La forma más común de concordancia se conoce como concordancia KWIC
[KWIC concordance] -Palabra Clave en Contexto [Key Word In Context]-. Esto es lo
que MicroConcord nos proporciona, aunque la Palabra Clave se refiere como la
Palabra de Búsqueda [Search Word].
C) Horizonte
Se llama horizonte [horizon] a la distancia en palabras, tanto a la izquierda como a la
derecha de la palabra-de-búsqueda, dentro de cuyo alcance se encuentra(n) la(s)
palabra(s) de contexto. El horizonte se puede fijar; por ej., en 3/3: tres palabras a la
izquierda y otras tantas a la derecha de la palabra-de-búsqueda.
Por otra parte, combinando la tecla Ctrl con las teclas de flecha hacia la derecha,
podemos hacer aparecer hasta tres ventanillas como ésa:
Una vez mostradas las 2 o 3 ventanas, con la combinación de Ctr, más las flechas hacia
la izquierda o hacia la derecha, vamos seleccionando la ventanilla de co-locaciones que
nos interese:
Una vez seleccionada una ventanilla (con sólo las teclas de flecha hacia la derecha o
hacia la izquierda), podemos ordenar el listado alfabéticamente o por frecuencias:
Pulsando Esc., desaparecen todas las ventanillas de co-locados que estén activas: