Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lingüística e Informática
Lingüística e Informática
Lingüística e Informática
1. Introducción, términos y definiciones
2. Codificación
1
12/27/2011
¿Procesar el lenguaje?
Emisor Receptor
Mensaje
¿Procesar el lenguaje?
Emisor
codificar
(generar)
Sistema
lingüístico
signos
+
reglas
(relaciones entre
estos signos)
2
12/27/2011
¿Procesar el lenguaje?
Receptor
descodificar
(analizar)
signos
+
Sistema reglas
lingüístico (relaciones entre estos
signos)
¿Procesar el lenguaje?
Emisor
codificar
(generar)
Sistema
lingüístico
signos
+
reglas
(relaciones entre
estos signos)
3
12/27/2011
¿Procesar el lenguaje?
Receptor
descodificar
(analizar)
signos
+
Sistema reglas
lingüístico (relaciones entre estos
signos)
Términos
Lingüística Informática
Lingüística
computacional
Lingüística Procesamiento
informática del Lenguaje
Natural (PLN)
Ingeniería
Tecnologías del lingüística
lenguaje
4
12/27/2011
Computational Linguistics
Español Español
* Uso actual
5
12/27/2011
Inicios
• Los primeros intentos de desarrollar sistemas de traducción automática
durante la Guerra Fría
• 1952: El primer congreso celebrado en el MIT (Masachussetes Institute
of Technology) sobre la traducción mecánica
• 1954: El primer número de la revista “Mechanical Translation”
• 1966: El informe de ALPAC (Automatic Language Processing Advisroy
Committee of the National Academy of Sciences)
http://www.nap.edu/openbook.php?isbn=ARC000005
6
12/27/2011
Desarrollo histórico
1952
Congreso
1966
¿Seguir?
Traducción
Informe ALPAC
mecánica
?
Guerra Fría 1966
ELIZA
¿Abandonar?
1954
Revista-
Teorías
Turing
Mechanical 1956
Translation Inteligencia
artificial
¿Seguir?
• Las investigaciones llevadas a cabo han dado resultados acerca de la
naturaleza de la lengua natural, lo cual implica un mayor entendimiento
hacia la automatización de su procesamiento.
• La traducción es un proceso complejo que antes de llegar a ello, es
necesario crear recursos lingüísticos y entender los niveles de análisis
lingüísticos y los métodos para procesarlos paso a paso.
7
12/27/2011
2. Codificación
Codificación
Los ordenadores procesan señales eléctricas en código
binario
010100110000100100
100010101001010101
8
12/27/2011
Sistemas de codificación
Sistemas de codificación
¿Qué es la codificación de caracteres?
• A cada carácter se le asigna un número en particular. Estos
números se representarán en el ordenador por uno o más bytes.
9
12/27/2011
Sistemas de codificación
¿Qué es la codificación de caracteres?
Sistemas de codificación
• ASCII/ ANSI (1963)
Binario Decimal Representación
0010 0000 32 espacio ( )
0010 1101 45 -
0010 1110 46 .
0010 1111 47 /
0011 0000 48 0
0011 0001 49 1
0011 0010 50 2
0011 0011 51 3
0011 1011 59 ;
0011 1111 63 ?
0100 0000 64 @
0100 0001 65 A
0100 0010 66 B
0100 0011 67 C
0100 0100 68 D
0110 0001 97 a
0110 0010 98 b
0110 0011 99 c
0111 0111 119 w
10