Está en la página 1de 10

12/27/2011

Lingüística e Informática
1. Introducción, términos y definiciones
2. Codificación

1
12/27/2011

¿Procesar el lenguaje?

Emisor Receptor
Mensaje

¿Procesar el lenguaje?
Emisor
codificar
(generar)

Sistema
lingüístico

signos
+
reglas
(relaciones entre
estos signos)

2
12/27/2011

¿Procesar el lenguaje?

Receptor

descodificar
(analizar)

signos
+
Sistema reglas
lingüístico (relaciones entre estos
signos)

¿Procesar el lenguaje?
Emisor
codificar
(generar)

Sistema
lingüístico

signos
+
reglas
(relaciones entre
estos signos)

3
12/27/2011

¿Procesar el lenguaje?

Receptor

descodificar
(analizar)

signos
+
Sistema reglas
lingüístico (relaciones entre estos
signos)

Términos

Lingüística Informática

Lingüística
computacional
Lingüística Procesamiento
informática del Lenguaje
Natural (PLN)
Ingeniería
Tecnologías del lingüística
lenguaje

4
12/27/2011

Lingüística Computacional vs. Lingüística


Informática

Computational Linguistics

Término acuñado por David Hays


a mediados de los sesenta

Español Español

Lingüística Computacional Lingüística Informática

* Uso actual

Lingüística Computacional vs.


Procesamiento del Lenguaje Natural

• El encuentro entre la Lingüística y la Informática ha dado lugar a dos


enfoques principales

Enfoque lingüístico Enfoque informático

Lingüística Procesamiento del


Computacional Lenguaje Natural

5
12/27/2011

Ingeniería Lingüística y Tecnologías del


Lenguaje

• La ingeniería lingüística y tecnologías del lenguaje

• Las industrias del lenguaje

Inicios
• Los primeros intentos de desarrollar sistemas de traducción automática
durante la Guerra Fría
• 1952: El primer congreso celebrado en el MIT (Masachussetes Institute
of Technology) sobre la traducción mecánica
• 1954: El primer número de la revista “Mechanical Translation”
• 1966: El informe de ALPAC (Automatic Language Processing Advisroy
Committee of the National Academy of Sciences)
http://www.nap.edu/openbook.php?isbn=ARC000005

6
12/27/2011

Desarrollo histórico
1952
Congreso
1966
¿Seguir?
Traducción
Informe ALPAC
mecánica

?
Guerra Fría 1966
ELIZA
¿Abandonar?
1954
Revista-
Teorías
Turing
Mechanical 1956
Translation Inteligencia
artificial

¿Seguir?
• Las investigaciones llevadas a cabo han dado resultados acerca de la
naturaleza de la lengua natural, lo cual implica un mayor entendimiento
hacia la automatización de su procesamiento.
• La traducción es un proceso complejo que antes de llegar a ello, es
necesario crear recursos lingüísticos y entender los niveles de análisis
lingüísticos y los métodos para procesarlos paso a paso.

7
12/27/2011

1. Introducción, términos y definiciones

2. Codificación

Codificación
Los ordenadores procesan señales eléctricas en código
binario

010100110000100100
100010101001010101

8
12/27/2011

Sistemas de codificación

Las palabras y las oraciones de un texto se crean a partir


de caracteres. Algunos ejemplos de caracteres
incluyen la letra latina á, el ideograma chino 請, el
carácter devanagari ह o el carácter árabe ‫ض‬

Sistemas de codificación
¿Qué es la codificación de caracteres?
• A cada carácter se le asigna un número en particular. Estos
números se representarán en el ordenador por uno o más bytes.

9
12/27/2011

Sistemas de codificación
¿Qué es la codificación de caracteres?

• Es el método que permite convertir un carácter de un lenguaje


natural (alfabeto o silabario) en un símbolo de otro sistema de
representación, por ejemplo en un número, una secuencia de
pulsos eléctricos en un sistema electrónico.

• Esto, con la finalidad de facilitar el almacenamiento de texto en


ordenadores o para facilitar la transmisión de texto a través de la
redes de telecomunicaciones

Sistemas de codificación
• ASCII/ ANSI (1963)
Binario Decimal Representación
0010 0000 32 espacio ( )
0010 1101 45 -
0010 1110 46 .
0010 1111 47 /
0011 0000 48 0
0011 0001 49 1
0011 0010 50 2
0011 0011 51 3
0011 1011 59 ;
0011 1111 63 ?
0100 0000 64 @
0100 0001 65 A
0100 0010 66 B
0100 0011 67 C
0100 0100 68 D
0110 0001 97 a
0110 0010 98 b
0110 0011 99 c
0111 0111 119 w

10

También podría gustarte