Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CUAUTITLN IZCALLI
Cdigo: FO-205P11000FORMATO DE ENTREGA XX
DE EVIDENCIAS
Pgina 1de14
DIVISIN.
ASIGNATURA.
LENGUAJES Y AUTMATAS I
DOCENTE.
NO. DE CONTROL.
GRUPO.
FECHA
N ACTIVIDAD
NOVIEMBRE 2014
PRODUCTO.
CALIFICACIN Y FIRMA
DEL PROFESOR.
Unidad 5
INDICE
UNIDAD 5
ANLISIS LEXICO
5.1
5.2
5.3
5.4
Errores lxicos..........................................................................................8
5.5
5.6
REFERENCIAS BIBLIOGRAFICAS..............................................................13
Pgina 2de14
UNIDAD 5
ANLISIS LEXICO
5.1
Pgina 3de14
DEFINICIONES
Tokens
Smbolos
terminales
una
gramtica
de
Atributos
Informacin adicional que tiene el token, de utilidad para el anlisis sintctico y
semntico.
Componentes lxicos (tokens)
Unidad mnima de informacin que significa algo a la hora de compilar; concepto de
palabra; las fases de un lenguaje constan de cadenas de componentes lxicos.
Lexema
Una secuencia de caracteres de entrada que comprenden un solo componente lxico
se llama lexema; cadena de caracteres que extrae el componente abstracto del
componente lxico.
Patrn
Descripcin de la forma que han de tomarlos lexemas para ajustarse a un componente
lxico.
Otras Funciones
Pgina 4de14
Manejo del fichero de entrada del programa fuente: abrirlo, leer sus caracteres, cerrarlo
y gestionar posibles errores de lectura.
Eliminar comentarios, espacios en blanco, tabuladores y saltos de lnea (caracteres no
vlidos para formar un token).Inclusin de ficheros: # include...
La expansin de macros y funciones in line: # define...
Contabilizar el nmero de lneas y columnas para emitir mensajes de error.
Reconocimiento y ejecucin de las directivas de compilacin (por ejemplo, para depurar
u optimizar el cdigo fuente).
Aspectos del Anlisis Lxico.
a) Diseo ms sencillo
Los smbolos que trata el scanner se describe con una gramtica ms simple que la del
parser, gramtica regular
b) Mejora la eficiencia
Gran parte del tiempo de compilacin se consume en la lectura y exploracin de
caracteres.
c) Mejora la portabilidad
Se pueden tener varias versiones del scanner una para distintos cdigos (EBCDID,
ASCII, ...), con el mismo parser
d) Descarga el anlisis sintctico
Ejemplo; no puedo distinguir en FORTRAN hasta despus del 1
o
DO 5 I=1.25
Pgina 5de14
DO 5 I=1,25
5.2
Operadores aritmticos
Operadores
Relacionales
Operadores lgicos
Operador de asignacin
Identificadores
Constantes
Cadenas
Literales
Signos de puntuacin
Libreras
Lexema
Representan cadenas de caracteres en el programa fuente que se pueden tratar juntos
como una unidad lxica. Un lexema es una secuencia de caracteres en el programa
fuente con la que concuerda el patrn para un componente lxico.
Pgina 6de14
Patrn
Regla que describe el conjunto de lexemas que pueden representar a un determinado
componente lxico en los programas fuente. En otras palabras, es la descripcin del
componente lxico mediante una regla.
Atributos de los componentes lxicos
El analizador lxico recoge informacin sobre los componentes lxicos en sus atributos
asociados. Los componentes lxicos influyen en las decisiones del anlisis sintctico y
los atributos en la traduccin de los componentes lxicos:
Apuntador a la entrada de la Tabla de smbolos donde se guarda la informacin sobre
el componente lxico.
El lexema para un identificador
El nmero de lnea en que se encontr por primera vez.
5.3
Tabla
Conjunto de pares clave-valor, llamados elementos de la tabla. La tabla de smbolos es
una componente necesaria de un compilador. Al declarar un identificador (normalmente
una sola vez), ste es insertado en la tabla. Cada vez que se utilice el identificador se
realizar una bsqueda en la tabla para obtener la informacin asociada (el valor).
Bsqueda
Dada la clave de un elemento, encontrar su valor.
Insercin
Dado un par clave-valor, aadir un elemento nuevo a la tabla.
Cambio de valor
Pgina 7de14
Pgina 8de14
5.4
Errores lxicos
El anlisis lxico constituye la primera fase, aqu se lee el programa fuente de izquierda
a derecha y se agrupa en componentes lxicos (tokens), que son secuencias de
caracteres que tienen un significado. Adems, todos los espacios en blanco, lneas en
blanco, comentarios y dems informacin innecesaria se elimina del programa fuente.
Tambin se comprueba que los smbolos del lenguaje (palabras clave, operadores,...)
se han escrito correctamente.
Como la tarea que realiza el analizador lxico es un caso especial de coincidencia de
patrones, se necesitan los mtodos de especificacin y reconocimiento de patrones, y
estos mtodos son principalmente las expresiones regulares y los autmatas finitos.
Sin embargo, un analizador lxico tambin es la parte del traductor que maneja la
entrada del cdigo fuente, y puesto que esta entrada a menudo involucra un importante
gasto de tiempo, el analizador lxico debe funcionar de manera tan eficiente como sea
posible.
Son pocos los errores simplemente en el nivel lxico ya que tiene una visin muy
restringida de un programa fuente.
El analizador lxico debe devolver el componente lxico de un identificador y dejar a
otra fase se ocupe de los errores.
Suponga que una situacin en la cual el analizador lxico no puede continuar porque
ninguno de los patrones concuerda con un prefijo de la entrada.
Pgina 9de14
5.5
Pgina 10de14
Como las tablas de transiciones son muy escasas, se pueden guardar en una lista
corta que se consulte cada vez que se necesite hacer una transicin a partir de un
estado
Estas listas no suelen tener ms de tres o cuatro elementos, as que su bsqueda ser
razonablemente rpida
5.6
10
Pgina 11de14
Estos son los identificadores definidos (total 49 lexemas) para la tabla de smbolos.
Diagrama de transiciones.
11
Pgina 12de14
12
Pgina 13de14
13
REFERENCIAS BIBLIOGRAFICAS
Acosta,
I.
F. (s.f.).
TECNOLOGICO
MONOGRAFIAS.COM:
DE
LAGUNA.
Obtenido
de
http://www.monografias.com/trabajos-
pdf/automatas-finitos/automatas-finitos.pdf
Cases Muoz , R., & Mrquez Villodre, L. (2002). Lenguajes, gramticas y
autmatas . Mxico D.F: ALFAOMEGA.
DOCUWIKI. (s.f.). Obtenido de
http://sistemas.uniandes.edu.co/~isis1106/dokuwiki/lib/exe/fetch.php?
media=bibliografia:capitulo3.pdf
FILE WORDPRESS. (s.f.). Obtenido de
http://matedis.files.wordpress.com/2011/07/mc3a9todo-dethompson.pdf
G, V. (s.f.). BLOGSPOT. Obtenido de http://automatas-finitos.blogspot.mx/
Galeon.com. (s.f.). Obtenido de http://10380054.galeon.com/u2.htm
INGENIERIA INFORMATICA. (s.f.). Obtenido de
http://ocw.uc3m.es/ingenieria-informatica/teoria-de-automatas-ylenguajes-formales/material-de-clase-1/tema-3-automatas-finitos
ULPCG. (s.f.). Obtenido de
http://www2.dis.ulpgc.es/~mluengo/automatas/teoria/tema2.pdf