Análisis Léxico

Este documento describe el análisis léxico como la primera fase del análisis sintáctico de un lenguaje de programación. Explica que el analizador léxico lee el código fuente, identifica tokens como palabras reservadas e identificadores, y los pasa al analizador sintáctico. También cubre temas como el manejo de búferes, reconocimiento de patrones y recuperación de errores léxicos.

Cargado por

LEYDY NAVARRO

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

245 vistas19 páginas

Análisis Léxico

Cargado por

LEYDY NAVARRO

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Análisis léxico

Edgardo A. Franco
Instituto Politécnico Nacional, México
[Link]
Introducción
Para la construcción de todo traductor, compilador o interprete, es
necesario analizar el texto de entrada de manera eﬁciente.
En el ámbito de compiladores, el análisis léxico es la parte que tiene
contacto directo con el código fuente, el analizador léxico hace las
funciones, a la vez, de preprocesador y de scanner o lexer.
Análisis léxico
● La función principal del analizador léxico consiste en leer los
caracteres de entrada y elaborar como salida una secuencia de
componentes léxicos que utiliza el analizador sintáctico para hacer el
análisis.
● Esta interacción, suele aplicarse convirtiendo al analizador léxico en
una subrutina o corrutina del analizador sintáctico.
○ Recibida la orden “Dame el siguiente componente léxico” del analizador
sintáctico, el analizador léxico lee los caracteres de entrada hasta que pueda
identiﬁcar el siguiente componente léxico.
Análisis Léxico

Interacciones entre el analizador léxico y el analizador sintáctico

Funciones del analizador léxico
● Eliminar o saltar comentarios, espacios en blanco, tabuladores, retorno de carro, ...,
y en general, todo aquello que carezca de signiﬁcado según la sintaxis del lenguaje.
(Preprocesamiento).
● Reconocer los tokens: identiﬁcadores del usuario, números, palabras reservadas
del lenguaje, ..., y tratarlos correctamente con respecto a la tabla de símbolos (sólo
en los casos que debe de tratar con la tabla de símbolos).

Para reconocer el token usa un patrón o regla que describe cómo se forman las cadenas
que corresponden a un token.
Funciones del analizador léxico
● Llevar la cuenta del número de línea por la que va leyendo, por
si se produce algún error, dar información sobre dónde se ha
producido.
● Avisar de errores léxicos. P.g., si @ no pertenece al lenguaje,
avisar de un error, es posible que recupere el error. *No se
encuentre el patrón
● Puede hacer funciones de preprocesador.
○ P.g. Convertir los valores literales al tipo que corresponda.
Tokens y lexemas
● Token:
○ Elemento básico del lenguaje
○ Unidad léxica indivisible
○ Identifica una entidad lógica dentro del lenguaje
○ Incluyen: Palabras Reservadas, Constantes, Operadores, Signos de Puntuación e Identificadores
● Lexema:
○ La cadena original que se identifica como token
○ No hay correspondencia 1-1 entre token-lexema
Tokens y lexemas
Palabras Reservadas
● Una palabra reservada es aquella que inicia con una letra, y es
seguida por letras o dígitos.
● Las palabras clave cumplen con este mismo patrón de construcción
por lo tanto.
○ Se hace necesario un mecanismo que permita decidir cuando una cadena es
una palabra clave o un identificador
■ Solución sencilla: Las palabras reservadas no pueden ser usadas como
identificadores.
Estrategias de recuperación de errores léxicos
● Modo Pánico: obvia los siguientes caracteres de la entrada hasta
encontrar un token bien formado.
● Tratar de Arreglar la entrada:
○ Borrar el carácter extraño
○ Insertar el carácter perdido
○ Reemplazar un carácter incorrecto por uno correcto
○ Encontrar que cambio genera el menor número de errores sintácticos, y
aplicarlo
Manejo de búferes
● El manejo de búferes tiene la intención de mejorar el rendimiento de
esta primera fase donde se hace necesario el acceso al archivo con el
código fuente de entrada.
● El estar continuamente accediendo a llamadas del sistema que operan
con archivos, no siempre es eficiente.
● Es bien conocido que el realizar una transferencia previa de la
información de un archivo a memoria, permitirá obtener una mayor
eficiencia a la hora de procesar dicha información.
Manejo de búferes
● Cuando se implementa analizador léxico se hace necesario manejar un
búfer de entrada para hacer más eficiente la lectura de la cadena de
entrada y así evitar la sobrecarga requerida en el procesamiento de un solo
carácter de entrada.
Manejo de búferes
● Generalmente se define un búfer del tamaño de un bloque de disco (4096 bytes).
● Se maneja un apuntador que marca el inicio del lexema que se está analizando, y
un apuntador que marca el carácter que está siendo analizado.
Manejo de búferes
● Existen ocasiones en que es necesario buscar uno o más
caracteres más allá del siguiente lexema para poder estar
seguros de que tenemos el lexema correcto.
○ P.g. en C los caracteres -, = o < podrán ser un operador o el
principio de otros ->, == o <=.
Manejo de búferes

● Posibilidades
○ Un búfer

○ Par de búferes
Manejo de búferes
Centinelas
● Es un carácter especial que no puede formar parte del programa fuente. (P.g. EOF).

● Entonces EOF signiﬁca:

○ Se llegó al final del 1er búfer y debe ser cargado el segundo.
○ Se llegó al final del 2do búfer y debe ser cargado el primero
○ Se llegó al final del archivo
Implementación del algoritmo
● Se construyen dos buffers, cada búfer de tamaño N, por lo general de un bloque
de disco (4096 bytes).
● Mediante un comando de lectura del sistema podemos leer N caracteres y
colocarlos en el buffer, en vez de utilizar una llamada al sistema por cada carácter.
● Si quedan menos de N caracteres en el archivo de entrada, entonces se coloca un
EOF, marcando el final del archivo fuente.
○ Se mantienen dos apuntadores a la entrada:
■ El apuntador inicioLexema marca el inicio del lexema actual, cuya extensión se está tratando
de determinar.
■ El apuntador avance explora por adelantado hasta encontrar una coincidencia en el patrón.
Implementación del algoritmo
● Una vez que se determina el siguiente lexema, avance se coloca
en el carácter que se encuentra en su extremo derecho.
● Después una vez que el lexema se registra como un valor de
atributo de un token devuelto al analizador sintáctico,
inicioLexema se coloca en el carácter que va justo después del
lexema que acabamos de encontrar.
Implementación del algoritmo
● Para desplazar avance hacia adelante primero tenemos que probar si
hemos llegado al final de uno de los dos búferes, y de ser así, debemos
recargar el otro búfer de la entrada, y mover avance al principio del
búfer recién cargado.
● Siempre y cuando no tengamos que alejarnos tanto del lexema como
para que la suma de su longitud más la distancia que nos alejamos sea
mayor que N (Evitar sobrescribir el lexema en su búfer antes de poder
determinarlo).

También podría gustarte

Introducción a Applets en Java
Aún no hay calificaciones
Introducción a Applets en Java
5 páginas
Componentes de Un Sistema de Computo
Aún no hay calificaciones
Componentes de Un Sistema de Computo
16 páginas
Línea del Tiempo de las Computadoras
100% (1)
Línea del Tiempo de las Computadoras
2 páginas
Mapa Conceptual de Los Paradigmas y Lenguajes de La Programación Representativa
Aún no hay calificaciones
Mapa Conceptual de Los Paradigmas y Lenguajes de La Programación Representativa
1 página
Arquitecturas Paralelas y Distribuidas
Aún no hay calificaciones
Arquitecturas Paralelas y Distribuidas
32 páginas
Programación Lógica y Funcional
100% (1)
Programación Lógica y Funcional
37 páginas
Desarrollo de Sistemas de Información
Aún no hay calificaciones
Desarrollo de Sistemas de Información
3 páginas
Instituto Tecnológico Superior de Macuspana
Aún no hay calificaciones
Instituto Tecnológico Superior de Macuspana
16 páginas
Análisis Semántico en Lenguajes de Programación
Aún no hay calificaciones
Análisis Semántico en Lenguajes de Programación
28 páginas
Cuadro Sinóptico (Historia de Las Bases de Datos y Access
Aún no hay calificaciones
Cuadro Sinóptico (Historia de Las Bases de Datos y Access
7 páginas
Introducción a la Informática y su Historia
Aún no hay calificaciones
Introducción a la Informática y su Historia
10 páginas
Base de Datos Veterinaria
Aún no hay calificaciones
Base de Datos Veterinaria
1 página
Diseño y ETL de Data Warehouse en BDIII
Aún no hay calificaciones
Diseño y ETL de Data Warehouse en BDIII
25 páginas
Generaciones de Los Sistemas Operativos y Lenguajes de Programacion
Aún no hay calificaciones
Generaciones de Los Sistemas Operativos y Lenguajes de Programacion
3 páginas
Manual de Usuario para FAVA SENA
Aún no hay calificaciones
Manual de Usuario para FAVA SENA
25 páginas
Estandarización y Uso de UML en Diseño
Aún no hay calificaciones
Estandarización y Uso de UML en Diseño
1 página
Arquitectura Multi Core
Aún no hay calificaciones
Arquitectura Multi Core
13 páginas
SQL Procedural: Procedimientos y Disparadores
Aún no hay calificaciones
SQL Procedural: Procedimientos y Disparadores
12 páginas
Ejercicio Practico - Variables y Tipos de Datos
Aún no hay calificaciones
Ejercicio Practico - Variables y Tipos de Datos
4 páginas
02 - Ingenieria Web PDF
Aún no hay calificaciones
02 - Ingenieria Web PDF
15 páginas
Conceptos de Bases de Datos
Aún no hay calificaciones
Conceptos de Bases de Datos
49 páginas
Normalización de Bases de Datos
Aún no hay calificaciones
Normalización de Bases de Datos
27 páginas
Evolución y Funcionamiento del Microprocesador
Aún no hay calificaciones
Evolución y Funcionamiento del Microprocesador
2 páginas
4 Proces Paralelo
Aún no hay calificaciones
4 Proces Paralelo
20 páginas
Fundamentos de Ingeniería de Software UACJ
Aún no hay calificaciones
Fundamentos de Ingeniería de Software UACJ
6 páginas
3.1 Procedimientos
Aún no hay calificaciones
3.1 Procedimientos
9 páginas
Instalación de SWI-Prolog paso a paso
Aún no hay calificaciones
Instalación de SWI-Prolog paso a paso
11 páginas
Pasos para un Trabajo de Investigación
Aún no hay calificaciones
Pasos para un Trabajo de Investigación
10 páginas
Código Intermedio y Notación Polaca
Aún no hay calificaciones
Código Intermedio y Notación Polaca
30 páginas
Manejo de Formularios en Informática
100% (1)
Manejo de Formularios en Informática
15 páginas
Comunicación en Sistemas Distribuidos
Aún no hay calificaciones
Comunicación en Sistemas Distribuidos
15 páginas
1.4 Ejercicios Con Funciones de Agregado
Aún no hay calificaciones
1.4 Ejercicios Con Funciones de Agregado
6 páginas
Sistemas de Tipos en Programación
Aún no hay calificaciones
Sistemas de Tipos en Programación
21 páginas
Mapa Mental Modelo Rup
Aún no hay calificaciones
Mapa Mental Modelo Rup
1 página
Modelado de Sistemas en UML
Aún no hay calificaciones
Modelado de Sistemas en UML
9 páginas
Introducción a Bases de Datos y SGBD
Aún no hay calificaciones
Introducción a Bases de Datos y SGBD
12 páginas
Disparadores y Procedimientos SQL
Aún no hay calificaciones
Disparadores y Procedimientos SQL
31 páginas
Glosario Fundamentos Ingenieria de Software
Aún no hay calificaciones
Glosario Fundamentos Ingenieria de Software
7 páginas
Curso Completo de Python: Sintaxis y Estructuras
Aún no hay calificaciones
Curso Completo de Python: Sintaxis y Estructuras
20 páginas
Ingeniería de Requerimientos
Aún no hay calificaciones
Ingeniería de Requerimientos
6 páginas
Categorías de Sistemas de Información
Aún no hay calificaciones
Categorías de Sistemas de Información
53 páginas
Elaboración de Diagramas y Plantillas para Casos de Uso Del Proyecto. GA2-220501093-AA1-EV02
Aún no hay calificaciones
Elaboración de Diagramas y Plantillas para Casos de Uso Del Proyecto. GA2-220501093-AA1-EV02
18 páginas
Aplicaciones de Bases de Datos Cliente-Servidor
100% (1)
Aplicaciones de Bases de Datos Cliente-Servidor
55 páginas
Modelo XP
Aún no hay calificaciones
Modelo XP
5 páginas
Línea Del Tiempo Historia y Evolución de Lenguajes de Programación
Aún no hay calificaciones
Línea Del Tiempo Historia y Evolución de Lenguajes de Programación
18 páginas
Taller Intermedio de SQL Server
Aún no hay calificaciones
Taller Intermedio de SQL Server
25 páginas
Ejemplo Bases de Datos
Aún no hay calificaciones
Ejemplo Bases de Datos
15 páginas
Introducción a Algoritmos y Programas
Aún no hay calificaciones
Introducción a Algoritmos y Programas
31 páginas
Comparación de Los SGBD Mas Usados
Aún no hay calificaciones
Comparación de Los SGBD Mas Usados
9 páginas
Diseño Arquitectónico de Software y Microservicios
Aún no hay calificaciones
Diseño Arquitectónico de Software y Microservicios
34 páginas
Definición de Componentes de Software
Aún no hay calificaciones
Definición de Componentes de Software
31 páginas
Guía de Normalización y Consultas SQL
Aún no hay calificaciones
Guía de Normalización y Consultas SQL
4 páginas
Analizador Léxico con Flex y JavaScript
Aún no hay calificaciones
Analizador Léxico con Flex y JavaScript
20 páginas
Analizador Lexico
Aún no hay calificaciones
Analizador Lexico
10 páginas
Analisis Lexico 2
Aún no hay calificaciones
Analisis Lexico 2
15 páginas
Análisis del Analizador Léxico en Compiladores
Aún no hay calificaciones
Análisis del Analizador Léxico en Compiladores
37 páginas
Analizador Lexico
Aún no hay calificaciones
Analizador Lexico
9 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
19 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
12 páginas
Análisis Léxico en Compiladores
Aún no hay calificaciones
Análisis Léxico en Compiladores
15 páginas
Secciones Transversales de Caminos
Aún no hay calificaciones
Secciones Transversales de Caminos
15 páginas
Ficha Tec. y Acta
Aún no hay calificaciones
Ficha Tec. y Acta
6 páginas
Catalogo Dibujo Tecnico 2016
Aún no hay calificaciones
Catalogo Dibujo Tecnico 2016
2 páginas
Exam COMIPEMS 1
Aún no hay calificaciones
Exam COMIPEMS 1
38 páginas
Extraer Datos de Un Libro y Varias Hojas
Aún no hay calificaciones
Extraer Datos de Un Libro y Varias Hojas
4 páginas
Alineación láser de motores de 3500hp
Aún no hay calificaciones
Alineación láser de motores de 3500hp
11 páginas
Guía de Educación Cívica 2020
Aún no hay calificaciones
Guía de Educación Cívica 2020
14 páginas
Reglamento PERH
Aún no hay calificaciones
Reglamento PERH
21 páginas
Tratamientos y Diagnósticos de Neumonía
Aún no hay calificaciones
Tratamientos y Diagnósticos de Neumonía
2 páginas
U1-S2 Analisis de Un Fenomeno
Aún no hay calificaciones
U1-S2 Analisis de Un Fenomeno
4 páginas
Modelo Entidad-Relación Ferretería
Aún no hay calificaciones
Modelo Entidad-Relación Ferretería
5 páginas
Nafin en Guerrero Capacitación - Financiamiento
Aún no hay calificaciones
Nafin en Guerrero Capacitación - Financiamiento
12 páginas
Memoria poética de José Pascual Buxó
Aún no hay calificaciones
Memoria poética de José Pascual Buxó
290 páginas
Administración en Salud 2do Parcial EXAMEN
67% (3)
Administración en Salud 2do Parcial EXAMEN
67 páginas
HALOFORMO (Autoguardado)
Aún no hay calificaciones
HALOFORMO (Autoguardado)
9 páginas
Métodos de Aforo de Agua
100% (1)
Métodos de Aforo de Agua
27 páginas
Comunicación Oral-Seminario
Aún no hay calificaciones
Comunicación Oral-Seminario
8 páginas
Red de Proveedores Colectivo Asistencia Primaria PORSALUD - Colectivo
Aún no hay calificaciones
Red de Proveedores Colectivo Asistencia Primaria PORSALUD - Colectivo
67 páginas
Paleontología, Procesos de Fosilización
100% (1)
Paleontología, Procesos de Fosilización
27 páginas
Estrategias para Equipos Motivados
100% (1)
Estrategias para Equipos Motivados
7 páginas
Los Niveles Del Movimiento Segun Rudolf Laban
Aún no hay calificaciones
Los Niveles Del Movimiento Segun Rudolf Laban
10 páginas
Trabajo Ciclos de Refrigeración Por Compresión Modo Prueba
Aún no hay calificaciones
Trabajo Ciclos de Refrigeración Por Compresión Modo Prueba
30 páginas
Semana 3 - Tarea Académica I
Aún no hay calificaciones
Semana 3 - Tarea Académica I
15 páginas
Teoremas de Bolzano y Valores Intermedios
Aún no hay calificaciones
Teoremas de Bolzano y Valores Intermedios
12 páginas
Protección Eléctrica y Simbología
Aún no hay calificaciones
Protección Eléctrica y Simbología
16 páginas
Adaptaciones y clasificación de plantas
Aún no hay calificaciones
Adaptaciones y clasificación de plantas
12 páginas
Lisina: Funciones y Beneficios Esenciales
Aún no hay calificaciones
Lisina: Funciones y Beneficios Esenciales
5 páginas
Regresión y Mínimos Cuadrados: Análisis
Aún no hay calificaciones
Regresión y Mínimos Cuadrados: Análisis
6 páginas
Infografia Informatica
Aún no hay calificaciones
Infografia Informatica
4 páginas
Voucher 12632785
Aún no hay calificaciones
Voucher 12632785
3 páginas