Está en la página 1de 106

CUADERNO DIDCTICO N ...

LENGUAJES
GRAMTICAS
Y
AUTMATAS

Juan Manuel Cueva Lovelle

Catedrtico de E.U. de Lenguajes y Sistemas Informticos


Departamento de Informtica
Universidad de Oviedo

Segunda edicin
BORRADOR, Noviembre 2001
A Guillermo, Antonio y Paloma
LENGUAJES, GRAMTICAS Y AUTMATAS. Segunda Edicin
Juan Manuel Cueva Lovelle. Oviedo (Espaa), 2001.
Reservados todos los derechos. De conformidad con lo dispuesto en el art. 534-bis del Cdigo Penal vigente, podrn ser castigados
con penas de multa y privacin de libertad quienes reprodujeren o plagiaren, en todo o en parte, una obra literaria, artstica o cientfica
fijada en cualquier tipo de soporte sin la preceptiva autorizacin.

ISBN: 84-
Depsito legal: AS/
Impreso en
LENGUAJES, GRAMTICAS Y AUTOMATAS

TABLA DE CONTENIDOS
CAPTULO 1: INTRODUCCIN ............................................................................................. 1
CAPTULO 2: DEFINICIONES PREVIAS ............................................................................. 3
2.1 Smbolo .................................................................................................................................... 3
2.1.1 Ejemplos ........................................................................................................................... 3
2.2 Vocabulario o alfabeto ............................................................................................................. 3
Ejemplos 2.2.1 ........................................................................................................................... 3
2.3 Cadena ..................................................................................................................................... 3
Ejemplos 2.3.1 ........................................................................................................................... 4
2.4 Longitud de cadena .................................................................................................................. 4
Ejemplos 2.4.1 ........................................................................................................................... 4
2.5 Cadena vaca ............................................................................................................................ 4
2.6 Concatenacin de cadenas ....................................................................................................... 4
2.7 Universo del discurso ............................................................................................................... 5
Ejemplo 2.7.1 ............................................................................................................................. 5
2.8 Lenguaje ................................................................................................................................... 5
Ejemplo 2.8.1 ............................................................................................................................. 5
2.9 Lenguaje vacio ......................................................................................................................... 6
2.10 Gramtica ............................................................................................................................... 6
2.11 Autmata ................................................................................................................................ 6

CAPTULO 3: DEFINICIN FORMAL DE GRAMTICA ................................................. 7


Ejemplo 3.1 .................................................................................................................................... 8
Ejemplo 3.2 .................................................................................................................................... 8
Ejemplo 3.3 .................................................................................................................................... 8
Ejemplo 3.4 .................................................................................................................................... 8
3.5 Notacin ................................................................................................................................... 9
3.5.1 Vocabulario terminal ........................................................................................................ 9
3.5.2 Vocabulario no terminal ................................................................................................... 9
3.5.3 Vocabulario ...................................................................................................................... 9
3.5.4 Cadenas terminales ........................................................................................................... 10
3.5.5 Cadenas ............................................................................................................................. 10

CAPTULO 4: RELACIONES ENTRE CADENAS ............................................................... 11


4.1 Relacion de derivacin directa ................................................................................................. 11
Ejemplo 4.1.1 ............................................................................................................................ 11
4.2 Relacion de derivacin ............................................................................................................. 11
Ejemplo 4.2.1 ............................................................................................................................ 12

CAPTULO 5: SENTENCIAS O INSTRUCCIONES ............................................................. 13


Ejemplo 5.1 .................................................................................................................................... 13
Ejemplo 5.2 .................................................................................................................................... 13
CAPTULO 6: DEFINICIN FORMAL DE LENGUAJE .................................................... 14
6.1 Propiedad ................................................................................................................................. 14
Ejemplo 6.2 .................................................................................................................................... 14
Ejemplo 6.3 .................................................................................................................................... 14
Ejemplo 6.4 .................................................................................................................................... 15
Ejemplo 6.5 .................................................................................................................................... 15
Ejemplo 6.6 .................................................................................................................................... 15
Ejemplo 6.7 .................................................................................................................................... 16
Ejemplo 6.8 .................................................................................................................................... 17
CAPTULO 7: JERARQUA DE LAS GRAMTICAS ......................................................... 18
7.1 Gramticas de tipo 0 ................................................................................................................ 18
7.1.1 Ejemplos ........................................................................................................................... 18
7.2 Gramticas de tipo 1 ................................................................................................................ 18
7.2.1 Ejemplos de gramticas de tipo 1 ..................................................................................... 18
Ejemplo 7.2.1.1 ..................................................................................................................... 19
Ejemplo 7.2.1.2 ..................................................................................................................... 19
Ejemplo 7.2.1.3 ..................................................................................................................... 19
7.2.2 Ejemplos de gramticas que No son de tipo 1 .................................................................. 19
- IV -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejemplo 7.2.2.1 ..................................................................................................................... 19


Ejemplo 7.2.2.2 ..................................................................................................................... 20
7.2.3 Propiedades de las gramticas de tipo 1 ........................................................................... 20
7.2.3.1 Propiedad de no decrecimiento ................................................................................. 20
7.2.3.2 Propiedad de sensibilidad al contexto ....................................................................... 21
Ejemplo 7.2.3.3 ..................................................................................................................... 21
7.3 Gramticas de tipo 2 ................................................................................................................ 22
Ejemplo 7.3.1 ............................................................................................................................. 22
Ejemplo 7.3.2 ............................................................................................................................. 22
Ejemplo 7.3.3 ............................................................................................................................. 22
7.4 Gramticas de tipo 3 ................................................................................................................ 23
Ejemplo 7.4.1 ............................................................................................................................. 23
7.5 Lenguajes con la cadena vacia ................................................................................................. 23
Teorema 7.5.1 ............................................................................................................................ 24
Corolario 7.5.2 ........................................................................................................................... 24
Corolario 7.5.3 ........................................................................................................................... 24
7.6 Relacin de inclusin ............................................................................................................... 24
CAPTULO 8: CORRESPONDENCIA ENTRE GRAMTICAS Y LENGUAJES ........... 26
CAPTULO 9: EXPRESIONES REGULARES ....................................................................... 28
9.1 Operaciones con los lenguajes regulares ................................................................................. 28
9.2 Operaciones con las expresiones regulares .............................................................................. 29
9.3 Precedencia de las operaciones ................................................................................................ 30
9.4 Teorema ................................................................................................................................... 30
9.5 Propiedades .............................................................................................................................. 30
Ejemplo 9.6 .................................................................................................................................... 31
Ejemplo 9.7 .................................................................................................................................... 31
Ejemplo 9.8 .................................................................................................................................... 31
Ejemplo 9.9 .................................................................................................................................... 31
Ejemplo 9.10 .................................................................................................................................. 32
Ejemplo 9.11 .................................................................................................................................. 32
Ejemplo 9.12 .................................................................................................................................. 32
Ejemplo 9.13 .................................................................................................................................. 32
Ejemplo 9.14 .................................................................................................................................. 33
Ejemplo 9.15 .................................................................................................................................. 33
Ejemplo 9.16 .................................................................................................................................. 33
Ejemplo 9.17 .................................................................................................................................. 33
CAPTULO 10: AUTMATAS ................................................................................................. 34
10.1 Definicin formal de autmata .............................................................................................. 35
10.2 Representacin de autmatas ................................................................................................. 35
10.2.1 Tabla de transiciones ...................................................................................................... 35
10.2.2 Diagramas de Moore ...................................................................................................... 36
10.3 Mquinas de Moore y Mealy ................................................................................................. 37
Ejemplo 10.3.1 ........................................................................................................................... 39
10.4 Estados accesibles de un autmata ........................................................................................ 40
10.5 Autmatas conexos ................................................................................................................ 40
10.6 Autmatas deterministas y no deterministas ......................................................................... 40
CAPTULO 11: JERARQUA DE LOS AUTMATAS ......................................................... 41

CAPTULO 12: MQUINAS DE TURING ............................................................................. 43


12.1 Teorema ................................................................................................................................. 44
12.2 Teorema ................................................................................................................................. 44
12.3 Corolario ................................................................................................................................ 45
Ejemplo 12.4 .................................................................................................................................. 45

CAPTULO 13: AUTMATAS LINEALES ACOTADOS .................................................... 47


13.1 Teorema ................................................................................................................................. 48
13.2 Teorema ................................................................................................................................. 48
13.3 Corolario ................................................................................................................................ 48
CAPTULO 14: AUTMATAS DE PILA ................................................................................ 49
14.1 Lenguaje reconocido por un autmata de pila ....................................................................... 52
-V-
LENGUAJES, GRAMTICAS Y AUTOMATAS

14.1.1 Teorema .......................................................................................................................... 53


14.1.2 Teorema .......................................................................................................................... 53
14.1.3 Corolario ......................................................................................................................... 53
Ejemplo 14.1.4 ........................................................................................................................... 53
14.2 Algoritmo de transformacin de una gramtica de tipo 2 en un autmata de pila ................ 54
Ejemplo 14.2.1 ........................................................................................................................... 56
Ejercicio 14.2.2 .......................................................................................................................... 58
CAPTULO 15: AUTMATAS FINITOS ................................................................................ 59
15.1 Definicin formal de autmata finito ..................................................................................... 59
15.2 Lenguaje reconocido por un autmata finito ......................................................................... 60
15.2.1 Teorema .......................................................................................................................... 60
15.2.2 Teorema .......................................................................................................................... 60
15.2.3 Corolario ......................................................................................................................... 60
Ejemplo 15.2.4 ........................................................................................................................... 61
Ejemplo 15.2.5 ........................................................................................................................... 63
Ejemplo 15.2.6 ........................................................................................................................... 64
Ejemplo 15.2.7 ........................................................................................................................... 65
Ejemplo 15.2.8 ........................................................................................................................... 65
15.3 Clasificacin de los autmatas finitos ................................................................................... 66
15.3.1 Autmatas finitos no deterministas ................................................................................ 67
Ejemplo 15.3.1.1 ................................................................................................................... 67
15.3.2 Autmatas finitos deterministas ..................................................................................... 68
15.3.3 Teorema sobre la transformacin de AFND en AFD ..................................................... 68
Ejemplo 15.3.3.1 ................................................................................................................... 70
15.4 Algoritmo de transformacin de una gramtica de tipo 3 en un autmata finito .................. 73
Ejemplo 15.4.1 ........................................................................................................................... 74
15.5 Transformacin de una expresin regular en un autmata finito .......................................... 76
15.5.1 Equivalencia entre expresiones regulares bsicas y autmatas finitos ........................... 77
15.5.1.1 Expresin regular ................................................................................................. 77
15.5.1.2 Expresin regular a ................................................................................................. 77
15.5.1.3 Expresin regular a* ................................................................................................ 77
15.5.1.4 Expresin regular a+ ................................................................................................ 78
15.5.1.5 Expresin regular a|b ............................................................................................... 78
15.5.1.6 Expresin regular (a|b)* .......................................................................................... 78
15.5.1.7 Expresin regular (ac|b)* ........................................................................................ 79
15.5.1.8 Expresin regular (acd|b)* ...................................................................................... 79
15.5.2 Construccin de Thompson ............................................................................................ 79
Ejemplo 15.5.2.1 .................................................................................................................. 80
15.6 Minimizacin de estados de un AFD ..................................................................................... 81
Algoritmo 15.6.1 ........................................................................................................................ 81
Ejemplo 15.6.2 ........................................................................................................................... 83
CAPTULO 16: EJERCICIOS RESUELTOS .......................................................................... 86
Ejercicio 16.1 ................................................................................................................................. 86
Ejercicio 16.2 ................................................................................................................................. 86
Ejercicio 16.3 ................................................................................................................................. 87
Ejercicio 16.4 ................................................................................................................................. 88
Ejercicio 16.5 ................................................................................................................................. 88
Ejercicio 16.6 ................................................................................................................................. 90

CAPTULO 17: EJERCICIOS PROPUESTOS ....................................................................... 93


Ejercicio 17.1 ................................................................................................................................. 93
Ejercicio 17.2 ................................................................................................................................. 93
Ejercicio 17.3 ................................................................................................................................. 93
Ejercicio 17.4 ................................................................................................................................. 93
Ejercicio 17.5 ................................................................................................................................. 93
Ejercicio 17.6 ................................................................................................................................. 93
Ejercicio 17.7 ................................................................................................................................. 94
Ejercicio 17.8 ................................................................................................................................. 94
Ejercicio 17.9 ................................................................................................................................. 94
Ejercicio 17.10 ............................................................................................................................... 94

CAPTULO 18: EJERCICIOS DE PROGRAMACIN ......................................................... 95


- VI -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejercicio 18.1 ................................................................................................................................. 95


Ejercicio 18.2 ................................................................................................................................. 95
Ejercicio 18.3 ................................................................................................................................. 95
Ejercicio 18.4 ................................................................................................................................. 95
Ejercicio 18.5 ................................................................................................................................. 95
Ejercicio 18.6 ................................................................................................................................. 95

BIBLIOGRAFA ......................................................................................................................... 96

- VII -
LENGUAJES, GRAMTICAS Y AUTOMATAS

TABLA DE FIGURAS
Fig. 1 : Relacin de inclusin entre gramticas ............................................................................ 25
Fig. 2 : Correspondencia entre gramticas y lenguajes ................................................................. 27
Fig. 3 : Diagrama de Moore ........................................................................................................... 36
Fig. 4 : Ejemplo de diagrama de Moore ........................................................................................ 37
Fig. 5 : Ejemplo de mquina de Moore ......................................................................................... 40
Fig. 6 : Correpondencia entre gramticas, leng. y autmatas ........................................................ 42
Fig. 7 : Esquema de mquina de Turing ........................................................................................ 43
Fig. 8 : Esquema de autmata lineal acotado ................................................................................. 47
Fig. 9 : Esquema de autmata de pila ............................................................................................ 50
Fig. 10 : Transicin en un autmata de pila ................................................................................... 51
Fig. 11 : Transicin en un autmata de pila ................................................................................... 52
Fig. 12 : Esquema intuitivo de un autmata finito ......................................................................... 59
Fig. 13 : Transicin entre dos estados ............................................................................................ 61
Fig. 14 : Diagrama de Moore del ejemplo 15.2.4 .......................................................................... 62
Fig. 15 : Diagrama de Moore del ejemplo 15.2.5. ......................................................................... 63
Fig. 16 : Diagrama de Moore del ejemplo 15.2.6. ......................................................................... 64
Fig. 17 : Diagrama de Moore del ejemplo 15.2.7. ......................................................................... 65
Fig. 18 : Diagrama de Moore del ejemplo 15.2.8. ......................................................................... 66
Fig. 19 : Diagrama de Moore del ejemplo 15.3.1.1. ...................................................................... 68
Fig. 20 : Diagrama de Moore del ejemplo 15.3.3.1. ...................................................................... 72
Fig. 21 : Diagrama de Moore para f(A,a)=B ................................................................................. 73
Fig. 22 : Diagrama de Moore para f(A,a)=qf ................................................................................. 73
Fig. 23 : Diagrama de Moore del ejemplo 15.4.1 .......................................................................... 74
Fig. 24 : Diagrama de Moore AFD del ejemplo 15.4.1 ................................................................. 76
Fig. 25 : Diagrama de Moore para la expresin regular vacia ....................................................... 77
Fig. 26 : Diagrama de Moore para la expresin regular a ............................................................. 77
Fig. 27 : Diagrama de Moore para la expresin regular a* ........................................................... 77
Fig. 28 : Diagrama de Moore para la expresin regular a+ ........................................................... 78
Fig. 29 : Diagrama de Moore para la expresin regular a|b ........................................................... 78
Fig. 30 : Diagrama de Moore para la expresin regular a|b ........................................................... 78
Fig. 31 : Diagrama de Moore para la expresin regular (a|b)* ...................................................... 78
Fig. 32 : Diagrama de Moore para (ac|b)* ..................................................................................... 79
Fig. 33 : Diagrama de Moore (acd|b)* ........................................................................................... 79
Fig. 34 : Construccin de Thompson para N(s|t) ........................................................................... 79
Fig. 35 : Construccin de Thompson para st ................................................................................. 80
Fig. 36 : Construccin de Thompson para s* ................................................................................ 80
Fig. 37 : Descomposicin sintactica de la expresin regular ......................................................... 80
Fig. 38 : Construccin de Thompson para r7 ................................................................................. 81
Fig. 39 : Construccin de Thompson para la expresin regular .................................................... 81
Fig. 40 : Solucin del ejercicio 16.2 .............................................................................................. 87

- VIII -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 1: INTRODUCCIN
El objetivo de este libro de texto es introducir los conceptos tericos necesarios sobre
Teora de Lenguajes Formales, Gramticas y Autmatas para un curso universitario de
Traductores, Procesadores, Compiladores e Intrpretes de lenguajes de programacin.

En este texto se presenta la Teora de Gramticas y Lenguajes Formales, como una


herramienta matemtica que permite abordar con rigor el diseo de lenguajes de progra-
macin. Adems se desarrollan los conceptos necesarios para la construccin de Autmatas
para el reconocimiento de lenguajes de programacin.

La Teora de los Lenguajes Formales tiene su origen en un campo aparentemente


bastante alejado de la Informtica: la Lingistica.

Los lingistas de la llamada escuela estructuralista americana haban elaborado por


los aos 50 algunas ideas informales acerca de la gramtica universal. Se entiende por
gramtica universal, una gramtica que caracteriza las propiedades generales de cualquier
lenguaje humano.

El primer trabajo que desarroll teoras formales sobre gramticas y lenguajes fue
obra de Avram Noam Chomsky (1928-), quien es sin duda la figura ms destacada de la
lingistica moderna, tanto por desarrollar sus fundamentos matemticos, como por sus
teoras sobre el origen y la naturaleza de los lenguajes naturales, aunque stas ltimas son
ms discutidas (Chomsky, 1956; 1959; 1962; y 1963).

En el campo de la Informtica, poco despus de las primeras publicaciones de


Chomsky, el concepto de Gramtica Formal adquiri gran importancia para la especifi-
cacin de lenguajes de programacin; concretamente, se defini con sus teoras la sintaxis
del lenguaje ALGOL 60 (con ligeras modificaciones sobre su versin primitiva), usndose
una gramtica libre de contexto. Ello condujo rpidamente al diseo riguroso de algoritmos
de traduccin y compilacin.

Finalmente, y enlazando con el campo de la lingistica, la Teora de Lenguajes


Formales es de gran utilidad para el trabajo en otros campos de la Informtica por ejemplo
en Informtica Terica, Inteligencia Artificial, Procesamiento de lenguajes naturales
(comprensin, generacin, y traduccin) y Reconocimiento del Habla.

La Teora de los Lenguajes y Gramticas Formales tiene una relacin directa con la
Teora de Autmatas, siendo posible establecer entre ambas una correspondencia deno-
minada en Algebra isomorfismo.

-1-
LENGUAJES, GRAMTICAS Y AUTOMATAS

La Teora de los Autmatas proviene del campo de la Ingeniera Elctrica. El cien-


tfico estadounidense Claude Elwood Shannon (1916-2001), public varios trabajos, donde
mostraba las bases para la aplicacin de la Lgica Matemtica a los circuitos combinatorios
y secuenciales. A lo largo de las dcadas siguientes, las ideas de Shannon se desarrollaron
considerablemente, dando lugar a la Teora de Autmatas (Shannon 1949; 1954 y 1956).

Los autmatas son sistemas que reciben informacin, la transforman y producen otra
informacin que se transmite al entorno.

La Teora de Autmatas tiene aplicacin en campos muy diversos :

- Lgica de los Circuitos Secuenciales


- Teora de Control de Sistemas
- Teora de la Comunicacin
- Arquitectura de Ordenadores
- Redes Conmutadoras y Codificadoras
- Teora de los Sistemas Evolutivos y Auto-reproductivos
- Reconocimiento de patrones
- Redes Neuronales
- Reconocimiento y procesado de lenguajes de programacin
- Traduccin de lenguajes
- Teora de Lenguajes Formales

En este texto la Teora de Autmatas se aplicar principalmente los tres ltimos


campos enumerados. Dentro del campo de los Traductores, Procesadores, Compiladores
e Intrpretes se aplicarn los lenguajes, gramticas y autmatas de tipo 3 para la cons-
truccin de analizadores lxicos, y los de tipo 2 para la construccin de analizadores
sintcticos.

-2-
DEFINICIONES PREVIAS

CAPTULO 2: DEFINICIONES PREVIAS


En este captulo se introducen un conjunto de definiciones elementales necesarias
para los desarrollos tericos posteriores. Se definen de forma intuitiva, especificndose
algunas de ellas de manera formal en captulos posteriores.

2.1 Smbolo

Es una entidad abstracta, que no se va a definir, pues se dejar como axioma. Al igual
que no se define punto en Geometra. Normalmente los smbolos son letras (a, b, c, . . . ,z),
dgitos (0, 1, . . ., 9), y otros caracteres (+, -, *, /, ?, . . .). Los smbolos tambin pueden
estar formados por varias letras o caracteres, as por ejemplo las palabras reservadas de
un lenguaje de programacin son smbolos de dicho lenguaje.

2.1.1 Ejemplos

a , b , c , # , 0 , 1 , + , * ,then, begin, end, else

2.2 Vocabulario o alfabeto

Es un conjunto finito de smbolos, no vacio. Para definir que un smbolo a pertenece


a un alfabeto V se utiliza la notacin a V. Los alfabetos se definen por enumeracin de
los smbolos que contienen, as por ejemplo se presentan a continuacin varios alfabetos.

Ejemplos 2.2.1

V1 = { A , B , C , D , E , F , G , H , . . . , X , Y , Z }
V2 = { a , b , c , d , 0 , 1 , 2 , 3 , 4 , * , # , + }
V3 = { 0 , 1 }
V4 = {if, then, begin, end, else, a, b, ; , =, > }

Tambin se puede definir las tablas ASCII y EBCDIC como los alfabetos de distintos
ordenadores.

2.3 Cadena

Una cadena es una secuencia finita de smbolos de un determinado alfabeto.

-3-
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejemplos 2.3.1

Se utilizan los vocabularios de los ejemplos del epgrafe 2.2.1.

abcb es una cadena del alfabeto V2


a+2*b es una cadena del alfabeto V2
000111 es una cadena del alfabeto V3
if a>b then b=a; es una cadena del alfabeto V4

2.4 Longitud de cadena

La longitud de una cadena es el nmero de smbolos que contiene. La notacin


empleada es la que se indica en los siguientes ejemplos.

Ejemplos 2.4.1

Se utilizan las cadenas de los ejemplos del epgrafe 2.3.1.

| abcb | 4
| a + 2*b | 5
| 000111 | 6
| if a > b then a = b ; | 9

2.5 Cadena vaca

Existe una cadena denominada cadena vaca, que no tiene smbolos y se denota con
, entonces su longitud es :

| | 0

2.6 Concatenacin de cadenas

Sean y dos cadenas cualesquiera, se denomina concatenacin de y a una


nueva cadena constituida por los smbolos de la cadena seguidos por los de la cadena
.

El elemento neutro de la concatenacin es :

= =

-4-
DEFINICIONES PREVIAS

2.7 Universo del discurso

El conjunto de todas las cadenas que se pueden formar con los smbolos de un alfabeto
V se denomina universo del discurso de V y se representa por W(V). Evidentemente W(V)
es un conjunto infinito. La cadena vacia pertenece a W(V).

Ejemplo 2.7.1

Sea un alfabeto con una sola letra V = { a }, entonces el universo del discurso es :

W(V) = { , a, aa, aaa, aaaa, . . . }

que contiene infinitas cadenas.

2.8 Lenguaje

Se denomina lenguaje sobre un alfabeto V a un subconjunto del universo del discurso.


Tambin se puede definir como un conjunto de palabras de un determinado alfabeto.

Alguien puede pensar que los lenguajes se pueden definir porenumeracin de las
cadenas que pertenecen a dicho lenguaje, pero este mtodo adems de ineficiente, es en
muchos casos imposible (habitualmente un lenguaje tiene infinitas cadenas). As los
lenguajes se defienen por las propiedades que cumplen las cadenas del lenguaje.

Ejemplo 2.8.1
El conjunto de palndromos (cadenas que se leen igual hacia adelante, que hacia
atrs) sobre el alfabeto {0,1}. Evidentemente este lenguaje tiene infinitas cadenas.
Algunas cadenas de este lenguaje son:


0
1
00
11
010
0110
000000
101101
111111

-5-
LENGUAJES, GRAMTICAS Y AUTOMATAS

100001
001100
1101011
0010100

2.9 Lenguaje vacio

Existe un lenguaje denominado el lenguaje vaco, que es un conjunto vaco y que se


denota por {}. El lenguaje vaco no debe confundirse con un lenguaje que contenga una
sola cadena, y que sta sea la cadena vacia, es decir {}, ya que el nmero de elementos
(cardinalidad) de estos dos conjuntos es diferente.

Cardinal ({}) = 0
Cardinal ({}) = 1

2.10 Gramtica

La gramtica es un ente formal para especificar, de una manera finita, el conjunto de


cadenas de smbolos que constituyen un lenguaje.

2.11 Autmata

Un autmata es una construccin lgica que recibe una entrada y produce una salida
en funcin de todo lo recibido hasta ese instante.
En el caso de los Procesadores de Lenguaje un autmata es una construccin lgica
que recibe como entrada una cadena de smbolos y produce una salida indicando si dicha
cadena pertenece o no a un determinado lenguaje.

-6-
DEFINICIN FORMAL DE GRAMTICA

CAPTULO 3: DEFINICIN FORMAL DE GRAMTICA


Una gramtica es una cudrupla :

G = ( VT , VN , S , P )

donde :

VT = {conjunto finito de smbolos terminales}


VN = {conjunto finito de smbolos no terminales}
S es el smbolo inicial y pertenece a VN.
P = {conjunto de producciones o de reglas de derivacin}

Todas las cadenas del lenguaje definido por la gramtica estn formados con smbolos
del vocabulario terminal VT. El vocabulario terminal se define por enumeracin de los
smbolos terminales.

El vocabulario no terminal VN es el conjunto de smbolos introducidos como ele-


mentos auxiliares para la definicin de la gramtica, y que no figuran en las sentencias del
lenguaje. El vocabulario no terminal se define por enumeracin de los smbolos no
terminales.

La interseccin entre el vocabulario terminal y no terminal es el conjunto vacio :

{VN} {VT} = {}

La unin entre el vocabulario terminal y no terminal es el vocabulario :

{VN} {VT} = {V}

En ocasiones es importante distinguir si un determinado vocabulario incluye o no la


cadena vacia, indicndose respectivamente con superndice + o superndice *, tal como se
muestra a continuacin :

V+ = V {}

V* = V + {}

El smbolo inicial S es un smbolo no terminal a partir del cual se aplican las reglas
de la gramtica para obtener las distintas cadenas del lenguaje.

-7-
LENGUAJES, GRAMTICAS Y AUTOMATAS

Las producciones P son las reglas que se aplican desde el smbolo inicial para obtener
las cadenas del lenguaje. El conjunto de producciones P se define por medio de la enu-
meracin de las distintas producciones, en forma de reglas o por medio de un metalenguaje
por ejemplo BNF (Backus Naur Form) o EBNF (Extended Backus Naur Form).

Ejemplo 3.1

Sea la gramtica : G = ( VT, VN, S, P) donde VT = {a, b}, VN = {S}, y el conjunto


de producciones es :

S ab
S aSb

Ejemplo 3.2

Sea la gramtica G = ( {a, b, c, d} , {S, A, B} , S, P) donde P son las producciones :

S ASB
A b
aaA aaBB
S d
A aA
B dcd

Ejemplo 3.3

Sea la gramtica G = (VN, VT, S, P) donde :

VN = { <nmero> , <dgito> }
VT = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }
S = <nmero>

Las reglas de produccin P son :

<nmero> ::= <dgito> <nmero>


<nmero> ::= <dgito>
<dgito> ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

Ejemplo 3.4

Sea la gramtica G = (VN, VT, S, P) donde :

-8-
DEFINICIN FORMAL DE GRAMTICA

VN = { <dgito> , <otroDgito> , <Base2>, <vacio>}


VT = { 0, 1 }
S = <Base2>

Las reglas de produccin P son :

<Base2> ::= <dgito> <otroDgito>


<otroDgito> ::= <dgito> <otroDgito> | <vacio>
<dgito> ::= 0 | 1
<vacio> ::=

3.5 Notacin

Se usar la que se describe a continuacin, por ser la ms extendida en la bibliografa


Aho y Ullman (1973a, 1973b), Hopcroft y Ullman (1979), Aho et al. (1986), Sanchs y
Morales (1986), Alfonseca et al. (1987), y Snchez y Valverde (1989).

3.5.1 Vocabulario terminal

Los elementos del vocabulario terminal se representan por :

- letras minsculas de comienzo del abecedario : a, b, c, . . . , g.


- operadores tales como : + , - , * , / , . . .
- caracteres especiales : # , @ , ( , ) , . , ; , . . .
- los dgitos : 0, 1, . . . , 9
- las palabras reservadas de lenguajes de programacin con letras minsculas
y en negrita : if, then, else, . . .

3.5.2 Vocabulario no terminal

Los elementos del vocabulario no terminal se representan por :

- letras maysculas de comienzo del abecedario : A, B, . . . , G. La nica


excepcin suele ser el smbolo inicial que se representa con S.
- nombres en minscula, pero encerrados entre parntesis angulares : <ex-
presin>, <operador>, . . .

3.5.3 Vocabulario

Los elementos indiferenciados del vocabulario terminal y no terminal se denotan


con :
-9-
LENGUAJES, GRAMTICAS Y AUTOMATAS

- las letras maysculas del final del abecedario : U, V, W, X, Y, Z.

3.5.4 Cadenas terminales

Las cadenas compuestas totalmente por smbolos terminales se representan como :

- las letras minsculas del final del abecedario : t, u, v, x, y, z.

3.5.5 Cadenas

Las cadenas que contienen smbolos terminales y no terminales indiferenciados se


representan por :

- letras minsculas griegas : , , , , , . . .

- 10 -
RELACIONES ENTRE CADENAS

CAPTULO 4: RELACIONES ENTRE CADENAS


En este captulo se muestran las relaciones de derivacin directa y de derivacin entre
las cadenas de un determinado lenguaje descrito por una gramtica.

4.1 Relacion de derivacin directa

Sea una gramtica G = (VN,VT,S,P), si es una produccin, es decir

()P

y es una cadena, es decir V+ , entonces las cadenas y estn en la


relacin de derivacin directa de la gramtica G, que se puede expresar por:

y se puede decir que la cadena deriva directamente de la , o bien que produce


directamente en la gramtica G. De ah el nombre de producciones para los elementos
de P.

Ejemplo 4.1.1

Sea la gramtica : G = ( VT, VN, S, P) donde VT = {a, b}, VN = {S}, y el conjunto


de producciones es :

S ab
S aSb
Se obtiene la siguiente derivacin directa, al sustituir la primera regla en la segunda :

S aabb

4.2 Relacion de derivacin

Sean 1 y m cadenas pertenecientes a V+, se dice que estn en relacin de derivacin


en la gramtica G si existen 1,2,3,..., m tales que :

- 11 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

1 2
2 3

3 4
...
(m 1) m

se escribir entonces:

1 m

dicindose que m deriva de 1 , o que 1 produce m .

Ejemplo 4.2.1

Sea la gramtica G = ({S, A, B}, {a, b, c, d}, S, P) donde P son las siguientes reglas
de produccin, que en este caso se numeran para su posterior identificacin cuando se
usen.

(1) S ASB
(2) A b
(3) aaA aaBB
(4) S d
(5) A aA
(6) B dcd
Por aplicacin de derivaciones inmediatas a partir del smbolo inicial se obtiene la
derivacin :

S abddcd

Las derivaciones inmediatas necesarias para llegar a la derivacin anterior se


muestran a continuacin, indicndose en cada paso el nmero de la regla aplicada.
(1) (5) (2) (4) (6)
S ASB aASB abSB abdB abddcd

- 12 -
SENTENCIAS O INSTRUCCIONES

CAPTULO 5: SENTENCIAS O INSTRUCCIONES


Se denominan sentencias o instrucciones de un lenguaje a cualquier cadena que sea
el resultado ltimo de una derivacin a partir del smbolo inicial S y que est compuesta
nicamente por smbolos terminales, es decir

S m y m VT

Ejemplo 5.1

Utilizando la relacin de derivacin directa del ejemplo 4.1.1, la derivacin da lugar


a la sentencia :

aabb

Ejemplo 5.2

Continuando con el ejemplo 4.2.1, la derivacin da lugar a la sentencia :

abddcd

- 13 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 6: DEFINICIN FORMAL DE LENGUAJE


El lenguaje L(G) generado por una gramtica G es el conjunto de todas las sentencias
que puede generar G. Es decir expresado formalmente :

L(G) = { VT*/S }

Una sentencia pertenece a L(G) si :

- est compuesta de smbolos terminales


- la sentencia puede derivarse del smbolo inicial S aplicando las reglas de
produccin de la gramtica.

6.1 Propiedad

Dos gramticas son equivalentes si ambas generan el mismo lenguaje.

G1 y G2 son equivalentes si L(G1)=L(G2)

Ejemplo 6.2

Sea la gramtica definida por G2 = ({S}, {0,1}, S,P) donde P={(S 000S111),
(0S1 01)}. Determinar el lenguaje que genera.

Solucin : La nica forma de generar sentencias es aplicando cualquier n de veces


la primera produccin y terminando con la aplicacin de la segunda, as se obtiene el
lenguaje.

S 000S 111 000000S 111111 0(3n 1)0S11(3n 1) 0(3n)1(3n)

Por consiguiente el lenguaje que genera esta gramtica es el conjunto infinito de


instrucciones que se indica a continuacin :

L(G2) = {0(3n)1(3n)/n 1}

Ejemplo 6.3

Si la 2 produccin de la gramtica del ejemplo 6.2 fuese S 01 el lenguaje sera :

L(G3) = {0(3n + 1)1(3n + 1)/n 0}

- 14 -
DEFINICIN FORMAL DE LENGUAJE

Ejemplo 6.4

Sea la gramtica G4 = ({S}, {a,b}, S, P) donde P={(S aSb), (S ab)}. Determinar


el lenguaje que genera.

Solucin : Aplicando la primera produccin n-1 veces, seguida por la aplicacin de


la segunda produccin, se tiene que :

S aSb aaSbb a 3Sb 3 a (n 1)Sb (n 1) a n b n

El lenguaje generado :

L(G4)={an bn/n 1}

Ejemplo 6.5

Dada la gramtica G5 = ({S,A}, {a,b}, S, P) donde P={(S abAS), (abA baab),


(S a), (A b)}. Determinar el lenguaje que genera.

Solucin : Se generan sentencias del lenguaje aplicando las reglas hasta que se pueda
ver la forma general del lenguaje.

S abAS baabS baaba


S a
S abAS abbS abba
S abAS abAabAS (abA)n S (abb)n a
S abAS abAabAS (abA)n S (baab)n a
S abAS abAabAS abbbaaba
S abAS abAabAS baababba
S abAS abAabAS abAabAabAS baababbbaaba
L(G5) = {cadenas que contienen abb y baab intercambindose y reproducindose
cualquier nmero de veces, y terminando siempre con el smbolo a}

Se puede observar que la forma de expresar este lenguaje no es simple, y surge la


necesidad de tener una herramienta que permita describir los lenguajes de otra forma.

Ejemplo 6.6

Sea la gramtica G6 = ({S,A,B}, {a,b}, S, P) donde las producciones P son :

- 15 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

S aB A bAA
S bA B b
A a B bS
A aS B aBB
Determinar el lenguaje que genera.

Solucin : Se generan algunas instrucciones.

S aB ab
S bA ba
S aB abS abbA abba
S bA bbAA bbaa
S aB abS abaB ababS ababaB ababab
Se puede demostrar (Hopcroft y Ullman (1979), pp. 81-82) que el lenguaje generado
es :

L(G6) = {cadenas que tienen igual n de a que de b}


La demostracin no es inmediata.

Ejemplo 6.7

Sea la gramtica G7 = (VN, VT, S, P) donde :

VN = { <nmero> , <dgito> }
VT = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }
S = <nmero>

Las reglas de produccin P son :

<nmero> ::= <dgito> <nmero>


<nmero> ::= <dgito>
<dgito> ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

Determinar el lenguaje que genera.

Solucin : A continuacin se muestran algunas sentencias del lenguaje generado por


esta gramtica.

- 16 -
DEFINICIN FORMAL DE LENGUAJE

< nmero >< dgito >< nmero > 7 < nmero > 72
< nmero >< dgito > 7
< nmero >< dgito > 0
< nmero >< dgito >< nmero >< dgito >< dgito >< nmero > 235

L(G7) = {conjunto de los nmeros naturales en base diez}.

Ejemplo 6.8

Sea la gramtica G8 = ({A,S}, {a,b}, S, P) donde las reglas de produccin son :

S aS
S aA
A bA
A b
Determinar el lenguaje que genera esta gramtica.

Solucin : Se muestran algunas sentencias del lenguaje generado por la gramtica.

S aS aaA aab
S aA ab

S aS aaS aaaS a n S a n aA a n + 1b

S aA abA abbA abbbA ab n A ab n + 1

El lenguaje generado se puede definir con la siguiente expresin regular, cuya


definicin se estudiar en el captulo 9.

L(G8) = a a* b b*

- 17 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 7: JERARQUA DE LAS GRAMTICAS


Chomsky defini cuatro tipos distintos de gramticas en funcin de la forma de las
reglas de derivacin P (Chomsky, 1959). La clasificacin comienza con un tipo de
gramticas que pretende ser universal, aplicando restricciones a sus reglas de derivacin
se van obteniendo los otros tres tipos de gramticas. Esta clasificacin es jerrquica, es
decir cada tipo de gramticas engloba a todos los tipos siguientes.

7.1 Gramticas de tipo 0

Tambin llamadas gramticas no restringidas o gramticas con estructura de frase.


Las reglas de derivacin son de la forma:

siendo (VN VT)+ y (VN VT)*, es decir la nica restriccin es que no puede
haber reglas de la forma donde es la cadena vacia.

7.1.1 Ejemplos

Todas las gramticas mostradas en los ejemplos del captulo 6 son de tipo 0, pues en
ninguna de ellas existe la produccin siendo la cadena vacia.

7.2 Gramticas de tipo 1

Tambien llamadas gramticas sensibles al contexto (en ingls context sensitive). En


ellas las reglas de produccin son de la forma :

siendo A VN; , (VN VT)* y (VN VT)+ .

Estas gramticas se llaman sensibles al contexto, pues se puede reemplazar A por


siempre que estn en el contexto .

7.2.1 Ejemplos de gramticas de tipo 1

A continuacin se muestran varios ejemplos de gramticas de tipo 1, que se adaptan


a la definicin anterior.

- 18 -
JERARQUA DE LAS GRAMTICAS

Ejemplo 7.2.1.1

La gramtica G = ({S,A,B}, {a,b}, S, P) cuyas producciones P se muestran a conti-


nuacin es de tipo 1.

S aB A bAA
S bA B b
A a B bS
A aS B aBB

Ejemplo 7.2.1.2

La gramtica G = (VN, VT, S, P) donde VN = { <nmero> , <dgito> }; VT = { 0,


1, 2, 3, 4, 5, 6, 7, 8, 9 }; S = <nmero> y las reglas de produccin P que se muestran a
continuacin es de tipo 1.

<nmero> ::= <dgito> <nmero>


<nmero> ::= <dgito>
<dgito> ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

Ejemplo 7.2.1.3

La gramtica G = ({a,b}, {A,S}, S, P) donde P son las producciones que se muestran


a continuacin es de tipo 1.

S aS
S aA
A bA
A b

7.2.2 Ejemplos de gramticas que No son de tipo 1

A continuacin se muestran algunos ejemplos de gramticas que no son de tipo 1, y


que pueden ilustrar mejor la definicin de estas gramticas.

Ejemplo 7.2.2.1

La gramtica definida como G = ({S}, {a,b}, S, P) donde P son las siguientes


producciones :

- 19 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

S aaaaSbbbb
aSb ab

La produccin aSb ab no es del tipo 1, pues se sustituye S por vaco en el contexto


a...b.

Sin embargo si se esta produccin fuera S ab o aSb abb , entonces sera de tipo
1.

Ejemplo 7.2.2.2

La gramtica G = ({S,A}, {a,b}, S, P) con las producciones P siguientes :

S abAS
abA baab
S a
A b

No es del tipo 1, ya que la produccin abA baab no es sensible al contexto. Lo


sera si fuese abA abab .

7.2.3 Propiedades de las gramticas de tipo 1

A continuacin se presenta la propiedad de no decrecimiento de las gramticas de


tipo 1, que se presenta en forma directa e inversa, lo cual permite intercambiar dicha
propiedad con la definicin dada anteriormente.

7.2.3.1 Propiedad de no decrecimiento

Las cadenas que se obtienen en cualquier derivacin de una gramtica de tipo 1 son
de longitud no decreciente, es decir :

| || |

y que se puede enunciar como la longitud de la parte derecha de la produccin es mayor


o igual a la de la parte izquierda.

La demostracin es inmediata. Si se define una produccin de un lenguaje tipo 1


como :

- 20 -
JERARQUA DE LAS GRAMTICAS

siendo (VN VT)+, es decir nunca puede ser la cadena vacia, lo que implica que
| | 1 y como | A | como mnimo vale 1, queda demostrada la propiedad :

|A | ||

7.2.3.2 Propiedad de sensibilidad al contexto

Tambin se puede demostrar (Fernndez y Sez Vacas, 1987, pg. 442) que si todas
las reglas de una gramtica cumplen la condicin de no decrecimiento, se puede hallar una
gramtica equivalente con las producciones sensibles al contexto. Esta segunda propiedad
combinada con la primera hace que se pueda intercambiar la caracterstica de no decre-
cimiento con la definicin.

Ejemplo 7.2.3.3

Sea la gramtica G = ({S,B,C}, {a,b,c}, S, P) donde P son las producciones :

S aSBC
S aBC
CB BC
bB bb
bC bc
cC cc
aB ab
La gramtica anterior no es de tipo 1 segn la definicin dada, ya que la regla
CB BC no respeta el contexto. Sin embargo puede apreciarse que todas las reglas de
esta gramtica son no decrecientes, por lo tanto es posible encontrar una gramtica equi-
valente que genere el mismo lenguaje. Se puede sustituir la regla CB BC por :

CB XB
XB XY
XY BY
BY BC

Puede observarse que ambas gramticas son equivalentes y que generan el lenguaje :

L(G) = { an bn cn / n 1 }

- 21 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

7.3 Gramticas de tipo 2

Las gramticas de tipo 2 tambin se denominan gramticas de contexto libre o libres


de contexto (en ingls context free). Sus reglas de produccin tan slo admiten tener un
smbolo no terminal en su parte izquierda, es decir son de la forma :

siendo A VN y (VN VT)+ .

Si cada regla se representa como un par ordenado (A, ), el conjunto P es un sub-


conjunto del conjunto producto cartesiano VN ({VN VT})+, es decir :

P {N ({VN} {VT})+}

La denominacin contexto libre se debe a que se puede cambiar A por , indepen-


dientemente del contexto en que aparezca A.

Ejemplo 7.3.1

La gramtica G = ({S,A,B}, {a,b}, S, P) cuyas producciones P se muestran a conti-


nuacin es de tipo 2.

S aB A bAA
S bA B b
A a B bS
A aS B aBB

Ejemplo 7.3.2

La gramtica G = (VN, VT, S, P) donde VN = { <nmero> , <dgito> }; VT = { 0,


1, 2, 3, 4, 5, 6, 7, 8, 9 }; S = <nmero> y las reglas de produccin P que se muestran a
continuacin es de tipo 2.

<nmero> ::= <dgito> <nmero>


<nmero> ::= <dgito>
<dgito> ::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

Ejemplo 7.3.3

La gramtica G = ({a,b}, {A,S}, S, P) donde P son las producciones que se muestran


a continuacin es de tipo 2.
- 22 -
JERARQUA DE LAS GRAMTICAS

S aS
S aA
A bA
A b

7.4 Gramticas de tipo 3

Las gramticas de tipo 3 tambien denominadas regulares o gramticas lineales a la


derecha comienzan sus reglas de produccin por un smbolo terminal, que puede ser
seguido o no por un smbolo no terminal, es decir son de la forma :

A aB
A a

donde A,B VN y VT.

Ejemplo 7.4.1

La gramtica G = ({a,b}, {A,S}, S, P) donde P son las producciones que se muestran


a continuacin es de tipo 3.

S aS
S aA
A bA
A b

7.5 Lenguajes con la cadena vacia

Segn las definiciones anteriores la cadena vacia no puede aparecer en ningn len-
guaje de tipo 1, 2 o 3. Supongamos que deseamos aadir la cadena vacia a un lenguaje.
Se pretende crear un nuevo lenguaje L, a partir del lenguaje L de tal forma que:

L = L {}

Bastar aadir de algn modo a la descripcin del lenguaje L.

Una forma de hacer esto es aadir la siguiente regla de produccin S a las reglas
de la gramtica que describe L. Pero se haba impuesto a las reglas de las gramticas de

- 23 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

tipo 1 A , con la condicin de , para cumplir la propiedad de no


decrecimiento. Si se aade S ser necesario imponer la condicin de que no aparezca
en la parte derecha S, tal y como se ver en el teorema 7.5.1

Teorema 7.5.1

Si G es una gramtica de tipo 1, 2, o 3 puede encontrarse una gramtica equivalente


G de tipo 1, 2 o 3 respectivamente, tal que L(G)=L(G) y adems su smbolo inicial S,
no aparece en el segundo trmino de ninguna regla de G. Es decir si G=(VT,VN,P,S)
se puede encontrar G=(VT,VN*,P,S) donde P=P{S /(S ) P} . La
demostracin se puede encontrar en las pginas 437-438 del libro Fundamentos de
Informtica, Fernndez G. y Sez Vacas F.).

Corolario 7.5.2

Si L es un lenguaje de tipo 1, 2 o 3 entonces L {} y L {} son lenguajes de tipo


1, 2, o 3 respectivamente.

Corolario 7.5.3

Dada una gramtica G cualquiera de tipo 1, 2 o 3 se puede obtener otra G, con S


de forma que L(G) = L(G) {} .

7.6 Relacin de inclusin

Los cuatro tipos de gramticas estudiados anteriormente (tipo 0, tipo 1, tipo 2, y tipo
3), cada una de ellas tiene restricciones ms fuertes que las anteriores. Las gramticas de
tipo 0, contienen a todas las dems. Las de tipo 1 contienen a las de tipo 2 y tipo 3. Y por
ltimo las de tipo 2 contienen a las de tipo 3. Es decir una gramtica de tipo 3 es de tipo
2, tipo 1 y tipo 0. Por lo tanto se define una jerarqua de gramticas respecto de la relacin
de inclusin, que se puede representar grficamente mediante el diagrama de la figura 1.

- 24 -
JERARQUA DE LAS GRAMTICAS

JERARQUIA DE LAS GRAMATICAS

TIPO 0 TIPO 1 TIPO 2 TIPO 3

Fig. 1 : Relacin de inclusin entre los distintos tipos de gramticas

- 25 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 8: CORRESPONDENCIA ENTRE


GRAMTICAS Y LENGUAJES
Se denomina lenguaje de tipo 0 al generado por una gramtica de tipo 0. De la misma
forma, se denominan lenguajes de tipo 1, tipo 2, y tipo 3, a los generados por las gramticas
de tipo 1, tipo 2, y tipo 3, respectivamente.

Si los lenguajes generados por los distintos tipos de gramticas se se relacionan entre
s con respecto a la relacin de inclusin se obtiene :

{L(G3)} {L(G2)} {L(G1)} {L(G0)}

Segn lo visto anteriormente existe una correspondencia entre las gramticas y los
lenguajes de tal forma que se genera una jerarqua de lenguajes anloga a la mostrada para
las gramticas, que se puede representar grficamente mediante el diagrama de la figura
2.

- 26 -
CORRESPONDENCIA ENTRE GRAMTICAS Y LENGUAJES

CORRESPONDENCIA ENTRE
LOS LENGUAJES Y LAS GRAMATICAS

GRAMATICAS

TIPO 0 TIPO 1 TIPO 2 TIPO 3

TIPO 0 TIPO 1 TIPO 2 TIPO 3

LENGUAJES

Fig. 2 : Correspondencia entre gramticas y lenguajes

- 27 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 9: EXPRESIONES REGULARES


Anteriormente se estudiaron los lenguajes formales, y se vio como en algunos
ejemplos no era fcil representar los lenguajes de una manera condensada. En este captulo
se va a presentar una herramienta, las expresiones regulares, para describir lenguajes de
tipo 3 o lenguajes regulares.

Las expresiones regulares se introducen para describir los lenguajes regulares,


entonces las expresiones regulares sern metalenguajes. Es decir las expresiones regulares
son un metalenguaje para describir los lenguajes regulares.

9.1 Operaciones con los lenguajes regulares

a) Unin o alternativa : Sean dos lenguajes definidos sobre un mismo alfabeto, se


denomina unin de los dos lenguajes al conjunto formado por las cadenas que pertenezcan
indistintamente a uno u otro de los dos lenguajes. Formalmente se puede expresar :

L1 L2 = {x/x L1 x L2}

b) Concatenacin : Sean dos lenguajes definidos sobre el mismo alfabeto, se


denomina concatenacin de los dos lenguajes al conjunto de todas las cadenas formadas
concatenando una palabra del primer lenguaje con otra del segundo. Formalmente se puede
expresar :

L1L2 = {x1x2/x1 L1 x2 L2}

c) Potencia de un lenguaje : Desde un punto de vista estricto esta no es una nueva


operacin, sino un caso particular de la anterior. Se denomina potencia i-sima de un
lenguaje a la operacin que consiste en concatenarlo consigo mismo i-veces. En el caso
de i=0, el resultado es el conjunto vacio.

d) Cierre u operacin estrella : La operacin cierre de un lenguaje L es otro lenguaje


L* obtenido uniendo el lenguaje L con todas sus potencias posibles, incluso L0. Formal-
mente se puede expresar como :

L * = {} {L} {LL} {LLL} = L n
n =0

e) Cierre positivo : La operacin cierre positivo de un lenguaje L es otro lenguaje


L obtenido uniendo el lenguaje L con todas sus potencias posibles, excepto L0. Formal-
+

mente se puede expresar como :

- 28 -
EXPRESIONES REGULARES


L + = {L} {LL} {LLL} = L n
n =1

9.2 Operaciones con las expresiones regulares

Si es una expresion regular, entonces {} es el conjunto descrito por la expresin


regular . Tambin se puede decir que denota el lenguaje de la cadena .

Las expresiones regulares describen los lenguajes regulares, luego sus operaciones
corresponderan a las indicadas para los lenguajes regulares.

a) Unin o alternativa : Si y son expresiones regulares, | es una expresion


regular tal que :

{ | } = {} {}

es decir puede aparecer o indistintamente.

b) Concatenacin : Si y son expresiones regulares, es una expresin regular


tal que { } = {} {}

c) Cierre u operacin estrella : Si es una expresin regular, entonces * es una


expresin regular que denota { }*. Es decir denota las cadenas :

d) Cierre positivo : Si es una expresin regular, entonces + es una expresin


regular que denota { }+. Es decir denota las cadenas :

- 29 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

9.3 Precedencia de las operaciones

Se permite el uso de parntesis para indicar la precedencia de las operaciones, pero


cuando no se utilizan parntesis para evaluar una expresin regular, hay que tener en cuenta
el siguiente orden de precedencia :

1.- Uso de parntesis


2.- Operacin cierre y cierre positivo
3.- Operacin concatenacin
4.- Alternativa

9.4 Teorema

Dos expresiones regulares son iguales, si designan al mismo conjunto regular.

9.5 Propiedades

A partir del teorema anterior se pueden enunciar las siguientes propiedades :

a) Asociatividad de la operacin concatenacin

()=()

b) Distributividad de la operacin alternativa respecto de la concatenacin

| = ( | )

c) es el elemento neutro de la concatenacin, es decir

= =

d) Propiedades de la operacin cierre

- 30 -
EXPRESIONES REGULARES

d.1) ( | )* = (* | *) = (**)
* *

d.2) ( | )* = (* | ) = *
d.3) * | = *
d.4) * =

Ejemplo 9.6

Sea el vocabulario {a,b} y la expresin regular aa *bb * . Indicar el lenguaje que


denota, y algunas cadenas de dicho lenguaje.

Solucin : Algunas cadenas son:

ab
aab
aaaab
abbbb
abb
aaaab

El lenguaje que se describe es L={cadenas que comienzan por una a y continuan con
varias o ninguna a, y siguen con una b y continuan con varias o ninguna b}

Ejemplo 9.7

Sea el vocabulario {0,1}, la expresin regular 1(01)*denota el conjunto de cadenas


que empiezan por 1 y van seguidas por (01) cualquier n de veces o ninguna.

Ejemplo 9.8

Sea el vocabulario {0,1}, la expresin regular (0 | 1)+denota el conjunto de nmeros


en base 2.

Ejemplo 9.9

Sea el vocabulario {0, 1, 2}, la expresin regular (0 | 1 | 2)+denota el conjunto de


nmeros en base 3.

- 31 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejemplo 9.10

Dada la expresin regular (a | b)* , el lenguaje que denota es el que se puede formar
con todas las cadenas compuestas por a y b incluida la cadena vacia. Algunos ejemplos
de sentencias de este lenguaje son :


aaa
bbb
aba
abaaa
abbaa

Ejemplo 9.11

Sea el vocabulario {1,2,3}, la expresin regular (1 | 2)* 3 indica el conjunto de todas


las cadenas formadas con los smbolos 1 y 2, sucedindose cualquier n de veces (y en
cualquier orden), y siempre terminando la cadena en el smbolo 3. Ejemplos de sentencias :

3 23
13 223
123 113
11113 121211223
221113 111212213

Ejemplo 9.12

Sea el vocabulario {a,b,c}, la expresin regular a | bc denota el lenguaje formado


por las sentencias a y bc.

Ejemplo 9.13

Sea el vocabulario {a,b}, la expresin regular ((a | b) (a | b))* denota el lenguaje


compuesto por todas las cadenas cuya longitud es cero o un n par, y estn compuestas
solamente por el smbolo a, el smbolo b, o por smbolos a y b.

- 32 -
EXPRESIONES REGULARES

Ejemplo 9.14

Sea el vocabulario {a,b}, la expresin regular (a | b)(a | b) denota el lenguaje com-


puesto por todas las cadenas de longitud dos formadas con los smbolos a y b. Se pueden
definir por enumeracin {aa, ab, ba, bb}.

Ejemplo 9.15

Dar una expresin regular para identificador:

<letra> (<letra> | <dgito>)*

Tambin se puede definir identificador como:

(a | b | c | | z) (a | b | c | d | | z | 0 | 1 | | 9)*

Ejemplo 9.16

Dar una expresin regular para los nmeros reales sin exponente del lenguaje Pascal
estndar.

Solucin :

( | + | ) (< dgito >< dgito >* < dgito >*< dgito >)

Ejemplo 9.17

La expresin regular a *b * denota el lenguaje {a m b n /m 0 y n 0} .

- 33 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 10: AUTMATAS


La palabra autmata evoca algo que pretende imitar las funciones propias de los
seres vivos, especialmente relacionadas con el movimiento, por ejemplo el tpico robot
antropomorfo. En el campo de los Traductores, Procesadores, Compiladores e Intrpretes,
lo fundamental no es la simulacin del movimiento, sino la simulacin de procesos para
tratar informacin.

La informacin se codifica en cadenas de smbolos, y un autmata es un dispositivo


que manipula cadenas de smbolos que se le presentan a su entrada, produciendo otras tiras
o cadenas de smbolos a su salida.

El autmata recibe los smbolos de entrada, uno detrs de otro, es decir secuencial-
mente. El smbolo de salida que en un instante determinado produce un autmata, no slo
depende del ltimo smbolo recibido a la entrada, sino de toda la secuencia o cadena, que
ha recibido hasta ese instante.

Todo lo anterior conduce a definir un concepto fundamental : estado de un autmata.


El estado de un autmata es toda la informacin necesaria en un momento dado, para
poder deducir, dado un smbolo de entrada en ese momento, cual ser el smbolo de salida.
Es decir, conocer el estado de un autmata, es lo mismo que conocer toda la historia de
smbolos de entrada, as como el estado inicial, estado en que se encontraba el autmata
al recibir el primero de los smbolos de entrada.

El autmata tendr un determinado nmero de estados (pudiendo ser infinitos), y se


encontrar en uno u otro segn sea la historia de smbolos que le han llegado.

Se define configuracin de un autmata a su situacin en un instante. Se define


movimiento de un autmata como el transito entre dos configuraciones.

Si un autmata se encuentra en un estado determinado, recibe un smbolo tambin


determinado, producir un smbolo de salida y efectuar un cambio o transicin a otro
estado (tambin puede quedarse en el mismo estado).

El campo de estudio de los Traductores, Procesadores e Intrpretes son los lenguajes


y las gramticas que los generan. Los elementos del lenguaje son sentencias, palabras,
etc... formadas a partir de un alfabeto o vocabulario, que no es otra cosa que un conjunto
finito de smbolos. Establecidas las reglas gramaticales, una cadena de smbolos
pertenecer al correspondiente lenguaje si tal cadena se ha formado obedeciendo esas
reglas. Entonces un autmata reconocedor de ese lenguaje, funciona de tal forma que

- 34 -
AUTMATAS

cuando reciba a su entrada una determinada cadena de smbolos indica si dicha cadena
pertenece o no al lenguaje. Tambin se mostrar como existe un tipo de autmata para
reconocer cada uno de los tipos de lenguajes generados por las correspondientes gramticas.

10.1 Definicin formal de autmata

Un autmata es una quntupla A = ( E, S, Q, f, g ) donde :

E = {conjunto de entradas o vocabulario de entrada}


S = {conjunto de salidas o vocabulario de salida}
Q = {conjunto de estados}
f:EQQ
g:EQ S
E es un conjunto finito, y sus elementos se llaman entradas o smbolos de entrada.

S es un conjunto finito, y sus elementos se llaman salidas o smbolos de salida.

Q es el conjunto de estados posibles, puede ser finito o infinito.

f es la funcin de transicin o funcin del estado siguiente, y para un par del conjunto
E Q devuelve un estado perteneciente al conjunto Q. E Q es el conjunto producto
cartesiano de E por Q.

g es la funcin de salida, y para un par del conjunto E Q, devuelve un smbolo de


salida del conjunto S.

10.2 Representacin de autmatas


Los autmatas se pueden representar mediante :

- Tabla de transiciones
- Diagrama de Moore

10.2.1 Tabla de transiciones

Las funciones f y g pueden representarse mediante una tabla, con tantas filas como
estados y tantas columnas como entradas. As por ejemplo se puede representar el autmata
A = ( E, S, Q, f, g ) donde E = {a,b}, S = {0,1}, Q = {q1, q2, q3} y las funciones f y g se
pueden representar por :

- 35 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

f a b g a b

q1 q1 q2 q1 0 1

q2 q3 q2 q2 0 0

q3 q3 q1 q3 1 0
As se tiene que f(a , q1) = q1 ; g(a, q1) = 0 ; o tambin f(a, q2) = q3 ; y g(a, q3) = 1 .

Ambas funciones tambin se pueden representar en una misma tabla de la siguiente


forma :

f/g a b

q1 q1/0 q2/1

q2 q3/0 q2/0

q3 q3/1 q1/0

10.2.2 Diagramas de Moore

Los diagramas de Moore son otra forma de representar las funciones de transicin y
salida de un autmata.

El diagrama de Moore es un grafo orientado en el que cada nodo corresponde a un


estado; y si f( , qi) = qj y g( , qi) = s existe un arco dirigido del nodo qi al correspondiente
qj, sobre el que se pone la etiqueta / s, tal y como se muestra en la figura 3.

/s

q i
q
j

Fig. 3 : Diagrama de Moore.

As continuando con el ejemplo del apartado 10.2.1, el autmata se representa con


el diagrama de Moore de la figura 4.

- 36 -
AUTMATAS

a/0

q
1
b/1 b/0

q q
2 3

a/0 a/1

b/0

Fig. 4 : Ejemplo de diagrama de Moore.

10.3 Mquinas de Moore y Mealy

El modelo general de autmata que se ha definido se llama mquina de Mealy.

Se puede plantear el siguiente problema : si se considera que adems de los elementos


del vocabulario de entrada E, un elemento vacio , que fsicamente indica que no hay
entrada, se han de ampliar los dominios de las definiciones de la siguiente forma :

f : {E {}} Q Q
g : {E {}} Q S
La ampliacin del dominio f no plantea ningn problema, pues se puede convenir
que f( ,q)=q, es decir si no hay entrada, no se cambia de estado.

No ocurre lo mismo con la ampliacin del dominio de g, ya que g( ,q), produce


una salida indeterminada, pues depende del estado anterior al q. As por ejemplo en el
autmata del apartado 10.2.1, se observa que :

g( ,q2)=1, si el estado anterior es q1.


g( ,q2)=0, si el estado anterior es q2.

- 37 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

ya que si se llega a q2 desde q1 la salida es 1, mientras que si se alcanza desde el propio q2


la salida es 0.

Entonces slo se puede ampliar el dominio de g, si a cada estado q se le puede asociar


una salida y slo una.

Cuando esto ocurre para todo q Q, se puede definir una aplicacin inyectiva :

h:QS

tal que g se obtiene como composicin de h por f :

g=hf

es decir g(e,q) = h(f(e,q)), donde e {E {}} y q Q. En este caso, se puede decir,


que la salida slo depende del estado, y el autmata se llama mquina de Moore.

En una mquina de Mealy las salidas estn asociadas a las transiciones, mientras que
en una mquina de Moore las salidas estn asociadas a los estados, o, lo que es lo mismo,
todas las transiciones que conducen a un mismo estado tienen asociada la misma salida.
Tambin se puede decir que una mquina de Mealy, en el instante de efectuar una transicin
necesita conocer una entrada e E, ya que en general g( ,q) no est definida. Sin embargo
en las mquinas de Moore la entrada puede ser .

Puesto que por definicin toda mquina de Moore es una mquina de Mealy que
cumple la condicin de que a cada estado se le puede asociar una salida y slo una, parece
en principio que las mquinas de Moore son un subconjunto de las mquinasde Mealy.
Sin embargo, se va a demostrar que, dada una mquina de Mealy, siempre se puede
encontrar una mquina de Moore equivalente, normalmente, a costa de aumentar el nmero
de estados.

En efecto sea la mquina de Mealy A = (E, S, Q, f, g) siempre se puede definir un


nuevo autmata :

A = (E,S,Q, f, g)

en el que Q se obtiene escindiendo q Q en tantos estados qs como salidas s pueden


asociarse a q, es decir

Q = {qs / (q Q y e E) tales que f(e, q) = q y g(e, q) = s }

y en el que f y g se definen de la siguiente forma :

- 38 -
AUTMATAS

f (e, qs) = [f(e,q)]g(e,q)


g (e, qs) = g(e,q)

De este modo, a cada qs Q se le puede asociar una sola salida s, y as tendra una funcin
de salida :

h : Q S

tal que g (e, qs) = h ( f (e, qs)), por lo tanto A es una mquina de Moore.

En lo sucesivo siempre que slo se tratarn autmatas que son mquinas de Moore.

Ejemplo 10.3.1

Construir una mquina de Moore equivalente a la mostrada en el ejemplo del apartado


10.2.1.

Solucin : Se construye la siguiente tabla de transiciones combinada.

g=hf a b

q10 q10 q21

q20 q30 q20

q21 q30 q20

q30 q31 q10

q31 q31 q10

Se observa que al estado q1 siempre se le asocia la salida 0; sin embargo q2 puede


tener la salida 0 1, se crean entonces los estados q20 y q21; de la misma forma q30 y q31.

Esta mquina de Moore se puede representar por el diagrama de la figura 5. Las


salidas estn indicadas en los nodos como superndices de los estados.

- 39 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

a b

a
a

0
q1 q0 q
3 3 2

b
a

0 q1 b
q 2
1

Fig. 5 : Ejemplo de mquina de Moore.

10.4 Estados accesibles de un autmata

Sea un autmata A=(E,S,Q,f,g), se dice que un estado qj es accesible desde otro estado
qi, si existe una entrada e E* tal que f(qi,e)=qj.

Evidentemente todo estado es accesible desde s mismo, puesto que f(qi,)=qi.

10.5 Autmatas conexos

Sea un autmata A=(E,S,Q,f,g), se dice que es conexo si todos los estados de Q son
accesibles desde el estado inicial q0.

Dado un autmata no conexo se puede encontrar otro equivalente y conexo elimi-


nando los estados inaccesibles. Es evidente que los dos autmatas aceptarn el mismo
lenguaje.

10.6 Autmatas deterministas y no deterministas

Se denomina autmata determinista cuando la funcin de cambio de estado f es


determinista. En caso contrario se dice no determinista.

- 40 -
JERARQUA DE LOS AUTMATAS

CAPTULO 11: JERARQUA DE LOS AUTMATAS


En el campo de los Traductores, Procesadores, Compiladores e Intrpretes, la teora
de autmatas interesa desde el punto de vista de las relaciones entre el tipo de lenguaje y
la estructura de la mquina capaz de reconocerlo. Estas relaciones pueden ser en dos
sentidos :

a) Dada una gramtica G Qu estructura deber tener una mquina, M, tal que el
lenguaje reconocido por la mquina M, es igual al lenguaje generado por G?

b) Dada una mquina M Cul ser la gramtica G, tal que el lenguaje generado por
G, es igual al lenguaje reconocido por M?

En los apartados siguientes se expondr como paralelamente a la jerarqua de


gramticas y de lenguajes, aparece una jerarqua de autmatas, cuya correspondencia puede
verse en el diagrama de la figura 6.

- 41 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CORRESPONDENCIA ENTRE LOS LENGUAJES


LAS GRAMATICAS Y LOS AUTOMATAS

GRAMATICAS

TIPO 0 TIPO 1 TIPO 2 TIPO 3


AUTOMATAS

TIPO 0 TIPO 1 TIPO 2 TIPO 3

TIPO 0 TIPO 1 TIPO 2 TIPO 3

LENGUAJES

Fig. 6 : Correspondencia entre gramticas, lenguajes y autmatas.

- 42 -
MQUINAS DE TURING

CAPTULO 12: MQUINAS DE TURING


Su nombre se debe a Alan Mathison Turing, que fu quien introdujo el concepto en
1936 (A. M. Turing, 1936; C. Conde, 1969; J.E. Hopcroft, 1984). Una mquina de Turing
o autmata de tipo 0 es una construccin lgica, que se puede representar intuitivamente
como un dispositivo mecnico (fig. 7), formado por una cinta infinita, dividida en celdas,
y un cabezal de lectura/escritura que se mueve sobre dicha cinta, avanzando una celda de
cada vez. En la figura 7 se representa el caso particular de un conjunto de smbolos en la
cinta formados por 0 y 1.

Un movimiento de la mquina de Turing, depende del smbolo explorado con la


cabeza, y del estado actual en el que se encuentra la mquina, el resultado puede ser :

a) Cambio de estado
b) Imprime un smbolo en la cinta reemplazando el smbolo ledo.
c) Se mueve la cabeza de la cinta a la izda, a la derecha o se para.

Pueden darse los tres fenmenos anteriores, juntos o separados.

Formalmente una mquina de Turing es un autmata, y como todo autmata est


formado por una quntupla MT = (E, S, Q, f, g) sin embargo suele usarse la notacin
equivalente :

MT = (Q, , , , q0, B, F)

CELDA
CINTA

1 1 0 0 0 0 1 1 1 1 1 1 0 1 1

MOVIMIENTO A IZQUIERDA MOVIMIENTO A DERECHA

CABEZA DE LECTURA / ESCRITURA

Fig. 7 : Esquema de mquina de Turing.

donde :

- 43 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

- Q = {conjunto de estados}
- = {conjunto de smbolos permitidos en la cinta}
- B es el smbolo blanco.
- es el subconjunto de smbolos de entrada no incluyendo el blanco.
- : Q Q {I, D, S} donde es la funcin del siguiente movi-
miento, I significa movimiento a izquierda, D significa movimiento a derecha,
y S parada (stop).
- q0 Q es el estado inicial.
- F Q es el subconjunto de estados finales

El lenguaje aceptado o reconocido por una mquina de Turing, que denotaremos por
L(MT), es el conjunto de palabras formadas con el alfabeto * , que hace que la mquina
de Turing se pare al alcanzar un estado final.

En un principio la cabeza de la mquina de Turing est situada a la izquierda de la


cadena a reconocer, y su estado es el estado inicial q0.
Formalmente, el lenguaje aceptado por una mquina de Turing
MT = (Q, , , , q0, B, F) es :

L(MT) = {W/W * y q0W 1p2 p F, 1,2 *}

Una mquina de Turing reconoce un lenguaje L si es capaz de reconocer todas las


sentencias de dicho lenguaje. Si una sentencia de L es aceptada, la maquina se para, es
decir alcanza un estado final. Pero si no se acepta la sentencia, la mquina de Turing no
se parar nunca.

12.1 Teorema

Para toda gramtica de tipo 0, existe una mquina de Turing que reconoce el lenguaje
generado por dicha gramtica.

12.2 Teorema

Para toda mquina de Turing, existe una gramtica de tipo 0 que genera un lenguaje
igual al reconocido por la mquina de Turing.

- 44 -
MQUINAS DE TURING

12.3 Corolario

Existe una correspondencia entre gramticas, lenguajes y autmatas de tipo 0, tal y


como se mostr en el diagrama de la figura 6.

Ejemplo 12.4

Disear una mquina de Turing que acepte el lenguaje L = {0n 1n /n 1} .

Solucin : Inicialmente la cinta contendr 0n 1n , sequido por ambos lados por un


nmero infinito de blancos.

El algoritmo de reconocimiento es el siguiente : la cabeza de lectura/escritura se


coloca en el 0 ms a la izquierda y lo reemplaza por una X, se mueve a la derecha hasta
encontrar el 1 ms a la izquierda, reemplazndolo por una Y, despus se mueve a la
izquierda hasta encontrar la X ms a la derecha, entonces se mueve una celda a la derecha,
y repite el ciclo.

La mquina de Turing que reconoce el lenguaje L es MT = (Q, , , , q0, B, F) donde :

Q={q0, q1, q2, q3, q4}


={0,1}
={0,1,X,Y,B}
F={q4}
q0 es el estado inicial
La funcin viene dada por la tabla siguiente.

0 1 X Y B

q0 q1,X,D - - q3,Y,D -

q1 q1,0,D q2,Y,I - q1,Y,D -

q2 q2,0,I - q0,X,D q2,Y,I -

q3 - - - q3,Y,D q4,B,D

q4 S S S S S

- 45 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Los guiones (-) en la tabla significan estados imposibles. La mquina primero escribe,
luego cambia de estado y por ltimo se mueve. Utilizando la mquina anterior se puede
reconocer la cadena 0011 :

q00011 Xq1011 X0q111 Xq20Y1 q2X0Y1 Xq00Y1


XXq1Y1 XXYq11 XXq2YY Xq2XYY XXq0YY
XXYq3Y XXYYq3 XXYYBq4 S

- 46 -
AUTMATAS LINEALES ACOTADOS

CAPTULO 13: AUTMATAS LINEALES ACOTADOS


Los autmatas de tipo 1 son los autmatas limitados linealmente o autmatas lineales
acotados, en ingls linear bounded automaton. Un autmata lineal acotado es una mquina
de Turing que satisface las siguientes condiciones :

a) El alfabeto de entrada incluye dos smbolos especiales # y $, que son las


marcas fin de cinta, izquierda y derecha respectivamente.
b) La cabeza del autmata no puede desplazarse fuera de los limites izquierdo
y derecho de la cinta, y no puede imprimir otro smbolo sobre # y $.

Un autmata lineal acotado se puede representar por el diagrama de la figura 8. Se


representa el caso particular de que los smbolos de la cinta son 0 y 1.

CELDA
CINTA

# 1 1 0 0 0 0 1 1 1 0 1 1 $

MOVIMIENTO A IZQUIERDA MOVIMIENTO A DERECHA

CABEZA DE LECTURA / ESCRITURA

Fig. 8 : Esquema de autmata lineal acotado.

Un autmata lineal acotado se puede definir formalmente como una mquina de


Turing con dos smbolos lmite de la cinta.

ALA = (Q, , , , q0, #, $, F}

donde Q, , , , q0, y F significan lo mismo que en la mquina de Turing; # y $ son


smbolos de , correspondientes a la marca izquierda y derecha de la cinta.

El lenguaje aceptado por un autmata lineal acotado, es :

L(ALA) = { W / W { - {#,$}}* y q0#W$ q para algn q F}

- 47 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ntese que las marcas fin de cinta y comienzo de cinta no son consideradas como
parte de la sentencia a reconocer. Un autmata lineal acotado no puede moverse fuera de
la cadena de entrada.

13.1 Teorema

Para toda gramtica sensible al contexto G1 existe un autmata reconocedor lineal


acotado RALA, tal que el lenguaje generado por la gramtica L(G1), es reconocido por el
autmata RALA.

L(G1)=L(RALA)

13.2 Teorema

Si L(RALA) es el lenguaje reconocido por un autmata lineal acotado, existe una


gramtica sensible al contexto G1, tal que el lenguaje reconocido por el autmata es igual
al generado por la gramtica.

L(RALA)=L(G1)

13.3 Corolario

De los dos teoremas anteriores se deduce que existe una correspondencia entre las
gramticas de tipo 1, los lenguajes de tipo 1, y los autmatas lineales acotados.

- 48 -
AUTMATAS DE PILA

CAPTULO 14: AUTMATAS DE PILA


Un autmata de pila AP, en ingls pushdown automata, es un autmata capaz de
reconocer los lenguajes libres de contexto, o de tipo 2. Los autmatas de pila se pueden
representar como una mquina de Turing, que slo puede leer de una cinta, y que puede
guardar resultados intermedios en una pila. De hecho, su capacidad de procesamiento es
inferior a los ALA, debido a las siguientes restricciones sobre las posibles operaciones con
la cinta y la pila :

- La cinta se desplaza en un slo sentido, y su cabeza slo puede leer.


- La pila, est limitada en un extremo por definicin, cuando se lee un elemento
de la pila, este desaparece o se saca, y cuando se escribe en la pila, se introduce
un elemento.

Las operaciones elementales, que se pueden realizar con un AP, son de dos tipos :

- Dependientes de la entrada : se lee ei , y se desplaza la cinta, y en funcin


de ei, qj (el estado en que se encuentra la cinta), y Z (el valor de la pila), el
control pasa a otro estado ql, y en la pila se introduce Z, o se extrae Z, o no
se hace nada.
- Independientes de la entrada : puede ocurrir lo mismo que en el caso anterior,
slo que ei no interviene, la cinta no se mueve, lo que permite manejar la pila
sin las informaciones de entrada.

En cualquier caso, si se vacia la pila (es decir se extrae todas las Z) el autmata se
para.
Un autmata de pila se puede representar intuitivamente segn el esquema de la
figura 9.

- 49 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

MOVIMIENTO DE LA CINTA
CINTA

1 1 0 0 0 0 1

CONTROL DE ESTADOS
PILA

Fig. 9 : Esquema de un autmata de pila.

Un autmata de pila se puede definir formalmente como una sptupla :

AP = (Q, , , , q0, Z0, F)

donde :

- Q es el conjunto finito de estados.


- es el alfabeto de entrada, es finito.
- es el alfabeto de pila.
- es la funcin de transicin, y es una aplicacin de la forma :

: Q { {}} Q *
- q0 es el estado inicial, y cumple q0 Q.
- Z0 es el smbolo inicial que contine la pila antes de comenzar, evidentemente
Z0 .
- F es el conjunto de estados finales, evidentemente F Q.

Tal y como ha sido definida la funcin de transicin , el autmata es en general no


determinista. Se entiende por no determinista, cuando el resultado de la funcin no est
determinado, es decir pueden resultar dos o ms valores, sin que la funcin precise cual
va a tomar de ellos.

- 50 -
AUTMATAS DE PILA

Se define configuracin de un autmata de pila a su situacin en un instante, que se


puede expresar formalmente mediante el terceto :

(q, W, )

donde :

- q representa el estado actual del autmata, y evidentemente q Q .

- W es la cadena de entrada que resta por analizar, siendo W * ; si W = ,


se asume que toda la cadena de entrada ya ha sido leda.

- es el contenido de la pila, en el instante considerado, y = indica que


la pila est vacia. Por supuesto * .

Se entiende por movimiento de un autmata a una transicin entre configuraciones,


y se representa por el operador binario . As por ejemplo sea el siguiente movimiento :

(q, aW, z ) (q, W, )

donde la funcin de transicin para esta entrada toma el valor (q,aW,Z) (q, ) , siendo
q Q , a {} , W * , Z , y * .

Es decir que el autmata se encuentra en el estado q, que la cabeza de lectura de la


cinta se encuentra sobre el smbolo a, y que la pila contiene determinados smbolos
representados por la concatenacin de Z y , siendo el situado ms a la izquierda Z el que
se encuentra en cabeza de la pila (fig. 10).

MOVIMIENTO DE LA CINTA
CINTA

a W

CONTROL DE ESTADOS
PILA

- 51 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Fig. 10 : Transicin en un autmata de pila.

El autmata pasa de la configuracin (q, aW, z) a la configuracin (q, W, ) , es


decir pasa a un estado q, avanzando la cabeza de lectura al siguiente smbolo y procediendo
a realizar determinadas sustituciones en la cabeza de la pila (fig. 11).

MOVIMIENTO DE LA CINTA
CINTA

a W

CONTROL DE ESTADOS
PILA

Fig. 11 : Transicin en un autmata de pila.

14.1 Lenguaje reconocido por un autmata de pila

Se puede definir de dos formas :

a ) El autmata reconoce una cadena de entrada, cuando alcanza el estado final, es


decir el lenguaje reconocido por un autmata de pila se puede expresar de la siguiente
forma :

L(AP) = {W/W * y (q0,W, Z0) (q f , , )}

b ) El autmata reconoce la cadena cuando la pila queda vacia, independientemente


del estado al que se llegue, entonces el lenguaje reconocido por el autmata es :

L(AP) = {W/W * y (q0,W, Z0) (q , , )}

Se puede demostrar que ambas definiciones de L(AP), son equivalentes, en el sentido


de que la clase de lenguajes aceptados por los autmatas de pila es la misma en ambos
casos.
- 52 -
AUTMATAS DE PILA

14.1.1 Teorema

Para toda gramtica libre de contexto G2, existe un reconocedor constituido por un
autmata de pila RAP, tal que el lenguaje generado por la gramtica L(G2) es reconocido
por el autmata RAP.

L(G2)=L(RAP)

14.1.2 Teorema

Para todo reconocedor constituido por un autmata de pila RAP, existe una gramtica
libre de contexto G2, tal que el lenguaje reconocido por el autmata es igual al generado
por la gramtica.

L(RAP)=L(G2)

14.1.3 Corolario

De los dos teoremas anteriores se deduce que el conjunto de lenguajes reconocidos


por los autmatas de pila, son los lenguajes de tipo 2 y que todo lenguaje de tipo 2 se puede
reconocer por un autmata de pila. Tambin se puede deducir que existe una correspon-
dencia entre las gramticas, los lenguajes y los autmatas de tipo 2.

Ejemplo 14.1.4

Construir un autmata de pila que reconozca el lenguaje L = {0n 1n /n 0} .

Solucin : Se puede definir un autmata de pila, P, de la forma:

P = ({q0, q1, q2}, {0,1}, {Z,0}, , q0, Z, {q0})

donde se define :

(q0, 0, Z) (q1, 0Z)

(q1, 0, 0) (q1, 0, 0)

(q1, 1, 0) (q2, )

(q2, 1, 0) (q2, )

- 53 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

(q2, , Z) (q0, )

(q0, , Z) (q0, )
El autmata va copiando todos los 0 de la cinta en la pila, y cuando va encontrando
los 1, va sacando los ceros de la pila. Puede observarse que la cadena vacia tambin
pertenece al lenguaje.

Tambin se puede definir por la tabla, donde los guiones (-) representan estados
imposibles.

0 1

q0,Z q1,0Z - q0,

q1,0 q1,00 q2, -

q2,0 - q2, -

q2,Z - - q0,

Por ejemplo para reconocer la sentencia 0011 del lenguaje, se realizan las siguientes
transiciones :

(q0,0011,Z) (q1,011,0Z) (q1,11,00Z) (q2,1,0Z) (q2,,Z) (q0,,)

En el caso general de i1, las transiciones son las siguientes :


i i
(q0,00i11i,Z) (q1,0i11i,0Z) (q1,11i,00iZ) (q2,1i,0iZ) (q2,,Z) (q0,,)

y para i=0 la transicin es :

(q0,00i11i,Z) (q0,,)

14.2 Algoritmo de transformacin de una gramtica de tipo 2 en un autmata de


pila

Dada una gramtica de tipo 2 se puede construir un autmata de pila (por lo general
no determinista) que reconozca el mismo lenguaje que genera la gramtica.

- 54 -
AUTMATAS DE PILA

Sea la gramtica G=(VN,VT,S,P) se desea construir el autmata de pila


AP=(Q,, , , q0, z0, F) que reconozca el mismo lenguaje generado por G. As se puede
obtener el autmata AP de la siguiente forma:

= VT El vocabulario o alfabeto de entrada del autmata coincide con


el vocabulario terminal VT de la gramtica.

= VN VT El alfabeto de la pila coincide con la union de los


vocabularios terminal y no terminal de la gramtica.

z0 = S El smbolo inicial que contiene la pila es el smbolo inicial de la


gramtica

Q = {q} El conjunto de estados del autmata tiene un estado nico q

F = {} El conjunto de estados finales del autmata de pila est


vacio. El autmata slo se parar si se vacia la pila.

La funcin de transicin se construye de la siguiente forma:

a) Para todo smbolo terminal x se construye la siguiente


relacin (q, x, x) (q, ) que se puede interpretar como:

Saca x de la pila
Avanza el smbolo x de la cinta

No escribe nada en la pila

No cambia de estado

b) Para toda regla de produccin A perteneciente a P se


construye la siguiente relacin (q , , A) (q , ) que se
puede interpretar como:

No avanza la cinta

Saca A de la pila

Mete en la pila

No cambia de estado

- 55 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejemplo 14.2.1

Sea la gramtica G=(VN,VT,S,P) que representa el manejo de expresiones aritm-


ticas, siendo VN={E,T,F} donde E es la abreviatura de expresin, T la de trmino y F la
de factor. VT={a,+,*,(,)} donde a representa a los identificadores. El smbolo inicial S=E.
Las reglas de produccin son las siguientes:

E E +T |T
T T*F | F
F (E) | a

Construir un autmata de pila que reconozca el mismo lenguaje generado por la


gramtica G.

Solucin: AP=(Q,, , , q0, z0, F) donde

Q = {q}
= {a , +, *, (, )}
= {a, +, *, (, ), E, T, F}
q0 = q
z0 = E
F = {}

a) Smbolos terminales

(1) (q , a, a) (q, )

(2) (q, +, +) (q , )

(3) (q, *, *) (q , )

(4) (q, (, ( ) (q, )

(5) (q , ), ) ) (q, )

b) Reglas de produccin

(6) (q , , E) (q, T)

(7) (q, , E) (q, E + T)

(8) (q, , T) (q , F)

(9) (q , , T) (q, T*F)

- 56 -
AUTMATAS DE PILA

(10) (q , , F) (q, (E))

(11) (q, , F) (q , a)

Se puede observar que si se desea reconocer una cadena por ejemplo a+a se producen
retrocesos, debido a que el autmata no es determinista. As se pone la cadena a reconocer
a+a en la cinta, el autmata en el estado inicial q, y la pila con su valor inicial E. Las reglas
de transicin entre configuraciones estn numeradas y el autmata aplica en primer lugar
la regla con nmero ms bajo.
(6) (8) (10)
(q , a + a , E) (q, a + a, T) (a, a + a , F) (a , a + a , (E) )

Aqu se alcanza una configuracin imposible. El smbolo terminal en la cima de la


pila no coincide con el smbolo terminal de la cinta. Se debe retroceder hasta donde se
eligi la ltima regla alternativa que fue la (10). Se observa que hay otra regla la (11).
(11) (1)
(q , a + a , F) (q, a + a, a ) (q, +a, )

Se alcanza una configuracin imposible la pila est vacia pero queda una parte de la
cadena en la cinta. Se tiene que retroceder hasta aplicar otra regla alternativa. Se retrocede
hasta donde se aplic la regla (8) y ahora se utiliza la regla (9).
(9) (8) (10)
(q , a + a, T) (q, a + a, T*F) (q, a + a, F*F) (q , a + a, (E)*F)

Se alcanza una configuracin imposible. Se retrocede y se aplica la regla (11) en vez


de la (10).
(11) (1)
(q , a + a, F*F) (q, a + a, a*F) (q, +a, *F)

Se alcanza una configuracin imposible. Se retrocede hasta donde se aplic la regla


(6) y ahora se utiliza la regla (7). Estamos otra vez en la configuracin inicial.
(7) (6) (8) (10)
(q , a + a , E) (q , a + a , E + T) (q , a + a , T + T) (q , a + a , F + T) (q , a + a , (E) + T)

Se alcanza una configuracin imposible y se retrocede hasta donde se aplic la regla


(10) y ahora se usa la (11).
(11) (1) (2) (8) (10)
(q , a + a , F + T) (q , a + a , a + T) (q , +a , +T) (q , a , T) (q , a , F) (q , a , (E))

Se alcanza una configuracin imposible y se retrocede hasta donde se aplic la regla


(10) y ahora se usa la (11).
- 57 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

(11) (1)
(q , a , F) (q, a , a) (q, , )

La cadena a+a ha sido reconocida por el autmata.

Ejercicio 14.2.2

Sea la gramtica G=(VN,VT,S,P) que representa el manejo de expresiones tipo Lisp,


siendo VN={S,R} y VT={x,(,), , }. Las reglas de produccin son las siguientes:

S x

S (SR

R , SR

R )
Determinar el lenguaje que genera y construir el autmata que lo reconoce. Poner
un ejemplo de reconocimiento de una cadena del lenguaje.

- 58 -
AUTMATAS FINITOS

CAPTULO 15: AUTMATAS FINITOS


Los autmatas finitos reconocen los lenguajes regulares, o de tipo 3 y se pueden
representar intuitivamente por una cinta y una cabeza de lectura (fig. 12).

MOVIMIENTO A IZQUIERDA CELDA


CINTA

1 1 0 0 0 0 1 1 1 1 1 1 0 1 1

CONTROL DE ESTADOS

Fig. 12 : Esquema intuitivo de un autmata finito.

La cinta de entrada, slo contiene smbolos de un determinado alfabeto, y se mueve


en una sla direccin.

El control de estados, determina el funcionamiento del autmata.

Una sentencia de un lenguaje determinado, colocada en la cinta, y leda por el


autmata finito, es reconocida por ste, si el control de estados llega a un estado final.

15.1 Definicin formal de autmata finito

Se puede definir como una quntupla AF = (E, Q, f, q1, F) donde :

E = {conjunto finito de smbolos de entrada, que constituye el vocabulario}

Q = {conjunto finito de estados}

f:E * Q Q es la funcin de transicin

q1 Q , es el estado inicial

F Q es el conjunto de estados finales

- 59 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Se entiende por configuracin de un autmata finito, a un par de la forma (q, W)


donde q, es el estado actual, y W la cadena que queda por leer en ese instante. Segn la
definicin anterior, se puede afirmar que la configuracin inicial de un autmata finito es
el par (q1, t) siendo t la sentencia o cadena de entrada a reconocer. La configuracin final
se representa por el par (qi, ) donde qi F, y indica que no queda nada por entrar de la
cinta.

Un movimiento de un autmata finito, puede definirse como el trnsito entre dos


configuraciones, y se representa por (q, aW) (q,W) y se debe de cumplir que f(q,a)=q.

15.2 Lenguaje reconocido por un autmata finito

Cuando un autmata transita a una configuracin final partiendo de la configuracin


inicial, en varios movimientos, se dice que se ha producido aceptacin o reconocimiento
de la cadena de entrada. Es decir que dicha cadena, pertenece al lenguaje reconocido por
el autmata.

Por el contrario, cuando el autmata finito no es capaz de llegar a un estado final, se


dice que el autmata no reconoce dicha cadena y que por tanto no pertenece al lenguaje.

El lenguaje reconocido por un autmata finito, es:

L(AF) = {t/t E *, (q1,t) (qi , ), qi F}

15.2.1 Teorema

Para toda gramtica regular, G3, existe un autmata finito, AF, tal que el lenguaje
reconocido por el autmata finito es igual al lenguaje generado por la gramtica.

L(AF) = L(G3)

15.2.2 Teorema

Para todo autmata finito, AF, existe una gramtica regular, G3, tal que el lenguaje
generado por la gramtica es igual al lenguaje reconocido por el autmata finito

L(G3) = L(AF)

15.2.3 Corolario

Segn el teorema 15.2.1, se tiene que {L(G3)} {L(AF)} y por el teorema 15.2.2,
{L(AF) {L(G3)} , luego {Lregulares} = {L(AF)} = {L(G3)}
- 60 -
AUTMATAS FINITOS

La forma habitual de representar los autmatas finitos es mediante un grafo o dia-


grama de estados (fig. 13), donde los nodos son los estados y las ramas estn marcadas
con los smbolos del alfabeto de entrada. Las ramas se construyen segn la funcin de
transicin, as debe de cumplir f(q1, a) q2.

q q
1 2

Fig. 13 : Transicin entre dos estados.

Los nodos que representan los estados finales, suelen marcarse con un doble crculo, y el
estado inicial tambin se marca con una flecha, encima de la cual se coloca la palabra
INICIO.

Ejemplo 15.2.4

Sea el autmata finito A1 = (E, Q, f, q1, F) donde E = {a, b} {} ; Q = {q1, q2, q3, q4}
y la funcin f viene dada por la tabla siguiente y el conjunto de estados finales es F={q3}

f a b

q1 q2 q4

q2 q2 q3

q3 q4 q3

q4 q4 q4

Determinar el lenguaje que reconoce, representar el diagrama de Moore, e indicar la


expresin regular que representa al lenguaje.

- 61 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Solucin : Se construye el diagrama de Moore, colocando en primer lugar todos los


estados dentro de crculos, marcando con doble crculo el estado final. El estado inicial se
indica con una flecha que lo seala con la palabra INICIO encima. Para construir las ramas,
nos situamos en el primer estado de la tabla de transiciones y se observa que f(q1,a)=q2,
entonces se traza una flecha entre q1 y q2, apuntando a q2, y se coloca encima de la flecha
el smbolo del vocabulario de entrada a. De igual forma se recorre la tabla de transiciones
para cada estado y entrada completndose el diagrama de Moore.

a b

INICIO a b
q q2 q
1 3

b
a

q
4
a,b

Fig. 14 : Diagrama de Moore del ejemplo 15.2.4

El lenguaje generado se obtiene partiendo del estado inicial y recorriendo todos los
caminos posibles para alcanzar el estado final. As se obtiene que este autmata reconoce
el lenguaje :

L(A1) = {ab , aab, , abbb, , aabb, }

L(A1) = {a n b m /n 1m 1}

La expresin regular que denota el lenguaje es a+b+ o tambin aa*bb*.

- 62 -
AUTMATAS FINITOS

Ejemplo 15.2.5

Sea el autmata finito A2 = (E, Q, f, q1, F) donde E = {0,1} , Q = {q1, q2, q3, q4} y f se
define por la tabla siguiente, y F={q2}.

f 0 1

q1 q4 q2

q2 q3 q4

q3 q4 q2

q4 q4 q4

Construir el diagrama de Moore, y determinar el lenguaje que reconoce, denotndolo


con su expresin regular.

Solucin : Se construye el diagrama de Moore de forma anloga al ejemplo anterior


(fig. 15).

El lenguaje generado es el siguiente :

L(A2) = {1,101,10101,} = {1(01)n /n 0}

La expresin regular 1(01)*.

0
INICIO 1
q q q
1 2 3
1
1
0 0

q
4

0,1

- 63 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Fig. 15 : Diagrama de Moore del ejemplo 15.2.5.

Ejemplo 15.2.6

Sea el autmata finito A3 = ( E, Q, f, q1, F) donde E = {a,b,c}, Q = {q1, q2, q3, q4, q5},
f se representa por la tabla siguiente y F={q2, q4}.

Representar el diagrama de Moore, determinar el lenguaje que reconoce, y denotarlo


con una expresin regular.

f a b c

q1 q2 q3 q5

q2 q5 q5 q5

q3 q5 q5 q4

q4 q5 q5 q5

q5 q5 q5 q5

Solucin : El diagrama de Moore se construye al igual que en los ejemplos anteriores


(fig. 16).

El lenguaje generado es L(A3)={a,bc}, se puede denotar con la expresin regular


a | bc.

q2
a a,b,c

a,b,c
INICIO
c
q q
1 5

b a,b
a,b,c

q q4
3 c

Fig. 16 : Diagrama de Moore del ejemplo 15.2.6.

- 64 -
AUTMATAS FINITOS

Ejemplo 15.2.7

Sea el autmata A4 = (E = {1,2,3}, Q = {q1, q2, q3}, f, q1, F = {q2}), donde f viene dada
por la tabla siguiente.

f 1 2 3

q1 q1 q1 q2

q2 q3 q3 q3

q3 q3 q3 q3

Determinar el diagrama de Moore, el lenguaje que genera y la expresin regular que


lo describe.

Solucin : El diagrama de Moore se construye al igual que en los ejemplos anteriores


(fig. 17).

El lenguaje reconocido es el siguiente :

L(A4) = {3,13,113,1113, ,123,12223, ,213,21113, }

(n ) (n ) (n ) (n )
L(A4) = 1 1 2 2 1 3 2 4 3/n1, n2, 0

1,2 1,2,3

INICIO 3 1,2,3
q q2 q
1 3

Fig. 17 : Diagrama de Moore del ejemplo 15.2.7.

La expresin regular es (1 | 2)*3.

Ejemplo 15.2.8

Construir un autmata finito que reconozca un identificador de un lenguaje de pro-


gramacin, definido en EBNF de la forma :

- 65 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

<identificador> ::= <letra> {<letra>|<dgito>}


<letra> ::= a|b|...|z
<dgito> ::= 0|1|2|...|9

Solucin : Este ejemplo es inverso a los anteriores, pues se da un lenguaje y se pide


el autmata que lo reconoce. En primer lugar se construye un diagrama de Moore, de tal
forma que a partir del estado inicial, despus de leer una letra, acepte letras o dgitos de
forma variable, y cuando encuentre un carcter diferente de letra o dgito alcance el estado
final. El diagrama de Moore es el que se muestra en la figura 18.

letra, dgito

INICIO letra $
q q q
0 1 2

Fig. 18 : Diagrama de Moore del ejemplo 15.2.8.

$ representa a todos los caracteres diferentes de letra o dgito.

El autmata finito se deduce del diagrama de Moore y es el siguiente :

AF = (E = {a , b , , z,0,1, 9,$}, Q = {q0, q1, q2}, f, q0, F = {q2})

donde f se define por :

f <letra> <dgito> $

q0 q1 - -

q1 q1 q1 q2

q2 - - -

15.3 Clasificacin de los autmatas finitos

Cuando se defini autmata finito, la funcin f:E * Q Q , es en general no


determinista. As en funcin de f, se hablar de autmatas finitos deterministas AFD y
autmatas finitos no deterministas AFND.

- 66 -
AUTMATAS FINITOS

Un autmata finito no determinista AFND se caracteriza por la posibilidad de que


dada una entrada e en un estado qi, se pueda pasar a un estado qj, qk,...,qn sin saber a ciencia
cierta, a cual de esos estados pasar. Existiendo la misma probabilidad de que pase a
cualquiera de dichos estados.

15.3.1 Autmatas finitos no deterministas

La definicin de autmata finito no determinista AFND coincide con la de autmata


finito :

AFND = (E, Q, f, q1,F)

con la salvedad de que f:E *xQ Q es no determinista.

Ejemplo 15.3.1.1

Sea el autmata finito no determinista AFND = (E, Q, f, q1,F) donde E={a,b},


Q = {q1, q2, q3, q4} , F = {q4} y la funcin f viene dada por la siguiente tabla :

f a b

q1 {q2,q3}

q2 {q2,q4}

q3 q3 q4

q4 q4

Determinar el lenguaje que reconoce, y dar su expresin regular.

Solucin : El diagrama de Moore se construye al igual que en los ejemplos anteriores


de autmatas finitos, con la salvedad de que para una entrada a un estado puede salir ms
de una flecha de un determinado estado (fig. 19).

El lenguaje reconocido es el siguiente :

a(b *b | a *b)a *

o tambin

a(b * | a *)ba *

- 67 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

q
2

a b

b a
INICIO
q q4
1

b
a
q
3

Fig. 19 : Diagrama de Moore del ejemplo 15.3.1.1.

15.3.2 Autmatas finitos deterministas

Un autmata finito determinista AFD es un caso particular de los autmatas finitos,


en el que la funcin de transicin no presenta ningna ambigedad en las transiciones de
estados para una entrada dada.

Un autmata finito determinista es una quntupla AFD=(E, Q, f, q1, F) donde la


funcin f:E * Q Q es determinista.

15.3.3 Teorema sobre la transformacin de AFND en AFD

El teorema dice as : "Para todo autmata finito no determinista AFND=(E, Q, f, q1,


F) se puede construir un autmata finito determinista AFD=(E, Q, f, q1, F) tal que el
lenguaje reconocido por el autmata finito determinista AFD coincida con el lenguaje
reconocido por el autmata finito no determinista AFND, es decir L(AFD) = L(AFND)".

Demostracin :

Se determina en primer lugar Q que es el conjunto de las partes del conjunto de


estados Q.

Q = P(Q) = { conjunto de las partes de Q }

- 68 -
AUTMATAS FINITOS

El cardinal de Q o nmero de estados del conjunto Q es :

cardinal (Q)= 2 cardinal(Q)

Al estado de Q que corresponde a {qa,qb,...ql} se denotar por [qa,qb,...ql] es decir que se


define f de la forma :

f(e,[qa,qb,...ql])=[qm,qn,...qk] si y slo si f(e,{qa,qb,...ql})={qm,qn,...qk}

Es decir se calcula f(e,q) aplicando f a cada estado q de los que figuran en q y


haciendo la unin de todos los resultantes.

q1=[q1]

F={q Q/q f q y q f F }

Es decir, para que q sea estado final basta que uno o ms de los estados de Q que lo
componen sea final.

Con esto se ha construido un autmata finito determinista, ahora hace falta demostrar
que reconocen el mismo lenguaje, para ello bastar comprobar que, para todo x E *,
f(x,q1) F si y solo si f(x,q1) contiene un estado (o varios) qf F, y teniendo en cuenta
la definicin de F esto ser evidentemente cierto si se demuestra que :

f(x,q1)=[qa,...,ql] si y slo si f(x,q1)={qa,...,ql}

Tal demostracin puede hacerse por induccin sobre la longitud de x : para longitud
de x nula, x = , es inmediato puesto que f(,q1)=q1=[q1], y f(,q1)={q1}. Supngase
que es cierto para longitud de x <= 1; entonces para e E se tiene que

f(xe,q1)=f(x,q1)

Pero por hiptesis de induccin :

f(x,q1)=[qa,...,ql] si y slo si f(x,q1)={qa,...,ql}


y por definicin de f

f(e,[qa,...,ql])= [qm,qn,...qk] si y slo si f(e,{qa,...,ql})={qm,qn,...qk}

Por tanto

f(x,q1)=[qm,...,qk] si y slo si f(xe,q1)={qm,...,qk}

con lo que queda demostrado.

- 69 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejemplo 15.3.3.1

Sea el autmata finito no determinista del ejemplo 15.3.1.1, determinar un autmata


finito determinista equivalente.

Solucin : Siguiendo la construccin del teorema 15.3.3, el AFD tendr en un


principio 24 estados, es decir Q conjunto de las partes de Q tiene en un principio 16 estados.
Tambin se define el estado inicial y el conjunto de estados finales F.

Q={,[q1],[q2],[q3],[q4],[q1q2],...,[q1q2q3q4]}
q1=[q1]
F={[q4],[q1q4],[q2q4],[q3q4],[q1q2q4],...,[q1q2q3q4]}

y f se construye a partir de f resultando la siguiente tabla :


f a b

[q1] [q2q3]
[q2] [q2q4]
[q3] [q3] [q4]
[q4] [q4]
[q1q2] [q2q3] [q2q4]
[q1q3] [q2q3] [q4]
[q1q4] [q2q3q4]
[q2q3] [q3] [q2q4]
[q2q4] [q4] [q2q4]
[q3q4] [q3q4] [q4]
[q1q2q3] [q2q3] [q2q4]
[q1q2q4] [q2q3q4] [q2q4]
[q1q3q4] [q2q3q4] [q4]
[q2q3q4] [q3q4] [q2q4]
[q1q2q3q4] [q2q3q4] [q2q4]

Ahora bien, en un AF los estados que no son accesibles desde el inicial pueden
eliminarse, as se eliminan los marcados en la tabla con flechas:

[q2], [q1q2], [q1q3], [q1q4], [q1q2q3], [q1q2q4], [q1q3q4], y [q1q2q3q4] por no aparecer
dentro de la tabla.

- 70 -
AUTMATAS FINITOS

[q2q3q4] por no aparecer en la tabla como transicin de un estado eliminado ante-


riormente.

[q3q4] por aparecer en la tabla como transicin de un estado eliminado anteriormente,


y tambin en su propio estado, no es accesible por no aparecer en otro estado.

Evidentemente [q1] nunca puede eliminarse como estado, por ser el estado inicial.

Entonces f puede resumirse segn la tabla :

f a b

[q1] [q2q3]
[q3] [q3] [q4]
[q4] [q4]
[q2q3] [q3] [q2q4]
[q2q4] [q4] [q2q4]

El estado vacio [] no puede eliminarse en este caso, pues es accesible desde [q1] y
[q4].

De los 16 estados posibles slo han quedado 6, con los que se construye el diagrama
de Moore de la figura 20.

- 71 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

[q q ]
2 3
a
a
b

INICIO
[q ] [q q ] a [q ]
1 b 2 4 3

a
b b
a
a,b
b [q ]
4

Fig. 20 : Diagrama de Moore del ejemplo 15.3.3.1.

Se puede comprobar que el lenguaje reconocido por el AFD es el mismo que el


reconocido por el AFND del ejemplo 15.3.1.1. As el lenguaje reconocido por el AFD es :

abb * | abb *aa * | aaa *ba *

= abb *( | aa *) | aaa *b a *

= abb *a * | aaa *ba *

= ab *ba * | aaa *ba *

= a (b * | aa *)ba *

= a (b * | a *)ba *
La ltima igualdad se ha obtenido teniendo en cuenta que:

b * | aa * = b * | | aa * = b * | a *

- 72 -
AUTMATAS FINITOS

15.4 Algoritmo de transformacin de una gramtica de tipo 3 en un autmata


finito

Sea una gramtica de tipo 3 o regular G=(VT,VN,S,P) y se desea obtener un autmata


finito AF=(E,Q,f,q1,F) que reconozca el lenguaje generado por la gramtica. El autmata
obtenido, en general ser no determinista.

Solucin: Se determinan los distintos elementos del autmata de la siguiente forma:

E=VT

Q=VN {q f} A cada smbolo no terminal de la gramtica se le asocia


un estado del autmata. Adems se introduce un nuevo
estado, denominado qf, que ser el nico estado final
del autmata.

q1=S

F={qf}

La funcin de transicin f se determina a partir de la forma de las reglas de produccin


P, de la manera siguiente:

a) Para reglas de la forma A a B se obtiene f(A,a)=B siendo A y B los estados


correspondientes a los no terminales A y B.

A B

Fig. 21 : Diagrama de Moore de f(A,a)=B

b) Para reglas de la forma A a se obtiene f(A,a)=qf.

A q
f

Fig. 22 : Diagrama de Moore de f(A,a)=qf

- 73 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejemplo 15.4.1

Sea la gramtica de tipo 3 siguiente :

G = (VN={A,S}, VT={a,b}, S, P)

donde P son las reglas :

S aS
S aA
A bA
A b

Obtener un AFND y otro AFD que reconozcan el mismo lenguaje que esta gramtica
genera.

Solucin : Se define el AFND a partir de la gramtica como AFND = (E, Q, f, q1, F) donde
E={a,b}, Q={A,S,X}, q1=S, F={X}, y f viene dada por la tabla siguiente :
f a b
S {S,A} -
A - {A,X}
X - -

El diagrama de Moore se representa en la figura 23.

a b

INICIO a b
S A X

Fig. 23 : Diagrama de Moore del ejemplo 15.4.1

El lenguaje que reconoce :

a *a b *b = aa *bb * = a +b +

El AFD se define como AFD=(E, Q,f, q1, F) donde f viene dado por la tabla :

- 74 -
AUTMATAS FINITOS

f a b

[S] [S,A]
[A] [A,X]
[X]
[S,A] [S,A] [A,X]
[S,X] [S,A]
[A,X] [A,X]
[S,A,X] [A,X] [A,X]

Se eliminan de la tabla los estados inaccesibles desde el estado inicial [S], y se


representa el diagrama de Moore de la figura 24.

El lenguaje que reconoce es :

aa *bb * = a +b +

- 75 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

[S,A]

a b

a
INICIO
[S] b [A,X]
a,b

b a

[S,A]

a b

a
INICIO
[S] b [A,X]

Fig. 24 : Diagrama de Moore AFD del ejemplo 15.4.1

15.5 Transformacin de una expresin regular en un autmata finito

Dada una expresin regular existe un autmata finito capaz de reconocer el lenguaje
que sta define. Recprocamente, dado un autmata finito, se puede expresar mediante una
expresin regular el lenguaje que reconoce.

Para la transformacin de una expresin regular en un autmata finito, se definirn


en un principio las equivalencias entre las expresiones regulares bsicas y sus autmatas
finitos. Posteriormente se mostrar la construccin de Thompson que genera
automticamente un autmata finito a partir de una o varias expresiones regulares de
cualquier complejidad.
- 76 -
AUTMATAS FINITOS

15.5.1 Equivalencia entre expresiones regulares bsicas y autmatas finitos

Se muestran equivalencias entre expresiones regulares simples y autmatas finitos


expresados mediante un diagrama de Moore

15.5.1.1 Expresin regular

INICIO
q q
f

Fig. 25 : Diagrama de Moore de

15.5.1.2 Expresin regular a

INICIO
q q
f

Fig. 26 : Diagrama de Moore de a

15.5.1.3 Expresin regular a*

INICIO a
q
f

Fig. 27 : Diagrama de Moore de a*

- 77 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

15.5.1.4 Expresin regular a+

INICIO
q q a
f

Fig. 28 : Diagrama de Moore de a+

15.5.1.5 Expresin regular a|b

q
1
a

INICIO
q q
f

b
q
2

Fig. 29 : Diagrama de Moore de a|b

a ,b

INICIO
q q
f

Fig. 30 : Otro diagrama de Moore de a|b

15.5.1.6 Expresin regular (a|b)*

a,b
INICIO
q
f

Fig. 31 : Diagrama de Moore de (a|b)*

- 78 -
AUTMATAS FINITOS

15.5.1.7 Expresin regular (ac|b)*

b
a

INICIO
q q
f

Fig. 32 : Diagrama de Moore de (ac|b)*

15.5.1.8 Expresin regular (acd|b)*

b
a c

INICIO
q
f q1 q
2

Fig. 33 : Diagrama de Moore de (acd|b)*

15.5.2 Construccin de Thompson

La construccin de Thompson construye un AFND a partir de cualquier expresin


regular. La herramienta lex utiliza esta construccin para obtener en sucesivos pasos un
AFD (Aho et al., 1986, captulo 3).

Supongamos que N(s) y N(t) son AFND para las expresiones regulares s y t.

a) Para la expresin regular s|t se construye el AFND N(s|t) que se muestra en la figura
34.

qj N(s) qk

INICIO
q qf

ql N(t) qm

Fig. 34 : Construccin de Thompson para N(s|t)

b) Para la expresin regular st se construye el AFND N(st) que se muestra en la figura 35.

- 79 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

INICIO
q1 N(s) q2 N(t) q3

Fig. 35 : Construccin de Thompson para st

c) Para la expresin regular s* se construye el AFND N(s*) que se muestra en la figura 36.

INICIO
q1 q2 N(s) q3 qf

Fig. 36 : Construccin de Thompson para s*

d) Para la expresin regular (s) se utiliza directamente N(s)

Ejemplo 15.5.2.1

Utilizando la construccin de Thompson construir un autmata finito AF que reco-


nozca la expresin regular (0|1)* 0 (0|1) (0|1)

Solucin: Se descompone la expresin regular en subexpresiones, siguiendo la precedencia


de operadores, tal y como se muestra en la figura 37.

r17

r12
r16
r11
r7 ( r15 )

r5 r6 r10
r13 | r14
r4 *
0 1
( r3 )

r1 | r2

0 1

Fig. 37 : Descomposicin sintctica de la expresin regular

Comenzando por r1, r2,... r7 se llega que el AFND de la expresin r7 es el representado


en la figura 38.

- 80 -
AUTMATAS FINITOS

0
2 3
INICIO 0
0 1 6 7 8

1
4 5

Fig. 38 : Construccin de Thompson para r7

Continuando se puede observar que para la expresin r17 el AFND es el que se


presenta en la figura 39.

2
0
3 0 0
9 10 14 15
INICIO 0
0 1 6 7 8
13
18
1
4 5
11 12 16 17

1 1

Fig. 39 : Construccin de Thompson para (0|1)*0(0|1)(0|1)

15.6 Minimizacin de estados de un AFD

Se defini anteriormente que dos AF son equivalentes si reconocen el mismo len-


guaje. En este apartado se trata de encontrar un AF equivalente en forma mnima. Es
importante poder saber si un AF est en forma mnima, y si no lo est hallar un AF
equivalente en forma mnima. Se puede demostrar que siempre existe una forma mnima
de un AF (Hopcroft y Ullman, 1979, pp. 67-68). Para determinar el AF en forma mnima
no es preciso realizar infinitos ensayos con cadenas de entrada. Existen algoritmos para
minimizar AF, es decir, hallar otro AF en forma mnima equivalente.

Algoritmo 15.6.1

Entrada. Un autmata finito determinista A=(E,Q,f,q0,F).

Salida. Un autmata finito determinista A=(E,Q,f,q0,F) que acepta el mismo


lenguaje que A, y que tiene el menor nmero de estados posible.

- 81 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Metodo. El algoritmo para minimizar el nmero de estados de un AFD funciona


encontrando todos los grupos de estados que pueden ser diferenciados por una cadena de
entrada. Cada grupo de estados que no puede diferenciarse se fusiona entonces en un nico
estado. El algoritmo opera manteniendo y refinando una particin del conjunto de estados.
Cada grupo de estados dentro de la particin est formado por estados que an no han sido
distinguidos unos de otros, y todos los pares de estados escogidos de entre grupos diferentes
han sido considerados distinguibles por una entrada.

1. Se construye una particin inicial del conjunto de estados Q en dos grupos : los
estados finales F y los estados no finales Q-F.

2. Se determina una nueva particin nueva a partir de la particin anterior , con el


siguiente procedimiento :

FOR cada grupo G de DO

BEGIN
Particin de G en subgrupos tales que dos estados qi y qj de G estn en el
mismo subgrupo si, y slo si, para todos los smbolos de entrada e, los
estados qi y qj tienen transiciones en e hacia estados del mismo grupo de
;

/* en el peor caso, un estado estar slo en un subgrupo */

sustituir G en nueva por el conjunto de todos los subgrupos formados;


END

3. Se realizan las siguientes comprobaciones.

IF nueva= THEN

BEGIN
final:=;
GOTO 4; /* Ir al paso 4 */
END

ELSE

- 82 -
AUTMATAS FINITOS

BEGIN
:=nueva;
GOTO 2; /* Volver al paso 2 */
END

4. Se escoge un estado en cada grupo de la particin final como representante de


este grupo.
Los representantes seran los estados reducidos Q de A. Sea un estado qi repre-
sentante, y sea una entrada a que produce una transicin de qi a qj en A. Sea qk el
representante del grupo de qj (qk puede ser qj). Entonces A tiene una transicin desde qi
a qk con la entrada a. Sea el estado inicial q0 de A el representante del grupo que contiene
al estado inicial q0 de A, y sean los estados finales F de A los representantes que estn
en F. Se puede observar que cada grupo de final consta nicamente de estados en F o no
tiene ningn estado en F.

5. Se eliminan los estados pasivos qp de Q, es decir estados que no son finales, y


que tienen transiciones hacia ellos, pero no desde ellos hacia otros. Todas las transiciones
a qp desde otros estados se convierten en indefinidas. Tambin se eliminan los estados
inaccesibles de Q, es decir todos los estados que no se pueden alcanzar desde el estado
inicial. Se obtiene Q y la funcin f.

Ejemplo 15.6.2

Sea el autmata finito determinista A=(E,Q,f,q1,F), donde E={a,b},


Q={q1,q2,q3,q4,q5}, F={q5}, y f viene dada por la tabla :

f a b

q1 q2 q3

q2 q2 q4

q3 q2 q3

q4 q2 q5

q5 q2 q3

Se desea determinar un autmata equivalente con un nmero de estados mnimo.

Solucin

- 83 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

(1).La particin inicial consta de dos grupos : (q5) conjunto de estados finales, y
(q1q2q3q4) los estados no finales.

(2). Se aplica el procedimiento de particin a cada grupo. El grupo (q5) consta de un


slo estado, y no se puede dividir ms, se coloca directamente en nueva. El otro grupo
(q1q2q3q4), con la entrada a tiene una transicin a q2, as que todos podran permanecer en
un mismo grupo en lo que a la entrada a se refiere. Sin embargo, con la entrada b, q1, q2,
y q3 van a miembros del grupo (q1q2q3q4) de mientras que q4 va al grupo (q5). Por lo
tanto nueva, tiene tres grupos :(q1q2q3), (q4) y (q5).

(3). Como nueva no es igual a , se repite el paso (2) con :=nueva.

(2). Se aplica el procedimiento de particin a los grupos de que constan de ms de


un estado. Para una entrada a en el grupo (q1q2q3), no hay divisin, sin embargo para la
entrada b se produce una divisin en (q1q3) y (q2), puesto que (q1q3) tienen una transicin
a q3, mientras que q2 tiene una transicin a q4, que es miembro de un grupo distinto de
(q1q2q3). Por lo tanto nueva, tiene cuatro grupos :(q1q3), (q2), (q4) y (q5).

(3). Como nueva no es igual a , se repite el paso (2) con :=nueva.

(2). Se aplica el procedimiento de particin a los grupos de que constan de ms de


un estado. La nica posibilidad es intentar dividir (q1q3). Sin embargo, q1 y q3 van al mismo
estado q2 para la entrada a, y al mismo estado q3 para la entrada b. Por lo tanto nueva, tiene
cuatro grupos :(q1q3), (q2), (q4) y (q5).

(3). Como nueva es igual a , se va al paso (4) con final:=.

(4). Se escoge q1 como representante del grupo (q1q3), y q2, q4 y q5 como representantes
de los grupos de un slo estado.

(5). El automata con un nmero de estados mnimo A=(E,Q,f,q1,F), donde E={a,b},


Q={q1,q2,q4,q5}, F={q5}, y f viene dada por la tabla :

f a b

q1 q2 q1

q2 q2 q4

q4 q2 q5

q5 q2 q1

- 84 -
AUTMATAS FINITOS

En el autmata reducido A, el estado q5 tiene una transicin al estado q1 con la


entrada b, puesto que q1 es el representante del grupo (q1q3) y hay una transicin de q5 a
q3 con la entrada b en el autmata original. Una modificacin similar se realiza para el
estado q1 y la entrada b. Todas las dems transiciones estn tomadas de f. No hay ningn
estado pasivo, y todos los estados son accesibles desde el estado inicial q1.

Se puede observar que el lenguaje reconocido por los autmatas A y A es (a|b)*abb.

- 85 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

CAPTULO 16: EJERCICIOS RESUELTOS

Ejercicio 16.1

Dada la gramtica G=(VN={S,A},VT={0,1},S,P) donde P son las producciones :

S 0A
A 0A
A 1S
A 0

Determinar :
a) De qu tipo es?
b) Expresar de algn modo el lenguaje que genera.

Solucin :

a) Es una gramtica de tipo 3, donde las reglas de produccin son de la forma : A aB o


tambin A a, donde A,B pertenecen al VN y a pertenece al VT.

b) Se generan algunas sentencias del lenguaje :

S 0A 00A 001S 0010A 00100


S 0A 01S 010A 0100

L(G) = { Cadena que empieza por 0 y termina con dos 0. Entre ellos puede haber un
n indefinido de 0 y 1, con la restriccin de que no puede haber dos 1 seguidos}

Ejercicio 16.2

Definir una gramtica que permita generar todos los nmeros racionales escritos en
decimal con el formato :

<signo> <parte entera> . <parte fraccionaria>

Construir un autmata que reconozca dichos nmeros.

Solucin : Sea la gramtica G = (VN={<racional>, <cadena dgitos>, <dgito>,


<signo>, <vacio>}, VT={0,1,2,3,4,5,6,7,8,9,+,-}, S=<racional>, P), donde las reglas de
produccin P son las siguientes :

- 86 -
EJERCICIOS RESUELTOS

<racional> <signo><cadena dgitos>.<cadena dgitos>


<cadena dgitos> <dgito><cadena dgitos>
<cadena dgitos> <dgito>
<dgito> 0|1|2|3|4|5|6|7|8|9
<signo> +|-|<vacio>
<vacio>

<dgito>
+,- q
1

INICIO <dgito>
q <dgito>
q q4
0 3

.
<dgito>
q
2

<dgito>

Fig. 40 : Solucin del ejercicio 16.2

Ejercicio 16.3

Definir una gramtica que permita generar identificadores, es decir secuencias de


letras y dgitos que empiezan siempre por una letra.

Solucin : Sea la gramtica G=(VN={<identificador>,<letra>,<resto identificador>,


<dgito>, <vacio>}, VT={a,b,...,A,...,Z,0,1,...,9}, S=<identificador>, P), donde P son las
producciones :

<identificador> <letra><resto identificador>


<letra> a | b | c | ... | z | A | B | C | ... |Z
<resto identificador> <dgito> <resto identificador>
<resto identificador> <letra> <resto identificador>
<resto identificador> <letra>
<resto identificador> <dgito>
<resto identificador> <vacio>
<dgito > 0 | 1 | 2 | 3 | ... |9
<vacio>

- 87 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejercicio 16.4

Escribir una gramtica que defina el lenguaje L = {ab n a/n 0} .

Solucin : Sea G=(VN={S,B}, VT={a,b}, S, P) y las producciones P de la gramtica


son :

S aB
B bB
Ba

Ejercicio 16.5

Escribir una gramtica libre de contexto para un nmero real del lenguaje C++, y
escribir las derivaciones, para las siguientes sentencias:

(a) 251. (e) 14.25E+02


(b) -61. (f) -25.2E-23
(c) -75.25 (g) .23E12
(d) 1.73 (h) .23

Solucin :

<Tipo REAL> <signo> <nmero> <exp>


<Tipo REAL> <signo> <nmero> <exponente>
<Tipo REAL> <signo> <fraccin> <exponente>
<Tipo REAL> <signo> <nmero> <fraccin> <exponente>
<signo> +|-|<vacio >
<nmero> <dgito><nmero>|<dgito>
<fraccin> .< nmero >
<exp> E <signo> <nmero>
<exponente> <exp> | <vacio>
<dgito> 0|1|2|3|4|5|6|7|8|9
<vacio>

b) -61.

< Tipo REAL > <signo> <num> . <exponente>


- < num > . < exponente >
- < dgito > < num > . < exponente >
- < dgito > < num >.
- 88 -
EJERCICIOS RESUELTOS

- 6 < num >.


- 6 < dgito >.
- 61.

c) -72.25

< Tipo REAL > < signo > < num > < fraccin > < exponente >
< signo > < num > < fraccin >
- < num > < fraccin >
- < dgito > < num > < fraccin >
- 7 < num > <fraccin >
- 7 < dgito > < fraccin >
- 72 < fraccin >
- 72. < num >
- 72. < dgito > < num >
- 72.2 < num >
- 72.2 < dgito >
- 72.25

e) 14.25E+02

< Tipo REAL > < signo > < num > < fraccin > < exponente >
< num > < fraccin > < exponente >
< dgito > < num > < fraccin > < exponente >
< num > < fraccin > < exponente >
1 < dgito > < fraccin > < exponente >
< fraccin > < exponente >
14. < num > < exponente >
14. < dgito > < num > < exponente >
14.2 < num > < exponente >
14.25 < exponente >
14.25 < exp >
14.25E < signo > < num >
14.25E+ < num >
14.25E+ < dgito > < num >
14.25E+0 < num >
14.25E+0 < dgito >
14.25E+02
- 89 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

f) -25.2E-23

< Tipo REAL > < signo > < num > < fraccin > < exponente >
- < num > < fraccin > < exponente >
- < dgito > < num > < fraccin > < exponente >
-2 < num > < fraccin > < exponente >
-2 < dgito > < fraccin > < exponente >
-25 < fraccin > < exponente >
-25. < num > < exponente >
-25. < dgito > < exponente >
-25.2 < exponente >
-25.2 < exp >
-25.2E < signo > < num >
-25.2E- < num >
-25.2E- < dgito > < num >
-25.2E-2 < num >
-25.2E-2 < dgito >
-25.2E-23

Ejercicio 16.6

Escribir una gramtica libre de contexto para la sentencia de FORTRAN FORMAT.


Supongase que no se admiten constantes definidas con H (Hollerith). Dar las derivaciones
de las sentencias.
(a) 10 FORMAT (I7, F5.1)
(b) 200 FORMAT (E12.5)
(c) 99015 FORMAT (I5/F7.1)
(d) 40 FORMAT (1X,I4,3X,F7.2)
(e) 50 FORMAT (I3,2(F7.2))

Solucin :

< sentencia FORMAT > < etiqueta > < blanco > {< blanco >} FORMAT
{<blanco>} ({< blanco >} < argumento > {< blanco >})
< etiqueta > < dgito > < nmero1 >
< nmero1 > < dgito > < nmero2 > | < vacio >
< nmero2 > < dgito > < nmero3 > | < vacio >

- 90 -
EJERCICIOS RESUELTOS

< nmero3 > < dgito > < nmero4 > | < vacio >
< nmero4 > < dgito > | < vacio >
< dgito > 0 | 1 | 2 | .. | 9
< blanco > b
< argumentos > < especificacin > < resto argumentos >
< resto argumentos > , < especificacin > < resto argumentos >
< resto argumentos > <diagonal> <especificacin> <resto argumentos>
< resto argumentos > < vacio >
< diagonal > / < otra diagonal >
< otra diagonal > < diagonal >
< otra diagonal > < vacio >
< especificacin > < nmero > (< argumentos >)
< especificacin > < formato >
< formato > I < nmero real >
< formato > I < nmero >
< formato > Q
< formato > A < nmero >
< formato > A
< formato > R < nmero >
< formato > L < nmero >
< formato > K < nmero >
< formato > F < nmero real >
< formato > Z < nmero >
< formato > E < nmero real >
< formato > E < nmero real > E.
< formato > D < nmero real >
< formato > D < nmero real > E.
< formato > G < nmero real >
< formato > G < nmero real > E.
< formato > T < nmero >
< formato > TL < nmero >
< formato > TR < nmero >
< formato > < nmero > X
< formato > < nmero > P
< formato > S

- 91 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

< formato > SP


< formato > SS
< formato > BN
< formato > BZ
< nmero real > < nmero > . < nmero >
< nmero > < dgito > < nmero >
< nmero > < vacio >
< vacio >

- 92 -
EJERCICIOS PROPUESTOS

CAPTULO 17: EJERCICIOS PROPUESTOS

Ejercicio 17.1

Construir una gramtica que describa el lenguaje constituido por los nmeros
romanos. Disear un autmata que dada una cadena de entrada indique si es un nmero
romano o no lo es.

Ejercicio 17.2

Construir una gramtica que describa el lenguaje constituido por todas las cadenas
de a y b, que no contienen la subcadena abb. Se entiende por subcadena de una cadena s
como una cadena que se obtiene suprimiendo cero o ms smbolos desde la derecha o la
izquierda de la cadena s. Ejemplo : ver es una subcadena de conversin. Sin embargo
cosin no es una subcadena de conversin.

Ejercicio 17.3

Construir una gramtica que describa el lenguaje constituido por todas las cadenas
de a y b, que no contienen la subsecuencia abb. Se entiende por subsecuencia de una cadena
s como una cadena que se obtiene suprimiendo cero o ms smbolos no necesariamente
contiguos de la cadena s. Ejemplo : ovesi es una subsecuencia conversin.

Ejercicio 17.4

Construir un AFD con mnimo de estados para que reconozca el lenguaje descrito
por la expresin regular (0|1)*0(0|1)(0|1).

Ejercicio 17.5

Escribir un ejemplo de lenguaje, gramtica y autmata de tipo 0, pero que no sea de


tipo 1, 2 o 3. No incluido en este texto.

Ejercicio 17.6

Escribir un ejemplo de lenguaje, gramtica y autmata de tipo 1, pero que no sea de


tipo 2 o 3. No incluido en este texto.

- 93 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

Ejercicio 17.7

Escribir un ejemplo de lenguaje, gramtica y autmata de tipo 2, pero que no sea de


tipo 3. No incluido en este texto.

Ejercicio 17.8

Escribir un ejemplo de lenguaje, gramtica y autmata de tipo 3. No incluido en este


texto.

Ejercicio 17.9

Escribir un autmata que reconozca si un nmero es un real vlido en Pascal estndar


o no.

Ejercicio 17.10

Disear una gramtica que genere el lenguaje formado por las expresiones con o sin
parntesis, debiendo estar siempre los parntesis emparejados. Los smbolos terminales
son VT={(,e,)}. Ejemplos de instrucciones del lenguaje : e, ee, (e)(e), (((e))), ((e)(e)), y
(eee). Construir un autmata que reconozca dicho lenguaje.

- 94 -
EJERCICIOS DE PROGRAMACIN

CAPTULO 18: EJERCICIOS DE PROGRAMACIN

Ejercicio 18.1

Escribir un programa que simule el funcionamiento de una mquina de Turing


genrica. El programa pedir al usuario bien por teclado o por fichero los componentes de
la definicin de la mquina de Turing reconocedora de un lenguaje de tipo 0. Dada una
cadena de entrada indicar si pertenece o no al lenguaje.

Ejercicio 18.2

Escribir un programa que simule el funcionamiento de un autmata lineal acotado


genrico. El programa pedir al usuario bien por teclado o por fichero los componentes
de la definicin del autmata lineal acotado reconocedor de un lenguaje de tipo 1. Dada
una cadena de entrada indicar si pertenece o no al lenguaje.

Ejercicio 18.3

Escribir un programa que simule el funcionamiento de un autmata de pila genrico.


El programa pedir al usuario bien por teclado o por fichero los componentes de la defi-
nicin del autmata de pila reconocedor de un lenguaje de tipo 2. Dada una cadena de
entrada indicar si pertenece o no al lenguaje.

Ejercicio 18.4

Escribir un programa que simule el funcionamiento de un autmata finito genrico.


El programa pedir al usuario bien por teclado o por fichero los componentes de la defi-
nicin del autmata finito reconocedor de un lenguaje de tipo 3. Dada una cadena de entrada
indicar si pertenece o no al lenguaje.

Ejercicio 18.5

Escribir un programa que tome como entrada la definicin de un autmata finito no


determinista y escriba como salida un autmata finito determinista equivalente.

Ejercicio 18.6

Escribir un programa que dado un autmata finito determine otro equivalente con
un nmero de estados mnimo.

- 95 -
LENGUAJES, GRAMTICAS Y AUTOMATAS

BIBLIOGRAFA
(1) Aho A.V. y Ullman J.D. (1973b). The Theory of Parsing, Translation and Com-
piling. Vol I: Parsing. Prentice-Hall.

(2) Aho A.V. y Ullman J.D. (1973a). The Theory of Parsing, Translation and Com-
piling. Vol II: Compiling. Prentice-Hall.

(3) Aho A.V., Sethi R. y Ullman J.D (1986). Compilers : Principles, Techniques, and
Tools. Addison-Wesley. Edicin en Castellano (1990) Compiladores : Principios,
Tcnicas y Herramientas. Addison-Wesley Iberoamericana.

(4) Alfonseca M., Sancho J. y Martnez Orga M. (1987). Teora de lenguajes,


gramticas y autmatas. Ediciones Universidad y Cultura.

(5) Alvarez-Ura Alvarez, E. (1974). Algoritmos de Markov y lenguajes de progra-


macin. Dto. de Matemticas. Escuela Tcnica Superior de Ingenieros de Minas.
Universidad de Oviedo.

(6) Barber F., Botti V.J. y Prez T.A. (1986). Introduccin a los traductores, compi-
ladores e intrpretes. Dto. de Sistemas Informticos y Computacin.
Universidad Politcnica de Valencia.

(7) Chomsky N. (1956). Three models for the description of language. IRE Trans. on
Information Theory 2:3, pp 113-124.

(8) Chomsky N. (1959). On certain formal properties of grammars. Information and


Control 2:2, pp. 137-167.

(9) Chomsky N. (1962). Context-free grammars and pushdown storage. Quaterly


Prog. Rept. No. 65, pp. 187-194, MIT REs. Lab. Elect., Cambridge, Mass.

(10) Chomsky N. (1963). Formal properties of grammars. Handbook of Math. Psych.,


Vol. 2, pp. 323-418, John Wiley and Sons.

(11) Chomsky N, y Miller G.A. (1958). Finite state languages. Information and Control
1:2, pp 91-112.

(12) Chomsky N., y M.P. Schutzenberger (1963). The algebraic theory of context free
languages. Computer Programming and Formal Systems, pp. 118-161, North
Holland.

- 96 -
BIBLIOGRAFA

(13) Conde Snchez C. (1969). Mquinas de Turing y computabilidad. Discurso ina-


gural del ao acadmico 1969-70 en la Universidad de Oviedo. Dto. de
Matemticas. Escuela Tcnica Superior de Ingenieros de Minas. Universidad de
Oviedo.

(14) Cueva Lovelle J.M. (1998). Conceptos bsicos de Procesadores de Lenguaje.


Cuaderno Didctico de Ingeniera Informtica n10. SERVITEC.

(15) Fernndez G. y Sez Vacas F. (1987). Fundamentos de informtica. Alianza.

(16) Hopcroft J.E. y Ullman J.D. (1979). Introduction to automata theory, languages
and computation. Addison-Wesley.

(17) Hopcroft J.E. (1984). Mquinas de Turing. Investigacin y Ciencia n 94, pp 8-19,
Julio 1984.

(18) Isasi P., Martnez P., Borrajo D. Lenguajes, Gramticas y Autmatas. Un enfoque
prctico. Addison-Wesley (1997)

(19) Katrib Mora M. (1988). Lenguajes de programacin y tcnicas de compilacin.


Editorial Pueblo y Educacin (Cuba).

(20) Minsky M.L. (1967). Computation: Finite and Infinite Machines. Prentice Hall,
Englewood Cliffs.

(21) Snchez Dueas G. y Valverde Andreu J.A. (2 Edicin, 1989). Compiladores e


intrpretes. Un enfoque pragmtico. Ed. Daz de Santos.

(22) Sanchs Llorca F.J. y Galn Pascual C. (1986). Compiladores. Teora y


construccin. Paraninfo.

(23) Shannon C.E. (1949). The synthesis of two-terminal switching circuits. Bell System
Tech. J., vol. 28, pp. 59-98.

(24) Shannon C.E. (1954). A symbolic analysis of relay and switching circuits. Van
Nostrand.

(25) Shannon C.E. (1956). A universal Turing machine with two internal states.
Automata Studies, pp. 129-153, Princeton Univ. Press.

(26) Turing A.M. (1936). On computable numbers with an application to the


Entscheidungs-problem. Proc. London Math. Soc. . 2:42, pp 230-265. Una
correccin ibid, 43, pp- 544-546.

- 97 -
LENGUAJES, GRAMTICAS Y AUTMATAS

ndice
AFD tipo 3, 23
autmata finito determinista, 66
transformacin AFND en AFD, 68 Instruccin, 13
AFND, 67
autmata finito no determinista, 67, 79 Lenguaje, 5, 14
Alfabeto, 3 vacio, 6
Autmata, 6, 34 lex, 79
Configuracin, 34
de pila, 49 Mquina de Mealy, 37
Estado, 34 Mquina de Moore, 39
finito, 59 Mquina de Turing, 43
lineal acotado, 47 Metalenguaje, 28
Reconocedor de lenguaje, 34 Minimizacin de estados
tipo 0, 43 AF en forma mnima, 81
tipo 1, 47 Moore
tipo 2, 49 diagrama, 62
tipo 3, 59
Transicin, 34 Palndromos, 5
Procesadores de lenguaje, 6
BNF, 8 Producciones, 8

C++, 88 Sentencia, 13
Cadena, 3, 10 Shannon, 2
concatenacin, 4 Smbolo, 3
vacia, 4 inicial, 7
Chomsky, 1, 18
Construccin de Thompson, 79, 80 Thompson
construccin de Thompson, 79
Derivacin Turing, 43
relacin de, 11
Diagrama de Moore, 62 Universo del discurso, 5

EBNF, 8 Vocabulario, 3, 7
Expresin regular no terminal, 7, 9
construccin de Thompson, 79 terminal, 7, 9
transformacin en AFND, 76
Expresiones regulares, 28
Operadores, 29

Gramtica, 6, 7
transformacin gramticas tipo 3 en
AFND, 73
Gramticas
con estructura de frase, 18
contexto libre, 22
lineales a la derecha, 23
no restringidas, 18
regulares, 23
sensibles al contexto, 18
tipo 0, 18
tipo 1, 18
tipo 2, 22
- 98 -

También podría gustarte