Está en la página 1de 12

Ángel Sebastián Ortiz Chingaté – 67001080

Autómatas - 21/02/2024

Regex Activity
1. Introducción:

Una expresión regular es sólo un patrón de caracteres que utilizamos para realizar búsquedas
en un texto. Por ejemplo, la expresión regular “the” significa: la letra t, seguida de la letra h,
seguida de la letra e.
2.1 Full stop:
Full stop. es el ejemplo más simple del meta-carácter. El meta-carácter. coincide con cualquier
carácter. No coincidirá con el retorno o nuevos caracteres de línea. Por ejemplo, la expresión
regular .ar significa: cualquier carácter, seguido del carácter a, seguido del carácter r.

2.2 Conjunto de caracteres:


Los conjuntos de caracteres también se llaman clase de caracteres. Los corchetes se utilizan para
especificar conjuntos de caracteres. Utilice un guion dentro de un conjunto de caracteres para
especificar el rango de los caracteres. El orden del rango de caracteres dentro de corchetes no
importa. Por ejemplo, la expresión regular [Tt]he significa: un carácter en mayúscula T o
minúscula t, seguido del carácter h, seguido del carácter e.

Sin embargo, un período dentro de un conjunto de caracteres significa un período literal. La


expresión regular ar[.] significa: un carácter en minúscula a, seguido del carácter r, seguido del
carácter.
Sin embargo, un período dentro de un conjunto de caracteres significa un período literal. La
expresión regular ar[.] significa: un carácter en minúscula a, seguido del carácter r, seguido del
carácter.
2.2.1 Conjunto de caracteres negados:
En general, el símbolo de intercalación representa el comienzo de la cadena, pero cuando se
escribe después del corchete de apertura niega el conjunto de caracteres. Por ejemplo, la
expresión regular [^c]ar significa: cualquier carácter, excepto c, seguido del carácter a, seguido del
carácter r.

2.3 Repeticiones:
Los siguientes caracteres meta +, * o ?, se utilizan para especificar cuántas veces puede producirse
un subpatrón. Estos meta-caracteres actúan de manera diferente en diferentes situaciones.

2.3.1 Asterisco:
El símbolo * coincide con cero o más repeticiones del marcador anterior. La expresión
regular a* significa: cero o más repeticiones del carácter en minúscula precedente a. Pero, si
aparece después de un conjunto de caracteres o una clase, entonces encuentra las repeticiones de
todo el conjunto de caracteres. Por ejemplo, la expresión regular [a-z]* significa: cualquier número
de letras minúsculas en una fila.
El símbolo * se puede utilizar con el meta-carácter . para que coincida con cualquier cadena de
caracteres .*. El símbolo * se puede utilizar con el carácter de espacio en blanco \s para que
coincida con una cadena de caracteres de espacio en blanco. Por ejemplo, la
expresión \s*cat\s* significa: cero o más espacios, seguido por el carácter en minúscula c, seguido
del carácter en minúscula a, seguido del carácter en minúscula t, seguido de cero o más espacios.
2.3.2 Signo de más:
El símbolo + coincide con una o más repeticiones del carácter anterior. Por ejemplo, la expresión
regular c.+T significa: carácter en minúscula c, seguido por lo menos de un carácter, luego el
carácter en minúscula t.
2.3.2 Signo de interrogación:
En expresiones regulares el meta-carácter ? hace que el carácter precedente sea opcional. Este
símnbolo coincide con cero o una instancia del carácter precedente. Por ejemplo, la expresión
regular [T]?he significa: El carácter opcional T seguido por el carácter en minúscula h, seguido del
carácter en minúscula e.

2.4 Llaves:
En la expresión regular, las llaves, que también se denominan cuantificadores, son utilizados para
especificar el número de veces que se puede repetir un carácter o un grupo de caracteres. Por
ejemplo, la expresión regular [0-9]{2,3} significa: Combina al menos 2 dígitos pero no más de 3
(caracteres en el rango de 0 a 9).
Podemos dejar fuera el segundo número. Por ejemplo, la expresión regular [0-9] {2,} significa:
Combina 2 o más dígitos. Si también eliminamos la coma, la expresión regular [0-9]{3} significa:
coincidir exactamente con 3 dígitos.
2.5 Grupos de caracteres:
Un grupo de caracteres es un grupo de sub-patrones que se escribe dentro de paréntesis (...).
Como hemos discutido antes en la expresión regular, si ponemos un cuantificador después de un
carácter, repetiremos el carácter anterior. Pero si ponemos un cuantificador después de un grupo
de caracteres, entonces repetimos todo el grupo de caracteres. Por ejemplo, la expresión
regular (ab)* coincide con cero o más repeticiones del caracter ab. También podemos usar el
carácter de alternancia | meta dentro del grupo de caracteres. Por ejemplo, la expresión
regular (c|g|p)ar significa: carácter en minúscula c, g o p, seguido del carácter a, seguido del
carácter r.

2.6 Alternancia:
En la expresión regular, la barra vertical | se utiliza para definir la alternancia. La alternancia es
como una condición entre múltiples expresiones. Ahora, puedes estar pensando que el conjunto
de caracteres y la alternancia funciona de la misma manera. Sin embargo, la gran diferencia entre
el conjunto de caracteres y la alternancia es que el conjunto de caracteres funciona a nivel de
carácter pero la alternancia funciona a nivel de expresión. Por ejemplo, la expresión
regular (T|t)he|car significa: el carácter en mayúscula T o en minúscula t, seguido del carácter en
minúscula h, seguido del carácter en minúscula e o del carácter en minúscula c, seguido de un
carácter en minúscula a, seguido del carácter en minúscula r.

2.7 Caracteres especiales de escape:


La barra invertida \ se utiliza en la expresión regular para escapar el carácter siguiente.
Esto permite especificar un símbolo como un carácter coincidente incluyendo caracteres
reservados {}[]/\+*.^|?. Para usar un carácter especial como un carácter coincidente,
agrega \ a su izquierda.
Por ejemplo, la expresión regular . se utiliza para coincidir con cualquier carácter, excepto
la nueva línea. Ahora, para emparejar . en una cadena de entrada, la expresión
regular (f|c|m)at\.? significa: el carácter en minúscula f, c o m, seguido del carácter en
minúscula a, seguido del carácter en minúscula t, seguido del carácter opcional ..
2.8 Anclas:
En expresiones regulares, usamos anclas para comprobar si el símbolo coincidente es el símbolo
inicial o el símbolo final de la cadena de entrada. Los anclajes son de dos tipos: El primer tipo es el
símbolo de intercalación ^ que comprueba si el carácter coincidente es el carácter inicial de la
entrada y el segundo tipo es el símbolo del dólar $ que comprueba si el carácter coincidente es el
último carácter de la cadena de entrada.

2.8.1 Anclas:

También podría gustarte