Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autómatas - 21/02/2024
Regex Activity
1. Introducción:
Una expresión regular es sólo un patrón de caracteres que utilizamos para realizar búsquedas
en un texto. Por ejemplo, la expresión regular “the” significa: la letra t, seguida de la letra h,
seguida de la letra e.
2.1 Full stop:
Full stop. es el ejemplo más simple del meta-carácter. El meta-carácter. coincide con cualquier
carácter. No coincidirá con el retorno o nuevos caracteres de línea. Por ejemplo, la expresión
regular .ar significa: cualquier carácter, seguido del carácter a, seguido del carácter r.
2.3 Repeticiones:
Los siguientes caracteres meta +, * o ?, se utilizan para especificar cuántas veces puede producirse
un subpatrón. Estos meta-caracteres actúan de manera diferente en diferentes situaciones.
2.3.1 Asterisco:
El símbolo * coincide con cero o más repeticiones del marcador anterior. La expresión
regular a* significa: cero o más repeticiones del carácter en minúscula precedente a. Pero, si
aparece después de un conjunto de caracteres o una clase, entonces encuentra las repeticiones de
todo el conjunto de caracteres. Por ejemplo, la expresión regular [a-z]* significa: cualquier número
de letras minúsculas en una fila.
El símbolo * se puede utilizar con el meta-carácter . para que coincida con cualquier cadena de
caracteres .*. El símbolo * se puede utilizar con el carácter de espacio en blanco \s para que
coincida con una cadena de caracteres de espacio en blanco. Por ejemplo, la
expresión \s*cat\s* significa: cero o más espacios, seguido por el carácter en minúscula c, seguido
del carácter en minúscula a, seguido del carácter en minúscula t, seguido de cero o más espacios.
2.3.2 Signo de más:
El símbolo + coincide con una o más repeticiones del carácter anterior. Por ejemplo, la expresión
regular c.+T significa: carácter en minúscula c, seguido por lo menos de un carácter, luego el
carácter en minúscula t.
2.3.2 Signo de interrogación:
En expresiones regulares el meta-carácter ? hace que el carácter precedente sea opcional. Este
símnbolo coincide con cero o una instancia del carácter precedente. Por ejemplo, la expresión
regular [T]?he significa: El carácter opcional T seguido por el carácter en minúscula h, seguido del
carácter en minúscula e.
2.4 Llaves:
En la expresión regular, las llaves, que también se denominan cuantificadores, son utilizados para
especificar el número de veces que se puede repetir un carácter o un grupo de caracteres. Por
ejemplo, la expresión regular [0-9]{2,3} significa: Combina al menos 2 dígitos pero no más de 3
(caracteres en el rango de 0 a 9).
Podemos dejar fuera el segundo número. Por ejemplo, la expresión regular [0-9] {2,} significa:
Combina 2 o más dígitos. Si también eliminamos la coma, la expresión regular [0-9]{3} significa:
coincidir exactamente con 3 dígitos.
2.5 Grupos de caracteres:
Un grupo de caracteres es un grupo de sub-patrones que se escribe dentro de paréntesis (...).
Como hemos discutido antes en la expresión regular, si ponemos un cuantificador después de un
carácter, repetiremos el carácter anterior. Pero si ponemos un cuantificador después de un grupo
de caracteres, entonces repetimos todo el grupo de caracteres. Por ejemplo, la expresión
regular (ab)* coincide con cero o más repeticiones del caracter ab. También podemos usar el
carácter de alternancia | meta dentro del grupo de caracteres. Por ejemplo, la expresión
regular (c|g|p)ar significa: carácter en minúscula c, g o p, seguido del carácter a, seguido del
carácter r.
2.6 Alternancia:
En la expresión regular, la barra vertical | se utiliza para definir la alternancia. La alternancia es
como una condición entre múltiples expresiones. Ahora, puedes estar pensando que el conjunto
de caracteres y la alternancia funciona de la misma manera. Sin embargo, la gran diferencia entre
el conjunto de caracteres y la alternancia es que el conjunto de caracteres funciona a nivel de
carácter pero la alternancia funciona a nivel de expresión. Por ejemplo, la expresión
regular (T|t)he|car significa: el carácter en mayúscula T o en minúscula t, seguido del carácter en
minúscula h, seguido del carácter en minúscula e o del carácter en minúscula c, seguido de un
carácter en minúscula a, seguido del carácter en minúscula r.
2.8.1 Anclas: