Expresiones regulares en Python
Cita con formato IEEE:
E. Bahit, "Expresiones regulares", in
Python Aplicado, 4th ed., EBRC Publisher, 2022, pp.
97–100.
Cita con formato APA 7:
Bahit, E. (2022). Expresiones regulares. In
Python Aplicado (4th ed., pp. 97–100). EBRC Publisher.
Cita en línea:
(Bahit, 2022)
Python provee de soporte nativo para búsquedas mediante expresiones regulares, de forma similar a Perl.
Una expresión regular es un patrón de caracteres de reconocimiento, que aplicado sobre una cadena de texto, permite encontrar fragmentos que coincidan con dicha expresión.
Para definir los patrones se utilizan caracteres de forma simbólica (es decir, que cada carácter posee un significado particular en el patrón). Por ejemplo, el patrón "^ho" significa «cadena que comienza por las letras ho», y "la$", significa «cadena que finaliza por las letras la». Mientras que el acento circunflejo ^ simboliza los comienzos de cadenas, el signo dólar, simboliza los finales. Los caracteres simbólicos se listan a continuación.
Caracteres de posición | |||
---|---|---|---|
^ | Inicio de cadena | $ | Final de cadena |
Cuantificadores | |||
? | Cero o uno | * | Cero o más |
+ | Uno o más | {n} | n veces |
{n,} | n o más veces | {,m} | Entre 0 y n veces |
{n,m} | Entre n y m veces | ||
Agrupamiento | |||
(...) | Grupo exacto | [...] | Caracteres opcionales y rangos |
| | Operador lógico «or» (A|B) | - | Usado para expresar un rango [a-z] |
Caracteres de formato | |||
\ | Caracter de escape para expresar literales: \. (literal del carácter punto) | \d | Dígito NOTA |
Caracteres de posición | |||
. | Cualquier carácter excepto el salto de línea | \n | Salto de línea |
\s | Espacio en blanco NOTA | \w | Palabra NOTA |
NOTA: En mayúsculas significa lo contrario. Por ejemplo, \S simboliza cualquier carácter que no sea un espacio en blanco. |
Búsqueda de patrones
Para realizar búsquedas mediante expresiones
regulares en Python, se utiliza el módulo re
. La...