Opa, demorei! Quando pensei pela primeira vez em escrever sobre expressões regulares pensei: “Tenho que escrever TUDO que sei.”
Alguns meses depois não publiquei nada pensando: “Não posso publicar só isso.”
Pois é, quase 4 anos se passaram, ainda não publiquei nada e agora penso: “Poxa, agora que tenho um bom material e se eu publicar tudo de uma vez vai ficar cansativo e no fim não vai ficar prático.”
Resolvi que quebrei e agendei para serem publicados aos poucos.

Para não alongar a conversa, vamos ao que interessa:

Expressões regulares nada mais são do expressões que especificam um padrão de texto.
Elas são compostas de símbolos, caracteres literais e especiais que são interpretados de forma a verificar se um texto de entrada confere exatamente com o padrão descrito na expressão.

Um pouco de história que convém salientar é que expressões regulares tem sua origem marcada por estudos de neurologistas na década de 40 ao teorizar o funcionamento dos nossos neurônios.
Então quanto melhor entender os padrões, provavelmente irá utilizar melhor o seu cérebro. 🙂

Expressões regulares são conhecidas por diversos nomes: RegExp, regex, ereg, … ou simplesmente ER.
Ao utilizar uma ER, muitas literaturas utilizam o termo “casar” ao verificar se o dado confere com o padrão.
Outras preferem dizer: bater, checar, combinar, conferir, encontrar, igualar, … então não estranhem.

São inúmeras as possibilidades de utilização de ER, é difícil até expressar.
Imagine um dado de entrada (um texto qualquer) e que a partir dele pode ser extraído padrões. O nome de um arquivo é um texto, o conteúdo de um arquivo é um texto, um xml é um texto, uma conversa num protocolo qualquer (HTTP, SMTP, FTP, …) são textos.
Esses padrões podem ser qualquer coisa: data, hora, ip, telefone, e-mail, <tags>, cabeçalho de uma resposta HTTP, cpf, linhas de um arquivo, tabelas, pontuações de um texto, … enfim, qualquer coisa. Tudo pode ser um padrão, depende da forma como você precisa e consegue extrair a informação.

No próximo post vou falar sobre os metacaracteres que são caracteres especiais e que fazem as ER terem significados e comportamentos bem específicos.

Share
Tags:
Categorias: Programação
Wesley Menezes

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.