Expressões Regulares <ul><li>Expressões regulares:  linguagem de especificação de padrões simbólicos (ER, REGEX, REGEXP) <...
Expressões Regulares <ul><li>Conceitos Básicos: </li></ul><ul><li>Metacaracteres : símbolos com funções especiais dentro d...
Expressões Regulares <ul><li>Os exercícios serão feitos sobre o textodisponível na nossa página na  www.abralin.org </li><...
Expressões Regulares: metacaracteres Metacaracteres tipo Representante  Ponto (.):  funciona como um curinga para um único...
Expressões Regulares: metacaracteres Metacaracteres tipo Representante  Lista ([ ]):  delimita os caracteres que podem ser...
Expressões Regulares: metacaracteres Metacaracteres tipo Representante  Lista negada ([^ ]):   Possui lógica inversa, ou s...
Expressões Regulares: metacaracteres Metacaracteres tipo Quantificador  Opcional (?):   Indica que aquele símbolo ou padrã...
Expressões Regulares: metacaracteres Metacaracteres tipo Quantificador  Asterisco (*):   Indica que aquele símbolo ou padr...
Expressões Regulares: metacaracteres Metacaracteres tipo Âncora  Circunflexo (^):   Marca o começo de uma linha ^[0-9] a p...
Expressões Regulares: metacaracteres Metacaracteres tipo Âncora  Cifrão ($):   Marca o fim de uma linha [0-9]$ casa com nú...
Expressões Regulares: metacaracteres Limpeza da saída do PALAVRAS (saída da análise morfossintática completa, formato plan...
Upcoming SlideShare
Loading in …5
×

Lcl Aula3

1,054 views
987 views

Published on

Corpus - Violeta

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,054
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Lcl Aula3

  1. 1. Expressões Regulares <ul><li>Expressões regulares: linguagem de especificação de padrões simbólicos (ER, REGEX, REGEXP) </li></ul><ul><li>Exemplo: ATO </li></ul><ul><li>Se a lacuna é preenchida por uma letra: </li></ul><ul><li>H 1 : GATO MATO RATO BATO FATO JATO NATO PATO </li></ul><ul><li>Se a lacuna é preenchida por duas letras: </li></ul><ul><li>H 2 : CHATO HIATO BOATO TRATO PRATO CRATO ... </li></ul><ul><li>Se a lacuna pode não ser preenchida: </li></ul><ul><li>H 3 : ATO </li></ul><ul><li>Qualquer das opções: H 1 U H 2 U H 3 </li></ul>
  2. 2. Expressões Regulares <ul><li>Conceitos Básicos: </li></ul><ul><li>Metacaracteres : símbolos com funções especiais dentro de uma expressão regular . ? * + ^ $ | [ ] { } ( ) </li></ul><ul><li>String : sequência de símbolos </li></ul><ul><li>Casamento (&quot;match&quot;): associação entre duas strings, em uma espécie de equivalência representacional </li></ul><ul><li>Padrão (&quot;pattern&quot;): string possivelmente contendo metacaracteres </li></ul><ul><li>Interpretador das expressões regulares: procedimento que efetua o casamento entre padrões. </li></ul><ul><li>Ex: [rgp]ato pode casar rato, gato e pato, mas não com mato. </li></ul>
  3. 3. Expressões Regulares <ul><li>Os exercícios serão feitos sobre o textodisponível na nossa página na www.abralin.org </li></ul><ul><li>Instruções iniciais: </li></ul><ul><li>Abrir o TextPad </li></ul><ul><li>Carregar o texto do exercício (mundo Wumpus.txt) </li></ul><ul><li>Abrir a caixa de diálogo no botão Localizar ( ) </li></ul><ul><li>Configurar a caixa de diálogo como na figura: </li></ul>
  4. 4. Expressões Regulares: metacaracteres Metacaracteres tipo Representante Ponto (.): funciona como um curinga para um único símbolo; pode ser um número, uma letra, um TAB, um @, o ponto casa qualquer coisa . EXEMPLO: Localizar “a..a” - toda seqüência de tamanho 4 que começa com “a” e termina com “a”.
  5. 5. Expressões Regulares: metacaracteres Metacaracteres tipo Representante Lista ([ ]): delimita os caracteres que podem ser casados em determinada posição [aeiou] limita o casamento às letras vogais. intervalo: [0123456789] é igual a [0-9] uma lista que case apenas letras maiúsculas, minúsculas e números: [A-Za-z0-9]. EXERCÍCIO: Localizar “a[glv][aeo]” - aga, age, ago, ala, ale, alo, ava, ave, avo.
  6. 6. Expressões Regulares: metacaracteres Metacaracteres tipo Representante Lista negada ([^ ]): Possui lógica inversa, ou seja, ela casará com qualquer coisa, fora os componentes listados. EXERCÍCIO: Localizar “a[^glv][aeo]”
  7. 7. Expressões Regulares: metacaracteres Metacaracteres tipo Quantificador Opcional (?): Indica que aquele símbolo ou padrão pode ocorrer ou não “ falar?” falar, fala O opcional é útil para procurar palavras no singular e plural. Podemos tornar opcionais caracteres e metacaracteres. EXERCÍCIO: Localizar “salas?” EXERCÍCIO: Localizar “[AO]s? ......? ”
  8. 8. Expressões Regulares: metacaracteres Metacaracteres tipo Quantificador Asterisco (*): Indica que aquele símbolo ou padrão pode ocorrer 0 ou mais vezes O curinga .* é qualquer coisa! EXERCÍCIO: Localizar “a.*” EXERCÍCIO: Localizar “ a[^ ]*”
  9. 9. Expressões Regulares: metacaracteres Metacaracteres tipo Âncora Circunflexo (^): Marca o começo de uma linha ^[0-9] a partir do começo da linha, casa um número, ou seja, procuramos linhas que começam com números. O contrário seria ^[^0-9], linhas que não começam com números. O circunflexo como marcador de começo de linha só é especial se estiver no começo da REGEX. [0-9]^ casa um número seguido de um circunflexo literal, em qualquer posição da linha. EXERCÍCIO: Localizar “^[AO]s? ” EXERCÍCIO: Localizar “^{Em}”
  10. 10. Expressões Regulares: metacaracteres Metacaracteres tipo Âncora Cifrão ($): Marca o fim de uma linha [0-9]$ casa com números localizados no fim de linhas. O cifrão como marcador de começo de linha só é especial se estiver no fim da REGEX. EXERCÍCIO: Localizar “1$”
  11. 11. Expressões Regulares: metacaracteres Limpeza da saída do PALAVRAS (saída da análise morfossintática completa, formato plano). 1. substituir: @.* por: vazio 2. substituir: .*](espaço) por: _ 3. substituir:<.*>(espaço) por: vazio 4. substituir: (espaço).* por: vazio

×