Lcl Aula3
Upcoming SlideShare
Loading in...5
×
 

Lcl Aula3

on

  • 1,318 views

Corpus - Violeta

Corpus - Violeta

Statistics

Views

Total Views
1,318
Views on SlideShare
1,317
Embed Views
1

Actions

Likes
0
Downloads
10
Comments
0

1 Embed 1

http://www.slideshare.net 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Lcl Aula3 Lcl Aula3 Presentation Transcript

  • Expressões Regulares
    • Expressões regulares: linguagem de especificação de padrões simbólicos (ER, REGEX, REGEXP)
    • Exemplo: ATO
    • Se a lacuna é preenchida por uma letra:
    • H 1 : GATO MATO RATO BATO FATO JATO NATO PATO
    • Se a lacuna é preenchida por duas letras:
    • H 2 : CHATO HIATO BOATO TRATO PRATO CRATO ...
    • Se a lacuna pode não ser preenchida:
    • H 3 : ATO
    • Qualquer das opções: H 1 U H 2 U H 3
  • Expressões Regulares
    • Conceitos Básicos:
    • Metacaracteres : símbolos com funções especiais dentro de uma expressão regular . ? * + ^ $ | [ ] { } ( )
    • String : sequência de símbolos
    • Casamento ("match"): associação entre duas strings, em uma espécie de equivalência representacional
    • Padrão ("pattern"): string possivelmente contendo metacaracteres
    • Interpretador das expressões regulares: procedimento que efetua o casamento entre padrões.
    • Ex: [rgp]ato pode casar rato, gato e pato, mas não com mato.
  • Expressões Regulares
    • Os exercícios serão feitos sobre o textodisponível na nossa página na www.abralin.org
    • Instruções iniciais:
    • Abrir o TextPad
    • Carregar o texto do exercício (mundo Wumpus.txt)
    • Abrir a caixa de diálogo no botão Localizar ( )
    • Configurar a caixa de diálogo como na figura:
  • Expressões Regulares: metacaracteres Metacaracteres tipo Representante Ponto (.): funciona como um curinga para um único símbolo; pode ser um número, uma letra, um TAB, um @, o ponto casa qualquer coisa . EXEMPLO: Localizar “a..a” - toda seqüência de tamanho 4 que começa com “a” e termina com “a”.
  • Expressões Regulares: metacaracteres Metacaracteres tipo Representante Lista ([ ]): delimita os caracteres que podem ser casados em determinada posição [aeiou] limita o casamento às letras vogais. intervalo: [0123456789] é igual a [0-9] uma lista que case apenas letras maiúsculas, minúsculas e números: [A-Za-z0-9]. EXERCÍCIO: Localizar “a[glv][aeo]” - aga, age, ago, ala, ale, alo, ava, ave, avo.
  • Expressões Regulares: metacaracteres Metacaracteres tipo Representante Lista negada ([^ ]): Possui lógica inversa, ou seja, ela casará com qualquer coisa, fora os componentes listados. EXERCÍCIO: Localizar “a[^glv][aeo]”
  • Expressões Regulares: metacaracteres Metacaracteres tipo Quantificador Opcional (?): Indica que aquele símbolo ou padrão pode ocorrer ou não “ falar?” falar, fala O opcional é útil para procurar palavras no singular e plural. Podemos tornar opcionais caracteres e metacaracteres. EXERCÍCIO: Localizar “salas?” EXERCÍCIO: Localizar “[AO]s? ......? ”
  • Expressões Regulares: metacaracteres Metacaracteres tipo Quantificador Asterisco (*): Indica que aquele símbolo ou padrão pode ocorrer 0 ou mais vezes O curinga .* é qualquer coisa! EXERCÍCIO: Localizar “a.*” EXERCÍCIO: Localizar “ a[^ ]*”
  • Expressões Regulares: metacaracteres Metacaracteres tipo Âncora Circunflexo (^): Marca o começo de uma linha ^[0-9] a partir do começo da linha, casa um número, ou seja, procuramos linhas que começam com números. O contrário seria ^[^0-9], linhas que não começam com números. O circunflexo como marcador de começo de linha só é especial se estiver no começo da REGEX. [0-9]^ casa um número seguido de um circunflexo literal, em qualquer posição da linha. EXERCÍCIO: Localizar “^[AO]s? ” EXERCÍCIO: Localizar “^{Em}”
  • Expressões Regulares: metacaracteres Metacaracteres tipo Âncora Cifrão ($): Marca o fim de uma linha [0-9]$ casa com números localizados no fim de linhas. O cifrão como marcador de começo de linha só é especial se estiver no fim da REGEX. EXERCÍCIO: Localizar “1$”
  • Expressões Regulares: metacaracteres Limpeza da saída do PALAVRAS (saída da análise morfossintática completa, formato plano). 1. substituir: @.* por: vazio 2. substituir: .*](espaço) por: _ 3. substituir:<.*>(espaço) por: vazio 4. substituir: (espaço).* por: vazio