Tagger numbers
Upcoming SlideShare
Loading in...5
×
 

Tagger numbers

on

  • 175 views

 

Statistics

Views

Total Views
175
Views on SlideShare
175
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Tagger numbers Tagger numbers Presentation Transcript

  • * Татьяна Елипашева 12МАГКЛ
  • *Numbers Tagger Поиск чисел в gate.creole.numbe документах rs.NumbersTagger (цифровая и словесная формулировки) и их аннотация в виде числовых значенийRoman Numerals Поиск и аннотация gate.creole.numbeTagger римских чисел rs.RomanNumeralsT agger
  • **Содержит ресурсы, разработанные для аннотирования чисел, появляющихся в документах.*Определяет точное числовое значение*Добавляет значение к аннотации*Позволяет строить более сложные аннотации на базе тех, что были обработаны данным плагином (денежные единицы, измерения)*Конфигурация описывается в XML файле*Готовая конфигурация для аннотирования для английского, французского, немецкого и испанского языков View slide
  • ** Все ресурсы в данном плагине производят так называемые Number annotations (числовые аннотации) в следующем виде:* Type(тип): описывается типы токенов, которые могут образовывать число* Value(значение): обозначает собой реальное значение числа , которое было аннотировано View slide
  • *String Value3^2 9101 1013,000 30003.3e3 33001/4 0.259^1/2 34x10^3 40005.5*4^5 5632thirty one 31three hundred 300four thousand one hundred and two 41023 million 3000000fünfundzwanzig 254 score 80
  • ** configURL- путь к конфигурационному файлу. Значение по умолчанию: resources/languages/all.xml Конфигурационный файл для английского языка: resources/languages/english.xml* Encoding – кодировка. По умолчанию UTF-8* postProcessURL – путь для JAPE грамматики
  • *
  • ** <config> <description>Basic Example</description> <imports> <url encoding="UTF-8">symbols.xml</url> </imports> <words> <word value="0">zero</word> <word value="1">one</word> ... <word value="10">ten</word> </words> <multipliers> <word value="2">hundred</word> <word value="2">hundreds</word> <word value="3">thousand</word> <word value="3">thousands</word> <word value </multipliers> <conjunctions> <word whole="true">and</word> </conjunctions> <decimalSymbol>.</decimalSymbol> <digitGroupingSymbol>,</digitGroupingSymbol></config>
  • ** e: обозначает экспоненциальное основание 10<word value="2">hundred</word>3 hundred => 3 × 102 или 300* /: позволяет определять доли или дробиthree halves => 1.5* ^: возведение в степень числаthree squared => 9
  • *…<conjunctions> <word whole="true">and</word></conjunctions><decimalSymbol>.</decimalSymbol><digitGroupingSymbol>,</digitGroupingSymbol>
  • **allowWithinWords*annotationSetName*failOnMissingInputAnnotations*useHintsFromOriginalMarkups
  • **allowLowerCase – позволяет выполнять аннотацию для римских цифр нижнего регистра*maxTailLength – ограничение количества символов*outputASName – имя для множества аннотаций