Tagger numbers

186 views
140 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
186
On SlideShare
0
From Embeds
0
Number of Embeds
9
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Tagger numbers

  1. 1. * Татьяна Елипашева 12МАГКЛ
  2. 2. *Numbers Tagger Поиск чисел в gate.creole.numbe документах rs.NumbersTagger (цифровая и словесная формулировки) и их аннотация в виде числовых значенийRoman Numerals Поиск и аннотация gate.creole.numbeTagger римских чисел rs.RomanNumeralsT agger
  3. 3. **Содержит ресурсы, разработанные для аннотирования чисел, появляющихся в документах.*Определяет точное числовое значение*Добавляет значение к аннотации*Позволяет строить более сложные аннотации на базе тех, что были обработаны данным плагином (денежные единицы, измерения)*Конфигурация описывается в XML файле*Готовая конфигурация для аннотирования для английского, французского, немецкого и испанского языков
  4. 4. ** Все ресурсы в данном плагине производят так называемые Number annotations (числовые аннотации) в следующем виде:* Type(тип): описывается типы токенов, которые могут образовывать число* Value(значение): обозначает собой реальное значение числа , которое было аннотировано
  5. 5. *String Value3^2 9101 1013,000 30003.3e3 33001/4 0.259^1/2 34x10^3 40005.5*4^5 5632thirty one 31three hundred 300four thousand one hundred and two 41023 million 3000000fünfundzwanzig 254 score 80
  6. 6. ** configURL- путь к конфигурационному файлу. Значение по умолчанию: resources/languages/all.xml Конфигурационный файл для английского языка: resources/languages/english.xml* Encoding – кодировка. По умолчанию UTF-8* postProcessURL – путь для JAPE грамматики
  7. 7. *
  8. 8. ** <config> <description>Basic Example</description> <imports> <url encoding="UTF-8">symbols.xml</url> </imports> <words> <word value="0">zero</word> <word value="1">one</word> ... <word value="10">ten</word> </words> <multipliers> <word value="2">hundred</word> <word value="2">hundreds</word> <word value="3">thousand</word> <word value="3">thousands</word> <word value </multipliers> <conjunctions> <word whole="true">and</word> </conjunctions> <decimalSymbol>.</decimalSymbol> <digitGroupingSymbol>,</digitGroupingSymbol></config>
  9. 9. ** e: обозначает экспоненциальное основание 10<word value="2">hundred</word>3 hundred => 3 × 102 или 300* /: позволяет определять доли или дробиthree halves => 1.5* ^: возведение в степень числаthree squared => 9
  10. 10. *…<conjunctions> <word whole="true">and</word></conjunctions><decimalSymbol>.</decimalSymbol><digitGroupingSymbol>,</digitGroupingSymbol>
  11. 11. **allowWithinWords*annotationSetName*failOnMissingInputAnnotations*useHintsFromOriginalMarkups
  12. 12. **allowLowerCase – позволяет выполнять аннотацию для римских цифр нижнего регистра*maxTailLength – ограничение количества символов*outputASName – имя для множества аннотаций

×