Rule b platf

Павел Гращенков [email_address] Институт востоковедения РАН ЭПАМ-Системз

[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Название Функция Text parser Убирает лишние абзацы и т.д., помещает текст в “ хранилище ” Break detector Объединяет цепочки символов в слова, цепочки слов – в предложения RegExp Обрабатывает даты, электронные адреса, опечатки, сленг,… Morphology Словарь с морфологическими атрибутами Gazetteer Списки, классифицирующие слова по некоторым атрибутам Unknown word Распознает неизвестные слова, основываясь на их морфологии CAPE Выделяет специальные и именованные сущности POS tagger Снимает грамматическую омонимию NE recognizer Специальный модуль для выделения именованных сущностей Chunker Выделяет простые синтаксические группы Syntax Строит полное дерево синтаксического разбора Post syntax Разбивает сложные предложения на простые, уточняет сферу действия отрицания,… Precise Extraction Выделяет факты

Название Язык правил, примеры Text parser Конфигурируется строчкой регулярных выражений Break detector Регулярные выражения и макросы, пример : $Digit+ ( [] $Digit+ )+ RegExp Регулярные выражения + правила сопоставления + добавление стандартных атрибутов, пример : /(з[ао]ч)о([дт])(ная)/i RSYN $1е$2$3 Morphology палит {PosTag="V;Prs;Ipf;Itr;Sg;Third", SyntType = "Rdat;Riz;Rins;Rva;Racc"} {PosTag="V;Prs;Ipf;Tr;Sg;Third", SyntType = "Rdat;Riz;Rins;Rva;Racc"} Gazetteer убыточный MSYN {SpeechPart = "A" @match, Sentiment = "-1"} Unknown word Словари аффиксов, пример : ибельн SYN ибельн { SpeechPart="A" } // лечибельный CAPE Контекстно-зависимый язык, оперирующий со словами и их атрибутами POS tagger { Модель, основанная на Байесовском классификаторе } NE recognizer { Модель, основанная на Байесовском классификаторе } Chunker Контекстно-зависимый язык, оперирующий со словами и их атрибутами Syntax Контекстно-свободный язык, оперирующий словами, фразами и атрибутами Post syntax Алгоритмический язык, синтаксис близок к языкам программирования Precise Extraction ~ Язык логики предикатов

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object]

Rule b platf

Recommended

Recommended

More Related Content

What's hot

What's hot (19)

Similar to Rule b platf

Similar to Rule b platf (20)

More from Natalia Ostapuk

More from Natalia Ostapuk (20)

Rule b platf

Editor's Notes