SlideShare a Scribd company logo
Автоматическая обработка
текста
Автоматическая обработка текста —преобразование
текста на искусственном или естественном языке с
помощью ЭВМ.
Прикладные системы и теория А. о. т. начали
создаваться в конце 50-х гг. 20 в. (США, СССР, Франция,
ФРГ и др.) и развивались в нескольких различных
приложениях: в системном программировании,
издательском деле и в вычислительной лингвистике.
• Преобразование текста – внесение в текст исправлений и
добавлений
• Форматирование текста – выделение заголовков,
формировании строк и страниц нужного формата и т.д.
• Автоматический набор и верстка текста
• Лексиграфическая обработка - текст преобразуется в
лексикографическое представление
• Автоматический лигвистический анализ
• Автоматический синтез
Наиболее полно функции А. о. т. развиты в системах
автоматического перевода и системах человеко-
машинного общения, где основным является
синтаксический, а в системах общения с ЭВМ —
семантический анализ. Эти наиболее сложные формы А.
о. т. целиком опираются на формальный аппарат,
развитый в рамках математической лингвистики и
вычислительной лингвистики.
В составе лингвистического обеспечения
автоматизированных информационных систем
различают три группы функций А. о. т.:
автоматическое индексирование входных
документов, автоматическое составление
поисковых предписаний по тексту запросов и
автоматизированное ведение словарей системы.
С 70-х гг. наблюдается тенденция к
интеграции всех подходов к
конструированию систем А. о. т. в
рамках искусственного интеллекта
— направления в информатике
(computer science), связанного с
созданием сложных человеко-
машинных и робототехнических
систем, моделирующих человеческую
деятельность в различных сферах и
предметных областях.
Здесь функции редактирования
всё больше сливаются с
функциями содержательной
обработки, образуя единый
аппарат понимания текста. Это
открывает возможности для
автоматизации наиболее
сложных областей человеческой
деятельности, требующих
затрат прежде всего
интеллектуального труда, таких,
как редакционно-издательские
процессы, извлечение информации
из текстов и т.д.
Однако в таких массовых, «промышленных» применениях А.
о. т. должна опираться на мощную информационную
поддержку в виде автоматизированных словарных
картотек, автоматических словарей, грамматик и других
форм представления лингвистических данных в ЭВМ
Результатом А. о. т. являются частотные словари,
конкордансы (словоуказатели с контекстами),
автоматические моно- и многоязычные словари,
размещаемые в базах данных и используемые
программами лексикографических систем в качестве
справочного при обработке новых данных. Поэтому
такие системы являются развивающимися системами.
Автоматические словари используются в системах
автоматического перевода, а также в информационных
системах и системах общения с ЭВМ на естественном
языке в качестве справочников при подготовке и
расширении словарей и уточнении грамматик этих
систем.

More Related Content

Viewers also liked

ASCD 2014 Unleashing Power of Excellent Schools
ASCD 2014 Unleashing Power of Excellent SchoolsASCD 2014 Unleashing Power of Excellent Schools
ASCD 2014 Unleashing Power of Excellent Schools
Sherri Wilson
 
Pxw launch hcc
Pxw launch hccPxw launch hcc
La llegenda de Sant Jordi
La llegenda de Sant JordiLa llegenda de Sant Jordi
La llegenda de Sant Jordi
mariaponspons
 
Fre 2015 webinar
Fre 2015 webinarFre 2015 webinar
Fre 2015 webinar
Sherri Wilson
 
Polyppolyp lynch syndrome version a
Polyppolyp lynch syndrome version aPolyppolyp lynch syndrome version a
Polyppolyp lynch syndrome version a
Douglas Riegert-Johnson
 
DWP SME conference (11 March 2014) - Brian Gannon (kainos)
DWP SME conference (11 March 2014) - Brian Gannon (kainos)DWP SME conference (11 March 2014) - Brian Gannon (kainos)
DWP SME conference (11 March 2014) - Brian Gannon (kainos)
Department for Work and Pensions
 
Crm web client user interface struttura - 1
Crm web client user interface  struttura - 1Crm web client user interface  struttura - 1
Crm web client user interface struttura - 1
frbrun
 
Technical Writer as Scrum Master: Expand Your Skill Set
Technical Writer as Scrum Master: Expand Your Skill SetTechnical Writer as Scrum Master: Expand Your Skill Set
Technical Writer as Scrum Master: Expand Your Skill Set
Salesforce Engineering
 
Tangible Property Capitalization Regulations
Tangible Property CapitalizationRegulationsTangible Property CapitalizationRegulations
Tangible Property Capitalization Regulations
Cohen and Company
 
SharePoint Hakkında
SharePoint HakkındaSharePoint Hakkında
SharePoint Hakkında
Mustafa Aksoy
 
Director General of WA Health - Launch Address
Director General of WA Health - Launch AddressDirector General of WA Health - Launch Address
Director General of WA Health - Launch Address
Pip Brennan | Author, Non Profits
 
Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...
Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...
Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...
Oportunidad Estratégica Ltda
 

Viewers also liked (12)

ASCD 2014 Unleashing Power of Excellent Schools
ASCD 2014 Unleashing Power of Excellent SchoolsASCD 2014 Unleashing Power of Excellent Schools
ASCD 2014 Unleashing Power of Excellent Schools
 
Pxw launch hcc
Pxw launch hccPxw launch hcc
Pxw launch hcc
 
La llegenda de Sant Jordi
La llegenda de Sant JordiLa llegenda de Sant Jordi
La llegenda de Sant Jordi
 
Fre 2015 webinar
Fre 2015 webinarFre 2015 webinar
Fre 2015 webinar
 
Polyppolyp lynch syndrome version a
Polyppolyp lynch syndrome version aPolyppolyp lynch syndrome version a
Polyppolyp lynch syndrome version a
 
DWP SME conference (11 March 2014) - Brian Gannon (kainos)
DWP SME conference (11 March 2014) - Brian Gannon (kainos)DWP SME conference (11 March 2014) - Brian Gannon (kainos)
DWP SME conference (11 March 2014) - Brian Gannon (kainos)
 
Crm web client user interface struttura - 1
Crm web client user interface  struttura - 1Crm web client user interface  struttura - 1
Crm web client user interface struttura - 1
 
Technical Writer as Scrum Master: Expand Your Skill Set
Technical Writer as Scrum Master: Expand Your Skill SetTechnical Writer as Scrum Master: Expand Your Skill Set
Technical Writer as Scrum Master: Expand Your Skill Set
 
Tangible Property Capitalization Regulations
Tangible Property CapitalizationRegulationsTangible Property CapitalizationRegulations
Tangible Property Capitalization Regulations
 
SharePoint Hakkında
SharePoint HakkındaSharePoint Hakkında
SharePoint Hakkında
 
Director General of WA Health - Launch Address
Director General of WA Health - Launch AddressDirector General of WA Health - Launch Address
Director General of WA Health - Launch Address
 
Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...
Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...
Acerca de la sostenibilidad del programa PYME MIDAS y sus aprendizajes para e...
 

Similar to автоматическая обработка текста

Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов
Сергей Балан
 
Машинный перевод
Машинный переводМашинный перевод
Машинный перевод
Kirill Posternyak
 
АОТ - Введение
АОТ - ВведениеАОТ - Введение
АОТ - Введениеeibolshakova
 
4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)
Smolensk Computer Science Club
 
История программного обеспечения и ИКТ
История  программного обеспечения и ИКТИстория  программного обеспечения и ИКТ
История программного обеспечения и ИКТ
maxim1415
 
13. информатика 10 11класс фкгос
13. информатика 10 11класс фкгос13. информатика 10 11класс фкгос
13. информатика 10 11класс фкгос
rassyhaev
 
презентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem netпрезентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem netBerik Badayev
 
Системы автоматического перевода
Системы автоматического переводаСистемы автоматического перевода
Системы автоматического перевода
mitqa
 
автоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отчавтоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отчanna_vereshchagina
 
Язык интернета. Семинар 5.
Язык интернета. Семинар 5.Язык интернета. Семинар 5.
Язык интернета. Семинар 5.
Max Kornev
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAINL Conferences
 
презентация1
презентация1презентация1
презентация1marizza10391
 
Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...
Ilya Nikitin
 
Андрей Вересов - .NET Reflection
Андрей Вересов - .NET ReflectionАндрей Вересов - .NET Reflection
Андрей Вересов - .NET ReflectionDataArt
 

Similar to автоматическая обработка текста (20)

Mashinny perevod
Mashinny perevodMashinny perevod
Mashinny perevod
 
Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов
 
Машинный перевод
Машинный переводМашинный перевод
Машинный перевод
 
АОТ - Введение
АОТ - ВведениеАОТ - Введение
АОТ - Введение
 
4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)
 
История программного обеспечения и ИКТ
История  программного обеспечения и ИКТИстория  программного обеспечения и ИКТ
История программного обеспечения и ИКТ
 
13. информатика 10 11класс фкгос
13. информатика 10 11класс фкгос13. информатика 10 11класс фкгос
13. информатика 10 11класс фкгос
 
презентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem netпрезентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem net
 
Системы автоматического перевода
Системы автоматического переводаСистемы автоматического перевода
Системы автоматического перевода
 
автоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отчавтоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отч
 
рар
раррар
рар
 
тема 6
тема 6тема 6
тема 6
 
Язык интернета. Семинар 5.
Язык интернета. Семинар 5.Язык интернета. Семинар 5.
Язык интернета. Семинар 5.
 
?аывафы
?аывафы?аывафы
?аывафы
 
лингвонтол
лингвонтоллингвонтол
лингвонтол
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
 
OntoEd
OntoEdOntoEd
OntoEd
 
презентация1
презентация1презентация1
презентация1
 
Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...
 
Андрей Вересов - .NET Reflection
Андрей Вересов - .NET ReflectionАндрей Вересов - .NET Reflection
Андрей Вересов - .NET Reflection
 

автоматическая обработка текста

  • 2. Автоматическая обработка текста —преобразование текста на искусственном или естественном языке с помощью ЭВМ. Прикладные системы и теория А. о. т. начали создаваться в конце 50-х гг. 20 в. (США, СССР, Франция, ФРГ и др.) и развивались в нескольких различных приложениях: в системном программировании, издательском деле и в вычислительной лингвистике.
  • 3. • Преобразование текста – внесение в текст исправлений и добавлений • Форматирование текста – выделение заголовков, формировании строк и страниц нужного формата и т.д. • Автоматический набор и верстка текста • Лексиграфическая обработка - текст преобразуется в лексикографическое представление • Автоматический лигвистический анализ • Автоматический синтез
  • 4. Наиболее полно функции А. о. т. развиты в системах автоматического перевода и системах человеко- машинного общения, где основным является синтаксический, а в системах общения с ЭВМ — семантический анализ. Эти наиболее сложные формы А. о. т. целиком опираются на формальный аппарат, развитый в рамках математической лингвистики и вычислительной лингвистики.
  • 5. В составе лингвистического обеспечения автоматизированных информационных систем различают три группы функций А. о. т.: автоматическое индексирование входных документов, автоматическое составление поисковых предписаний по тексту запросов и автоматизированное ведение словарей системы.
  • 6. С 70-х гг. наблюдается тенденция к интеграции всех подходов к конструированию систем А. о. т. в рамках искусственного интеллекта — направления в информатике (computer science), связанного с созданием сложных человеко- машинных и робототехнических систем, моделирующих человеческую деятельность в различных сферах и предметных областях.
  • 7. Здесь функции редактирования всё больше сливаются с функциями содержательной обработки, образуя единый аппарат понимания текста. Это открывает возможности для автоматизации наиболее сложных областей человеческой деятельности, требующих затрат прежде всего интеллектуального труда, таких, как редакционно-издательские процессы, извлечение информации из текстов и т.д.
  • 8. Однако в таких массовых, «промышленных» применениях А. о. т. должна опираться на мощную информационную поддержку в виде автоматизированных словарных картотек, автоматических словарей, грамматик и других форм представления лингвистических данных в ЭВМ
  • 9. Результатом А. о. т. являются частотные словари, конкордансы (словоуказатели с контекстами), автоматические моно- и многоязычные словари, размещаемые в базах данных и используемые программами лексикографических систем в качестве справочного при обработке новых данных. Поэтому такие системы являются развивающимися системами. Автоматические словари используются в системах автоматического перевода, а также в информационных системах и системах общения с ЭВМ на естественном языке в качестве справочников при подготовке и расширении словарей и уточнении грамматик этих систем.