Проектирование
классификаторов технико-
экономической информации
Одним из наиболее существенных компонентов информации является
экономическая информация, основные особенности которой следующие:
в форме
экономических
показателей
документов
Экономическая
информация
существует в
двух формах:
И
Для того чтобы приспособить
экономическую информацию для
эффективного поиска, обработки на
ЭВМ и передачи по каналам связи, её
необходимо представить в цифровом
виде, с этой целью её нужно сначала
упорядочить (классифицировать), а
затем формализовать (закодировать) с
использованием классификатора.
Классификатор – это документ, с помощью которого осуществляется
формализованное описание экономической информации в ЭИС, содержащий
наименования объектов, наименования классификационных
группировок и их кодовые обозначения.
Они описывают
процессы, место,
время
выполнения
процессов,
субъекты и
объекты действия,
отражаемые в
показателе.
Основными
объектами
классификации и
кодирования
являются
справочные
реквизиты-признаки
Каждая система классификации характеризуется следующими
свойствами:
В настоящее время чаще всего применяются
два типа систем классификации:
При использовании иерархической системы классификации
необходимо соблюдать следующие ограничения:
Характерные
особенности
Преимущества Недостатки
• наличие в системе
неограниченного
количества признаков
классификации;
• соподчинённость
признаков
классификации.
логичность,
простота ее
построения и
удобство логической
и
арифметической
обработки.
жёсткая структура
классификации, не
позволяющая вносить
новые признаки или
изменять их
последовательность.
Гибкость обеспечивается
за
счёт ввода большой
избыточности в ветвях-
слабая
заполненность
структуры
классификатора.
• получающиеся на каждом уровне
классификационные группировки
должны составлять исходное
множество объектов Мо;
• классификационные группировки Хjk на
каждой ступени не должны пересекаться;
• классификация на каждой ступени
должна проводиться только по
одному признаку (G).
Фасетная система характеризуется следующими особенно-
стями построения:
имеется некоторое множество классифицируемых объектов Мо;
это множество можно рассматривать в нескольких аспектах,
каждый из которых может характеризоваться одним или не-
сколькими признаками, образующими фасет Фr;
устанавливается некоторый порядок следования фасетов с
помощью фасетной формулы (при этом последовательность
фасетов определяется по частоте обращения к этим фасетам
на некотором множестве заданных задач):
F = (Ф1,…, Ф2 ,…,Фr ,…, ФR );
*большая емкость
*высокая степень гибкости
*сложность структуры
*низкая степень заполненности
Язык дескрипторного типа
набор отношенийсовокупность терминов Дескриптор/ лексика
переменные -
синтагматические
постоянные логические
- парадигматические
В зависимости от этапа фиксирующего все
возможные выражения, языки делятся на:
*предкоординированные
*посткоординируемые
Кодирование - это процесс присвоения
условных обозначений объектам и
классификационным группам по
соответствующей системе кодирования
Система кодирования — это
совокупность правил обозначения
объектов и группировок с использованием
кодов.
Код — это условное обозначение
объектов к в виде знака знаков в
соответствии с принятой системой. Код
базируется на определенном алфавите.
Число знаков этого множества
называется основанием кода.
Различают следующие типы алфавитов:
цифровой, буквенный и смешанный.
Код характеризуется следующими параметрами:
•длиной (L);
•основанием
кодирования (А);
структурой, под которой
понимают распределение знаков
по признакам и объектам
классификации;
степенью
информативности (I),
рассчитываемой как част-
ное от деления общего
количества признаков (R)
на длину кода (L):
I = R / L;
коэффициентом
избыточности (Кизб),
который определяется как
отношение максимального
количества объектов (Qмах)
к фактическому
количеству объектов (Qфа к)
Кизб = Qмах / Qфа к
Все системы кодирования можно сгруппировать в два подмножества:
регистрационные и классификационные системы
*Информационная часть
*Контрольная часть
порядковая
серийная
Последовательны
системы
Параллельные
системы
***Разрядная система применяется для кодирования объектов,
определяемых несколькими соподчиненными признаками,
используемыми для решения экономических задач***
***Комбинированная система базируется на сочетании принципов
построения таких систем кодирования, как разрядная, серийная,
порядковая и кода повторения***
Весь процесс разработки системы классификаторов
для ЭИС можно разбить на четыре этапа:
На первом этапе «Разработка ТЗ на проектирование» выполняются две
работы. Первая из них связана с определением состава, назначения и
сферы действия классификаторов, используемых в системе.Далее
определяют назначение классификаторов.
Содержанием второго этапа является «Разработка методических
материалов проектирования», которая включает прежде всего
разработку основных критериев и принципов построения каждого
классификатора.
Третий этап связан с работами по организации сбора и обработки
исходных данных, необходимых для составления классификаторов. К
их числу относится разработка инструктивных материалов по
сбору и обработке исходных данных
На четвертом этапе «Составление классификаторов и системы их
ведения» осуществляется построение эталонной и рабочей формы
классификатора и системы ведения классификатора

Проектирование классификаторов технико экономической информации

  • 1.
  • 2.
    Одним из наиболеесущественных компонентов информации является экономическая информация, основные особенности которой следующие:
  • 3.
    в форме экономических показателей документов Экономическая информация существует в двухформах: И Для того чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, её необходимо представить в цифровом виде, с этой целью её нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классификатора.
  • 4.
    Классификатор – этодокумент, с помощью которого осуществляется формализованное описание экономической информации в ЭИС, содержащий наименования объектов, наименования классификационных группировок и их кодовые обозначения. Они описывают процессы, место, время выполнения процессов, субъекты и объекты действия, отражаемые в показателе. Основными объектами классификации и кодирования являются справочные реквизиты-признаки
  • 5.
    Каждая система классификациихарактеризуется следующими свойствами: В настоящее время чаще всего применяются два типа систем классификации:
  • 6.
    При использовании иерархическойсистемы классификации необходимо соблюдать следующие ограничения: Характерные особенности Преимущества Недостатки • наличие в системе неограниченного количества признаков классификации; • соподчинённость признаков классификации. логичность, простота ее построения и удобство логической и арифметической обработки. жёсткая структура классификации, не позволяющая вносить новые признаки или изменять их последовательность. Гибкость обеспечивается за счёт ввода большой избыточности в ветвях- слабая заполненность структуры классификатора. • получающиеся на каждом уровне классификационные группировки должны составлять исходное множество объектов Мо; • классификационные группировки Хjk на каждой ступени не должны пересекаться; • классификация на каждой ступени должна проводиться только по одному признаку (G).
  • 7.
    Фасетная система характеризуетсяследующими особенно- стями построения: имеется некоторое множество классифицируемых объектов Мо; это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или не- сколькими признаками, образующими фасет Фr; устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач): F = (Ф1,…, Ф2 ,…,Фr ,…, ФR ); *большая емкость *высокая степень гибкости *сложность структуры *низкая степень заполненности
  • 8.
    Язык дескрипторного типа наборотношенийсовокупность терминов Дескриптор/ лексика переменные - синтагматические постоянные логические - парадигматические В зависимости от этапа фиксирующего все возможные выражения, языки делятся на: *предкоординированные *посткоординируемые
  • 9.
    Кодирование - этопроцесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования Система кодирования — это совокупность правил обозначения объектов и группировок с использованием кодов. Код — это условное обозначение объектов к в виде знака знаков в соответствии с принятой системой. Код базируется на определенном алфавите. Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.
  • 10.
    Код характеризуется следующимипараметрами: •длиной (L); •основанием кодирования (А); структурой, под которой понимают распределение знаков по признакам и объектам классификации; степенью информативности (I), рассчитываемой как част- ное от деления общего количества признаков (R) на длину кода (L): I = R / L; коэффициентом избыточности (Кизб), который определяется как отношение максимального количества объектов (Qмах) к фактическому количеству объектов (Qфа к) Кизб = Qмах / Qфа к
  • 11.
    Все системы кодированияможно сгруппировать в два подмножества: регистрационные и классификационные системы *Информационная часть *Контрольная часть порядковая серийная Последовательны системы Параллельные системы ***Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач*** ***Комбинированная система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения***
  • 12.
    Весь процесс разработкисистемы классификаторов для ЭИС можно разбить на четыре этапа: На первом этапе «Разработка ТЗ на проектирование» выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе.Далее определяют назначение классификаторов. Содержанием второго этапа является «Разработка методических материалов проектирования», которая включает прежде всего разработку основных критериев и принципов построения каждого классификатора.
  • 13.
    Третий этап связанс работами по организации сбора и обработки исходных данных, необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных На четвертом этапе «Составление классификаторов и системы их ведения» осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора