2. Електронний документообіг EDI.
ANSI ASC X12
• Електронний документообіг EDI (Electronic Data
Interchange) – обмін між комп’ютерами
структурованою інформацією по взаємоузгоджених
правилах. Вперше EDI почав застосовуватися в
середині 60-х років в сфері залізничних і
автомобільних перевезень.
• Стандарт електронного обміну документами ANSI
ASC X12 (American National Standards Institute
Accredited Standards Committee X12) був
розроблений в 70-х роках, коли був важливий
малий розмір електронного документа і кожен
байт повинен був нести максимум інформації.
3. Організації, які працюють над
стандартами EDI:
• ANSI (American National Standards Institute) – це Інститут, який встановлює
стандарти для багатьох видів діяльності. EDI займається Комітет ANSI X12 –
головна організація США по стандартизації EDI.
• EDIA (The Electronic Data Interchange Association, раніше відома як
Transportation Data Coordinating Committee (TDCC))
• AIAG (The Automotive Industry Action Group) – група стандартів для
автомобільної промисловості. Даний стандарт є підгрупою стандартів ANSI
X12.
• UCS (The Uniform Communications Standard) стандарт, використовуваний для
бакалійної індустрії.
• EDIFACT (Electronic Data Interchange for Administration, Commerce, and
Transport.) – Організація, що займається стандартизацією EDI при Раді з
Економіки та Соціальної політики ООН. Стандарти EDIFACT, в відміну від ANSI
X12, використовуються в основному в Європі, в той час як X12 – в Америці.
• ODETTE (The Organization for Data Exchange by Tele-Transmission in Europe.)
• VICS (The Voluntary Inter-industry Communication Standards) – організація, яка є
підгрупою ANSI X12 і займається стандартами для індустрії роздрібної торгівлі.
4. Основні терміни та поняття:
• документ
• функціональна група
• interchange
5. Типи даних, які може містити
елемент у стандарті:
• AN (Alpha-Numeric)
• R (Real)
• N[X] (Number)
• ID (Identity)
• DT (Date)
• TM (Time)
• B (Binary)
6. Сегмент
• Сегмент (segment) - комбінація пов'язаних
елементів або складових даних, які згруповані
для надання корисної інформації.
• Сегмент складається з ідентифікатора (tag) і
елементів, розділених спеціальними
символами (element separator) – («зірочка»
(asterisk) - «*»). Закінчуються сегменти іншим
символом (segment terminator) – (тильда «~»).
• У документі сегменти йдуть один за одним у
порядку, визначеному стандартом.
7. Типи опціональності елементу:
• M (Mandatory) – обов’язковий елемент.
• O (Optional) – необов’язковий,
опціональний елемент.
• C (Conditional) – залежний елемент, який
опціонально залежить від умов.
8. Елемент
• Елемент (element) сегмента - це «квант»
інформації, що міститься в сегменті.
• Елементи в сегменті мають свої «адреса», які
складаються з імені сегмента і позиції
елемента в даному сегменті. Зазвичай
позначається як
<ІМ'Я СЕГМЕНТУ> - <ПОЗИЦІЯ> або <ІМ'Я
СЕГМЕНТУ> <ПОЗИЦІЯ>
9. Сегменти конвертів
Існують три типи конвертів:
• ISA / IEA Envelopes,
• GS / GE Envelopes
• ST / SE Envelopes.
Початкові сегменти конвертів мають назву Header, а
завершальні – Trailer:
• ISA – Interchange Control Header
• GS – Function Group Header
• ST – Transaction Set Header
• SE – Transaction Set Trailer
• GE – Function Group Trailer
• IEA – Interchange Control Trailer
10. ISO / IEC 11179
ISO / IEC 11179 (офіційно відомий як
ISO/IEC 11179 реєстр метаданих (MDR)
СТАНДАРТ) міжнародний стандарт для
представлення метаданих для організації до
реєстру метаданих.
11. Структура стандарту ISO / IEC 11179:
• Частина 1 - Рамки (іменовані ISO/IEC 11179-1)
• Частина 2 – Класифікація
• Частина 3 - Registry метамодель і основні
атрибути
• Частина 4 - Формулювання визначень даних
• Частина 5 - найменування та ідентифікаційні
принципи
• Частина 6 – Реєстрація
12. Кожен елемент даних у реєстрі
11179 метаданих ISO / IEC:
• повинні бути зареєстровані відповідно до керівних
принципів реєстрація (11179-6)
• буде однозначно визначені в реєстрі (11179-5)
• повинні бути названі відповідно до іменування та
ідентифікації принципів (11179-5)
• повинні бути визначені за допомогою вироблення
правил визначення даних (11179-4)
• можуть бути класифіковані в схемі класифікації
(11179-2)
Елементи даних, які зберігають "коди" або
перераховані значення необхідно також вказати
семантику кожного з кодових значень з точними
визначеннями.
13. ПІДТРИМКА СТАНДАРТУ
ДУБЛІНСЬКОГО ЯДРА
Інтернет це величезний обсяг цифрових ресурсів,
розподілений практично по всій земній кулі. Оцінити
кількісно мережу Інтернет можна тільки приблизно.
Це динамічна система, яка змінює свої параметри
щохвилини.
Для того, що б хоч якось упорядкувати такий обсяг
неструктурованої інформації в мережі Інтернет
існують пошукові сервери.
За принципом індексування вони поділяються на
дві групи:
• з індексуванням автоматичним (машинним)
• з інтелектуальним індексуванням (за участю
людини)
14. МЕТАДАНІ
З покон віку бібліотекарі займалися
інтелектуальною обробкою джерел інформації на
паперових носіях. Вони створювали і створюють
каталоги. Спочатку карткові, останнім часом —
електронні. Та все ж і перші, і другі базуються на тих
самих правилах щодо опису книги, журналу,
газетної або журнальної статті тощо.
З розвитком Інтернет фахівці з інформаційних
технологій придумали нові терміни для збереження
певних одиниць описової або статистичної
інформації про об’єкти і назвали їх МЕТАДАНИМИ.
15. Набори Метаданих
У буквальному значенні МЕТАДАНІ можна розшифрувати як
“дані про дані”, перехід до чого-небудь іншого, зміну стану,
перетворення.
Бібліографічна картка є не що інше, як набір МЕТАДАНИХ на
книгу чи статтю з журналу, яка побудована за правилами
бібліографічного опису.
Наборів МЕТАДАНИХ існують десятки. Це можуть бути вузько
специфічні набори чи метадані універсального характеру.
Предметом подальшої уваги стане Ініціатива Дублінського
Ядра Метаданих (Dublin Core Metadata Initiative).
Стандарт метаданих Dublin Core, є форматом опису
практично будь-яких ресурсів Інтернет — не складний за
структурою, відносно легкий у застосуванні, інтернаціональний
16. Дублінське ядро
Дублінське ядро - словник (семантична мережа)
основних понять англійської мови, призначений для
уніфікації метаданих для опису найширшого діапазону
ресурсів.
Словник розділений на два рівні:
• простий (некваліфікований, simple), що
складається з 15 елементів;
• компетентний (кваліфікований, qualified), що
складається з 18 елементів і групи кваліфікаторів, які
уточнюють семантику елементів для підвищення
корисності пошуку ресурсів.
17. Практичне застосування елементів
Дублінського ядра.
Розглянемо елементарну веб-сторінку
<html>
<head>
<title>
Заклик до бібліотечного співтовариства
</title>
</head>
<body>
Привіт! Давайте вивчати Дублінське ядро.
</body>
</html>
Можемо спостерігати — у вікні браузера буде показано все те, що записано в блоці тіла html-
документу (тобто між тегами <body> і </body>).
Це дає нам змогу зробити важливе припущення — якщо ми створимо спеціальні теги із
даними Дублінського ядра і розмістимо іх у блоці ЗАГОЛОВКІВ, тобто між тегами <head> і </head>,
то вони будуть інтегровані у будь-який html-документ, але не з’являться у вікні браузера під час
перегляду.
18. Як "працює" Дублінське ядро
Знову перепишемо наш html-документ вставивши у блок заголовків теги
<html>
<head><title> Заклик до бібліотечного співтовариства </title>
<meta name=”DC.Title” content=”Заклик до бібліотечного співтовариства»>
<meta name=”DC.Description” content=”Цей документ є агітаційним закликом
вивчати новий стандарт Дублінське ядро метаданих" >
<meta name=”DC.Subject” content=”Дублінське ядро, метадані, звернення»>
<meta name=”DC.Language” content=”uk”>
</head>
<body>Привіт! Давайте вивчати Дублінське ядро. </body>
</html>
Розглянемо синтаксис кодування елементу. Спочатку завжди записується службове слово:
meta
Далі атрибут name= . Після службових слів вноситься власне назва елементу із префіксом DC
через крапку — щоб позначити стандарт метаданих, у нашому випадку це Дублінське ядро, і
обов’язково береться у подвійні лапки.
Після цього слідує атрибут content=, а за ним (теж обов’язково у подвійних лапках) слідує
змістовне наповнення елементу, тобто його значення.
19. Додаткові засоби DC
Ми розглянули мінімальний склад кодування
елементу Дублінського ядра мовою HTML.
Арсенал DC також включає в собі такі поняття
як кваліфікатори та схеми. Ці додаткові засоби
розширюють можливості опису цифрового
ресурсу і роблять його більш детальним. Їх
використання не обов’язково, але бажано.
20. Кваліфікатори
Кваліфікатор є атрибутом назви певного елементу Дублінського ядра,
що розширює або деталізує назву елемента. Він вноситься одразу ж після
імені елемента і відокремлюється крапкою.
Приклади (для наочності кваліфікатор підкреслено):
<meta
name=”DC.Creator.PersonalName”
content=”Чуковський”>
<meta
name=”DC.Data.Created”
content=”2014-04-23”>
Бажано використовувати у якості кваліфікаторів терміни із
контрольованих словників, але за філософією Дублінського ядра діє принцип
“відкидання зайвого”. Тобто якщо програма-агент, що індексує ресурси не
розуміє змісту якогось кваліфікатора — вона просто відкине його.
21. Схема та локалізація
Схема є атрибутом що пояснює до якої системи класифікації
відноситься певний елемент Дублінського ядра. Він не обов’язковий і
може бути використаний не у всіх елементах. Атрибут схема кодується
наступним чином: службове слово scheme, знак = і у подвійник лапках
назва класифікації, стандарту або схеми.
Приклад:
<Meta name="DC.Subject" Scheme="ББК" content="78.30">
І ще один атрибут — атрибут мови можна використовувати із
більшістю елементів Дублінського ядра. Як і схема він кодується у тегу
окремо і складається із службового слова Lang, знаку = і коду мови (у
подвійних лапках).
Приклад:
<meta name=”DC.Title” lang=”uk” content=”Мойдодир”>
22. Елементи метаданих DC:
1. Title (назва ресурсу)
2. Creator (особа, організація або служба, відповідальна за
підготовкузмісту ресурсу)
3. Subject (тема, обговорювана в змісті ресурсу)
4. Description (опис змісту ресурсу у вільній формі)
5. Publisher (особа, організація або служба, що забезпечує доступ до
ресурсу)
6. Contributor (інші учасники підготовки змісту ресурсу крімзазначеного в
Creator)
7. Date (дата створення або надання доступу до ресурсу)
8. Type (жанр, категорія або інші характеристики природи ресурсу)
9. Format (характер подання ресурсу)
10.Identifier (точне посилання на ресурс)
11.Source (посилання на джерело, з якого продукувати даний ресурс)
12.Language (мова представлення ресурсу)
13.Relation (посилання на ресурс, пов'язаний з даним)
14.Coverage (область простору, часу і т.д., до якої відноситьсязміст
ресурсу)
15.Rights (права інтелектуальної власності на ресурс і т.п.).
23. Додаткові елементи DC
Досягнута угода про склад елементів метаданих Дублінського ядра
фіксує склад належних йому елементів. Однак при практичному їх
використанні немає можливості забезпечення однозначної інтерпретації їх
сенсу різними користувачами.
Наприклад, елемент Date в різних випадках може мати різний зміст -
дата публікації сторінки в Веб, дата останнього оновлення цієї сторінки і т.д.
Крім того DC 1.1 не визначає правила подання значень назв елементів
метаданих. З цих причин DCMI в додаток до Дублінської ядра схвалила три
засоби, які не ввійшли в офіційний склад DC 1.1:
1. Набір з 33 додаткових і уточнюючих елементів метаданих
2. Комплект схем кодування (кваліфікаторів), кожна з яких визначає
безліч значень відповідного елемента DC
3. Словник типів, що включає набір ідентифікаторів типів можливих
значень деяких елементів DC, вказівка яких для відповідних значень
дозволить адекватно їх інтерпретувати.
24. Поділ елементів DC
ЗМІСТ
ІНТЕЛЕКТУАЛЬНА
ВЛАСНІСТЬ
СТАН
Назва Створювач Дата
Предмет Видавець Формат
Опис Співавтор Ідентифікатор
Тип Права Мова
Джерело
Відношення
Охват
П’ятнадцять елементів Дублінського ядра можна поділити на три основні
групи за їх призначенням
25. У стандарті Дублінського ядра метаданих
втілені наступні характеристики:
• Простота створення і підтримки даних
Дублінське ядро являє собою мінімально простий набір елементів що дають
змогу не тільки фахівцям створювати прості описові записи для цифрових ресурсів
і забезпечує ефективний механізм запитів до ресурсів у мережевому оточенні.
• Семантика загального вживання
Знаходження ресурсів серед великої кількості загальної (часто слабко
структурованої) інформації у мережі Інтернет є досить складною справою.
Дублінське ядро може допомогти «досліднику цифрових ресурсів»
(досліднику-непрофесіоналу) знайти потрібну інформацію через послідовність
загальних елементів.
• Міжнародний масштаб
WWW притаманний цілий ряд специфічних лінгвістичних проблем.
Розроблювачі Дублінського ядра, являють собою представників практично усіх
континентів планети впевнені, що розвиток цього стандарту вирішить складну
багатомовну і мильтикультурну природу електронних ресурсів планети.
• Розширюваність
Досягаючи балансу між простотою опису цифрових ресурсів з однієї сторони
і необхідністю ретельного опису деталей з іншого боку, розроблювачі Дублінського
ядра усвідомлюють важливість створення механізму, здатного розширити набір
елементів у залежності від специфіки ресурсу. Передбачається, що розроблювачі
інших подібних стандартів створять додаткові набори елементів для опису
ресурсів, які дадуть змогу інтегрувати їх до набору Дублінського ядра з метою
максимально повного опису ресурсу.