Довідка по експлуатації програми "Менеджер форматорів"Олександр Лук'янов
У довідці розміщені відомості щодо основних принципів експлуатації програми "Менеджер форматорів", розробленої задля забезпечення максимальної автоматизації і спрощення роботи розпорядників інформації в сфері формування та оприлюднення відкритих даних.
Довідка по експлуатації програми "Менеджер форматорів"Олександр Лук'янов
У довідці розміщені відомості щодо основних принципів експлуатації програми "Менеджер форматорів", розробленої задля забезпечення максимальної автоматизації і спрощення роботи розпорядників інформації в сфері формування та оприлюднення відкритих даних.
1. Вступ до SAS
1. Огляд продуктів SAS.
2. Вступ до SAS Enterprise Miner.
1
2. 2
Огляд продуктів SAS
Продукт – елементарне, неподільне
програмне забезпечення (ПЗ), що
виконує одну технічну функцію (СУБД,
клієнт для роботи з СУБД, портал тощо).
Рішення – сукупність продуктів, що
забезпечують виконання стандартних
процесів у певній галузі (рішення для
банків, страхових компаній тощо).
3. 3
Класи продуктів
SAS Foundation – “начинка”, яку не бачать
користувачі, але саме вона виконує основну
роботу. Містить: СУБД, ПЗ для підключення до
сторонніх СУБД, ПЗ з процедурами для
статистичного аналізу тощо.
Інтерфейс користувача – дозволяє
працювати з SAS Foundation.
Інструменти програміста – серія
продуктів для розробки сховищ даних,
Web-порталів і додатків.
Інструменти адміністратора
4. 4
SAS Foundation
SAS/Base - файлова нетранзакційна СУБД з
власною мовою обробки даних. Окрім роботи з
таблицями дозволяє зчитувати дані з текстових
файлів, XML, Excel файлів і створювати звіти у
різних форматах: HTML, Excel, PDF тощо.
Підтримує мову SQL.
SAS Macro – мова-надбудова над SAS/Base .
Дозволяє організовувати різні види розгалужень і
циклів у програмах SAS/Base , використовується
для створення процедур, які треба зберігати.
Аналог PL від Oracle або T-SQL від Sybase.
5. 5
SAS Foundation
SAS/Share – дозволяє кільком користувачам
працювати з СУБД одночасно. Розв’язує
проблеми конфліктів транзакцій при оновленні
таблиці одночасно кількома користувачами.
SAS/ACCESS – серія продуктів для
підключення SAS до сторонніх СУБД.
Найпопулярніший продукт цієї серії -
SAS/ACCESS for ODBC, дозволяє працювати з
будь-якою СУБД, що підтримує технологію ODBC.
Містить продукти, розроблені спеціально для
конкретних СУБД (ACCESS for Oracle, ACCESS for
Microsoft SQL Server).
6. 6
SAS Foundation
SAS/Connect – забезпечує взаємодію між ПЗ
SAS, що встановлені на різних комп’ютерах.
Дозволяє програмі, що завантажена на одному
ПК, керувати виконанням програм на іншому ПК.
Використовується у системах, де СУБД SAS
встановлено на кількох серверах, для
максимального використання сумарного
процесорного часу.
SAS/STAT – містить набір процедур для
статистичного аналізу даних: алгоритми розбиття
даних на кластери, лінійну регресію, оцінка
статистичних гіпотез тощо.
7. 7
SAS Foundation
SAS/ETS (Econometrics Time Series) –
містить процедури для аналізу і прогнозування
часових рядів.
SAS/HPF (High Performance Forecasting) –
розширює можливості SAS/ETS з прогнозування.
SAS/OR (Operations Research) – містить
процедури для рішення задач оптимізації
(дослідження операцій).
SAS/IML (Interactive Matrix Language) – мова
програмування для роботи з матрицями.
8. 8
SAS Foundation
SAS/Graph – розширює можливості SAS/Base
для створення звітів. Дозволяє включати у звіти
різні типи діаграм і графіків. Підтримує технологію
Active X, яка при перенесенні звітів у продукти
Microsoft зберігає їх інтерактивність (дозволяє
зменшувати-збільшувати, обертати зображення,
змінювати підписи, шрифти тощо).
SAS/Maps – розширює можливості SAS/Graph,
що дозволяє включати у звіти зображення країн і
територій.
9. 9
Інтерфейс користувача
Add-in for Microsoft Office – дозволяє
працювати зі сховищем SAS через Excel.
Enterprise Guide – головний інструмент
користувача – клієнт до сховища SAS. Це
середовище для створення кодів, перегляду
звітів, яке містить велику кількість статистичних
процедур, реалізованих за допомогою графічного
інтерфейсу. Підтримує створення діаграм обробки
даних (ETL-процесів), вузлами яких можуть бути
код обробки таблиці або статистична процедура.
Для роботи бажано знання мов програмування
SQL, SAS/Base або SAS/Macro.
10. 10
Інтерфейс користувача
Enterprise Miner – ще один клієнт до сховища
SAS. Відмінність від Guide – спеціалізація на
статистичному аналізі. Головна ідея –
максимально спростити роботу користувача при
аналізі даних. Робота з даними виконується у
проектах. Кожен проект – ETL-діаграма, на виході
якої може бути таблиця з прогнозом часового
ряду або будь-яка інша.
Forecast Server – середовище для
прогнозування часових рядів. Розширює
можливості SAS/ETS і SAS/HPF за рахунок
зручного інтерфейсу користувача.
11. 11
Інтерфейс користувача
JMP – назва продукту і одночасно компанії-
підрозділу SAS.
JMP – це ПЗ для статистичного аналізу рівня
SPSS, Matlab тощо. На сьогодні спеціалісти SAS
працюють над інтеграцією JMP у сімейство
продуктів SAS (JMP вже може підключатися до
сховища SAS і запускати деякі процедури,
реалізовані у SAS).
12. 12
Інструменти програміста
ETL Studio – графічний інтерфейс користувача
для створення ETL-процесів. ETL-процес
представляється у вигляді діаграми, що спрощує
розуміння процесу: вхідних і вихідних даних,
основних перетворень тощо. Не потребує знань
мов програмування. Користувач може створювати
ETL-процеси за допомогою тільки інтерфейсу
point and click.
OLAP Cube Studio – це ПЗ для створення і
зберігання OLAP кубів. Підтримує мову MDX.
Дозволяє використовувати OLAP куби як джерело
даних на рівні з плоскими таблицями в Enterprise
Guide і Information Map Studio.
13. 13
Інструменти програміста
Information Map Studio – дозволяє приховати від
користувача структуру даних, надаючи йому
можливість оперувати термінами бізнесу замість
назв таблиць і стовпчиків. Основна ідея – скоротити
навантаження на IT-спеціалістів компанії, так як
після розробки інформаційних карт користувачі
SAS можуть самостійно створювати вітрини і звіти,
користуючись зрозумілою для них термінологією.
Information Delivery Portal – забезпечує роботу
web-сервера (Apache) та його взаємодію з іншими
продуктами SAS.
Дозволяє переглядати звіти, таблиці, OLAP-куби
тощо через Web-інтерфейс.
14. 14
Інструменти програміста
AppDev Studio – середовище для розробки
додатків. Підтримує технології Java, ASP.NET,
ActiveX, Visual Basic, C++, C#. Містить множину
класів, що дозволяють інтегрувати додатки, що
розробляються, з іншими продуктами SAS.
Web Report Studio – Web-інтерфейс для
створення різноманітних звітів, включаючи діаграми
і графіки для їх наступного розміщення на web-
порталі. Не потребує навичок програмування, надає
зручний point and click інтерфейс.
15. 15
Інструменти адміністратора
Management Console – єдиний графічний
інтерфейс для адміністрування всіх продуктів SAS.
Окрім налаштування продуктів SAS дозволяє
управляти доступом до даних і працювати з
обліковими записами користувачів.
Це найбільш розповсюджені, але не всі продукти
SAS. Повний їх перелік знаходиться на
офіційному сайті SAS.
18. 18
SAS Enterprise Miner: загальний вигляд вікна
Інтерфейс SAS Enterprise Miner надає широкий спектр інструментів з
графічним інтерфейсом для керування процесом аналізу даних. Його
можна настроїти, включивши власні методи аналізу та інструменти.
19. 19
SAS Enterprise Miner: Огляд інтерфейсу
Панель головного меню
Кнопки швидкого виклику команд
За допомогою панелі головного меню та відповідних кнопок швидкого
виклику команд можна виконувати звичайні віконні задачі, окрім
запуску, зупинки та огляду аналітичних задач.
20. 20
SAS Enterprise Miner: Огляд інтерфейсу
Панель проекту
В панелі проекту можна керувати та переглядати джерела даних,
діаграми, результати та користувачів проекту.
21. 21
SAS Enterprise Miner: Огляд інтерфейсу
Панель властивостей
Панель властивостей дозволяє Вам переглядати та редагувати
настройки джерел даних, діаграм, вузлів, результатів і користувачів.
22. 22
SAS Enterprise Miner: Огляд інтерфейсу
Панель довідки
Панель довідки відображає короткий опис властивості, обраної Вами в
панелі властивостей.
23. 23
SAS Enterprise Miner: Огляд інтерфейсу
Робоча область діаграми
В робочій області діаграми будуються, редагуються та запускаються
діаграми хода процесу. Робоча область – це місце, де ви розміщуєте в
графічній послідовності інструменти, що використовуються Вами для
анализу даних і створення звітів.
24. 24
SAS Enterprise Miner – Огляд інтерфейсу
Хід процесу
Робоча область діаграми містить одну та більше одиниць ходу
процесу. Ход процесу починається з джерела даних та послідовно
використовує інструменти SAS Enterprise Miner для досягнення мети
аналізу даних.
25. 25
SAS Enterprise Miner: Огляд інтерфейсу
Вузол
Хід процесу містить декілька вузлів. Вузлами є інструменти SAS
Enterprise Miner, з’єднані стрілками для зазначення напряму потоку
інформації в аналізі даних.
26. 26
SAS Enterprise Miner: Огляд інтерфейсу
Набір інструментів SEMMA
Інструменти SAS Enterprise Miner, що доступні для аналізу даних,
містяться в наборі інструментів. Набір инструментів организований у
відповідності з SEMMA - SAS процесом для data mining.
27. 27
SEMMA – Вкладка Sample
• Input Data (введення даних)
• Data Partition (розбиття даних)
• Sample (вибірка)
• Time Series (часові ряди)