Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации архитектуры данных и форм представления бизнес-сущностей
Обсуждаются бизнес-потребности высокотехнологичных организаций, работающих в сфере банковской деятельности, государственного управления, телекоммуникациях, здравоохранении, сетевом ритейле, трансформирующие архитектуру предприятия. По мнению автора, на новом технологическом и архитектурном витке развития вновь растет интерес к датацентрическим архитектурам. В противовес интегрированным СУБД и моделеориентированным архитектурам новые архитектуры обеспечивают множественность типов и форм представления информационных сущностей, поддерживают гибкость и изменчивость содержащейся информации, работая в распределенной вычислительной среде. Это позволяет гибко и быстро подстраиваться под ключевые параметры бизнеса, эффективно управлять затратами на создание и развитие поддерживающих ИТ систем.
Similar to Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации архитектуры данных и форм пр (20)
European Standards on Confidentiality and Privacy in Healthcare
Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации архитектуры данных и форм пр
1. Реализация требований современных информационно-насыщенных
бизнес-архитектур за счет трансформации архитектуры данных и форм
представления бизнес-сущностей
С. Л. Добриднюк – Директор по исследованиям и инновациям ДРБ ГК «Диасофт»,
тел. +7(495)-780-75-75, факс +7(495)-780-75-76, sdobridnuk@diasoft.ru
Обсуждаются бизнес-потребности высокотехнологичных
организаций, работающих в сфере банковской деятельности,
государственного управления, телекоммуникациях, здравоохранении,
сетевом ритейле, трансформирующие архитектуру предприятия. По
мнению автора, на новом технологическом и архитектурном витке
развития вновь растет интерес к датацентрическим архитектурам. В
противовес интегрированным СУБД и моделеориентированным
архитектурам новые архитектуры обеспечивают множественность типов
и форм представления информационных сущностей, поддерживают
гибкость и изменчивость содержащейся информации, работая в
распределенной вычислительной среде. Это позволяет гибко и быстро
подстраиваться под ключевые параметры бизнеса, эффективно управлять
затратами на создание и развитие поддерживающих ИТ систем.
Состояние вопроса
Согласно исследованиям Gartner Industry Research, целый ряд отраслей
– таких, как банковская деятельность, государственное управление,
телекоммуникации, здравоохранение являются стратегически зависимыми от
ИТ-технологий. Особенности их деятельности предписывают специальные
бизнес-требования к информационной архитектуре предприятия:
• Архитектура должна позволять вносить изменения в ИТ
ландшафт и содержимое ключевых справочников плавно, без
революционных возмущений;
• Высокая производительность – речь идет о централизованной
работе десятков и сотен тысяч точек обслуживания и продаж;
• Высокая надежность и устойчивость к агрессивной эксплуатации,
исключающая техногенный и «человеческий» фактор;
• Низкая стоимость начального «захода» в архитектуру, затраты на
ее развитие должны коррелировать с реальным ростом объемов
бизнеса.
В современных комплексных архитектурах процесс оказания услуги
включает бизнес-процессы, выполняемые не только в рамках предприятия,
1
2. но и на смежных предприятиях и организациях – превращаясь в «сквозные»
бизнес-процессы масштаба региона. Бизнес-модель такого предприятия чаще
всего отличается значительной изменчивостью по причине постоянного
обновления продуктов и услуг.
Информационная модель предприятий в B2C сфере часто включает
функции постоянного сбора информации о клиентах: об их покупках,
предпочтениях, учет поведения при выборе товара иди услуги, и др. При
этом собираемая и обрабатываемая информация не имеет заранее
определенной схемы представления, слабоструктурирована и может
содержаться в принципиально различных представлениях – включая
фото/видео/географический контекст.
Аналитики Gartner считают, что доминирующими форм-факторами
архитектуры современных ИТ-систем станут SOA (Service-Oriented
Architecture), либо SOA в комбинации с EDA (Event-Driven Architecture). Но
их реализация на практике часто происходит с большими сложностями.
Причины ситуации
Для написания информационных систем в парадигме JavaEE1
компании-разработчики применяют обычно два популярных процесса
проектирования информационных систем: «Сode first» - рассматривая
целевую систему как набор классов и интерфейсов и интегрированного
концептуального представления, сознательно исключая уровень физического
представления данных; и «Data first» - когда сначала создается ER-модель
данных архитектуры системы, и на ее платформе затем строятся активные
компоненты – процедуры, функции, методы и пр.
Последний способ применяют разработчики с большой практикой
разработки информационных архитектур типа «клиент-сервер» и опытом
сопровождения реляционных систем управления базами данных (СУБД). Но,
даже работая с новыми информационными сущностями, такие специалисты
не могут избавиться от привычки представлять все данные в реляционном
виде или накладывать ограничения существующих СУБД на всю систему и
архитектуру предприятия в целом.
Известно, что динамичность меняющейся бизнес-модели несколько лет
назад уже превысила возможности большинства традиционных ИТ-систем
динамично меняться. Исходя из этого, задача создания эффективной
архитектуры данных не только остается, но и выходит на первый план для
крупномасштабных организаций, сталкивающихся в свой деятельности с
1
Java Platform, Enterprise Edition, сокращенно Java EE — набор спецификаций и соответствующей
документации для языка Java, описывающей архитектуру серверной платформы для задач средних и
крупных предприятий.
2
3. проблемами при использовании большого объема разрозненных данных.
Наиболее распространенным и проработанным на сегодняшний момент
является использование в архитектуре данных SQL-ориентированных
реляционных баз данных. Эти СУБД широко используются для хранения
структурированных данных, имеют мощный язык запросов, включая
поддержку ACID2
-транзакций. Вместе с тем, по мере развития
информационно-телекоммуникационной сети Интернет, приобретают
популярность Web-приложения, при помощи которых реализуются задачи
создания социальных сетей, распределенных поисковых систем, систем
электронной коммерции, поддержки мобильных и распределенных
приложений. Традиционные достоинства реляционных СУБД и системного
программного ПО в таких архитектурах уже не кажутся преимуществом, а
порой являются сдерживающим фактором.
Альтернативные СУБД как элемент архитектуры данных
Ответом на указанные вызовы стало появление большого числа
проектов создания «альтернативных» СУБД - объектно-ориентированных,
документоориентированных, графовых, класса ключ-значение, NoSQL,
BigTable и пр. Емкость рынка альтернативных СУБД растет темпами до 70%
в год, достигнув в 2014 г объема в 3,4 млрд. долларов3
.
Часть разработчиков – например проекты Cloudera, MapR, MarkLogic,
10Gen получают финансирование в сотни миллионов долларов и даже
успешно полностью вернули (проект Aerospike) все первоначальные
инвестиции.
Большое разнообразие типов обрабатываемых данных –
структурированных и слабоструктурированных, видов их представления –
цифрового, аудио-визуального, вариантов хранения – распределенного и
централизованного, наличие специальных требований по быстродействию,
отказоустойчивости, информационной безопасности повлекло за собой не
только разработку большого числа специализированных СУБД, но и
трансформацию архитектуры данных.
Целью трансформации является смена фокуса видения, когда все
данные любой формы представления рассматриваются в совокупности – как
самая важная ценность предприятия, вокруг которой создаются сервисы и
организуется бизнес. Этот «датацентрический» путь трансформации всей
2
Atomicity, Consistency, Isolation, Durability (ACID) — атомарность, согласованность,
изолированность, надежность требования к транзакционной СУБД, обеспечивающие наиболее надёжную и
предсказуемую её работу.
3
[В Интернете]. URL: http://wikibon.org/wiki/v/Hadoop-
NoSQL_Software_and_Services_Market_Forecast_2012-2017
3
4. комплексной архитектуры не противоречит мнению авторитетов - ведь и
Дж.Захман говорил про то, что преобразования архитектуры предприятия
могут начаться из любой клетки его таблицы-модели.
Таким образом, сегодня мы наблюдаем конвергенцию подходов «Code
first» и «Data first» и появление нового вида архитектур предприятия – где
слой архитектуры данных не так четко отделен от слоя системного и
прикладного программного обеспечения, где нет навязывания единых СУБД
для работы с разнородными информационными сущностями.
Новые подходы к архитектуре данных
Как же решаются в современных альтернативных архитектурах данных
и соответствующей ей архитектуре предприятия вышеуказанные задачи?
Перечислим несколько примеров.
Компактность и страничная организация физических данных в
реляционных SQL СУБД сегодня не имеют экономического значения –
дисковая и оперативная память в современных ЭВМ стали одной из самых
дешевых компонент. Появляются новые быстродействующие компоненты –
типа твердотельных жестких дисков или высокоскоростной связи,
позволяющей отказаться от встроенной долговременной памяти в принципе.
В архитектуре данных таких информационных систем присутствует
несколько хранилищ данных, разделенных по физическому способу хранения
данных и типу их организации. Для работы с постоянными данными
используются традиционные накопители на дисках, но временные таблицы и
рабочие данные – располагаются исключительно в оперативной памяти.
Надежность хранения данных в оперативной памяти обеспечивается
специальными аппаратными средствами.
Особенностью является то, что данные и объекты в оперативной
памяти могут иметь переменную длину и нелинейную адресацию. Это
позволяет применять в архитектуре современные решения для быстрой
трансформации и выборки данных, например при помощи оригинальных
алгоритмов индексирования и матричных преобразований. Практически в
каждой архитектуре информационной системы типа «социальная сеть» очень
много внимания уделяется технологиям быстрого построения графов
социальных связей пользователей для последующего применения в системах
коллективного взаимодействия, рейтингования инициатив и сортировки
контента участников.
Вторым сдерживающим фактором, унаследованным от реляционных
СУБД, является строгая структура данных и система ее поддержки,
4
5. разделяющая DML4
и DDL5
операторы, контроль целостности типов данных.
Такая реализация архитектуры данных затрудняет смену версии
программного обеспечения, мешает быстро адаптировать информационную
систему к изменчивому бизнес-ландшафту.
В архитектурах предприятия, устраняющих данный недостаток,
содержится компонента промежуточной ORM6
обертки, обеспечивающая
реализацию «Code first» парадигмы. Она хранит описание предметной
области в специальной мета-базе данных, отделяя логическое представление
данных от деталей физической реализации в объектной модели кода.
Перспективным видится хранение в ООП-виде справочников бизнес-
продуктов – поскольку интересы бизнеса требуют быстрой адаптивности к
рынку, подразумевая гибкое управление общими и индивидуальными
схемами комиссий и тарифов, что удобнее делать на принципах ООП -
наследовании и полиморфизме.
Кроме клиентских данных, мета-база может содержать полную
онтологическую модель информационной системы – включая не только
данные, но и активный код. Поддержка многоканального обслуживания
требует выделения в отдельный слой унифицированной бизнес-логики – что
тоже можно хранить в мета-базе данных. Это повышает уровень языка
работы с информацией, делает его насыщеннее и абстрактнее. Но поиск
единого языка манипулирования информацией, представленной в различной
форме, пока не завершен. С момента провозглашения М.Фаулером в 2011
году идеи «универсального языка для данных»7
практического решения для
этой задачи пока не найдено.
Третьим отличием от обычных архитектур данных является отказ от
строгой транзакционности, реализуемой сложными механизмами
репликации. В широком круге применений, таких как e-commerce,
допускается временная рассинхронизация данных на узлах данных
архитектуры предприятия. Появление экземпляра нового объекта данных во
всех узлах системы может допускаться в течение минут, часов, и даже дней.
Целостность и консистентность данных, и арбитраж конфликтов при такой
4
Data Manipulation Language (DML) язык управления (манипулирования) данными — семейство
компьютерных языков, используемых в СУБД для получения, вставки, удаления или изменения объекта
данных.
5
Data Definition Language (DDL) - язык описания данных — семейство компьютерных языков,
используемых в СУБД для описания структуры баз данных.
6
Object-relational mapping, - объектно-реляционное отображение — технология программирования,
связывающая СУБД с концепциями объектно-ориентированных языков программирования, создавая
«виртуальную объектную базу данных».
7
M. Fowler, «Polyglot Persistence», 2011. [В Интернете]. URL:
http://martinfowler.com/bliki/PolyglotPersistence.html.
5
6. асинхронности может реализовываться на уровне приложения, а не на уровне
центральной СУБД.
Четвертым отличием новых архитектур, является повышенная забота о
производительности. Поставщики промышленных реляционных СУБД, как
правило, решают задачи производительности «вертикальным»
масштабированием – переносом систем на крупные многопроцессорные
комплексы. В то время как бизнес требует «мягкого» наращивания затрат на
покупку оборудования и постепенного увеличения производительности
информационных архитектур – без серьезных начальных финансовых затрат.
Это лучше всего достигается при «горизонтальном» масштабировании –
подключением, по мере развития бизнеса, однотипных дешевых
дополнительных компьютеров, объединенных между собой в единую сеть.
Поддержка «горизонтального масштабирования», «электронных архивов»,
CDN8
понятна как программистам, так и финансистам, поскольку решает
ключевые вопросы выживания ИТ-проекта, делая затраты на построение и
поддержание информационных систем соразмерными с генерируемой
бизнесом прибылью.
Заключение
Пик применения «классических» реляционных СУБД пожалуй уже
пройден, за ними в ближайшее десятилетие останется лишь ниша
транзакционных операций – например в обработке финансовых проводок,
где важна мгновенная целостность.
На настоящий момент трудно сказать, какие решения для СУБД и
архитектуры данным мы увидим через 5 лет. Но то, что современная
архитектура предприятия, это уже не столько о «системах», сколько о
«данных» - несомненно. Об этом говорит высокая динамика развития
системного программного обеспечения в этой сфере и подходов к
архитектуре данных.
8
Content Delivery Network - Сеть доставки (и дистрибуции) контента
6
7. асинхронности может реализовываться на уровне приложения, а не на уровне
центральной СУБД.
Четвертым отличием новых архитектур, является повышенная забота о
производительности. Поставщики промышленных реляционных СУБД, как
правило, решают задачи производительности «вертикальным»
масштабированием – переносом систем на крупные многопроцессорные
комплексы. В то время как бизнес требует «мягкого» наращивания затрат на
покупку оборудования и постепенного увеличения производительности
информационных архитектур – без серьезных начальных финансовых затрат.
Это лучше всего достигается при «горизонтальном» масштабировании –
подключением, по мере развития бизнеса, однотипных дешевых
дополнительных компьютеров, объединенных между собой в единую сеть.
Поддержка «горизонтального масштабирования», «электронных архивов»,
CDN8
понятна как программистам, так и финансистам, поскольку решает
ключевые вопросы выживания ИТ-проекта, делая затраты на построение и
поддержание информационных систем соразмерными с генерируемой
бизнесом прибылью.
Заключение
Пик применения «классических» реляционных СУБД пожалуй уже
пройден, за ними в ближайшее десятилетие останется лишь ниша
транзакционных операций – например в обработке финансовых проводок,
где важна мгновенная целостность.
На настоящий момент трудно сказать, какие решения для СУБД и
архитектуры данным мы увидим через 5 лет. Но то, что современная
архитектура предприятия, это уже не столько о «системах», сколько о
«данных» - несомненно. Об этом говорит высокая динамика развития
системного программного обеспечения в этой сфере и подходов к
архитектуре данных.
8
Content Delivery Network - Сеть доставки (и дистрибуции) контента
6