Анализ международных практик поддержки R&D по направлению “Открытые Данные”

  • 461 views
Uploaded on

Анализ международных практик …

Анализ международных практик
поддержки R&D по направлению
“Открытые Данные”

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
461
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
5
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Анализ международных практик поддержки R&D по направлению “Открытые Данные” Российский офис Консорциума W3C при поддержке Центра семантических технологий НИУ ВШЭ
  • 2. История развивалась…  Документы  Датасеты  Связанные данные Эра документов С принятием директивы Re-use of Public Sector Information Directive (2003/98/EC, 17/11/2003) в Евросоюзе начался процесс публикации информации государственного сектора – Public Sctor Information (PSI). К июлю 2005 года все 25 стран – членов Евросоюза ввели соответствующие положения директивы в свои национальные законодательства. Эра датасетов Страны-лидеры по открытию государственной информации все больше стали публиковать информацию в виде каталогизированных наборов данных, или «датасетов» (Open Government Data – OGD). В 2009 году, опубликованная Директива администрации США предписала всем правительственным агентствам в 45-дневный срок опубликовать по 3 новых датасета на специально выделенных страницах порталов agency/…/data.gov. и добились существенных результатов, они продолжают фокусировать свои усилия на облегчении для общественности поиска данных и раскрытия их в самых разнообразных форматах. По мере наращивания массивов публикации пришло осознание, что для достижения эффективности использования бизнесом и гражданами данных не достаточно публиковать эти наборы в виде файлов, таблиц и графиков на выделенных государственных порталах. При использовании таких форматов публикации обнаружились некоторые проблемы:    Accessibility (Доступность) Discoverability (Обнаруживаемость данных) Cross-referencing (возможность перевязывания данных) +++ + – 2
  • 3.    Handling (Управляемость) Costs (Стоимость) Datasets Management Systems (системы управления датасетами)  Data catalog federation (?! – оказалось, что надо развертывать системы!) +++ +++ ?! ?! Причем, все трудности использования данных перекладываются “на плечи” разработчиков прикладных систем: Выяснилось, что затраты на подготовку данных (моделирование, структуризацию, “выравнивание” по словарям) с лихвой компенсируются легкостью их повторного использования - “re-use”. 3
  • 4. Эра связанных данных В 2009 году была предложена 5-ти звездная модель форматов раскрытия данных Реализация направления «Открытые государственные данные – OGD» получила развитие в сторону «Государственные связанные данные – GLD). В 2011 году Европейская Комиссия запустила стратегию Open Data Strategy for Europe (IP/11/1524), которая, как ожидается, будет приносить экономике ЕС до 40 миллионов ЕВРО ежегодно. Директива 2003/98/EC по вторичному использованию информации государственного сектора явилась по факту первым из наборов средств, призванных облегчить представителям деловых кругов получение доступа к государственной информации и разрешения на ее вторичное использование. В настоящее время данная Директива находится под пересмотром, вследствие которого предполагается расширить как доступ к информации, так и сферу воздействия Директивы, тем самым придавая Открытым Данным (Open Data) статус ценного источника, способного обеспечить экономический рост Евросоюза. В дополнение к пересмотру официальной инфраструктуры Открытых Данных, Комиссия одобрила проведение на различных уровнях всевозможных инициатив по поддержке, включая Call for tenders (от 19 июля 2011г.) для "Портала Открытых Данных Еврокомиссии" ("Commission Open Data Portal"), Call for tenders (от 3 августа 2012г.) для программы "Вспомогательные сервисы для информации государственного сектора и политики Открытых Данных (“Support services for the Public Sector Information and Open Data Policy"), а также требование настоящего Проекта, ставящего своей задачей помочь “Европейским малым и средним предприятиям обрести возможности и ресурсы, необходимые для создания инновационных услуг в области аналитики содержимого и данных." (стр. 51 рабочей программы 2013 FP7) Представление о данных как об открытых данных для рыночного использования в настоящее время является широко распространенным. Среди крупных и мелких компаний, фокусирующихся на данном секторе, следует отметить Azure Data Marketplace (Microsoft), data.com (Salesforce.com), InfoChimps.com и DataMarket.com. Новая стоимостная цепочка данных включает в себя не только продажу данных нескольким покупателям, но и тенденцию, следуя которой компаниям специализирующимся на консолидации и курировании наборов данных могут передавать ряд аспектов управления данными, 4
  • 5. Подобные компании обеспечивают данным добавочную ценность, такую как согласование данных, размещение данных, наличие общих API данных, а также поставляемые уже в комплекте продукты для их дальнейшего использования в стоимостной цепочке. В настоящее время в Евросоюзе широким фронтом государственных данных в формате связанных данных. идет процесс публикации Источник: https://raw.github.com/LATC/EU-data-cloud/master/diagram/eu-data-cloud.png Что изменилось в модели GLD по сравнению с моделью OGD:  Accessibility (Доступность)  Discoverability (Обнаруживаемость данных)  Cross-referencing (возможность перевязывания данных)  Handling (Управляемость)  Costs (Стоимость)  Linked Data Publishing  Linked Data Querying/Browsing  Vocabulary Management Systems  URI Management Systems (красным цветом выделены новые направления усилий) Наличие информации в машиночитаемом и связанном формате (GLD), а также достаточного количества согласованных метаданных могло бы обеспечить использование перекрестных ссылок, а также решить проблему совместимости и тем самым значительно повысить ценность подобной информации для ее повторного использования. Также необходимо наличие технической инфраструктуры с тем, чтобы обеспечить долгосрочное наличие информации. В дополнение к вышеперечисленному, требуется усиленная 5
  • 6. поддержка НИОКР и инноваций в области анализа данных и создания средств визуализации. В отчете 2009 года Digital Britain ("Цифровая Британия") данные характеризовались как ‘инновационная валюта’ и ‘источник жизненной силы в экономике знания’1. Большая часть данной инновационной валюты производится, собирается или приобретается правительственными структурами во всех странах ЕС. Это важный сырьевой материал для широкого спектра новых информационных продуктов и сервисов, основывающихся на новых возможностях анализа и визуализации данных, полученных из различных источников. Однако, основными препятствиями, с которыми сталкиваются компании в процессе получения открытых данных в качестве необходимых источников информации для своей деятельности, являются:   Деловая компетентность: В связи с незрелым характером Европейского (и всемирного) сектора Открытых Данных, потенциальные предприниматели по прежнему ждут создания более надежной и прозрачной базы, на которой можно было бы построить надежный бизнес. Согласно исследованию, проведенному MEPSIR в 2006 году для бизнес-сектора открытых данных, существует так называемая "игровая площадка" ("playground"), которая требует инвестиций, но приносит мало прибыли (сюда входят мобильные приложения, сервисы визуализации и им подобные), а также "поля сражений" ("battlegrounds"), которые дают ощутимую прибыль, связанную с большим объемом инвестиций в инфраструктуру данных, и которые характеризуются большей конкуренцией, (метеослужбы, бизнес-информация и т.п.). Дискуссии, проводимые по возможностям деловой активности в данном секторе носят по прежнему общий характер, далекий от принятия решений на высшем уровне.  Информированность в области финансирования и венчурного капитала: Вслед за предпринимателями, потенциальные инвесторы также по-прежнему обходят стороной сферу открытых данных. Среди факторов, способных изменить в ближайшие месяцы оценку экономики данных с позиции финансового сектора, можно отметить влияние такого явления, как Big Data, а также серьезных шагов, предпринимаемых Facebook, Google, Bing и им подобными.  1 Правовые рамки: Несмотря на определенные улучшения, произошедшие вследствие влияния Директивы 2003 года о вторичном использовании информации государственного сектора, сохраняется ряд проблем, связанных с национальными законами и практиками. Это приводит к фрагментации рынка внутренней информации и препятствует созданию международных информационных сервисов. Гармонизированный и взаимосвязанный рынок данных: По прежнему небольшим остается объем открытых данных, потребность в которых охватывала бы значительные географические зоны (с соответствующим количеством возможных потребителей информации). Согласующиеся наборы данных, на основе которых может быть создан конкретный сервис, присутствуют в одном регионе и отсутствуют в другом. Таким образом целевые рынки для приложений и сервисов набирают слишком малый объем для того чтобы набрать удовлетворяющее количество потребителей, способных приносить прибыль. Гармонизация данных, всеобщие стандарты, и взаимосвязанность данных вне зависимости от национальной принадлежности и языка являются жизненно важными факторами для создания привлекательного с экономической точки зрения http://www.official-documents.gov.uk/document/cm76/7650/7650.pdf. 6
  • 7. рынка.  Проверенные бизнес-модели: В целом для основанного на Web и мобильного видов бизнеса не существует какой-либо проверенной модели, по которой может быть создано успешное деловое предприятие. Кроме того, следует принимать во внимание, что данный сектор насыщен продуктами и сервисами, предоставляемыми бесплатно. Таким образом более сложные виды бизнеса должны быть построены на основе более продуманных концепций, таких как freemium-модель или open source (открытый источник), которые по-прежнему носят экспериментальный характер. Базовым средством, способным обеспечить автоматическое создание приложений, работающих на базе Связанных Открытых Данных (Linked Open Data), является концепция восприятия данных в качестве Data-as-a-Service (DaaS) для виртуализированного доступа к данным. Следуя принципу прочих XaaS (Everything as a Service) (Все как Сервис) концепций, в которых продукт или сервис предоставляется в самодостаточной форме, DaaS основывается на идее, состоящей в том, что данные могут быть предоставлены пользователю по его требованию вне зависимости от географической и организационной принадлежности провайдера и потребителя. С помощью верного DaaS решения компания может комбинировать (Связанные) Открытые Данные из различных источников с собственными данными и использовать полученные результаты для улучшения своей работы. На каких направлениях сосредоточены исследования и разработки  API: Стандартные API позволяют приложениям интегрировать данные в режиме реального времени при помощи новейших способов управления версиями и форматов открытых данных. Использование API наряду с жизненным циклом ОД означает возможность отслеживания использования данных, внедрения тарификации и обеспечения API ключами для управления смешанными видами бизнеса в качестве freemium-модели.  Облачные вычисления: Брокеры данных, располагающие большим количеством хранимых наборов данных, получают существенную выгоду с помощью облачных вычислений посредством использования инфраструктуры, которая может быть легко установлена и расширена по мере необходимости, в зависимости от потребности в объеме и пропускной способности. Подобная эффективная модель размещения приносит финансовую прибыль как брокеру, так и потребителю данных.  Linked Data, Big Data: Принцип Семантического Web находит отклик среди лидирующих Web-компаний. С помощью schema.org Google, Yahoo! и Bing обращаются к сценарию Семантического Web с целью получения большего количества данных, улучшенной функциональной совместимости и мощной рыночной силы, которую можно использовать в работе. В рамках работ по унификации моделей данных опубликованных европейских датасетов начаты разработка унифицированных базовых словарей для “выравнивания и согласования данных. В этих работах (февраль – ноябрь 2012 г. приняли участие 67 экспертов из 21 стран-участников, представляющих университеты, международные стандартизирующие 7
  • 8. организации и агентства Евросоюза. Источник: https://joinup.ec.europa.eu/sites/default/files/D1.1_20_UNCEFACT.pdf  Данные-как-Сервис (Data-as-a-Service): Активное международное финансирование НИОКР и инноваций обусловлено тем, что научная поддержка рассматривается как обязательная составляющая при преодолении барьеров по открытию государственных данных. Университеты Европы и Америки при помощи финансовых программ реализуют научно-исследовательские проекты по открытым данным, охватывающих широкий спектр исследований и приложений. С 2010г. финансирование НИОКР проектов осуществляется в рамках таких программ поддержки, как the Framework Programs for Research and Development, the Competitiveness and Innovation Program, а также ISA Program. Создание конкретных DaaS-приложений остается дорогостоящей и затратной по времени задачей. На данном пути можно обозначить три основных проблемы:    В отношении интеграции и управления данными разработчики сталкиваются с разнообразием новых форматов данных и языков запросов. Разработчики вынуждены бороться с отсутствием однородности между различными наборами данных. Решение данных проблем может потребовать создания различных новых систем баз данных и инструментов хранения, обработки и доступа к несходным данным. После завершения процесса интеграции, работающие на основе данных приложения требуют создания новых принципов взаимодействия данных, способных решить конкретные задачи и раскрыть возможности лежащих в основе форматов данных. Использование преимуществ Связанных Данных требует динамичного обнаружения доступных ресурсов данных, плавной интеграции Связанных Данных из различных источников, информации о происхождении, а также оценки качества информации. Здесь также должен соблюдаться принцип Data-as-a-Service. Это означает, что пользователи должны иметь возможность обнаруживать, интегрировать и использовать доступные разнотипные источники данных для конкретного случая и по первому требованию. Нельзя недооценивать важность наличия интерфейсов для конечных пользователей, реализующих принципы универсальной визуализации, изучения и взаимодействия Связанных Данных. С целью ускоренного создания приложений, основанных на Открытых Данных, разработчики должны обладать инструментами для визуализации и проведения анализа, позволяющие им динамично создавать многофункциональные пользовательские интерфейсы. В рамках реализации Open Data Strategy for Europe, ЕС намерен обеспечить разработчиков приложений полноценной самодостаточной платформой для ускоренного создания 8
  • 9. приложений и сервисов, работающих на основе Открытых Данных. Принцип самодостаточности в данном контексте означает, что разработчик приложения имеет возможность создавать и модифицировать приложения и сервисы по мере необходимости без необходимости ручного программирования. Создание сервисов и приложений происходит по простой и самодостаточной схеме:     Обнаружение источника данных: На первом этапе разработчик может обнаруживать и выявлять необходимые для работы приложения источники данных. На основе данных, поставляемых курирующими сервисами (curation services), которые обеспечивают наличие очищенных наборов данных, включая описание источников данных (метаданных), полученных благодаря множеству инициатив по Открытым Данным, доступные наборы данных могут быть изучены, рассортированы и отфильтрованы соответственно их метаданным, таким как область применения, расположение, создатель, время создания, доступные меры по обеспечению качества и многое другое. Данный процесс приводится в исполнение при помощи расширяемого набора инструментов для визуального изучения, просмотра, поиска и анализа доступных источников данных. Интеграция и использование данных: С момента выбора разработчиком набора данных (или множественных наборов данных), он может быть интегрирован и использован в приложении простым нажатием кнопки. Контролируемые словари, таксономии или списки кодов будут предоставляться для обеспечения надежной основы для семантического связывания соответствующих данных на базе программы ЕС ISA. Пользовательский интерфейс для ускоренного создания приложения: Работая поверх интегрированного корпуса данных, платформа обеспечивает наличие исключительного многофункционального пользовательского интерфейса, обеспечивающего различные виды взаимодействия с данными, включая визуализацию данных, графический браузер данных, основанное на wiki- и шаблонах редактирование и аннотирование, а также визуальное изучение и поиск. Он может быть с легкостью модифицирован с помощью использования богатого выбора встроенных виджетов, которые могут быть установлены полностью декларативным способом, с использованием либо простого, основанного на wiki- синтаксиса либо форм конфигурации. Подобным образом даже обычные пользователи могут создавать продвинутые пользовательские интерфейсы, обеспечивающие такие виды взаимодействия как пользовательская визуализация (например, включающая в себя отчеты и таблицы), совместное использование знания и интерфейсы ввода данных, мэшапы с внешними источниками или поддержка особой модальности данных (например, временные, пространственные, социальные сетевые данные и т.п.). Расширение платформы с помощью SDK: Тогда как первые три шага могут быть выполнены без помощи программирования, дальнейшее расширение платформы возможно при условии использования собственных компонентов: применение встроенных API, а также простых в использовании SDK позволяет с легкостью писать собственные, предназначенные для конкретных сценариев виджеты и динамичные поставщики данных. Софинансирование НИОКР и инноваций Комиссия поддержала создание открытых данных при помощи ряда финансовых программ, в 9
  • 10. частности, таких как the Framework Programmes for Research and Development, the Competitiveness and Innovation Programme, а также the ISA programme. Данные проекты охватывают широкий спектр исследований, приложений и типов организаций. Проект Linked Open Data (LOD22), который стартовал в сентябре 2010 года, рассчитан на 4 года. Он направлен на использование Web в качестве платформы для интеграции информации и данных, а также на использование семантических технологий с целью повышения пригодности использования государственных данных. Проект OpenAIRE3, начавшийся в декабре 2009 года, партнерами которого являются представители 25 стран ЕС и нескольких ассоциированных стран, ставит своей задачей создание совместной инфраструктуры для пилотного проекта ЕС по раскрытию доступа к исследовательским данным (EC Pilot for Open Access to Research Information). Акция ISA по обеспечению семантического взаимодействия (SEMIC.EU4) направлена на поддержку идеи создания Открытых Государственных Метаданных, как первого шага в направлении выравнивания метаданных как на национальном, так и общеевропейском уровнях. Некоторые примеры программ НИОКР Объем финансирования, млн. евро 200 150 100 164,1 50 34 0 ISA FP7 10 Open Data Innovation 1,06 Open Governmental Datasets 11 Open Government Initiative at NASA Меры обеспечения финансирования и поддержки: стимулирование НИОКР и инноваций в области открытых данных Комиссия также намерена проводить стимулирующую деятельность, направленную на расширение открытого доступа к государственной информации, посредством различных финансовых программ. Она будет использовать различные средства стимулирования рынка, тестирования и поощрения создания инновационных решений, а также обеспечения максимально возможного использования открытых данных. Поддержка НИОКР и инноваций Комиссия намерена оказывать поддержку в проведении НИОКР в области технологий 2 http://lod2.eu/. http://www.openaire.eu/. 4 http://www.semic.eu/ 3 10
  • 11. обращения с данными, таких как добыча данных, их анализ и визуализация. В период с 2011 по 2013 годы Комиссия планирует потратить на эти цели порядка 100 миллионов евро. Информационный менеджмент также является одним из ключевых направлений ИКТ в программе Horizon 2020, которая представляет собой поддержку ЕС в области исследований и инноваций на период с 2014 по 2020 годы. Комиссия будет поддерживать технические инновации и их внедрение с помощью пилотных акций, тестовых и демонстрационных инновационных приложений, таких как геоинформационные системы, сервисы, основанные на использовании информации о месторасположении (GIS), а также приложений содержательного характера в области образования, культуры или моды. Данная поддержка будет осуществляться в рамках программ CIP-ICT PSP в 2012-13гг. и далее - в рамках Horizon 2020. В дополнение к этому, Комиссия будет помогать в организации конкурсов открытых данных, предназначенных ускорить создание новых информационных сервисов, а также берет на себя инициативу в действиях, направленных на улучшение доступа к капиталу для предпринимателей, разрабатывающих новые информационные сервисы на основе данных государственного сектора. Поддержка информационных инфраструктур - порталы данных для Европы С целью облегчить создание информационных продуктов и сервисов, использующих данные различных стран ЕС, Комиссия намерена работать над созданием двух взаимосвязанных общеевропейских порталов данных. В 2012 году начнет свою работу портал, позволяющий получать и использовать ресурсы данных Еврокомиссии и прочих европейских организаций и ведомств. Параллельно с этим, будут выявлены и анонсированы определения метаданных с высоким потенциалом повторного использования. Стандартные условия использования поставят своей задачей максимально возможное потребление европейских данных в инновационных информационных сервисах соответственно Решению Комиссии о повторном использовании информации Комиссии. Комиссия также будет работать совместно с странами - членами ЕС, органами государственного сектора и региональными организациями над созданием пан-европейского портала данных, который начнет свою работу в 2013 году, и с помощью которого будет открыт доступ к широкому спектру наборов данных по всему ЕС (включая данные, доступные на портале Комиссии). В тех случаях. когда это возможно, работа будет основываться на существующих структурах и разработках, и далее портал будет постепенно расширяться с тем, чтобы охватить все ключевые наборы данных со всех стран ЕС. Поддержка будет обеспечиваться в начальном периоде в рамках программы CIP (2011-2013). В период с 2014 по 2020 годы, финансирование инфраструктуры европейского электронного сервиса государственных данных будет осуществляться фондом Connecting Europe Facility5. Комиссия также будет продолжать оказывать поддержку программам оцифровки материалов, а также развитию платформы Europeana, обращающейся к важным аспектам повторного использования данных. 5 См. Предложения Комиссии для CEF, COM(2011)665, COM(2011)657/3. 11
  • 12. Поддержка инфраструктур исследовательских данных Комиссия оказывает поддержку в рамках FP7, а также предполагает продолжать аналогичную деятельность в рамках программы Horizon 2020, направленную на создание надежной и устойчивой сервисной инфраструктуры для научных данных в Европе, отвечающей потребностям требующей переработки большого количества данных научноисследовательской деятельности по программе 2020, руководствующейся рекомендациями отчета ‘Riding the Wave’. Она обеспечит доступ и взаимодействие с множеством информации, начиная от "сырых" основанных на наблюдениях и экспериментальных данных и заканчивая публикациями во всех научных областях. Данная инфраструктура включает в себя технические, организационные и нормативные аспекты, требующие интенсивного согласования с странами-членами ЕС, а также третьими странами и международными организациями с целью обеспечения глобальной функциональной совместимости и взаимовыгодного доступа. Комиссия намерена работать совместно с международными партнерами с целью создания стандартов для обеспечения глобального доступа к данным и их совместимости. Выводы Страны-лидеры и международные институты в направлении открытия данных находятся на 3-м этапе развития своих проектов, - формировании датасетов связанных данных. Страны-лидеры сформировали R&D программы в качестве обязательного направления реализации государственной политики открытия данных. Реализуемые R&D программы носят международный характер:    Ирландия (NUI Galway’s Digital Enterprise Research Institute (DERI) – более 100 сотрудников) ведет разработки для стандартов и платформ для правительства США и Евросоюза. Эксперты и ученые W3C, Open Knowledge Foundation и др. участвуют практически во всех R&D проектах и программах, привнося в них накопленные опыт и компетенции. В рамках R&D разрабатываются не только новые стандарты представления и публикации данных, и программные платформы, но и разрабатываются перспективные бизнес-сценарии использования государственных данных. Выявляются также наиболее перспективные отрасли и направления, для которых концентрируются финансовые ресурсы для публикации данных. 12
  • 13. Приложение №1 к Отчету «Анализ международных практик поддержки R&D по направлению Открытых Данных» № Название проекта 1 ISA Краткое описание проекта. Основные направления исследований ISA - это программа поддержки, в рамках которой осуществляется финансирование мероприятий Европейской Комиссии. В рабочем плане «Электронное правительство (eGovernment)» очерчены области, требующие совместных действий государств-членов, намечены цели и заданы временные рамки для достижения этих целей. В принятых в Малмо и Гранаде министерских декларациях государства-члены подтвердили свою приверженность целям рабочего плана. Государства-члены обязались самостоятельно реализовывать пункты рабочего плана «Электронного правительства» в своих странах. Комиссия осуществляет надзор за ходом выполнения плана и предоставляет государствам-членам специальные знания вместе с эталонными данными, так чтобы они могли оценить свои собственные достижения, а также сравнить их с результатами других государств-членов. Сроки выполнения проекта Наименование исследовательской организации 2010-2015 ISA (Interoperability Solutions for European Public Administrations - «Решения по взаимодействию для европейских органов государственного управления») Заказчик или рамочная программа Объем финансирования 164,1 млн. EUR Ссылки в Интернет http://ec.europa.eu/isa/policy/policy1_en.htm http://ec.europa.eu/isa/index_en.htm Официальные документы: http://ec.europa.eu/isa/library/index_en.htm ISA поддерживает реализацию следующих программ:  Европейская стратегия взаимодействия (EIS).  Программа построения европейского «цифрового общества» (Digital Agenda), одна из флагманских инициатив стратегии «EURпа-2020».  Рабочий план «Электронное правительство» на 20112015 гг. ISA дополняет:  Программу поддержки политики по развитию информационных и коммуникационных технологий (ICT Policy Support Programme) в рамках Программы повышения конкурентоспособности за счет инноваций 13
  • 14. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет (CIP), доводя проверенные решения до стадии эксплуатационной готовности. 2 LOD2 Получение знаний из взаимосвязанных данных:  НИОКР в области оригинальных новаторских технологий Web`а Семантических Данных.  Расширение и интеграция находящихся в открытом доступе взаимосвязанных данных Всемирной Паутины.  Принятие и внедрение Связанных Данных для СМИ, предприятий и правительств. Проект LOD2 позволит осуществить интеграцию связанных данных с существующими крупномасштабными приложениями и продемонстрировать преимущества такого подхода на примере трех прикладных сценариев. Полученные в результате инструментальные средства, методы и наборы данных имеют потенциал изменить тот Web, который мы знаем сегодня. 01.09.2010 – 31.08.2014 Координатор: Universitaet Leipzig ГЕРМАНИЯ Участники: National University of Ireland, Galway Седьмая Рамочная Программа (FP7) Суммарная стоимость: 9 928 343 EUR Сайт проекта: Доля ЕС: 7 249 999 EUR О проекте в системе CORDIS: http://lod2.eu/Welcome.html http://cordis.europa.eu/projects/rcn/95562_en.ht ml ИРЛАНДИЯ Zemanta Pametne Spletne Storitve Insvetovanje d.o.o. СЛОВЕНИЯ Openlink Group Limited СОЕДИНЕННОЕ КОРОЛЕВСТВО Exalead ФРАНЦИЯ Korea Advanced Institute of Science and Technology РЕСПУБЛИКА КОРЕЯ TenForce BVBA* БЕЛЬГИЯ Universitaet Mannheim ГЕРМАНИЯ 14
  • 15. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет Semantic Web Company GmbH АВСТРИЯ Open Knowledge Foundation Limited LBG СОЕДИНЕННОЕ КОРОЛЕВСТВО Stichting Centrum Voor Wiskunde en Informatica НИДЕРЛАНДЫ Institut Mihajlo Pupin СЕРБИЯ Instytut Informatyki Gospodarczej sp z.o.o. ПОЛЬША Wolters Kluwer Deutschland GmbH ГЕРМАНИЯ Vysoka Skola Ekonomicka v Praze ЧЕШСКАЯ РЕСПУБЛИКА 3 LATC Программа круглосуточной поддержки Связанных Открытых Данных (LOD Around-The-Clock (LATC) Support Action) направлена на оказание содействия организациям и отдельным лицам в публикации и использовании качественных Связанных Данных во Всемирной Сети. Достижения в сферах крупномасштабной обработки данных, 01.09.2010 31.08.2012 Координатор: National University of Ireland, Galway ИРЛАНДИЯ Участники: Седьмая Рамочная Программа (FP7) Суммарная стоимость: 1 188 784 EUR Сайт проекта: Доля ЕС: 1 059 999 EUR О проекте в системе CORDIS: http://latc-project.eu/ http://cordis.europa.eu/projects/index.cfm?fusea 15
  • 16. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта интеграции данных и качественной оценки информации все в большей степени зависят от наличия больших объемов отображающих действительность данных. Наименование исследовательской организации Ссылки в Интернет ction=app.details&TXT=Linked+Data&FRM=1& STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&L NG=en&REF=95552 ГЕРМАНИЯ Vereniging Voor Christelijk Hoger Onderwijs WetenschappeLijk Onderzoek en Patientenzorg Глобальное пространство данных позволяет осуществлять разработку приложений, использующих преимущества универсальных идентификаторов ресурсов URI и унифицированной модели данных (RDF) на основе масштабируемого протокола доступа к данным (HTTP). Внедрение инновационной концепции Открытых Данных Объем финансирования Freie Universitaet Berlin Формирующийся Web Связанных Данных представляет собой крупнейший источник относящихся ко многим предметным областям, отображающих действительный мир и поступающих в реальном времени данных, которые существуют в данный момент, содержат миллиарды утверждений и охватывают разнообразные сферы деятельности: медийные компании типа Би-Би-Си и Рейтер, фармацевтические компании типа Eli Lilly и Johnson & Johnson, а также правительственные органы США и Великобритании публикуют Связанные Данные в Web. 4 Заказчик или рамочная программа Talis Information Limited Стартапы и небольшие компании, стремящиеся создавать продукты и услуги на основе открытых данных, получают возможность претендовать на новый вид так называемых «Инновационных ваучеров». Ваучеры номиналом 5 тысяч фунтов стерлингов готовятся к выпуску Британским Государственным управлением по стратегиям технического развития (TSB). Имеются ваучеры, выдаваемые за предпринимательские идеи в таких сферах деятельности, как агро-пищевая промышленность, энергетика, водно-канализационное хозяйство, освоение космоса. В последующие два года новаторы и изобретатели, работающие в области Открытых Данных, смогут подавать заявки на получение ваучеров стоимостью 1,1 млн ф. ст. Они будут распределяться каждые три месяца, с поквартальным количеством 25 штук, и НИДЕРЛАНДЫ Institut fur Angewandte Informatik ev ГЕРМАНИЯ СОЕДИНЕННОЕ КОРОЛЕВСТВО 5 лет ODI (Open Data Institute, Институт открытых данных) 1,1 млн. ф. ст. на этот проект, и в целом: http://www.theodi.org/ В течение пяти лет ODI получил 10 миллионов ф. ст. от правительства Соединенного Королевства (через Агентство по инновациям Соединенного 16
  • 17. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа присуждаться следующим категориям претендентов:     5 LDBC (Linked Data Benchmark Council, Совет по эталонному тестированию решений на основе Связанных Данных) Эта новая парадигма администрирования данных также приводит к тому, что результаты научных исследований оказывают сильное воздействие на молодые новаторские компании, работающие над Ссылки в Интернет Королевства и Британское Государственное управление по стратегиям технического развития), плюс 750 000 долл. США от благотворительн ой инвестиционной фирмы Omidyar Network, а в настоящее время работает над обеспечением долговременного устойчивого развития за счет сбалансированности фондов и получения прямых доходов. Компании малого бизнеса, создающие услуги и решения с использованием Открытых Данных. Новые компании, стремящиеся воплотить идею в рабочий прототип. Специализированные консалтинговые компании, работающие над проблемой интегрирования открытых данных с другими информационными источниками с целью разработки продуктов и опытных образцов. Консультанты по вопросам интеллектуальной собственности компаний, идеи которых предполагают использование открытых данных. Не реляционное администрирование данных приобретает характер и значение жизненной потребности для ориентированной на использование данных экономики, основываясь на больших, распределенных, гетерогенных и сложно-структурированных наборах данных. Объем финансирования 30.09.2012 30.03.2015 Координатор: Universitat Politecnica de Catalunya ИСПАНИЯ Участники: The Semantic Technology Седьмая Рамочная Программа (FP7) Суммарная стоимость: 3 462 512 EUR Доля ЕС: 2 660 000 EUR Проект только запущен, сайт официально еще не открыт. В системе CORDIS: http://cordis.europa.eu/projects/index.cfm?fusea ction=app.details&TXT=Linked+Data&FRM=1& STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&L NG=en&REF=105871 17
  • 18. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации новыми технологиями RDF и управления графическими данными, вследствие чего они начинают играть существенную роль в упомянутой выше «экономике данных». Объем финансирования Ссылки в Интернет Institute (STI), Innsbruck Стандарты и эталонное тестирование (бенчмаркинг) являются двумя наиболее важными факторами для разработки новой информационной технологии, хотя еще не созданы всесторонний пакет эталонных тестов и соответствующие практические методики для RDF- и графических баз данных, не говоря уж об отсутствии компетентного органа, устанавливающего эталонные параметры тестирования и процедуру аудирования официальных результатов. Без них дальнейшие разработки и восприятие таких технологий ставятся под сомнение, поскольку промышленность не получает ясных, ориентированных на потребителя ориентиров производительности и функциональности. Заказчик или рамочная программа НИДЕРЛАНДЫ Цель проекта LDBC заключается в создании первого всестороннего пакета открытых, справедливых и нейтральных по отношению к поставщикам эталонных тестов для RDF/графических баз данных, одновременно с учреждением LDBC как организации для получения, аудирования и публикации результатов. Таким образом, лежащей в основе LDBC научной инновацией является создание содержательных эталонных тестов, полученных путем комбинирования фактических сценариев использования с глубоким пониманием технических аспектов узких мест современной технологии, которым обладают исследователи и архитекторы передовых систем баз данных. АВСТРИЯ Stichting VU-VUmc Network Engine for Objects in Lund AB ШВЕЦИЯ Tecnische Universitaet Muenchen ГЕРМАНИЯ Openlink Group Limited СОЕДИНЕННОЕ КОРОЛЕВСТВО Foundation for Research and Technology - Hellas ГРЕЦИЯ Ontotext AD БОЛГАРИЯ LDBC объединит обширное сообщество ученых-исследователей и поставщиков RDF/графических баз данных для учреждения независимого органа, фонда LDBC, ответственного за разработку спецификаций и процедур эталонного тестирования, а также за проверку и обнародование результатов. Создаваемый форум станет долгоживущей, поддерживаемой промышленностью ассоциацией, 18
  • 19. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет аналогичной TCP (Комитету по вопросам обработки транзакций и её эффективности) Поставщики и пользовательские организации также примут участие в этой деятельности, чтобы иметь возможность влиять на разработку эталонных текстов и пользоваться очевидными маркетинговыми возможностями. 6 EUCLID («ЭВКЛИД») Программа обучения применению Связанных Данных Связанные Данные зарекомендовали себя, как эффективное средство де факто для публикации структурированных данных в Web, вследствие чего наблюдается поразительный рост количества организаций, включивших в свою практику применение основных принципов этой концепции для представления и связывания наборов данных с целью беспрепятственного осуществления обмена, интеграции и повторного использования данных. Все больше и больше коммерческих предприятий, работающих в сфере информационно-коммуникационных технологий, предлагают новаторские услуги по администрированию данных, построенные на базе Связанных (Открытых) Данных, тем самым формируя повышенный спрос на специалистов-практиков, обладающих квалификацией и профессиональными знаниями в этой области. Наличие и доступность таких специальных знаний станут решающим фактором, если европейские компании захотят во всей полноте воспользоваться преимуществами этих перспективных технологий администрирования данных, а также научно-техническим опытом, накопленным за последние годы исследователями, техническими энтузиастами и ранними последователями нововведений в различных государствах-членах ЕС. 01.05.2012 30.04.2014 Координатор STI International Consulting und Research GmbH АВСТРИЯ Участники: Седьмая Рамочная Программа (FP7) Суммарная стоимость: 742 428 EUR Доля ЕС: 661 998 EUR http://www.euclid-project.eu/ http://cordis.europa.eu/projects/index.cfm?fusea ction=app.details&TXT=Linked+Data&FRM=1& STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&L NG=en&REF=103709 The Open University СОЕДИНЕННОЕ КОРОЛЕВСТВО Ontotext AD БОЛГАРИЯ Karlsruher Institut fuer Technologie ГЕРМАНИЯ Проект EUCLID поможет продвинуться к этой цели за счет предоставления всесторонней программы обучения, поддерживаемой комбинированными учебными материалами и каналами электронного обучения, подогнанными под фактические потребности специалистов-практиков в области обработки данных. Основанная на опыте консорциума, аккумулированном в более чем 19
  • 20. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет 20 проектах по Связанным Данным с участием свыше 40 компаний и государственных учреждений в более чем 10 странах, дополненная обратной связью от более 20 учебных мероприятий и углубленным анализом обсуждений, ведущихся через почтовую рассылку, дискуссионные форумы, Твиттер и блогосферу, рассматриваемая программа обучения будет сфокусирована на методиках и программном обеспечении для интеграции, поиска и визуализации Связанных Данных, которые, по заявлениям практиков, представляют собой наиболее проблемные области. Учебная программа будет реализована в виде интерактивных учебных материалов, размещенных на Web-сайте сообщества, и будет оцениваться, уточняться и расширяться посредством проведения серии вебинаров, индивидуального обучения, непрерывной обратной связи с членами сообщества и их непосредственного участия, координируемых назначенным руководителем сообщества. Значительная доля материалов будет состоять из примеров, относящихся к реальным сценариям применения наборов данных и приложений, фрагментов программного кода, демонстрационных образцов, прогоняемых разработчиками на своих машинах, а также описаний передового опыта и практических руководств. Окончательный вариант программы обучения будет распространяться через iTunes U в виде серии электронных книг, дополненной материалами с Web-сайта сообщества. Предоставляя все эти компоненты по передаче важнейших знаний, EUCLID не только способствует восприятию промышленностью передового опыта работы со Связанными Данными и соответствующих технологий, но - что, возможно, даже важнее будет стимулировать их дальнейшее совершенствование и объединение наряду с поддержкой устойчивого функционирования сообщества - то есть, обеспечивать реализацию всех существенных аспектов, если принять в расчет новизну данной области и высокую скорость ее развития за последнее время. 20
  • 21. № 7 Название проекта COMDATA Инфраструктуры для администрирования данных, ориентированного на конкретные сообщества Краткое описание проекта. Основные направления исследований Объемы структурированных данных, создаваемых, передаваемых и архивируемых во Всемирной Паутине, постоянно растут. Одним из важнейших движений в этом контексте, движением по внедрению Связанных Данных, пропагандируется ускоренная онлайновая публикация больших объемов структурированных данных при соблюдении следующих трех базовых принципов:    Сроки выполнения проекта 01.09.2011 31.08.2014 Наименование исследовательской организации Universite de Fribourg ШВЕЙЦАРИЯ Заказчик или рамочная программа Седьмая Рамочная Программа (FP7) Объем финансирования Суммарная стоимость: 75 000 EUR Доля ЕС: 75 000 EUR Ссылки в Интернет http://www.unifr.ch/home/welcomeE.php http://cordis.europa.eu/projects/index.cfm?fusea ction=app.details&TXT=Linked+Data&FRM=1& STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&L NG=en&REF=100008 присвоение унифицированного идентификатора ресурсов (URI) каждому опубликованному ресурсу; публикация структурированных данных в соответствии с URI, относящемуся к данному ресурсу; и включение для каждого ресурса ссылок на аналогичные онлайновые ресурсы. Публикация Связанных Данных в различных формах представления в настоящее время процветает в Web, чему немало способствуют правительственные органы, социальные сети и научные работники из различных отраслей знаний. Несвязанные между собой сообщества пользователей в постоянно возрастающей степени проявляют интерес к поиску в Связанных Данных, манипулированию ими и возможности произвольно объединять такие данные, что необходимо им для создания новых приложений. К сожалению, имеющиеся сегодня в их распоряжении инфраструктуры данных предоставляют лишь весьма ограниченную и довольно неэффективную поддержку их потребностей. Настоящее предложение сконцентрировано на проектировании новых распределенных инфраструктур администрирования данных с целью обеспечения возможности распределенного, основанного на потребностях конкретного сообщества, манипулирования такими разнородными и взаимосвязанными данными в целом. Затронуты две связанные между собой исследовательские проблемы. 21
  • 22. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет Первая проблема касается проектирования и внедрения эффективной платформы с хранилищем для представления, опроса и распределения очень больших объемов Связанных Данных. Вторая проблема заключается в разработке новых механизмов абстрагирования для интеграции наборов Связанных Данных апостериори, после того, как они уже были опубликованы. Остальная часть настоящего документа посвящена формулировке основных исследовательских задач, подлежащих рассмотрению в данном контексте, и обзору программы исследований по реализации рассматриваемой здесь концепции. В нем воспроизводится структура Рабочей программы для описания Предложения по реинтеграционным грантам для обеспечения профессионального роста. 8 LINKEDUP LinkedUp: Связывание Web-данных для Образовательного проекта. Открытый конкурс по интеграции данных в масштабе Web Проект LinkedUp нацелен на стимулирование применения больших объемов имеющихся в Web общедоступных открытых данных, особенно образовательными учреждениями и организациями. Это будет достигнуто путем выявления и поддержки в высшей степени новаторских приложений по крупномасштабному управлению информацией в Web через открытую конкуренцию (LinkedUp Challenge) и специализированные оценочные схемы. Концепция LinkedUp Challenge заключается в реализации имеющей глобальное значение индивидуализированной модели обучения университетского уровня на основе открытых Web-данных и информации. Учитывая разнообразие имеющей отношение к образовательному процессу информации в Web, в диапазоне от метаданных Открытых Образовательных Ресурсов до обширных запасов знаний, получаемых через Связанные Данные (в одной только облачной среде Связанных Открытых Данных насчитывается 31 миллиард RDF-утверждений), следует признать, что достижение указанной цели, а именно, оказание индивидуализированных и 01.11.2012 31.10.2014 Координатор: Gottfried Wilhelm Leibniz Universitaet Hannover ГЕРМАНИЯ Участники: Седьмая Рамочная Программа (FP7) Суммарная стоимость: 1 170 554 EUR Доля ЕС: 1 058 497 EUR http://cordis.europa.eu/projects/index.cfm?fusea ction=app.details&TXT=Linked+Data&FRM=1& STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&L NG=en&REF=105621 The Open University СОЕДИНЕННОЕ КОРОЛЕВСТВО Exact Learning Solutions S.p.A. ИТАЛИЯ Open Knowledge Foundation Ltd. LBG 22
  • 23. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации доступных услуг обучения, требует преодоления значительных трудностей, связанных с администрированием информации и данных масштаба Web, в том числе Больших Данных, к которым можно отнести проблемы масштабируемости, функциональной совместимости, многоязычности и неоднородности. Объем финансирования Ссылки в Интернет СОЕДИНЕННОЕ КОРОЛЕВСТВО Таким образом, проект LinkedUp Challenge дает целевой сценарий по формулированию проблемных требований, оценочных критериев и пороговых значений, которые отражены в базовой оценочной структуре LinkedUp. В решениях по управлению информацией должны использоваться данные и учебно-аналитические методы, способствующие выработке исключительно индивидуализированных и контекстно-зависимых представлений гетерогенных Web-данных. Заказчик или рамочная программа Elsevier B.V. Open Universiteit Nederland НИДЕРЛАНДЫ НИДЕРЛАНДЫ Основываясь на прочном союзе организаций с компетенцией в таких областях, как администрирование открытых Web-данных, интеграция данных и обучение с использованием Web-ресурсов, проектом LinkedUp предусмотрено получение следующих основных результатов: базовая структура общего назначения для оценки приложений, использующих Web-данные, образовательные наборы данных с гарантированным высоким качеством, новаторские методы реализации крупномасштабного управления Web-информацией, формирование и объединение сообществ государственного и частного секторов, полноценная передача инновационных технологий по управлению информацией в Web. 9 Наборы Открытых Правительственных Данных Одной из главных сфер интересов в LiDRC (Научноисследовательском центре связанных данных) являются связанные правительственные данные. В этом сообщении научный сотрудник DERI (Исследовательского центра по цифровым технологиям для предприятий) Евангелос Калампокис (Evangelos Kalampokis) дает обзор последних работ в указанной сфере, проводившихся в различных странах. LiDRC (Научноисследовательский центр связанных данных) при DERI (Исследовательском центре по цифровым технологиям для предприятий) http://linkeddata.deri.ie/ http://linkeddata.deri.ie/node/72 Государственный сектор экономики собирает, производит, 23
  • 24. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет воспроизводит и распространяет большие объемы информации из многих областей деятельности, таких, как социальная, экономическая, географическая, коммерческая и образовательная. Общепризнано, что такая информация служит основным сырьем для цифровых продуктов и услуг, которые способствуют экономическому росту. Главная проблема, затрудняющая повторное использование этой информации, заключается в том, она содержится в изоляции посредством использования различных форматов и систем защиты интеллектуальной собственности. С недавних пор не только практики, но и правительства по всему миру осознали важность публикации правительственных данных в соответствии с открытыми стандартами и начали движение в этом направлении. Более того, в июне 2009 г. Тим Бернерс-Ли призвал правительства не только публиковать свои данные в Web, используя открытые стандарты, но также обратить особое внимание на публикацию связанных правительственных данных. Последний подход позволит комбинировать данные из различных источников стандартизированным способом, что даст возможность разрабатывать услуги и приложения, предоставляющие обществу дополнительные преимущества. Поэтому в течение последних двух лет специалисты-практики и правительства во всем мире вели работы, преследуя две цели:   Создание каталогов правительственных данных, содержащих пригодные для скачивания файлы в таких общепринятых форматах, как XML, CSV и RDF. Создание приложений, представляющих правительственные данные в виде связанных данных с помощью API Web-служб RESTful, поисковых интерфейсов типа SPARQL и др. Здесь мы описываем наиболее значительные инициативы 24
  • 25. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет различных стран в этих направлениях, то есть, разработка каталогов правительственных данных и приложений для работы со связанными правительственными данными. Каталоги открытых правительственных данных. Хотя могут иметься различные источники правительственных данных, разбросанные по всему Web (например, Web-сайты различных государственных служб), здесь мы представляем инициативные проекты, нацеленные на сбор и организацию в конкретном месте Всемирной Паутины некоторого количества наборов данных, имеющих отношение к органам государственного управления. В рассматриваемых каталогах используются различные форматы данных. Эти форматы можно разбить на три группы: форматы исходных данных (напр., XML, CSV, TXT, XLS), форматы геокосмических (геопространственных) данных (напр., SHP, KML), и формат RDF. Направления исследований Наборы Открытых Правительственных Данных 10 Инициативный проект Открытого Правительства в NASA NASA является сторонником идеи Открытого Правительства. Основываясь на заложившем в 1958 г. основу этой организации законодательном акте, обязывающем NASA «... обеспечивать максимально широкое и практически осуществимое распространение информации касательно ее деятельности и результатов оной», Агентство продолжает прилагать усилия для повышения степени открытости внутри него. Тот же законодательный акт обязывает NASA «... создавать условия для привлечения научного сообщества...» как часть его миссии. Руководители Агентства считают это требование своей перманентной задачей по организации сотрудничества в таких формах, которые трудно было даже предугадать на момент основания Агентства. План дальнейшей NASA http://www.nasa.gov/open/ http://open.nasa.gov/plan/progress/ http://www.nasa.gov/open/plan/ongoingoverview.html 25
  • 26. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет Белый дом (USA.gov) Точных цифр на сайте нет. http://data-gov.tw.rpi.edu/wiki деятельности NASA в этом направлении отражает достигнутые успехи и уроки, полученные в результате воплощения в жизнь принципов Открытого Правительства, которые составляют неотъемлемую часть деятельности и корпоративной культуры NASA на протяжении вот уже более полувека. 11 Связывание Открытых Правительственных Данных Проект «Связывание Открытых Правительственных Данных (СОПД)» посвящен исследованию способов открытия и связывания правительственных данных с помощью Семантических Webтехнологий. Относящиеся к деятельности правительства наборы данных преобразуются в RDF и связываются с Web`ом Данных, после чего готовятся демоверсии и обучающие руководства по объединению связанных правительственных данных из различных источников и их применению. 2009 — настоящее время Rensselaer Polytechnic Institute (RPI) Финансовая поддержка: DARPA, Microsoft Research, Fujitsu, Lockheed Martin http://logd.tw.rpi.edu/ Портал исследовательской группы TWC «Связывание Открытых Правительственных Данных (СОПД)» (TWC Linking Open Government Data, LOGD) содержит коллекцию наборов RDF-данных, сконвертированных из данных Правительства США и других аналогичных по характеру источников, доступных в Web. Ниже приведена актуальная статистическая информация о наборах данных, доступных через портал СОПД. По состоянию на 28.08.2011 г. 20:15: Сгенерировано 9 946 868 757 RDF-триплетов. Сконвертировано 5 165 таблиц для получения 2 018 версий 1 880 наборов данных от 117 исходных организаций, доступных в виде 1 887 наборов дословных RDF-данных. В 1 651 расширенных наборах данных используются 472 свойств объектов и 221 класс. Во всех наборах данных суммарно использовано 303 260 предикатов. 26
  • 27. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет Образцы различных версий 546 наборов данных доступны через точку доступа LOGD SPARQL и пригодны для поиска по запросам, примеры которого можно найти в разделе «How to find datasets using the LOGD sparql endpoint («Как находить наборы данных с помощью точки доступа LOGD sparql»). Направления исследований Семантический Web, RDF, SPARQL, LOD. 12 13 OpenLab PlanetData OpenLab, действующий в настоящее время проект Седьмой Рамочной Программы европейского Сообщества по научным исследованиям, техническим разработкам и демонстрационным мероприятиям в целях создания общеевропейской области исследований и инноваций (2007 - 2013) требует участия новых партнеров для решения определенных задач по этому проекту. В частности, такие задачи касаются проведения новаторских экспериментов, демонстрирующих технический уровень, научную новизну и качественный уровень в области Интернета будущего. Проект PlanetData нацелен на формирование жизнеспособного EURпейского сообщества ученых-исследователей, поддерживающего деятельность организаций по представлению их данных новыми и практичными способами. Способность эффективно и рационально извлекать смысл из огромных объемов данных, непрерывно публикуемых в глобальной сети, включая потоковые данные, сообщения в (микро)блогах, цифровые архивы, ресурсы научной информации с большим объемом вычислений (eScience), наборы данных государственного сектора и Облачную среду Связанных Открытых Данных является критически важным элементом процесса перехода Европы к обществу знаний. Она позволяет коммерческим структурам, правительствам, сообществам и индивидуумам принимать обоснованные решения, получая конкурентные преимущества и повышая свое благосостояние в Начало: Université Pierre et Marie 01 сент. 2011 г. Curie Продолжительность: 30 месяцев 01.10.2010 30.09.2014 Продолжительность: 48 месяцев The Semantic Technology Institute (STI) Innsbruck Седьмая Рамочная Программа (FP7) Совокупный бюджет: 7,35 млн. EUR Седьмая Рамочная Программа (FP7) Суммарная стоимость: 3,72 млн. EUR http://www.ict-openlab.eu/home.html Доля ЕС: 5 млн. EUR http://www.planet-data.eu/ Доля ЕС: 3,02 млн. EUR 27
  • 28. № Название проекта Краткое описание проекта. Основные направления исследований Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет общем. Проект PlanetData базируется на трех целевых установках, которые в совокупности ведут к формированию долговременного сообщества, состоящего из научных и промышленных партнеров. Это сообщество получает поддержку при проведении исследований методов крупномасштабного администрирования данных путем предоставления ему наборов данных и доступа к специализированной технологии администрирования данных. Сообщество также пользуется преимуществами комплексной программы обучения, распространения знаний, стандартизации и налаживания деловых связей, направленной на усиление существующих и установление новых партнерских отношений, обучение организаций ключевым вопросам работы с открытыми данными и передачи результатов исследований в промышленность. Цели проекта PlanetData: Исследования: Объединение подходов к крупномасштабному администрированию данных из различных дисциплин с целью создания целостных решений проблем, с которыми приходится сталкиваться при работе с данными на мировом уровне. Предоставление и администрирование данных: Разработка силами лаборатории PlanetData Lab программного обеспечения для работы с большими объемами данных, поддерживающего реляционные, графические и потоковые модели обработки данных, которое позволит исследователем тестировать и подтверждать правильность своих методик. Возможные направления исследований:  Создание определительных словарей для описания 28
  • 29. № Название проекта Краткое описание проекта. Основные направления исследований   Сроки выполнения проекта Наименование исследовательской организации Заказчик или рамочная программа Объем финансирования Ссылки в Интернет наборов данных и их контекстного окружения. Построение каталога наборов данных с вертикальной структурой областей определения, выбранных за их высокий внедренческий потенциал и соответствие потребностям в средствах администрирования данных. Обнародование методических указаний и передового опыта по предоставлению данных, чтобы стимулировать использование имеющихся наборов данных конечными пользователями, а также в целях повышения эффективности их интеграции в новые виды продуктов и услуг. Воздействие: Создание средства, с помощью которого результаты научных исследований и экспериментов, полученные в сети PlanetData, можно было бы использовать:    для повышения образовательного уровня применительно к крупномасштабному администрированию данных как в научных, так и промышленных организациях; для объединения усилий исследователей из несмежных дисциплин с целью формирования интегрированного сообщества, способного поддерживать организации при целенаправленной публикации ими своих данных, решая таким образом ключевые задачи по крупномасштабному администрированию данных; для стимулирования восприятия новых подходов промышленными предприятиями за счет стандартизации и стратегического планирования мероприятий по обмену информацией и налаживанию деловых связей. Направления исследований Управление семантическими данными. «Большие Данные» (Big Data). 29
  • 30. № 14 Название проекта Доступ к семантическим данным IKS (Interactive Knowledge Stack «Интерактивный стек знаний (ИСЗ)») Краткое описание проекта. Основные направления исследований      Базовая концепция семантических данных. Форматы представления семантических данных. Языка запроса для семантических данных. Организация хранения семантических данных и доступа к ним в хранилищах триплетов. Концепция Связанных Данных. Миссия IKS заключается в предоставлении организационной платформы и формировании сообщества для работы над проектами по разработке ПО с открытыми исходными кодами в пространстве систем управления семантическим контентом. Речь идет о создании рабочей среды для поставщиков систем управления контентом (CMS), разработчиков ПО с открытыми исходными кодами и исследователей, которая позволила бы им координировать усилия по разработке семантических технологий для CMS-продуктов с конечной целью создания таких семантических техно-логий, способных заменить собой и превзойти по эффективности некоторые традиционные технологии, применяемые в настоящее время в сиcтемах управления контентом на основе широко используемого в Web комплекса серверного программного обеспечения LAMP или Java. Сроки выполнения проекта Наименование исследовательской организации 2011-2012 Сообщество разработчиков систем управления семантическим контентом: University of Paderborn (Университет Падерборна) Заказчик или рамочная программа EURпейск ий союз Объем финансирования 6,58 млн. EUR доля Европейского Союза в субсидировании Ссылки в Интернет http://www.iks-project.eu/ http://www.iks-project.eu/academy/storing-andaccessing-semantic-data Центр по исследованиям и разработке программного обеспечения при Ближневосточном Техническом университете 30