Presentation held at a meeting in Bulgaria (Varna Regional Library) coorganized by Europeana, Bulgariana, Varna Regional library and BBIA about Europeana.
This is a presentation targeted to leaders of cultural institutions in Bulgaria to inform them about the opportunities to publish cultural content in Bulgariana and in Europeana and about what would be their benefits for doing this.
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013Mariana Damova, Ph.D
The document discusses building an ontology-based application to communicate museum content in multiple languages on the Semantic Web. It aims to make cultural heritage accessible to both humans and computers by generating natural language descriptions from semantic data. The application uses Grammatical Framework to linearly multiple museum datasets and ontologies into 15 languages. It addresses challenges in cross-linguistically representing classes, properties, word order, tense, and reference. The system was demonstrated to generate descriptions of paintings from the Louvre museum in English and French.
The document defines ontologies as explicit descriptions of a domain that define concepts, properties, attributes, and constraints. It discusses the history of categorization in philosophy and the development of knowledge models like semantic nets and conceptual graphs. The document outlines different methods for building ontologies and different types of ontologies. It also discusses ontology tools like Protege and TopBraid Composer and how ontologies are used on the semantic web through languages like OWL.
Presentation held at a meeting in Bulgaria (Varna Regional Library) coorganized by Europeana, Bulgariana, Varna Regional library and BBIA about Europeana.
This is a presentation targeted to leaders of cultural institutions in Bulgaria to inform them about the opportunities to publish cultural content in Bulgariana and in Europeana and about what would be their benefits for doing this.
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013Mariana Damova, Ph.D
The document discusses building an ontology-based application to communicate museum content in multiple languages on the Semantic Web. It aims to make cultural heritage accessible to both humans and computers by generating natural language descriptions from semantic data. The application uses Grammatical Framework to linearly multiple museum datasets and ontologies into 15 languages. It addresses challenges in cross-linguistically representing classes, properties, word order, tense, and reference. The system was demonstrated to generate descriptions of paintings from the Louvre museum in English and French.
The document defines ontologies as explicit descriptions of a domain that define concepts, properties, attributes, and constraints. It discusses the history of categorization in philosophy and the development of knowledge models like semantic nets and conceptual graphs. The document outlines different methods for building ontologies and different types of ontologies. It also discusses ontology tools like Protege and TopBraid Composer and how ontologies are used on the semantic web through languages like OWL.
This document discusses humanizing technologies and trends in developing technologies that are more human-centric. It provides examples of technologies being developed by Mozaika, a research center, to better integrate technologies into human lives in natural ways. Mozaika is working on projects involving summarization, skills matching, information management, publishing, and more using techniques like natural language processing, sentiment analysis, and semantic technologies.
Communication channels for the european single digital marketMariana Damova, Ph.D
Presentation about the importance of tackling the multilinguality in the strategy agenda for the European Digital Single Market, and about the role of language technology and the European language technology community in solving this issue endorsed by public funding
This document describes a new approach called BLOOMS+ for performing contextual ontology alignment of Linked Open Data datasets with an upper ontology. BLOOMS+ leverages contextual information from Wikipedia category hierarchies to compute similarities between concepts in different ontologies. It computes class similarity, contextual similarity between super classes, and an overall similarity to determine equivalence or subsumption relationships between concepts during alignment. The approach is evaluated on aligning several LOD ontologies to the PROTON upper ontology, outperforming existing solutions. Future work involves extending this approach to utilize more contextual sources and enable seamless querying across aligned datasets.
A Framework for Improved Access to Museum Databases in the Semantic WebMariana Damova, Ph.D
This paper presents a framework for processing Museum databases according to a set of interlinked ontologies, including CIDOC-CRM, and loading them in a reason-able view of the web of data, providing additional links to datasets from the LOD cloud. The infrastructure allows accessing the data via SPARQL queries and to verbalize the query results in natural language, the GF formalism, which allows access to 18 natural languages.
Презентацията „Успешни практики на сътрудничество между Уикипедия и културните институции“ пред Национална среща „Доброволците в българските музеи“, 7-8 април 2016, Национален политехнически музей.
Защо публикуваме колекциите си онлайн?
Какво искаме да постигнем с колекциите си онлайн?
Какви са ползите от споделянето на отворени и висококачествени данни?
Как работим с авторски права?
"Changing the world one building at a time"
Проектът Еко Библиотека и културен център в град Шипка ни предоставя един уникален шанс да преобразим рушащата се сграда на съществуващото читалище и да променим в положителна посока живота на хората в града и околните селища. В глобален план този проект цели да мотивира и вдъхнови българската и Европейската общественост да прегърне устойчивите методи и технологии при преустройството на съществуващите сгради и да премахне социалните и финансови пречки пред изпълнението на тези решения.
http://eplusinternational.com/bg/proekti/eko-biblioteka
This document discusses humanizing technologies and trends in developing technologies that are more human-centric. It provides examples of technologies being developed by Mozaika, a research center, to better integrate technologies into human lives in natural ways. Mozaika is working on projects involving summarization, skills matching, information management, publishing, and more using techniques like natural language processing, sentiment analysis, and semantic technologies.
Communication channels for the european single digital marketMariana Damova, Ph.D
Presentation about the importance of tackling the multilinguality in the strategy agenda for the European Digital Single Market, and about the role of language technology and the European language technology community in solving this issue endorsed by public funding
This document describes a new approach called BLOOMS+ for performing contextual ontology alignment of Linked Open Data datasets with an upper ontology. BLOOMS+ leverages contextual information from Wikipedia category hierarchies to compute similarities between concepts in different ontologies. It computes class similarity, contextual similarity between super classes, and an overall similarity to determine equivalence or subsumption relationships between concepts during alignment. The approach is evaluated on aligning several LOD ontologies to the PROTON upper ontology, outperforming existing solutions. Future work involves extending this approach to utilize more contextual sources and enable seamless querying across aligned datasets.
A Framework for Improved Access to Museum Databases in the Semantic WebMariana Damova, Ph.D
This paper presents a framework for processing Museum databases according to a set of interlinked ontologies, including CIDOC-CRM, and loading them in a reason-able view of the web of data, providing additional links to datasets from the LOD cloud. The infrastructure allows accessing the data via SPARQL queries and to verbalize the query results in natural language, the GF formalism, which allows access to 18 natural languages.
Презентацията „Успешни практики на сътрудничество между Уикипедия и културните институции“ пред Национална среща „Доброволците в българските музеи“, 7-8 април 2016, Национален политехнически музей.
Защо публикуваме колекциите си онлайн?
Какво искаме да постигнем с колекциите си онлайн?
Какви са ползите от споделянето на отворени и висококачествени данни?
Как работим с авторски права?
"Changing the world one building at a time"
Проектът Еко Библиотека и културен център в град Шипка ни предоставя един уникален шанс да преобразим рушащата се сграда на съществуващото читалище и да променим в положителна посока живота на хората в града и околните селища. В глобален план този проект цели да мотивира и вдъхнови българската и Европейската общественост да прегърне устойчивите методи и технологии при преустройството на съществуващите сгради и да премахне социалните и финансови пречки пред изпълнението на тези решения.
http://eplusinternational.com/bg/proekti/eko-biblioteka
This presentation gives insight to the overall Horizon 2020 Program and more specifically for the period 2018-2020 with emphasis to ICT. Mariana Damova is the National Contact Point for Horizon 2020 ICT in Bulgaria
Geography of Letters - The Spirituality of Sofia in the Historic MemoryMariana Damova, Ph.D
Presentation of the project The Spirituality of Sofia in the Historic Memory at the Round table on the future perspectives for Digital humanities in SEE within the Summer School in Advanced Tools for Digital Humanities and IT
The document describes IndustryInform, a semantic-based search and recommendation service for business networking. It allows industrial enterprises to advertise themselves, helps potential clients and investors find matching businesses, and provides a data as a service facility (DaaS) through annual subscriptions or pay-per-query plans. The service uses semantic web technologies and linked data to power searches across a database of over 50 million information units about 300,000 companies in 7 countries. It has features like extended search, company/user registration, and results displayed in table or Google-like formats. The system was developed by Mozaika's Humanizing Technologies Lab and has an engineering team, graphic designer, and business/marketing team to manage it.
Mozaika is a research center and SME operating since 2013 in the areas of data science, natural language interfaces, and human insight. It provides consulting, R&D projects, and data as a service solutions tailored to human behavior. Mozaika has expertise in semantic technologies, cognitive systems, and multimodal interactivity. It has completed projects in business networking, human resources management, cultural heritage, education, and aerospace with clients and partners from both private companies and research organizations.
This document summarizes Mozaika, a research center focused on humanizing technologies. It discusses technologies that make emerging technologies more understandable and give people more control, including reducing data complexity through semantic technologies. It provides examples of Mozaika's projects involving skills matching, city experience summarization, satellite communications, linked open data, and e-publishing. The goal is for technology to better support and enhance humanity.
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...Mariana Damova, Ph.D
This presentation described a Multilingual Retrieval Interface for Structured data on the Web, a talk given at NLIWoD workshop at ISWC 2014. The approach is based on Grammatical framework and semantic web and linked data technologies
This presentation is an overview of the Bulgarian participation in the virtual museum Europeana, and the path of establishing a National Aggregator to Europeana.
This document summarizes a presentation given by Mariana Damova on using semantic technologies and Europeana data. It discusses how Europeana data has been converted to RDF and loaded into the OWLIM semantic graph database. This allows linking Europeana data to other datasets to enable queries across multiple sources. Examples of queries over Europeana and other cultural heritage data are provided. Future work on projects like Europeana Creative is also mentioned.
This presentation introduces OWLIM semantic repository at DM2E project meeting, held in Vienna in November 2012. Ontotext entered the DM2E consortium as associated partner.
This presentation describes the public data service - FactForge. It is a reason-able view of a segement of LOD cloud, and the biggest body of general knowledge on which inference is performed, supplied with a reference layer for a quick access.
This presentation discusses the value of inferred knowledge over LOD and presents a new version of FactForge, a reason-able view, the biggest body of heterogeneous generic knowledge on which inference is performed, showing examples of inferred statements across LOD datasets.
This document discusses Bulgariana Collections in Europe, including:
- Bulgariana.eu is Bulgaria's aggregator for providing cultural heritage collections to Europeana.
- Collections include unique Bulgarian manuscripts and unpublished Thracian archaeological objects.
- Metadata is converted to Europeana Data Standards and ingested through OAI-PMH into Europeana's repository.
- A digital repository has been developed to publish digitized collections online with search and browsing features.
This paper describes the creation of linked data for cultural heritage domain, using semantic technologies. The Gothenburg city museum data are described according to an ontological model combining a series of upper-level and domain specific ontologies, such as PROTON and CIDOC-CRM, triplified and interlinked with data from LOD, e.g. DBpedia. The implementation is done as a reason-able view of the web of data and the data are loaded in OWLIM semantic repositoyr.
1. Пътят за създаване на български
национален агрегатор за Европейската
виртуална библиотека Европеана
Мариана Дамова, PhD
ПРЕОБРАЖЕНИЯТА НА Б-ПРОСТРАНСТВОТО
Варна
Март 2013
2. Ontotext
– Сред 5 най-добри доставчици на семантични технологии в света
– Създадена през 2000, с офиси в България, САЩ, Великобритания
– Европейско финансиране от повече от 10 години по FP5, FP6, FP7 – ICT
– Избрани клиенти в областта на културното наследство:
The National Archives (UK) contracted Ontotext to implement semantic KB and semantic
search for the Government Web Archive
British Museum (UK) Ontotext leads the development of Phase 3 of ResearchSpace project on
collaborative research in cultural heritage; British Museum’s public SPARQL end-point is powered by
OWLIM
The Polish Digital National Museum aggregates artifacts from over 70 contributing cultural
institutions in the Digital Libraries Federation PIONIER Network using OWLIM repository of Ontotext
LODAC (Linked Open Data in Academia), Japan's National Institute of Informatics aggregates
19 collections, 700K entities 15M triples across multiple Japanese resources as LOD.
Official experimental Europeana SPARQL end point for Europeana Semantic Data
(http://europeana.ontotext.com) since December 2012, growing popularity and unique visitors
3. Europeana
http://www.europeana.eu
• Стартира през 2008, с финансиране от Европейската комисия
• в Националната Библиотека на Холандия
• главна цел да направи културното и научното наследство на Европа достъпно за
обществеността
• над 180 организации oт цяла Европа членуват в мрежата на Еuropeana
• Колекциите: 5M обекта през 2009, 10M през 2010, 25M в момента
• Инициативата се заражда през 2005 и е подкрепена от Европейския парламент
• 2011 "Comité des Sages" – “Комитет на мъдреците” препоръчва на Europeana
to put online the collections held by Europe's libraries, archives, museums and
audiovisual archives – vast numbers of books and periodicals (there are some 2.5bn
items in Europe's libraries alone), and millions of hours of film and video covering the
whole of Europe's diverse history and culture.
3
4. Стратегически план на Europeana 2011-2015
От прeзентацията на Анетте Фриберг, Business Development Manager към
Еuropeana
5. Europeana
• Типове колекции: Image, Sound, Video, Text
• Архитектура на инфраструктурата на Еuropeana
Europeana Solr ingestion
Portal DB
visitor Provider
system context
back office
• Стандарти данни на Europeana
• Агрегатори на Europeana – по страна или по тема
• Процесът на инжектиране на съдържание е между 4 и 6 седмици
5
6. Кой доставя данни на Europeana ?
National Aggregators, National Aggregators,
single domains cross domains
Museums
Museums,
libraries , archives,
audiovisual
Thematic Aggregators
Archives
Libraries Project Aggregators
National Archives Museums,
Audio Archives libraries & archives
Museums, libraries,
archives, audiovisuals
От прeзентацията на Анетте Фриберг, Business Development Manager към
Еuropeana
9. Българско участие в Еuropeana
Европейско финансиране
• Athena, LinkedHeritage
• Europeana Local (http://www.europeanalocal.eu/eng)
• Europeana Photography
• CARARE
• Europeana Creative
• LoCloud
Друго финансиране (Korea, Ontotext)
• bulgariana.eu
Обем понастоящем - малко над 50К обекта, като целта а да се
стигне до 500К обекта до 2015
9
10. БГ Институции, които предоставят съдържание
• Народна библиотека Кирил и Методи
• Централна библиотека на БАН
• Регионална библиотека Пловдив (средновековни ръкописи)
• Регионална библиотека Варна
• Национален археологически музей
• НАБИС
• Регионална библиотека Велико Търново
• Регионална библиотека Шумен
• Библиотека “Родина” Стара Загора
• Институт по Балканистика с Център по Тракология на БАН
• Институт по Литература на БАН
• Geocad93
11. Българиана (bulgariana.eu)
• Създадена в края на 2011 година
• Технически агрегатор към Europeana
• Мрежа от дейци и радетели за
съхраняването и представянето на
българското културно наследство
11
13. Колекции
Златни страници от Българското Възраждане
unique manuscripts of Bulgarian folk songs collected in 19th century
by Miladinov Brothers, renowned Bulgarian Folklorists
published in 2008 by D-r Luchia Antonova,
Institute of Bulgarian Language, Bulgarian Academy of Sciences
МАРКО КРАЛЕВИКИ БОЛЕН СЕ КАИТ И
СЕ ИСПОВЕДВИТ
Поболил се Марко Кралевике,
що си лежал токму три години,
от нищо се иляч (1) не на’ож’ал.
И му рече негва стара майќа:
“Ай ти, Марко, ай ти, синко милий;
не си болен, синко, от господа,
тук си болен, синко, от гре’о’и,
да ти викна попой (2), ду’овници,
лепо да се синко исповедиш,
да си кажиш твоите гре’о’и!”
….
13
14. Колекции
Праисторическа и Тракийска цивилизации
Unpublished Thracian archeological objects collected by Prof.
Valeria Fol, Center of Thracology at the Institute for Balkan Studies
at the Bulgarian Academy of Sciences
14
16. Агрегатор към Europeana
• OAI-PMH сървър
• Установена процедура с Europeana за агрегиране на данни
• Подписан Data Exchange Agreement
• http://www.europeana.eu
– europeana_collectionName: 20215*
– for the individual sets use europeana_collectionName: 2021501* (or
2021502*)
• http://britishmuseum.ontotext.com
16
20. Създаване на общество
• Стъпвайки на опита от 3 срещи-семинар, проведени между 2009-2012 под
патронажа на българския Евро-депутат Емил Стоянов
– Януари 2012 – “Europeana мисията възможна” , София
– Март 2012 - "Проекти с българско участие за цифровизация и разпространение на
научното и културно наследство чрез публикуване в Европеанa" , Велико
Търново, съорганизирана с РБ Велико Търново
– Април 2012 – участие на 4та среща-семинар под патронажа на Емил Стоянов,
Пловдив
– Юни 2012 – Участие в Пленарна среща на Europeana
– Комуникация с Министерство на културата
– Юли 2012 – Създаване на национален съвет по дигитализация към Фондация “13
Века България”
– Септември 2012 – Участие в DiPP’2012, организирана от ИМ-БАН и РБ В.Търново
– Включване в мрежата на агрегатори на Europeana
– Октомви 2012 - "Българското участие в Европеана. Сътрудничество и развитие,
Варна, съорганизирана с РБ Варна
21. Създаване на общество
– Ноември 2012 – Кръгла Маса с участието на представители на Europeana,
съорганизирана с Министерство на културата
– Ноември 2012 – участие в Годишно Генерално Събрание на Europeana
– Награда “Unsung Hero” на Мариана Дамова в категория “aggregate” за принос в
създаването на контакти и дейност за създаване на български национален
агрегатор (for the high quality of images and metadata Ontotext provides and for
efforts to establish a Bulgarian national aggregator)
– Януари 2013 – blog пост на Europeana за кръглата маса в София през ноември 2012,
споменаващ Народната Библиотека, Държавния Архив, Регионалната Библиотека
Варна, фирмите Онтотекст и Геокад93
– Февруари 2013 – среща с Националния Съвет по Дигитализация към 13 века
България
• Google група с 50 участника
• Мрежа от над 200 институции в България
• Facebook страница
• Участие в консорциуми за Европейско финансиране
22. Изводи
• Еuropeana
– Идея
– Общност
– Инфраструктура
– Инструмент
• Пан-европейско културно наследство, разпространение и
полуляризиране
• Приобщаване на всички страни от Европа
• Създаване на условия за пре-използване на събраната
информация за информационни, увеселителни, образователни
и т.н. цели
• Ефикасен маркетингов инструмент на всяка страна участничка
23. Бъдеще
• Булгариана (сертифициран технически агрегатор към Еuropeana)
– НПО
• Мрежа от агрегатори в България, ако е необходимо
• Български национален агрегатор
– Техническа обезпеченост
– Избор на колекции с общо-европейско звучене
– Планиране
• Национално и Европейско финансиране за следващия програмен период
2014-2020
• Подкрепа на Europeana във включването й в рамката за финансиране на
Европейски инфраструктури
• Ontotext – доставчик на технологии
• Следващи срещи-семинар, организирани от Булгариана – април - май 2013,
септември - октомври 2013