1. Interoperabilidade de Acervos Digitais Culturais
Brasileiros através da Web Semântica e dos Dados
Abertos Ligados
Doutorando: Luis Felipe Rosa de Oliveira
Orientador: Dalton Lopes Martins
PPGCINF - UNB
04/04/2019
2. Tema e Objeto da Pesquisa
2
Interoperabilidade de acervos digitais a partir da perspectiva
aplicada da web semântica e dos dados abertos ligados
Acervos digitais da cultura brasileira disponíveis em formato
aberto pela plataforma livre de acervo digital Tainacan.
3. Objetivos
3
• Objetivo Geral
• Promover a integração das etapas do desenvolvimento e aplicação de um
sistema de interoperabilidade de acervos digitais culturais brasileiros a partir da
web semântica e dos dados abertos ligados.
• Objetivos Específicos
• Relacionar casos nacionais e internacionais que se assemelham à proposta de
interoperabilidade para embasamento comparativo;
• Acompanhar o desenvolvimento do Tainacan e como se dá a apropriação dos
acervos culturais;
• Reunir técnicas inerentes a integração de acervos digitais em formato aberto e
gratuito que possam ser utilizadas juntamente ao processo de disponibilização
on-line dos acervos;
4. Problema da Pesquisa
4
Como promover a interoperabilidade de acervos culturais
digitais pela perspectiva da web semântica e dos dados
abertos ligados na plataforma livre Tainacan?
5. Indicações de Bibliográficas
5
• Interoperabilidade
• CIDOC – CRM Modelo Conceitual de Referência do Comitê Internacional para Documentação do
Conselho Internacional de Museus
• EDM – Eropeana Data Model
• Web Semântica e Dados Abertos Ligados
• Tim Berners-Lee
• W3C – World Wide Web Consortium
• RDF – Resource Description Framework
• OWL - Web Ontology Language
• Dados Abertos Ligados (LOD)
• Acervos Digitais Culturais
• NIC.br - Núcleo de Informação e Coordenação do Ponto BR
• CETIC.br - Centro Regional de Estudos para o Desenvolvimento da Sociedade da Informação
• CGI.br - Comitê Gestor da Internet
• Projeto Tainacan
• Iniciativas Consolidadas
• Europeana
• American Art Instituite
6. Metodologia
6
1. Levantamento e aprofundamento de referencial bibliográfico;
2. Análise documental de relatórios e produções técnicas e conceituais de projetos
já implementados de interoperabilidade de acervos digitais;
3. Levantamento e reflexão crítica do contexto político e social brasileiro em que as
iniciativas de digitalização de acervos culturais se encontram;
4. Relação das técnicas, softwares e padrões semânticos em formato livres possíveis
de aplicação ao cenário brasileiro;
5. Acompanhamento das técnicas utilizadas atualmente na disponibilização digital dos
acervos pela plataforma Tainacan;
6. E desenvolvimento da proposta de um modelo teórico-aplicado de possa ser
integrado à plataforma produzindo a integração das fontes de informação.
7. Proposta
7
1. Preparar e Exportar Dados
1. Técnicas de Mineração e Normalização de Dados
2. Uso de Softwares de Organização de Dados e Scripts de Tratamento em Python.
2. Definir Modelo Semântico
1. Modelo Semântico deve levar em conta os metadados das bases dos Museus.
2. Como referência utilizar o EDM (Eropeana Data Model) e o CDOC-CRM
3. Produzir um Modelo de Referência para mapear os metadados dos acervos digitais para o formato
semântico.
3. Mapear os dados para RDF
1. Transformar os dados em formato em triplas de RDF (Sujeito, Predicado, Objeto)
2. Produzir o arquivo da base de dados no formato RDF para ser reconciliado com outras bases
semânticas.
4. Reconciliar os Dados
1. Reconciliar os dados com vocabulários controlados reconhecidos.
2. Conectar com a Wikidata.
• Obs. O Tainacan será o software de base para o mapeamento e reconciliação dos dados.
8. O que temos?
8
Conversão
SQL Server
Access
.DOC
.DOCX
PDF
Bas?s d? d?d?s
CSV
Original
Tratamento
CSV
Tratado
Open
Refine
Tainacan
Migração
Python
Modelo
Conceitual
RDF
RECONCILIAÇÃO
9. Problemática
9
• Contextual
• Como o contexto cultural Brasileiro têm se apropriado do meio digital?
• Até que ponto os casos internacionais podem auxiliar na produção de um modelo
de interoperabilidade para a cultura digital brasileira?
• Como os acervos culturais digitalizados do Brasil estão dispostos para a aplicação
de web semântica?
• Estrutural
• Como enfrentar a falta de padronização em alguns acervos?
• Quais as técnicas de automatização podem ser aplicadas nas etapas de migração?