O PADICAT é uma iniciativa da Biblioteca da Catalunha para capturar, preservar e disponibilizar o acervo da Web Catalã desde 2005, contendo atualmente 380.000 capturas de 117.000 websites e 526 milhões de arquivos. O projeto é coordenado pela Biblioteca da Catalunha com apoio do governo catalão e outros parceiros, e busca preservar registros de processos eleitorais e outros eventos relevantes da Catalunha por meio de uma estrutura tecnológica que realiza a captura periódica de sites
1. PADICAT
O archivo da web da Catalunha
Arquivamento e Preservaçao da Web
Trocando Experiencias
2 de fevereiro de 2021 via zoom
Ricard de la Vega
2. Patrimônio Digital da Catalunha
PADICAT é uma iniciativa da Biblioteca da
Catalunha para capturar, preservar e divulgar o
Arquivo Web da Catalunha
Conteúdo desde 2005
– 380.000 capturas
– 117.000 websites
– 526 milhões de arquivos em 23 TB
Accesso aberto em www.padicat.cat
3. Coordenação e colaboradores
A Bibliotecade Catalunya é a coordenadora
O Consorci de Serveis Universitaris de Catalunya
(CSUC) é o parceiro tecnológico
A Generalitat de Catalunya é o patrocinador
A FundaciópuntCAT apoia
Membros do International Internet Preservation
Consortium (IIPC)
4. Referentes e outros projetos
Referentes iniciais
– Internet archive
– Kulturaw3
– Pandora
– Etc
Dois modelos
– Exaustivo
– Seletivo
2005
2007
2009
5. Um modelo de captura híbrido
• Captura periódica do domínio .cat (41% do
arquivo)
• Captura seletiva de sites que correspondem a
acordos (2%) e recomendados (27%)
• Captura seletiva de sites vinculados a
monografias (30%)
6. 18 monografias em 15 anos
• 15 em processos eleitorais
– Parlamento da Catalunha (2006, 2010, 2012, 2015)
– Municipal (2007, 2011, 2015, 2019)
– Generais espanhóis (2008, 2011, 2015, 2 * 2019)
– Europeu (2009)
– Referendo para a independência da Catalunha (2017)
• 3 Temáticos
– Folk-Rock (2008)
– Museus da Catalunha (2010)
– Coronavírus (2020)
Llueca, C., Suades, G., Torres, N., De-la-Vega, R., & Cócera, D. (2011). A ritmo de tweet:archivando elecciones 2.0. ProfesionalDe La Información, 20(3), 309-
314. https://doi.org/10.3145/epi.2011.may.10
7. Etapas do arquivo
• 2005 – 2006: Nascimento
• 2007 – 2008: Crescimento
• 2009 – 2011: Consolidação
• Desde 2012: Meta de incorporar 75 mil versões de
32 mil websites anualmente
2006 2011 2019