• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Lívia relatório curso_biblioteca_digital_bn
 

Lívia relatório curso_biblioteca_digital_bn

on

  • 558 views

Relatório do curso de Biblioteca Digital, proferido pela Biblioteca Nacional em julho de 2012, na cidade do Rio de Janeiro. Relatos da participante Lívia Lopes Garcia.

Relatório do curso de Biblioteca Digital, proferido pela Biblioteca Nacional em julho de 2012, na cidade do Rio de Janeiro. Relatos da participante Lívia Lopes Garcia.

Statistics

Views

Total Views
558
Views on SlideShare
558
Embed Views
0

Actions

Likes
0
Downloads
6
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Lívia relatório curso_biblioteca_digital_bn Lívia relatório curso_biblioteca_digital_bn Document Transcript

    • Relatório de participação no “1o. Curso de Gestão de Bibliotecas Digitais: uma abordagemprática e teórica”.Participante: Lívia Lopes GarciaData: de 02/07/2012 a 06/07/2012Local: Biblioteca Nacional, no Rio de JaneiroPromovido: Biblioteca Nacional Digital02/07 Abertura com a Coord. da Biblioteca Digital Nacional (BND) Angela BettencourtO curso tem por objetivo auxiliar as instituições do Brasil a gerir a digitalização de seusacervos com intuito de formar um Portal Digital Nacional. O curso representou o primeirofruto da BND que tem como objetivos principais:- Preservação- Possibilitar acesso não físico- Reunir conteúdos e coleções dispersas em vários acervos- Divulgar o acervo- Democratizar o acesso02/07 Bibliotecas Digitais e suas utopias por Prof. Luiz Fernando SayãoE-mail: lsayao@cnen.gov.brSayão começa falando sobre o desejo antigo do homem de reunir todo o conhecimento emum só lugar, formando a idéia de “bibliotecas totais”, concretizada pela Biblioteca deAlexandria. Contudo, com o passar dos séculos, ironicamente a humanidade foi para o ladoinverso, o da fragmentação do conhecimento. As Bibliotecas Digitais (BD), retomam a idéiade bibliotecas totais, mas não totalmente, por meio delas, somente o acesso é único, mas osacervos podem estar dispersos em outras instituições.A microfilmagem foi mencionada como a base tecnológica das BDs, pois ampliou o acesso ereduziu o espaço ocupado, além da possibilidade de se fazer duplicatas e distribuir oconteúdo a outras instituições.Posteriormente Sayão apresentou os pensadores relevantes na evolução das BDs:- Otlet: Propôs “motor de busca analógica” com as fichas catalográficas.- H.G.Wells (1930): Acreditava que toda a memória seria acessível através do microfilmes.- Vanevar Bush (1945): Desenvolveu o projeto do Memex, que nunca saiu do papel. Tratava-se de um equipamento que armazenaria todos os conteúdos (livros, vídeos, fotos, etc.), seopondo a rigidez dos sistemas tradicionais da época. Início do hipertexto. Seria o IPAD dehoje.- Ted Nelson (1960): Criou os termos hipertexto e a hipermídia, interligando informações.- Licklider (1960): Biblioteca baseada em computador.- Lancaster (1980): Com computadores pode-se dispensar o papel.- Barnes-Lee (1990): Inventou a World Web Wide (1990) e a Web Semântica (2004).Para Sayão os desafios para se criar uma BD são mais gerenciais do que tecnológicos como:espaço de memória, novos documentos, coleções digitais, metadados, interoperabilidade,preservação, curadoria, acesso, serviços e autenticidades. E salienta que a Web não substitui oconceito de biblioteca, mas o expande. Para ele, as áreas possuem visões diferentes a respeitodas BDs:- Biblioteconomia: menos como sistema, mais como instituição, além de significar um outropasso da automação e ampliação dos serviços prestados.- Tecnologia da Informação: ampliação dos sistemas em rede.- Editores: novo mercado, nova economia da informação.- Governo: facilidade e visibilidade dos serviços.- Professores: novo recurso de aprendizado, ensino à distancia.- Arquivologia: alternativa ao microfilme, fim Fo dilema entre acesso e preservação.- Comércio eletrônico: informação inserida na economia global.- Pesquisador: espaço dinâmico voltado para o compartilhamento e disseminação deconhecimento.
    • - Profissionais de Cultura: visibilidade, curadoria virtual.Definição de BDs da Digital Library Federation (DLF): “Bibliotecas digitais são organizaçõesque disponibilizam os recursos, incluindo pessoal especializado para selecionar, estruturar,oferecer acesso intelectual, interpretar, distribuir, preservar a integridade e assegurar apersistência ao longo do tempo de coleções de trabalhos digitais, de forma que eles estejamprontamente e economicamente disponíveis para uso de uma comunidade definida ou umconjunto de comunidades.”Para Sayão, a web não tem memória, é preciso construí-la intencionalmente através detecnologia e gestão. Deve-se mudar com a tecnologia, mas manter a autenticidade e confiançaem ambientes certificados. Sayão seguiu falando de documentos essenciais para certificaçãocomo OAIS (Reference Model for an Open Archival Information System) - ISO 1472:2003Sayão menciona o DRIVER que reúne todos os repositórios digitais da Europa.http://www.driver-repository.eu/Sayão segue falando sobre objetos digitais, defende que estes são conceitualmenteequivalentes aos itens do acervo de bibliotecas, arquivos, coleções de museus, etc. Acrescentaque um objeto digital deve ser representado para se tornar um item de informação. Osobjetos digitais podem ser simples (completos em um só arquivo), como arquivos de textos,imagens ou complexos (formado por um conjunto de arquivos e metadados) como páginasde web. Sayão afirma que o texto por si não conta mais toda a história, ela está distribuída emvárias camadas. Os documentos estão se tornando complexos demais, dificultando seugerenciamento. Hoje, cada artigo de uma revista científica, por exemplo, é composto porvideo, blog, gráficos interativos, etc. Os objetos digitais não falam por si, requereminterpretações (hardwares e softwares) para torná-los visíveis aos sentidos humanos. E comono mundo tecnológico as mudanças são constantes, metadados devem acompanhar odocumento para interpretações futuras. Por exemplo: que software usar para a leitura de umdocumento? O metadado informará. Uma BD sem metadados tem tudo para se tornar bits deimpossível interpretação no futuro. Precisamos de informação para interpretação futura:estrutural e semântica.Sayão finaliza afirmando que as BDs exigem uma biblioteconomia muito mais precisa, exigemuito mais biblioteconomia. O processo tecnológico está mudando a forma como a biblitoecafaz seu trabalho e não a razão do seu trabalho que sempre foi conectar pessoas cominformações.02/07 Políticas de preservação digital por Prof. Luiz Fernando SayãoE-mail: lsayao@cnen.gov.brSegundo Sayão preservação não consiste em preservar mídias, mas sim conteúdo. Embora amídia sobreviva é preciso também preservar os equipamentos (hardware e software) paraleitura destas mídias. No meio físico, preserva-se o suporte, no digital, é preciso preservar osuporte, o acesso e a possibilidade de reprodução do conteúdo. No meio digital a preservaçãoe acesso se confundem, mas caminham juntos!A norma mais importante da preservação, a OAIS (Reference Model for an Open ArchivalInformation System) - ISO 1472:2003, foi desenvolvida pela NASA, pois a instituição estavaperdendo muitos dados. Os objectivos principais da OAIS são: identificar os componentesfuncionais que devem fazer parte de um arquivo dedicado à preservação da informaçãodigital e descrever as entidades internas e externas desses sistema, bem como os objectos deinformação que são manipulados no seu interior.
    • Segundo Sayão, com acervos digitais houve algumas mudanças no registro da informação:gerir registros invisíveis (gerir algo que não estamos vendo, os bits), desmaterialização dossuportes e gestão feita por profissionais de diversas áreas. Completa que quanto mais densa éa mídia, quanto mis caracteres ela possui, mais frágil e instável ela é, por exemplo, HDsexternos, Pendrives, etc. Sayão indicou a leitura da “Carta para a Preservação do PatrimônioArquivístico Digital” do Conarq.Sayão defende que nossa compulsão em produzir informações é maior que nossa capacidadeem garantir sua preservação. Para hoje nossa meta principal deve ser produzir informaçãopara durar, a curto prazo devemos salvar materiais em perigo, a médio prazo devemosdesenvolver políticas de preservação digital (definir se serão preservados os documentos esuas funcionalidades, softwares e hardwares, etc. além de detalhar nos metadados o que foidefinido pela política). Para Sayão a informação digital se perde por dois motivos: obsolênciae degradação física.Ameaças aos Acervos Digitais:- Rápido crescimento do número de objetos digitais- Complexidade dos objetos digitais- Falta planejamento de preservação digital- Ausência de padrões- Direitos Autorais- Falta expertise técnica- Dependência forte do ambiente tecnológico- Ciclo rápido da inovação tecnológica- Acompanhar as mudanças tecnológicasDe acordo com Sayão, para preservar objetos digitais é preciso preservar a cadeia de bits queo forma e sua interpretação (software)  que interpreta e lê o conteúdo da cadeia de bits.Cadeia de Bits  Interpretador (Software)  ConteúdoSayão sugere uma política de preservação:- Informação: intensidade das camadas de informação a serem preservadas- Estratégias de preservação- Formatos de arquivos- Metadados – descrição- Armazenamento- Software: plataforma (produção, manipulação, gestão, preservação dos objetos digitais)- Segurança: sistema de backupsPara Sayão, a política não é uniforme para todos os tipos de documentos, o que faz variarregras e formatos, mas que fique claro a necessidade de privilegiar formatos abertos, pois apreservação não é algo marcado no tempo (com formatos proprietários de empresas quepodem sumir), mas um processo contínuo.Sayão afirma que 3 níveis de preservação: a preservação intelectual (foco no conteúdo eautenticidade da obra), a preservação lógica (foco nos formatos: softwares e hardwaresnecessários) e a preservação física. Faz um adendo: “há algumas instituições financeiras quejá estão voltando ao microfilme, por se tratar de uma tecnologia mais barata e com grau delegalidade e autenticidade.”. Há situações onde se volta do digital para o analógico, devido aeste ser mais barato. Assim, deve-se pensar bem antes de iniciar um projeto de digitalização.Menciona ainda o HD Rosetta, placa de níquel com 2 polegadas, que armazena até 196.000páginas digitais e não requer software para leitura do conteúdo, este pode ser acessadofacilmente por microscópio.Sayão sugere algumas soluções parciais: fazer backups periódicos, investir na renovação dasmídias (migrar de suporte), usar mídias duráveis, arqueologia digital (procedimentos para
    • salvar conteúdos HDs). Menciona ainda estratégias de preservação digital (conservar ocontexto tecnológico): manutenção de museus de equipamentos em estado de uso, sistemasoperacionais, plataformas de hardware (preservação tecnológica), emulação da tecnologia(computador emulador de computador obsoleto – emulador faz, simulador não faz, no casode emuladores, os computadores serão novos, mas farão operações de computadores antigostambém). Sayão sugere que quando não se tem certeza da necessidade de preservar, deixa-sea solução para o futuro mantendo o dado, software, hardwares, manuais, ou seja, cria-se umacápsula de metadados para cada objeto digital, com todas as informações necessárias paraque um sujeito no futuro, se preciso, crie seu próprio emulador para acessar o conteúdo. ParaSayão a função dos metadados é preservar a cadeia de bits e a interpretação dos dados.Sayão diz que a migração é considerada a mais promissora forma de preservação segundoalguns especialistas, pois possibilita a manutenção do conteúdo, evita a obsolênciatecnológica e utiliza tecnologia corrente. Sugere que sejam utilizados formatos mais estáveis eaberto (não proprietários) e de uso disseminado como PDF, no lugar de formato que mudama cada versão, como o Word. Centralizar os objetos digitais na menor variedade possível deformatos. Salienta também os problemas da migração: não preserva os originais, asmultimídias (ob. digitais complexos) sofrem perdas de funcionalidades, deve ser aplicadarepetidamente para cada documento individualmente.Produtor  Arquivo OAIS  Consumidor | | GestãoVoltando à política, Sayão enfatiza que é preciso documentar os formatos utilizados na BD,assim como equipamentos, softwares, decisões, direitos de uso, licenciamentos, etc. Por fimsugere consulta ao PREMIS (PREservation Metadata: Implementation Strategies).02/07 Imagem Digital I e II por Prof. Joaquim MarçalMarçal define imagem digital como um código numérico formado por bits (bynary digit 0 e 1)e acrescenta que 8 bits = 1 byte. Sendo assim 8, 16, 24 bits são respectivamente 1, 2, 3 bytes.Seguiu diferenciando a imagem vetorial (composta por retas, curvas, elipses e polígonosgerada a partir da descrição geométrica, não perdem qualidade, pois as funções matemáticasse adequam à ampliação) da imagem bit-mapeada (tridimensional produzida a partir de umdocumento digital ou de um cenário qualquer, a imagem original é transformada numamalha de pontos de pixel - picture elements, perde definição ao ser ampliada).As BDs utilizam a imagem bit-mapeada, nela cada pixel (menor elemento da imagem) recebeum valor tonal (branco, azul, tons de cinza, etc.) que é representado em código binário 0 e 1,origem na imagem reticulada1. Há as cores de luz e as de impressão (pigmento), a soma dascores de luz dá branco, a soma dos pigmentos dá preto. A cor uniforme do pixel vem de umapalheta de cores e neste aspecto é bom observar que temos as cores de luz e as de impressão.As cores de luz primárias são o vermelho, o verde e o azul, ou o conhecido RGB, enquantoque na impressão temos o amarelo, magenta e ciano (aquelas aprendidas pela maioria naescola primária). Para imprimir corretamente é necessário ter o perfil de cores adequado. Asoma das luzes dá branco, a soma dos pigmentos dá preto.Marçal indica consulta ao tutorial “Moving Theory Into Practice Cornell University”http://www.library.cornell.edu/preservation/tutorial/contents.htmlMarçal prossegue com conceitos básicos sobre imagem digital:- Dimensão de imagens: cmxcm- Tamanho de arquivo: KB, MB, GB, TB                                                                                                                1  Formada por pontos. A variação tonal pode acontecer pela variação de tamanho dos pontos eqüidistantes ou pelavariação da distância entre pontos de mesmo tamanho.  
    • - Resolução: número de pixels por área determinada. 10 ppis = 1 polegada com 10 pixels- Profundidade de bits: cada bit possui um bit de profundidade, ou 2, 3, 8 bits deprofundidade (informação).- Alcance dinâmico: faixa de luminância que uma câmera consegue capturar.- Compressão: capacidade de armazenamento, escreve o conteúdo de uma forma que ocupemenos bits. Quando se comprime, ao descomprimir há perda.- Formato de arquivo: doc, xls, ppt, pdf, tiff, jpeg, etc. (As BDs utilizam o formato TIFF semcompressão)Marçal menciona os itens de controle de qualidade das imagens digitais:- Cores: RGB (red, green, blue) são as cores de luz, a visualização digital e CMYK (Cyan,Magenta, Yelloy, Key-Black) são as cores pigmento, impressão. Há perfis de cores de entrada,visualização e saída.- Calibragem dos monitores: para que fiquem compatíveis- Resolução: depende da utilização a que se destina a imagem- Identificação dos arquivos: os caracteres permitidos são 0 – 9 (todos os números), A – Z(todas as letras maiúsculas e minúsculas), _ (underline ou sublinhado), - (hífen) e . (ponto,apenas para separar nome da extensão). SEM ESPAÇOS para que as pastas nos servidoresvirem links diretos ao conteúdo. Nomear arquivos com 11 caracteres para graver CDs ou 30caracteres para nomear arquivos.- Nitidez: aumento da nitidez provoca grandes mudanças na imagem ou arquivo que nãopodem ser desfeitas.- Entrega: pode ser em mídias removíveis como pendrive, CDs, DVDs, ou mesmo por e-maile via FTP. Marçal sugere que não se use CDs e DVDs por uma questão de sustentabilidade.- Armazenamento e manutenção: backups e manutenções periódicasPro fim, Marçal menciona que a reprodução de materiais gráficos iconográficos consisteem 3grandes etapas:- Configurações de Captura- Curadoria digital e controle de qualidade- Preservação dos arquivos master derivados03/07 BNDigital: Trajetórias e perspectivas por Profa. Ângela BettencourtE-mail: angelab@bn.brÂngela começa falando sobre a Biblioteca Nacional (BN) como responsável pela guarda epreservação do patrimônio documental do pais. Segue esclarecendo que a Biblioteca NacionalDigital (BND) é uma extensão na BN e cita algumas de suas características como: reunircoleções de autores que estão dispersas em diversos países (convênios entre BDs do Brasil,Argentina, Portugal e França), preservação não só física, mas também do conteúdo edisponibilização de acesso.Ângela faz uma breve apresentação sobre a BND:- 1991: surgimento da Web- 1998: criação do Portal de Web da BN- 2001/2003: Primeiros projetos de digitalização (Atualmente a BND conta com 25 mil itensdigitalizados num total de 6 milhões de páginas)- 2006: lançamento da BND reunindo os projetos de digitalização até então concluídos. Usodo DublinCore (DC), que se tornou ISO 15836 em 2006.- 2008: a BND entra na Biblioteca Digital Mundial- 2009: Projeto França-Brasil em DSpace, OAI e com aporte financeiro do MINC- 2012: lançamento da Hemeroteca Digital BrasileiraA BND conta com 250.000 acessos por mês e sua equipe é formada por 14 contratados, 5bibliotecários, 4 historiadores, 1 profissional de letras, 1 arquiteto e 10 digitalizadores.O acervo contempla até o momento: 2.500 atlas, 20.000 mapas, 165 álbuns de fotografias (totalde 9724 fotografias), 800 documentos sonoros, 1013 textuais, 5 milhões de páginas de
    • periódicos e 2573 manuscritos. Ângela esclarece que a BND digitaliza somente as obras queestão em domínio público. Algumas músicas são disponibilizadas somente um trecho de 10segundos.Os arquivos utilizados para digitalização de documentos sonoros é o WAVE parapreservação (máster) e MP3 para acesso (compactação). Já as imagens são em TIFF parapreservação (máster) e JPEG e PDF para acesso (compactação). Para ter uma boa qualidade dezoom é utilizado o aplicativo Zoomify. As másters são atualmente armazenadas em DVDs eHDs e suas localizações fazem parte dos metadados administrativos, assim é possível saberem qual DVD ou HD a imagem está.É indicada a leitura do livro “Bibliotecas Digitais: saberes e práticas” de Carlos Marcondes,Hálio Kuramoto, Lídia Brandão Toutain e Luís Sayão para entender mais sobre padrões,normas e protocolos envolvidos na gestão de BDs. Ângela segue falando sobre os itens daGestão da BND:1) Política de Seleção: estado de conservação, raridade, demanda dos usuários, domíniopúblico, seleção temática2) Padrões de conversão para digital: captura em 300 ppi obedecendo o tamanho original dodocumento (fac-símile do original), arquivos em TIFF para imagens e WAVE para sonoros,scanners são escolhidos de acordo com o tipo de material (obras raras e materiais de grandeporte são digitalizados por 3 máquinas fotográficas back digitais, os microfilmes sãodigitalizados por 2 scanners de microfilmes FelxScan, os periódicos são digitalizados por 4scanners planetários da Zeutschel modelo 12.000)3) Padrões de compressão/compactação para transmissão web: Texto (PDF + OCR FineReader), Som (MP3), Imagem Multiparte (PDF), Imagem Simples (JPG – não tem zoom, masdeixa salvar e Zoomify – tem zoom, mas não deixa salvar e não precisa de plugin)4) Normas de descrição/organização de informação: DublinCore com acréscimo de outroselementos além dos 15, Autoridades (Base BN), Terminologia (Base BN, assuntos emportuguês e inglês!), linguagem de marcação XML, controle dos pontos de acesso (autoria eassunto). A CDD também passou a ser utilizada com o intuito de futuramente oferecer anavegação por grandes áreas.5) Armazenagem: DVDs e HDs com nomes dos arquivos. Todos os DVDs e HDsacompanham um livreto no qual estão relacionados os arquivos que contempla e osmetadados do suporte e formato. A BN está finalizando seu Data Center com capacidade de150 TB para onde irão todo o conteúdo dos HDs e DVDs (mencionado em detalhe na aula de06/07).6) Padrões de Interoperabilidade: OAI-PMH (substituindo o Z39.50), DublinCore e DSpace(em desenvolvimento e padronização de metadados, BN junto ao IBICT deve trabalhar com oDSpace para interoperar). Ângela afirma que o MARC não é aceito em outras BDs, como a daFrança, por exemplo, por isso adotaram o DublinCore, que não exige o rigor do MARC e éaceito (interoperabilidade) por grande parte das instituições, tornando possível reunir obrasde autores e coleções entre várias instituições.Ângela aponta uma distinção importante entre documento físico e digital, no físico haviaseparação entre descrição (ficha catalográfica) e material físico, já no digital o acesso é diretoao documento, por tanto não é preciso detalhar tanto a descrição. Esclarece que no passado aBN cometeu erros adotando aplicativos que necessitavam de plugin para a visualização, comoo Djvu, e isto é algo que vem sendo corrigido e não é indicado a nenhuma BD.Segundo Ângela primeiramente o material a ser digitalizado é preparado pelo setor deconservação ou restauro e planilhado com as indicações das páginas que serão escaneadas.Sobre o scanner de microfilme menciona que a BN vem produzindo 30.000 imagens/dia,contudo, o desempenho do equipamento pode ser superior, mas é necessário limitar ovolume de imagens/dia de acordo com a possibilidade de produção dos demais processosque envolve a digitalização destes materiais.Por fim Ângela respondeu a algumas questões da equipe da BMA:- Os objetos digitais estão separados do catálogo eletrônico de obras físicas, assim como a
    • Galica.- Garantiu que a microfilmagem (principalmente de periódicos por conta da baixa qualidadedo papel) é política básica da BN e estão pensando em comprar uma microfilmadora dedigitais.- São digitalizados os jornais em domínio público e extinção.- Sobre a gestão dos formatos originais (físicos), microfilmes e digitais esclarece que há doiscaminhos: 1) fazer uma base com a descrição dos suportes físicos e outra base digital (comdescrição dos objetos digitais e com os próprios objetos digitais) ou 2) acrescentar ao campo#093 do Marc a informação sobre microfilmes e ao campo #856 a URL do documento digital.A BN optou pelo primeiro caminho e criou uma BND separada do catálogo eletrônico da BNde documentos físicos. Possuem ainda uma outra base só com o catálogo de microfilmes.03/07 Disseminação da Cultura em Meio Digital por Prof. Vinícius Pontes MartinsE-mail: vinicius@bn.brA Rede Memória é um braço colaborativo da BND, que busca concretizar parcerias, além deagregar valor ao material digitalizado. A Rede apresenta textos de especialistas que fogem dalinguagem acadêmica apresentando conteúdos inéditos e relevantes. A intenção é atrairpúblico leigo à BND com navegação intuitiva. Há hiperlinks pelos quais as pessoas podem seaprofundar nos assuntos caso queiram através de biografias, bibliografias, etc.Dado importante: a Rede Memória tem equipamento portátil que pode ser levado ainstituições para digitalizar acervos relevantes que poderiam colaborar com a BND e com aRede Memória. Segundo Vinícius, o grande desafio da Rede é interoperar com outros acervose reunir em um único universo de busca, vários conteúdos que se completam.A Rede Memória foi criada em 2006 junto com a BND. A primeira fase seguiu até 2008,quando seu buscou novas parcerias, também com universidades, além da ampliação da basetemática (segunda fase). Em uma terceira fase, iniciada em 2010, a Rede de Memória passa aintegrar alguns elementos da web 2.0 visando participação e interatividade. Nestemomento, a rede abandonou as páginas estáticas somente em HTML passando a utilizar umCMS, com links para redes sociais, fóruns, além de espaço para que os usuários comentem aspublicações. Aproveitou-se o curso para lançar também a nova versão da Rede Memória,acessível a partir de hoje, em http://redememoria.bn.br/03/07 Plataformas de desenvolvimento de sites de Bibliotecas Digitais e ExposiçõesVirtuais por Prof. André Pfeiffer (Desenvolvedor do site da BND)André menciona que o necessário para se fazer um website é HTML padronizado pela W3C,mas sabendo que nenhum navegador aceita o HTML padrão. Os navegadores criam seuspróprios HTMLs o que gera problemas de compatibilidade de um site para váriosnavegadores. O sites se preocupam em aparecer no ranking do Google, contudo o Googleprecisa interpretar o conteúdo e para isto é preciso que o site esteja nos parâmetros da W3C.Segundo André é possível fazer um site da forma mais correta possível com HTML(HyperText Markup Language) e CSS (Content Management System). O HTML é umalinguagem de marcação que determina onde começa e termina um conteúdo. CSS é a folha deestilo, o visual do site. A forma mais correta é utilizar o CSS para inserir a formatação do sitee o HTML para marcar, assim programadores (através da HTML) e designers ou pessoasleigas (através do CSS) podem trabalhar simultâneamente sem depender necessariamente unsdos outros.André segue falando sobre linguagem na utilização de servidor, que segundo ele é o itemmais importante do site, pois executa no servidor o processamento e não no navegador,permite a criação de sites com conteúdo dinâmico e se comunica com o banco de dados.Existem diversas soluções tanto de banco de dados quanto de linguagem de programação de
    • servidor. A dica é escolher soluções livres que proporcionam custo reduzido, maiorsegurança e liberdade. Sugere ainda 2 formas de se diminuir o custo no desenvolvimento desites: frameworks (scripts prontos) e CMS (sistemas com estruturas prontas para gerenciar eformatar vários tipos de conteúdos: EAD, galerias de imagens, fóruns, exposição de acervos,etc.). É importante saber o tipo de conteúdo que se quer organizar para escolher um CMSadequado. Quando o conteúdo é misto, a saída é utilizar CMS para portais, pois todos elescontemplam: administrador de usuários, criação de diversos tipos de conteúdo, maneira deexpandir suas funcionalidades, customização do layout, categorização de conteúdo eferramentas de busca.André exibe algumas opções de CMS para portais, o WordPress, Joomla!, Plone e por fim oDrupal. Sugere que o Drupal e WordPress são considerados os melhores CMS parabibliotecas, principalmente o Drupal que possui um código bem escrito, muitos componentesdisponíveis, fácil de ser estendido e adaptado, muito versátil e seguro, há contudo, poucomaterial em português.Por fim, André menciona alguns sites que utilizam o CMS Drupal:- U.S.A. White House- Portal do Governo Francês- Portal Governo Inglês- Portal da Cidade de Londres- Harvard University- M.I.T. University- Portal da BBC- NASA03/07 Visita ao Laboratório de Digitalização da BNO Laboratório foi inaugurado em 2001 com parceria da LC, hoje é o laboratório mais bemequipado do pais. Seu principal objetivo é acesso contínuo e preservação dos objetos digitaisindependentemente do seu uso. Não há informação precisa sobre a durabilidade dos discosrígidos, eles nunca foram destinados para armazenamento a longo prazo, mas sim trânsito deinformações. Sobre as mídias há alguns estudos que mostram:- Pendrive: 10 anos- DVDR: 27 anos- CD áudio: 26 anos- CD RW: 7 anos- CD-R ouro: 100 anosAlertam que o foco não deve estar somente na compra de equipamentos, mas também emgarantir o acesso a longo prazo aos objetos digitais. Contudo, ainda não há estratégias sólidasque garantam o acesso a longo prazo. Sugestão: acompanhar as novas tecnologias e manter amigração dos dados para novas plataformas, evitando a obsolescência.A BND captura as imagens em RAW e guarda em TIFF. Ou seja, são guardadas as imagensprocessadas e não as in loco. Defendem que a profundidade de bits (mencionada na aula de02/07 por Marçal), aumenta a gradação da cor, tornando o objeto digital mais parecido com ooriginal. Reforçam que o HD Rossetta (mencionado na aula de 02/07 por Sayão) é imune àsvariações de tempo e umidade.O Laboratório é composto por:- 11 técnicos- 2 Scanners Zeutschel OS 12.000 HQ (Para periódicos, são mais rápidos e com menosqualidade que as Back Digitais, mas ainda sim a qualidade é altíssima. Os periódicos sãodigitalizados em JPEG e não em TIFF)- 9 computadores Power Mac G5 (recomendado para imagens)- 4 PCs Windows
    • - 3 Back Digital Hasselblad (equipamentos fotográficos, que garantem melhor qualidade, masmenor produtividade processo mais lento). Conectadas por Wifi aos computadores.- Escala de Cores da Tiffen e Tarjetas de Foco da Microdak- 2 Scanners digitalizadores de microfilmes (trabalho vem sendo realizado pela DocPro)Processo das imagens capturadas:1) Captura  2) Revelação (transforma em TIFF)  3) Renomear Arquivos (Sigla da Seção +No. Tombo)  4) Controle Imagem (verificar se as cores estão certas e qualidade da imagem,se estiver ruim volta para captura)  5) Revisor (confere nomes dos arquivos com conteúdo) 6) Armazenamento em HDs e DVDs (cofre junto com microfilmes)  7) Tratamento deimagem e conversão em JPG e cortes (edição)  8) Criação dos Derivados (PDF, ZOOMIFY,etc.)  9) Metadados dos arquivos derivados  10) WebA BND possui um total de 161 HDs (320 GB) e 4037 DVDs até o momento. Todo esteconteúdo será migrado para o Data Center na Caixa Cofre assim que estiver finalizado. A BNtrabalha com a Scansystem (mesma empresa do Projeto UNESP BD).O técnico do laboratório menciona ser crucial pensar na qualidade dos equipamentos,iluminação com alta potência, isos mais baixos que não perdem tanto em cor e definição (osmais altos são indicados para noite), qualidade dos computadores (Power Mac G5), aberturade diafragma (ideal meio aberto meio fechado), velocidade do obturador (não pode ser baixodemais para que a imagem não fique “tremida”), fotômetro (cálculo da luz), sala totalmentepreta, cortinas pretas e funcionários com jalecos pretos (buscando neutro).Materiais de grande porte, como mapas, são digitalizados em 4 partes e são guardados osarquivos das 4 partes separadas e o arquivo delas unidas.A obra já chega ao laboratório restaurada e planilhada (planilha de cada obra compreendemuitas páginas), muitas vezes a seção de restauro desmonta a obra e a deixa com as folhassoltas. A planilha contem 3 colunas:- Número da página- ID da página e se é frente ou verso (Ex: pág. 1, pág. 1v)- Descrição/ indicação para páginas sem paginação (observações ou instruções)Enfatizaram que os scanners que possuem são para digitalização em massa dos microfilmesnão servem para atendimento, no qual é preciso digitalizar poucas páginas de cada roloselecionadas pelo usuário. Para atendimento o mais indicado é a leitora digitalizadora quealugamos para a BMA. A DocPro digitaliza em media 40 rolos, na BN mesmo, e realiza naempresa o tratamento das imagens e OCR.04/07 Metadados/Linguagens de marcação por Profa. Ana PavaniSegundo Pavani, as BDs possuem disciplinas e padrões ISO que precisam ser seguidos comoem acervos físicos. Os conceitos de Bibliotecas Tradicionais são os mesmos das BDs.As Bibliotecas Tradicionais utilizaram o formato MARC e intercâmbio de registros por meioda ISO2709, que possibilitaram a criação de catálogos coletivos. As BDs utilizam o formatoDublinCore (DC) e intercâmbio de registros por meio do XML, permitindo intercâmbio demetadados.Metadados são dados sobre dados, ou informações sobre informações, termo que surgiu nocontexto da Tecnologia de Informação para descrição de itens de acervos digitais. Osmetadados são o resultado do processamento técnico de acervos digitais. Segundo Pavani,metadados seria a ficha catalográfica e conjunto de metadados seria o equivalente ao catálogode fichas.
    • O DC é ISO15836/2003, existe desde 1995, desenvolvido por um grupo liderado pela OLCCpara nomear arquivos na internet. Pavani sugere que uma BD baixe o selinho digital do DC ecole na sua página principal quando faz uso do formato.Pavani esclarece que o DC não especifica onde devem ficar os metadados, podendo serusadas duas soluções: metadados junto ao objeto digital, no cabeçalho ou metadadosseparados em um banco de dados. BDs geralmente utilizam a segunda solução, pois permiteo uso dos metadados para qualquer tipo de material digital (lógica do catálogo) como acervode livros + catálogo de fichas. Há ainda outros conjuntos de metadados como o DC:- Library Of Congress MDC: bom, pois possui muito campos administrativos- ETD-ms: padrão para teses- MTD-BR: padrão brasileiro para teses e dissertações- e-ARQ: padrão para gestão arquivística- PREMIS: padrão para preservação digital (não descreve tîtulo, autor, mas sim campos depreservação, sendo assim, não é utilizado sozinho, mas junto com DC, por exemplo)Pavani afirma que o DC é mais geral e pode ser utilizado junto com estes padrões maisespecíficos. O DC agrupa os elementos em 3 grandes áreas, que totalizam 15 elementos:1) Conteúdo ou recurso: são elementos que descrevem as características intelectuais- Título: escrito em formato livre- Assunto: usar vocabulário controlado ou cabeçalho de assunto. Recomenda-se classificarformalmente (CDD, CDU)- Descrição: resumo, sumário, nota de catalogação- Fonte: referência do todo ou parte de um conteúdo. Não é URL, é conteúdo! Ex: Baseado naobra de Shakespeare.- Língua: DC recomenda usar tabela ISO 639 (idiomas) e ISO 3166 (país no qual é falada). Ex:pt-BR, outra opção seria utilizar a tabela da ALA (American Library Association)- Relação: em casos de adaptações de obras ou traduções. Ex: “parte de” nos registrossecundários e “tem partes” no registro principal. Ex: a BN utiliza para álbuns de fotografiasou periódicos.- Cobertura: temporal, geográfica, jurisdicional, descreve a abrangência do conteúdo emtermos temporais (datas, épocas, períodos, etc.), em termos geográficos (países, continentes,regiões, etc.) e em termo jurisdicional.2) Propriedade intelectual: autoria e propriedade intelectual- Autor ou Criador: responsável pela criação do conteúdo corresponde aos campos #100, #110e #111 do MARC.- Editor: responsável pela disponibilização do conteúdo do suporte físico e do digital.- Contribuidores: orientações, membros das bancas, ilustradores, animadores (responsáveispor contribuir ao conteúdo)- Direitos: detentores dos direitos autorais ou patrimoniais do conteúdo ou referencia sobreonde eles possam ser encontrados. Identificados numericamente e depois traduzidos. AquiPavani indica o Creative Commons.3) Instanciação (descrição física): peso do arquivo digital, características, se precisa de plugin,etc.- Data: contém data associada ao conteúdo, podendo ser de sua criação e disponibilização naweb. Este elemento precisa ser desdobrado.- Tipo: há uma tabela da DC que também precisa ser desdobrada.- Formato: natureza física (digital) podendo dizer respeito ao software ou hardware,equipamento necessários para acesso do conteúdo.- Identificador: identificação única ao objeto digital e não pode ser ambígua. Ex: DOI (DigitalObject Identifier), que corresponde ao ISBN no material físico. O DOI é pago, mas o ISBNtambém é! Ainda não há regionais de DOI, mas a tendência é que o IBICT será nossa agêncianacional. O IBICT libera o ISSN, já o ISBN é liberado pela BN. Aqui surge uma discussãoimportante sobre o DOI. Como será o DOI para objetos digitais digitalizados por instituiçõesdiferentes? Ex: Debret está sendo digitalizado pela BN e pela Brasiliana. Será o utilizado omesmo número de DOI nas duas instituições? A conclusão foi que obras digitalizadas emlaboratórios diferentes precisam ter DOIs diferentes, pois a qualidade da digitalização é
    • diferente (ajuste da luz, palheta de cores, foco, enfim, objetos digitais diferentes). Outraquestão levantada pelo público, mas não muito debatida por não fazer parte do tema daapresentação era a necessidade de um controle para que duas instituições não tivessem omesmo trabalho em digitalizar a mesma obra.Pavani faz uma importante observação após apresentar os campos do DC, os campos MARCsão numéricos, já no DC os campos são identificados com palavras, essa é a parte chatinha,segunda ela, do DC.A aula segue sobre os Qualificadores do DC, que são os desdobramentos dos elementosprincipais, ele refinam os elementos. Pavani destaca que o DC sugere o uso de algunsinstrumentos e posteriormente faz algumas sugestões de refinamento da BN e da DC:- Autor: seguir ABNT e fazer remissivas.- Assunto: CDD, CDU, LCSH, LCC (Comentário Lívia: vale notar como não há diferenciaçãoentre lista de cabeçalho de assuntos, tesauros e sistemas de classificação, são todosvocabulários controlados de assuntos.)- Data: data da publicação física e data da publicação digital- Tipo: DCMI Vocabulary (Tabela do DC)- Formato: IMT (Internet Media Type)- Identificador: URI (Uniform Resource Identifier)- Fonte: URI ou DOI- Língua: ISO 639-2 (idioma) e ISO 3166(país)- Relação: codificação URI (tem versão, é versão de, tradução de, etc.)Pavani segue falando que a interoperabilidade permite que os sistemas se falem entre simaximizando o intercâmbio e a re-utilização da informação. Para integrar os conteúdos, ossistemas devem falar entre si, deve haver interoperabilidade. A melhor ferramenta que temospara interoperar é o XML.Menciona dois tipos de linguagem de marcação: descritivas que dizem que naquele campo hátal conteúdo, como o HTML, e as formativas, dizem que tal conteúdo está em tal tamanho, senegrito, cor, etc, como CMS. Desta forma é possível separar o conteúdo da formatação (estilo),como já havia mencionado André Pfeiffer na aula de 03/07.Pavani diz que cada objeto digital possui todo o seu contexto de metadados em XMLgrudado nele, pois se for perdido o banco de dados com os metadados, o objeto digitalmantém seus dados. Menciona o DTD (Document Type Definition), padrão para escrever DCem XML. Há vários formatos escritos em XML: MetsXML, MARCXML, DCXML e outros,cada biblioteca pode escolher o seu formato, o importante é que esteja em XML pois assim, oformato que escolheram não será um empecilho para interoperar com outros sistemas.04/07 Livros eletrônicos por Prof. Claudio SoaresE-mail: claudio@obliqpress.comClaudio inicia sua aula afirmando que não faz mais sentido criar produtos fora da lógica deinternet. As bibliotecas ainda não estão focadas em disseminar informação, mas em trancar,proteger seus livros.Segue falando sobre Meme, unidade de informação que se multiplica de cérebro em cérebrocomo informações virais. Características de um meme:- propagado por imitação- sobrevive ao hospedeiro- mudado intencionalmenteSe os livros são memes e o memes são idéias, logo livros são idéias. Segundo Claudio nósestamos acostumados com informação assíncrona, mas a nova geração não, ela necessita demais velocidade. Os livros digitais dizem menos respeito aos livros impressos do que àsidéias. A produção do livro independente sempre existiu, com a tecnologia só ficou mais fácil.
    • Completa que a o pai do Open Archives é o Santos Dummont, que liberou em 1910gratuitamente suas patentes do avião.Claudio defende que leitura é muito mais do que ler livros, pois há os periódicos, a internetcom blog, revistas, fóruns, colunistas, etc. Diz que ainda não há padrão para construção delivros eletrônicos, mas indica uma boa aplicação no “On the Road”, Jack Kerouac. Esta faltade padronização será um problema para o bibliotecário.E-books X Livros impressos: a geração atual quer liberdade, direito de consumir comliberdade, customização, integração entre outros elementos e os recursos existentes no e-Booknão são diferentes dos recursos da web, então porque pensar o e-book através do modelo doimpresso? Aconselha que não devemos nos concentrar no problema e sim observar ocontexto, pois geralmente a solução está no contexto.Uma pesquisa de 06/2012 mostra nos EUA são comprados mais e-books do que livros empapel. No Brasil já há 9.5 milhões de leitores de e-books. Outro número interessante é que 45milhões de brasileiros estão nas redes sociais e estas pessoas são leitores. Segue mostrando oranking das Redes Sociais no Brasil, Facebook, Orkut, MSN, Twiteer, etc. A leitura online estácrescendo. Mas as editoras nacionais e bibliotecas não observam o crescimento da leituradigital, não analisam o jornal, o livro como suportes que utilizam tecnologia, assim como umipad.Claudio segue afirmando que os softwares estão engolindo o mundo, tudo hoje é software, oslivros, as revistas, compras, etc. Segue mostrando as tendências tecnológicas relacionadas aolivro:- Cloud Computing- Virtualization- Social Business- Móbile ComputingMenciona um sistema da Amazon que aluga livros aos leitores, mais do que isso, os clientespodem comprar livros e colocá-los para alugar usando o sistema da Amazon. Tem editoras,por exemplo, que vendem o livro mais barato antes da revisão, depois de publicado vocêrecebe o livro. Você é o financiador da produção do livro. Isto é um modelo diferenciado.Por fim, indica plataformas publicadoras de livros como Pressbooks (da Obliq empresa deClaudio) que possibilita que um livro seja feito com a facilidade de um blog (escrito em XML)e no final você obtém um PDF, há também o IfBook da Apple e EPUB (software livre).Menciona o DITA que consolida o reuso no processo de criação de conteúdo, definindo umaarquitetura XML para projeto, redação, gerenciamento e publicação de vários tipos deinformação em forma impressa ou na Web. Menciona também o Single Sourcing Publishing,método que permite reutilizar informações, economizando tempo, dinheiro, eliminando otrabalho duplicado.04/07 Visita Técnica Guiada pela BNA BN dispõe de um Serviço de Informação Documental, que atende o usuário à distancia,enviando cópia do material que ele precisa mediante pagamento, o contato é dinf@bn.brOs acervos de microfilmes estão distribuídos pelas seções de periódicos e obras raras, háleitoras de microfilmes nas áreas de atendimento das seções, junto às mesas. Os originais emprata ficam em um cofre com temperatura e umidade controladas.Há na BN Laboratórios de Digitalização (visita em 03/07), de Encadernação e Restauro. Aseguir serão comentadas as visitas aos dois últimos.
    • O Setor de Encadernação conta com 31 funcionários e é responsável por preservar, higienizare encadernar obras. De 27 a 31 de agosto haverá um curso, estão disponíveis 70 vagas, o custoé de R$350,00. Interessados entrar em contato por preserve@bn.br. No setor são monitoradasa umidade e temperatura de todas as seções por sensores. Há uma tela de monitoramentodesde 2009 e o sistema utilizado é MT-530 Super, da Sitrad. Contam ainda com o apoio de umclimatologista da UFRJ. Segundo o bibliotecário, o sistema é bastante barato, de fácilimplementação e uso.O Setor de Restauro trabalha somente com papel, fotografias e outros documentos sãorestaurados pela Funarte. O foco está no restauro de obras entre os séculos XIV e XIX. Apósrestauradas as obras passam pela microfilmagem, digitalização e voltam aos seus acervos deorigem. Ao chegarem no Setor, as obras recebem uma ficha, na qual serão anotadas todas asintervenções realizadas (tipo de papel utilizado, cola, colorações, etc.), além de fotos de antese depois do restauro. Cada técnico trabalha na obra do começo ao fim, somente aencadernação é feita por um único profissional.Vale mencionar que os laboratórios são muito limpos e organizados, por outro lado, o Setorde Tratamento da Informação é bastante bagunçado, caixas de livros empilhadas em todos oslados, layout da sala segue ao redor das caixas empilhadas, móveis velhos...A BN possui aproximadamente 500 bibliotecários e 700 funcionários.05/07 Arquitetura da Informação e Usabilidade por Prof. Luiz AgnerAgner inicia a aula falando sobre Richard Saul Wurman, o arquiteto que cunhou o termoArquitetura da Informação (AI). Wurman estava preocupado com o Information Overload,segundo ele há mais informação em um dia na internet do que os mortais do século XVIIpodiam receber durante toda a vida. Para Agner o sistema básico da organização de umwebsite é a hierarquia, é preciso pesquisar para se saber como melhor elaborar estahierarquização dentro de cada contexto e objetivo.Menciona algumas características da AI:- Design estrutural de um espaço de informação para facilitar a conclusão de tarefas e acessointuitivo ao conteúdo- Rotulação e organização de um sistema de informações- Trazer para o contexto digital conceitos de design e arquitetura- Encontrabilidade, ou seja, estrutura centrada no usuário- Taxonomia intuitivaOs Sistemas de AI são:- Organização: hierarquia (taxonomia, níveis de topo, modelos mentais, etc.), banco de dados(conteúdo relacionado) e hipertexto (conteúdos cruzados)- Rotulagem: verbal (palavras e expressões) e icônico (ícones)-Navegação: global (onde estou?), local (o que há próximo?) e contextual (o que hárelacionado?)- Busca: focada na resposta, palavras-chave (que devem ser aquelas buscadas pelo usuário)e o sistema deve dar uma resposta mesmo que o usuário digite uma palavra-chave errada. Aresposta de busca deve ser clara, com título, descrição, URL, rank dos resultados. Agner deuexemplo do campo de busca do IBGE, empresa onde trabalha, lá inseriu o mecanismo debusca do Google, assim o usuário sempre terá uma resposta e as mesmas estarão ranqueadaspor relevância com o conteúdo do IBGE.A formação do arquiteto da informação é interdisciplinar: ciência cognitiva, engenharia desoftware, desenho industrial, ciência da computação, educação, psicologia, ciências sociais,ciência da informação, biblioteconomia e outras. No gráfico apresentado não tem ergonomia,mas o palestrante considera esta área importante.Papel do arquiteto da informação – clarificar a visão e missão do website fazendo o
    • balanceamento entre necessidades da organizadora do website e do usuário, determinarconteúdo relevante, especificar como usuários irão encontrar a informação e planejar ocrescimento do website.Primeira fase do projeto de AI – Pesquisa, seguida de estratégia, design, implementação,avaliação, sendo esta metodologia um ciclo contínuo. Alguns produtos de AI:- Navegação: blueprints, wireframes, taxonomias- Organização e Rotulação: esquema de metadados, vocabulários controlados e tesauros- Navegação suplementar: mapa do site, indicesSegundo Agner a AI não está concentrada nos recursos visuais da interface. Ela organiza aestrutura de informação. O tripé da área está nos seguintes aspectos: pesquisa de contexto,conteúdo e usuários. O contexto está relacionado a instituição, o conteúdo a uma série dedocumentos e usuário ao comportamento de busca. Não se deve estruturar um siteespelhando a estrutura da empresa (organograma) ou a forma como ela olha sua própriainformação. Agner sugere ainda o uso de Google Analytics.Algumas ferramentas que podem auxiliar a AI:Card sorting é uma abordagem de AI centrada no usuário para a classificação de itens dowebsite. Procedimentos: escrever os nomes dos itens, misturar os cartões, solicitar aoparticipante que separe agrupando e no final nomear as pilhas. O resultado final do cardsorting é uma taxonomia centrada no usuário.Testes de usabilidade, interação homem computador com 4 componentes: usuário, tarefa,contexto, sistema. O teste parte do princípio de que o usuário tem uma tarefa para usaraquele sistema e assim, são levantadas as finalidades, selecionados os usuários alvos e entãoestes são colocados para interagir com o sistema, gravando esta interação em áudio, video,movimentações de tela. Segundo Jacob Nielsen, o teste aplicado a 4 ou 5 usuários já ésuficiente para encontrar 80 % dos problemas. Testes de usabilidade são necessários quando ousuário tem dificuldade para realizar as tarefas.05/07 Os desafios da Interoperabilidade por Prof. Carlos Henrique MarcondesE-mail: marcon@vn.uff.brHá atualmente várias BDs disponíveis, isto exige que o usuário aprenda as interfaces de todaselas para poder explorá-las. Muitas vezes elas possuem coleções parecidas ou mesmo iguais.A interoperabilidade foca uma única interface web, possibilitando consulta a várias BDssimultaneamente. Acervos distribuídos, compartilhados e reunidos em uma unida interfaceweb.Marcondes segue definindo a interoperabilidade como capacidade de diferentes sistemastrabalharem em conjunto (troca de conteúdo ou metadados) através de padrões, acordos eprotocolos. A troca de metadados pode ser síncrona (através de protocolos) ou assíncrona(através de arquivos). A interoperabilidade pode ocorrer em 2 níveis:- Sintática: mais simples através de intercâmbio de dados-Semântica: mais complexa através de dados com significado (tesauros, vocabulárioscontrolados, etc.)O MARC é a primeira linguagem de marcação existente, focando em marcar conteúdos paraidentificá-los independentemente do software. O primeiro protocolo de interoperabilidade foio Z39.50, no início dos anos 1990, no lugar de interagir com cada interface, o usuário interagecom um catálogo que centraliza vários catálogos. Trata-se de um protocolo cliente-servidor. OZ39.50 é caro e complicado computacionalmente, além, de ser muito sensível. Está emdesenvolvimento pela LOL o Protocolo SRU em XML para substituir o Z39.50.Repositório digital é um tipo de BD, foi criado nos anos de 1990. Os pesquisadoresrealizavam suas pesquisas com verba pública e os repositórios de editoras científicascobravam assinaturas caríssimas para se ter acesso. Então surgiu o movimento Open
    • Archives, no qual os repositórios devem ter acesso livre para pesquisas realizadas com verbapública, permite que qualquer um se cadastre e faça upload de seus trabalhos (auto-arquivamento). Marcondes afirma ser o Open Archives, ou mais especificamente OAI-PMH(Open Archives Protocol for Metadata Harvesting) o mais recente, simples, barato epromissor protocolo para bibliotecas, arquivos e museus., pois liga provedores de dados(acervos) a provedores de serviço (metabuscadores), gerando uma busca unificada. A figuramostra as diferenças na interoperabilidade com o uso do protocolo Z39.50 X o OAI-PMH:Através do OAI-PMH os repositórios centralizam somente os metadados e um dosmetadados é o link para o documento, que remete ao acervo de origem, funciona como umcatálogo de referência. A interoperabilidade de metadados é feita com DC + XML e oHarvesting é programa coletor dos metadados.Marcondes usa o SCIELO como exemplo de provedor de dados, qualquer um pode coletar osmetadados do SCIELO e reutilizá-los sem os dirigentes do SCIELO saberem. Importantedestacar, OAI-PMH torna livre o acesso aos metadados, mas não ao documento. Caso ousuário queira acessar o documento, o mesmo será direcionado ao acervo que possui odocumento. METALIS exemplo de provedor de serviço, é um metabuscador em LibraryInformation Science que busca metadados em vários repositórios da área.05/07 Repositórios DSpace I e II por Prof. Milton ShintakuE-mail: shintaku@ibict.brShintaku inicia a aula com um conjunto de definições de BDs:- Acesso remoto via web- Compartilhar documentos- Fornecer serviços de biblioteca ou centro de informação- Acesso ao conteúdo integral organizado em coleções- Acesso a outras fontes de informações- Documentos multimídia- Facilidade para o acesso à informaçãoE complementa com definições de Repositórios Digitais:- Tipos: acadêmicos, temáticos e institucionais- Estar disponível em web e ter acervo acumulativo e preservado de acesso livre einteroperável
    • - Auto-arquivamento como prioridade de alimentação- Facilitar a disseminação da informação científica- Possibilidade de personalização dos repositórios- Ferramentas de Gestão do ConhecimentoSegue falando sobre DSpace, software de implantação de repositórios nascido em 2000,permanece como projeto na versão atual é a 1.8.2, mas a 2.0 já está em desenvolvimento.Surgiu da necessidade do MIT em compartilhar documentos da própria instituição.Características: altamente customizável, utilizado para muitas finalidades, software livre e decódigo aberto, múltiplas plataformas (windows, linux, java utilizando sempre o mesmoDSpace em qualquer um destes sistemas), utilizado por bibliotecas jurídicas, bibliotecas demúsica, etc. Suporta uma grande variedade de suportes tais como videos, fotografias, teses,dissertações, livros, áudio, programas de computador e outros.Há universidades que já possuem 2 e até mesmo 3 DSpace para criar repositórios, separandoos científicos do não científicos ou outros. Esta estrutura facilita os relatórios das métricas(estatísticas), depois é possível desenvolver um metabuscador que varra todos osrepositórios.Shintaku afirma que quase metade dos repositórios mundiais são em DSpace, o segundo maisutilizado é o E-Prints. A maioria dos usos de DSpace é ainda em universidades, no Brasil 60%do uso, por exemplo, é pelas universidades.O DSpace utiliza um servidor de web (Apache Tomcat – software livre) para gerenciar aspáginas exibidas aos usuários e um gerenciador de banco de dados (Postgre SQL – softwarelivre) para armazenar as informações do sistema. O DSpace possui 2 interfaces, XMLUI,baseada em XML e a JSPUI, clássica do DSpace. É possível ter mais de uma interface nomesmo repositório, personalizando com temas diferentes. O DSpace já vem com padrão DC.A estrutura do DSpace é hierárquica para facilitar a organização e permitir navegação.Compreende: Comunidades > Subcomunidades > Coleções > Itens (menor unidade doDSpace metadados + objeto digital). As comunidades e as subcomunidades representam aestrutura funcional, os grandes temas, não contendo objetos digitais diretamente. As coleçõessão as tipologias dos documentos, pois abarcam os objetos digitais. Aconselha-se então que ascoleções sejam formadas por tipo de arquivo (periódicos, livros, etc.) ou por formato (videos,áudios, etc), mas não por assuntos. As comunidades e subcomunidades são mais apropriadaspara representar assuntos.O DSpace trabalha com acesso de usuário e grupos. O usuário é quem acessa o DSpace, osgrupos podem ser anônimos (sem acesso, não podem depositar documentos) eadministradores (com permissão, podem fazer tudo). Estes 2 grupos já existem e não podemser apagados, mas podem ser criados grupos intermediários.Há 3 opções de permissões para acesso:- Aberto: acesso aberto para acessar metadados e objetos digitais- Restrito: acesso restrito para acessar metadados e objetos digitais- Embargado: data limite de acesso ao itemAs instituições geralmente liberam acesso somente aos metadados, mas não aos objetosdigitais, ou liberam para depósito de objetos digitais com preenchimento de metadadosbásicos.O login é seu e-mail cadastrado. Pode ser utilizado o protocolo L-DAP (LightweightDirectory Access Protocol) para gerenciar os logins. O DSpace avisa por e-mail todas asatualizações, quem logou, quem depositou, reporta erros, etc. Estas notificações podem serconfiguradas para recebimento ou não, de acordo com a responsabilidade de cadaadministrador.
    • A entrada de documentos se dá por 4 meios:- Fluxo de submissão: autoarquivamento- Importação/ migração: permite depósito em lotes (batch)- Sword: protocolo de comunicação, depósito automático oriundo dos periódicos- Harvesting: coleta automáticaNo auto-arquivamento o autor preenche um formulário com os metadados, faz o upload doobjeto digital, seleciona o licenciamento e disponibiliza no repositório. O auto arquivamentonão funcionou muito bem no Brasil até hoje, pois nas universidades os professores dizem nãoter tempo ou delegam esta função aos seus estagiários. O fluxo do autoarquivamento éajustável para cada coleção, pode-se por exemplo liberar o autoarquivamento até o upload doobjeto digital, assim um bibliotecário poderia avaliar a pertinência do documento, conferir osmetadados e disponibilizar. Pode-se ainda acrescentar ao fomulário campos com controle devocabulário, controle de autoridade, etc. Tesauros e Vocabulários Controlados devem serinseridos já estruturados no DSpace (sinonímias, relações, etc.)Para fazer a relação entre os arquivos criou-se o protocolo OAI-ORE (Object Reuse andExchange), que coleta não apenas os metadados, mas também os recursos contido nos itens,principalmente objetos digitais compostos como websites. O DSPACE vem tanto com oprotocolo OAI-PMH, como o protocolo OAI-ORE, permitindo capturar metadados oumetadados e documentos. Há ainda o Sword para depósito automático em repositórios.O DSpace oferece ferramentas de busca simples e avançada e possibilita customização doscampos de busca. Para DSpace interface XMLUI (Discovery) é possível ainda aplicarnavegação facetada, aplicação de filtros para refinar os resultados e a ferramenta de autocomplete baseada na base de dados.Por fim, Shintaku fala da curadoria do DSpace e sugere que se aplique vírus scan nos objetosdigitais.06/07 Curadoria Digital por Prof. Moreno BarrosSegundo Moreno a abordagem de projetos de digitalização deveriam se dividir entrepreservação e disponibilização (trabalho em web), eles se concentram muito em digitalização(preservação) e pouco em divulgação (web). Curadoria digital deveria entrar no início doprojeto de digitalização. Gasta-se muito para dar acesso, mas pouco para tornar istoconhecido, resumindo, é muito investimento financeiro de todos para poucos usuários (osespecializados).Moreno menciona que poucos sites estão abertos para que o Google rastreie seus conteúdos.A biblioteca deve ir aonde está o usuário nestes novos tempos, o catálogo deve aparecer noGoogle. Deve-se estar visível. Instituições passam horas catalogando e indexando suas obraspara no final das contas o robô do Google não conseguir acessar a informação, o usuárioprecisa ir até o site da biblioteca (quando ele tem conhecimento do site), procurar o catálogo eacessar. Moreno questiona: “De que adianta tanta catalogação e indexação bem feita?”. Oscatálogos precisam ser rastreados pelo Google. Assim quando o usuário clica no link, oGoogle o joga ao catálogo da Biblioteca. A Hemeroteca Digital da BN, por exemplo, está emDrupal e já é possível ter seu catálogo rastreado pelo Google. Comentário da Lívia: de fatopesquisei alguns títulos de periódicos e o primeiro resultado exibido pelo Google é o do siteda Hemeroteca da BND.Afirma também que poucas instituições usam o Facebook como ferramenta para facilitar otrabalho de difusão e interação. Completa que grane parte dos usuários estão lá, alem de seruma ferramenta com baixo custo de implantação e manutenção. Geralmente as redes sociaissão tocadas por uma só pessoa nas bibliotecas e tampouco estão articuladas com a estratégiadas bibliotecas.
    • A curadoria seria um novo termo para atacar um velho problema. De cara as bibliotecas nãoconseguiram, por meio das redes sociais, melhorar o relacionamento com o usuário. SegundoMoreno, a curadoria seria uma segunda chance. Para ele, as BDs resolvem o problema daacessibilidade e a curadores de conteúdo resolvem a barreira da participação, pois pegaconteúdos e refina para públicos específicos, seria um novo nome para DSI (DisseminaçãoSeletiva de Informação).Para Moreno, redes sociais são somente ferramentas, elas não emburrecem as pessoas atéporque o conteúdo das redes sociais é construído pelos próprios usuários. O problema dosusuários está na educação, na formação para utilizar as redes sociais de melhor maneira.Moreno questiona “seu filho fica o dia inteiro no facebook?”. Este não é o problema. Aquestão é a falta de filtros, algo que vem de um problema educacional e os bibliotecáriospoderiam levar a estes os tesouros que possuem em seus acervos por meios das redes sociais.Segue falando que as redes sociais fracassaram na biblioteconomia por falta de bibliotecáriospara realizar especificamente este trabalho.Moreno sugere que a BN seja depósito legal digital também, já que terá um Data Center aprova de incêndio, terremotos, inundações e falta de energia. Acredita que nenhum acervo dopais tenha algo assim guarda seus “tesouros digitais”. Assim as instituições estariamprotegidas contra a mudança de planos de seus financiadores. Indica para conhecimento owww.archive.org, organização sem fins lucrativos que visa preservar o conhecimentohumano, conta com cópias arquivadas de páginas da Web, mostrando assim a evolução daWeb. O arquivo inclui também softwares, filmes, livros, e gravações de áudio (inclusivegravações de shows/concertos ao vivo de bandas que o permitem). Já foi comparada com aBiblioteca de Alexandria.O canal Viva, por exemplo, é um canal para exibir os tesouros da Rede Globo. Há curadoriaquando se decide o que entra no Viva. Moreno dá o exemplo da Library of Congress deimagens que tinham poucos acessos em seu catálogos por falta de informação sobre elas, masque passou a ganhar muitos quando a instituição criou um perfil no Flickr (Rede Social ondeos usuários postam suas fotografias) e nos comentários da ferramenta usuários começaram adar informações sobre as fotos que a biblioteca não tinha conhecimento. Serviu também paraa LOC divulgar seus catálogos de imagens. Para conhecer:http://www.flickr.com/photos/library_of_congress/Para Moreno, o Flickr é o melhor modelo de Web 2.0. A Europeana possui pesfil no Twitter.A curadoria digital visa estudar e solucionar as seguintes questões: Quem é o público alvo?Qual conteúdo? Impedimentos legais? Quanto tempo dura? Como as pessoas vão acessar?Onde ele vai ficar? Quem vai ser o curador?Moreno alerta ainda que as bibliotecas brasileiras ainda não criam aplicativosde Smartphone e Tablets para seus eventos, excluem este meio de divulgação e ampliação nofornecimento de conteúdo. Não percebem que se trata de um investimento para sua própriasobrevivência.É importante existir um curador que monitore as redes sociais e a dispersão do conteúdodeve entrar em pauta. A estatística deve ser divulgada. Deve-se buscar retornar novasinformações para a sua comunidade social (intervenção e feedback). Exemplificando esteúltimo item: a biblioteca não sabe os dados de uma obra? Coloque na web, em ferramenta nãoformal, mesmo sem dados levantados e tente conseguir os dados por interação junto com ospróprios usuários. Faça o usuário colaborar até mesmo com a catalogação. Vale lembrar queas instituições precisam informar os direitos de uso, licenças, para que um curador externopossa saber o que pode usar.Moreno utiliza a ferramenta Pinterest – http://pinterest.com/morenobarros/ - para divulgarimagens, inclusive de bibliotecas, como em http://pinterest.com/morenobarros/biblioteca-nacional-digital/
    • 06/07 A Web e a Cultura Digital por Prof. Carlos Henrique MarcondesPara Marcondes a internet é a plataforma universal para troca, publicação e disseminação dasculturas (cultura digital), não só de acervo físico convertido em digital, mas também daquelesque já nascem no digital. A internet representa informação a qualquer hora, qualquer lugar epara qualquer usuário com acesso à ela. Seu surgimento e constante aprimoramento, implicano desenvolvimento de novas políticas, novos relacionamentos entre pessoas, entre pessoas einformações, etc. Às bibliotecas cabe o desafio de desenvolver a crescente autonomia dosusuários, estruturação de serviços via rede, integração com outras instituições e gestão doconhecimento (ensino à distancia).Marcondes sugere para conhecimento o aplicativo ICA-Atom, gratuito e de código-fonteaberto para gerenciamento de descrição arquivística, em conformidade com os padrões doConselho Internacional de Arquivos (ICA). O objetivo é disponibilizar um aplicativo fácil deusar, multilíngue, e totalmente baseado na web, permitindo que instituições possamrepresentar seus acervos arquivísticos em meio eletrônico.Segue afirmando que o OPAC (Online Public Access Catalog), utilizado hoje pelasbibliotecas, sistema que aparentemente resolve todas as questões, possui pouca interpretaçãosemântica, depende de pessoas que entendem o modelo de entrada de dados (bibliotecários),ou seja, não conseguem interpretar o que o usuário busca. Não refletem a necessidade atualde proporcionar mais autonomia de pesquisa aos usuários. Padrões como o Marc, protocoloscomo o Z39.50 somados aos softwares de bibliotecas, mantêm o registro preso ao catálogosem integração com a web.A web semântica não é outra web, mas sim uma extensão na atual. Na web semântica osentido da informação é melhor definido, as pessoas trabalham em cooperação (selfdescribing documents e better enabling computers). Se bem conduzida, a web semânticapode apoiar/mudar o conhecimento humano como um todo.A atual web faz uso da lógica formal (dedução), considerada muito pobre já que se baseia naforma, já a web semântica utiliza a lógica ontological, baseada no conteúdo. Evolução da webchegando a web semântica:- HTML: define onde o conteúdo vai estar (Ex. No topo, centro, lateral, etc.)- XML: define o que é o conteúdo (Ex: título, autor, etc.)- RDF: define a ordem do conteúdo (Ex: sujeito, predicado, objeto – a sintaxe do conteúdo)Ex de RDF: João da Silva é o diretor do site http://www.amazon.com.brSujeito (Recurso) http://www.amazon.com.brPredicado (Propriedade) DiretorObjeto (literal) João da SilvaAs camadas da web semântica são: URI, XML e XML Schema, RDF e RDF Schema, Ontologia,SPARQL, RIF, Lógica Unificadora, Proof, Criptografia, Confiança, Interface com usuário eaplicações.
    • Linguagens de Web Semântica:-RDF: Pressuposto semântico (sujeito, predicado e objeto)-RDF Schema: Extensão Semântica da RDF, define classes e propriedades dos termos da RDF.-OWL: Pressupostos Semânticos independente do conteúdo (classes, subclasses, propriedade,domínio, escopo, cardinalidade, etc).Marcondes comenta sobre a proposta de dados abertos, o Linked Open Data (Dados AbertosInterligados). São links semânticos e abertos que substituiriam os links tradicionais, do campo856 do Marc. A grande questão dos dados abertos, da web semântica, é poder reutilizar osdados. A Europeana utiliza Linked Data por RDF. A Web semântica, por meio dos dadosinterligados, incentiva o reuso da informação em outros contextos. Se pagarmos a obra DomCasmurro do catálogo de uma biblioteca, por exemplo, esta poderia estar ligada à minissérie“Capitu” da Rede Globo no Youtube, à definição de Capitu no Wikipedia, à biografia deMachado de Assis e vice-versa, o Youtube, Wikipedia e a biografia estariam ligados aocatálogo da biblioteca, seriam mais caminhos para se chegar aos conteúdos das bibliotecas.Recomendação da Lívia: Leitura do artigo “The Strongest Link: Libraries and Linked Data”http://www.dlib.org/dlib/november10/byrne/11byrne.htmlMarcondes sugere para conhecimento o VIAF (The Virtual International Authority File), quedesenvolve em conjuto com várias bibliotecas do mundo um catálogo de autoridadesmantido pela OCLC. O obejtivo unir em um único catálogo virtual vários catálogos nacionaisde autoridades. O VIAF iniciou apenas com pontos de acesso para pessoas, mas cobre hojetambém entidades coletivas, obras, expressões e nomes geográficos.Teste feito por Lívia: ao digitar no campo de busca o nome que deseja, o sistema retorna aficha com URL ou link permanente deste nome. Abaixo segue resultado da pesquisarealizada para Machado de Assis, vale mencionar que não há ainda nenhuma bibliotecabrasileira envolvida no projeto.Marcondes também menciona diversos vocabulários que já são utilizados:- DublinCore: namespace- Europeana: namespace- FRBR: namespace- OWL: namespace06/07 Repositórios institucionais como estratégia para o acesso livre ao conhecimento porProfa. Simone WitzelWitzel começa a aula colocando duas soluções para problemas de acesso: domínio detecnologias e acesso livre. Ressalta alguns elementos do novo modelo (acesso aberto):- Metadados (DublinCore), compatibilização com MARC21, Mods e Mets- Protocolo OAT-PMH (livre), que substitui o Z39.50 (pago)- Provedores de dados: acervos de metadados (uso do protocolo OAI-PMH parainteroperabilidade e DSpace para expor seus dados)
    • - Provedores de serviços: coletores de metadados (catálogos coletivos)- Convivência com modelo anterior, baseado em bases de dados comerciais, hospedeiros, etc.Segue falando sobre o modelo OAI (Open Archives Initiative):- Reconstrução de práticas e processos de comunicação- Auto-arquivamento (disseminação)- Revisão pelos pares (fidedignidade)- Interoperabilidade (acessibilidade)Os provedores de dados são as instituições que criam os metadados e possuem osdocumentos. Os provedores de serviços podem ser: OAISTER, OASIS BR (IBICT), Metalis,DLHarvest, Homes, etc. O software mais utilizado para provedores de serviços é OpenHarvester Systems (PKP).Witzel cometa que o IBICT dá treinamentos de DSpace. E segue falando sobre o ranking derepositórios na web, em 2010 a USP estava no 40o lugar, este ano pulou para 8o.Menciona o projeto Diadorim do IBICT, um serviço de informações relativas às autorizaçõesconcedidas para o armazenamento e o acesso dos artigos das revistas brasileiras emrepositórios digitais de acesso aberto.Por fim, menciona os instrumentos avançados relacionados a repositórios:- DOI- LemonX- Sword- RICCA- Creative Commons- Lockss06/07 Armazenagem Digital: O centro de processamento de dados da Biblioteca Nacional eVista ao Data Center da BN por Prof. Geraldo Chaves JúniorO Data Center da BN é um projeto em parceria com o BNDES, a HP e a AcecoTI, que visasalvaguardar, preservar e dar acesso ao acervo de 8 terabytes de arquivos digitais empermanente crescimento. Está em construção a sala segura à prova de incêndio, inundação,terremotos, roubo, falta de energia e falta de climatização, possui controle de acesso,certificações nacionais e internacionais.Os equipamentos a serem instalados comportam 500 terabytes iniciais, cloud computing HPCloud system Matrix. Servidores Blade HP. HP 3PAR storages e será possível crescer até 2petabytes. Suits de 10 GB conexões por fibra ótica. Trata-se do primeiro Data Center da áreacultural na América Latina e a previsão é já esteja funcionando em setembro. Com este DataCenter a BN quer alavancar parceiros para agregar conteúdo às suas coleções oferecendo adigitalização e armazenamento. Lívia Lopes Garcia 15/07/2012