Para diretor de projetos da Wikimedia alemã e membro do Comitê de Comunicação da Wikimedia Foundation, Mathias Schindler, “A Wikipedia é um lugar fantástico para começar uma pesquisa, mas péssimo para finalizá-la”.  A declaração foi feita na primeira mesa de discussão do Simpósio Internacional de Políticas Públicas para Acervos Digitais para explicar o papel da maior enciclopédia do mundo, atualmente com mais de 6 milhões de verbetes. “É este sentido de ponto de partida – que pressupõe a adoção de procedimentos livres, protocolos abertos e intenções não comerciais – que norteia o trabalho das grandes experiências de digitalização de bibliotecas pelo mundo”, complementa.

Duas delas – Gallica (França) e Brasiliana USP (Brasil) – mais a Wikimedia Foundation foram apresentadas na palestra. Veja os principais pontos levantados por cada palestrante:

============

MATHIAS SCHINDLER
Wikimedia Foundation/Alemanha
mathias.schindler@wikimedia.de
Twitter: @presroi

– O site http://commons.wikimedia.org é um repositório de arquivos de mídia, com 6 milhões de itens catalogados colaborativamente (entre imagens, áudio e vídeo)

– A Wikimedia desenvolveu um software para auxiliar os usuários na classificação com metadados, uma das principais questões hoje na digitalização de acervos (afinal, como indexar e tornar o conteúdo da internet encontrável?)

– Schindler defende que todo o conteúdo subido para a Wikipedia ou qualquer outro banco de dados aberto tenha liberação total de direitos autorais, inclusive para uso comercial. “É insignificante a quantidade de gente que vai utilizar o material com fins lucrativos perto dos que vão aproveitar para outros propósitos.”

– A própria questão do “uso comercial” não é consensual, diz Schindler. Quando se diz isso, fala-se sobre lucro direto sobre o conteúdo ou indireto (publicidade)? Dá para dizer que publicidade é um uso comercial? É muito fácil violar cláusulas a favor de licenças comerciais. Então, diz Schindler, tirem qualquer restrição à distribuição do material. Seria mais justo e simples – pensando também em quem não tem acesso à rede (e teria acesso em publicações vendidas em banca, por exemplo).

– Sim, a Wikipedia (e a Wikimedia) tem um departamento jurídico BEM grande em São Francisco (EUA) – ele responde a uma pergunta do auditório.

– A Wikimedia sobrevive de doações institucionais grandes e pequenas, de pessoas físicas. É assim, colaborativamente, que tem se mantido.

– Leia entrevista com Mathias Schindler

=======

FRÉDERIC MARTIN
Gallica/França
Twitter: @FredericDMartin

– Uma curiosidade sobre a Gallica. O projeto que deu origem a ela em 1997 remonta a François Miterrand, em 1989, quando anunciou a criação de uma biblioteca “de um tipo completamente novo”.

– Números da Gallica:

90 mil livros digitalizados em 2007 (35 mil em 1997)

60 mil imagens em 2007 (10 mil em 1997)

2008 – digitalização em massa de 100 mil volumes por ano (fac-símile + OCR)

2010 – digitalização em massa de outros materiais (imagens, manuscritos, mapas)

hoje tem mais de 1 milhão de documentos para consulta online

14.400 documentos de bibliotecas parceiras estão indexados na Gallica

os órgãos da imprensa francesa são digitalizados diariamente – e não retroativamente

– A Gallica adotou um padrão de digitalização que, entre os metadados, adota uma folha de rosto padrão para os documentos, com o mesmo estilo de texto e informações

– Uma medida controversa e nova tomada pela Gallica foi a aproximação com a indústria editorial. Estão indexados na biblioteca pública francesa livros à venda em livrarias, com links para compra em lojas online e físicas. Diz Martin: “Também papel do Estado fomentar a indústria editorial do país, com o interesse de promover hábitos de leitura”. A Gallica não ganha nada com isso – e nem deve, segundo ele, apesar de alguém do auditório ter sugerido que o acordo com livrarias poderia gerar renda e tornar a biblioteca mais sustentável.

– A Gallica procura se espalhar pelas redes sociais (Twitter, Netvibes, Facebook) para chegar aos usuários. Também usa plataformas de compartilhamento como o Scribd, o Isuu e a própria Wikimedia Commons. Por isso, procura também desenvolver interoperabilidade com outros serviços web e APIs

======

PEDRO PUNTONI
Brasiliana/Brasil
Twitter: @puntoni

– A Brasiliana, na condição de projeto de universidade pública também compromissada com ensino e pesquisa, vai disponibilizar em setembro, no próximo Seminário Mindlin, toda a documentação técnica do projeto, desenvolvido com softwares livre, para ser usada como modelo de digitalização de acervos em outros projetos pelo país. “Queremos plantar uma semente bem grande para dela crescer uma árvore que crie sombra, que seja de fato útil”, disse Puntoni.

– Está na hora, segundo o professor da USP, de definir padrões, métodos e cuidados para o crescimento bem orientado de bibliotecas digitais. “É um momento muito preciso do encontro do barateamento das novas tecnologias de digitalização (que já são antigas) e dos acervos não digitalizados.”

– A Brasiliana é também um projeto de pesquisa financiado pela Fapesp. É uma investigação sobre ciência da informação, que será finalizada em setembro.

– Eles escolheram uma máquina que digitaliza livros encadernados tendo em vista o tipo de acervo que se quer preservar. Outra opção seria comprar scanners poderosos, mas seria preciso desfazer a encadernação, cortar os originais. “Temos apego e queremos preservar o objeto-livro”, diz Puntoni, citando o bibliófilo José Mindlin, cujo acervo deu origem à Brasiliana.

– Princípios da Brasiliana:

. A biblioteca é vista como um instrumento de política de produção de conteúdo para a internet. “É preciso povoar a rede mundial com conteúdos da língua portuguesa e da cultura brasileira.”

. Difusão de uma coleção original. “É preciso que a população demande essas bibliotecas. Não é só oferta.”

. Orientação para o contexto do usuário. Busca-se uma visão polissêmica em que o usuário é central. Daí a preocupação com interoperabilidade, interface, desenho. “Foi imperativo iniciar o projeto colocando a biblioteca digital online.” Usuários têm dois canais para colaborar: e-mail e comentários no blog da Brasiliana.

. Biblioteca como instrumento de educação. São produzidos textos de apresentação de cada obra, tentando contextualizar os documentos digitalizados. Também aqui a preocupação com metadados e com customização: se um livro tem mapas ou imagens, por exemplo, elas são oferecidas separadamente, em alta definição, para download. “As imagens podem servir pra um professor preparar uma aula ou pra um aluno usar em um trabalho, por exemplo.”

. Biblioteca digital pública, com compromisso de difusão do acervo e protocolo para garantir interoperabilidade. É da natureza da Brasiliana a abertura e reprodução da experiência em outras instituições, com softwares livres

– Uma frase de Puntoni: “É preciso reproduzir documentos para poder preservá-los”

– A Brasiliana pede que não se faça uso comercial sem autorização da universidade, diferentemente do que pensa a Wikimedia. “Somos uma universidade, um patrimônio público. É um imbróglio legal que interessa discutir.”

– Puntoni tem sérias críticas ao modelo do Google Books, que já tem 12 milhões de itens online, um acervo realmente gigante e promissor. O problema, para ele, é a construção sobre segredos industriais não compartilhados com a lógica da internet. Como é feito o ranking do motor de busca?Para o indexador do Google, vale mais o número de vezes que uma palavra é citada em uma página do que a relevância contextual do livro. Os metadados são feitos de forma semi-automatizada, por computadores, um jeito “terrível”, segundo Puntoni. “O objeto-livro é um construção de anos e anos, de uma ciência, a biblioteconomia, com séculos e séculos de estudo. Não pode desrespeitar assim.”

=====

Fotos by Coletivo Garapa, para download no Flickr da FLi Multimídia

Tags: , , , , , , , ,