Grande parte dos arquivos digitalizados por instituições públicas brasileiras estão disponibilizados em formatos privados como jpeg, tiff, mpeg 4, avi e pdf. A constatação, presente num estudo feito pela FLi Multimídia para a Rede Nacional de Ensino e Pesquisa, levanta uma questão importante: como garantir a disponibilização desses conteúdos gratuitamente, da maneira como é feita hoje, daqui cinco, dez ou 20 anos? Os chamados formatos proprietários são aqueles pertencentes a uma empresa, normalmente com fins lucrativos e que vive da venda de seus softwares, como a Adobe, desenvolvedora do pdf, formato utilizado pela Biblioteca Digital Brasiliana e pelo Domínio Público, bons exemplos de acervos digitais no país.
Do outro lado, os padrões e formatos abertos têm as especificações de como armazenam as informações de forma pública, estão livre de royalties, não favorecem nenhum implementador e podem ainda servir de base para o desenvolvimento de outros padrões e softwares. “Isso também significa que podem ser acessados de qualquer software e sistema operacional”, explica o engenheiro eletrônico e especialista em padrões Jomar Silva.
Alguns formatos costumam causar confusão em relação à sua natureza, como é o caso do pdf. Em 2005, o ISO, Organização Internacional de Normalização, estabeleceu como norma uma versão chamada pdf/a, determinando-a como padrão aberto e garantindo o seu uso livre de patentes para sempre. O formato livre, no entanto, é baseado numa versão antiga do pdf, a 1.4, de 2001. Arquivos .pdf baseados em versões superiores seguem as definições de licença da Adobe.
São esses documentos concedidos pelos fabricantes e válidos por um tempo determinado que liberam o acesso gratuito ou não aos formatos. Passado os anos especificados na licença, ela pode ser renovada com outro caráter. Um exemplo disso é o caso do gif, formato de imagem lançado na década de 80 para uso livre, que teve o licenciamento alterado em 1999 pela Unisys, detentora da patente. A nova licença previa o pagamento de royalties que variavam de 5 mil a 7,5 mil dólares, causando na época grande polêmica e consequente diminuição na sua adesão.
O problema do uso de padrões e softwares proprietários quando se fala em acervos públicos vai além do custo hipotético. “Deixar informações em formatos fechados é o mesmo que colocá-las numa sala trancada, dependendo de alguém com a chave da porta para abri-la”, explica o ativista do movimento Software Livre VJ Pixel. “No padrão proprietário apenas a empresa fabricante tem a especificação de como a informação é armazenada”, complementa Jomar.
A justificativas das instituições para a adoção desses formatos é a popularidade. O usuário já está familiarizado a baixar e ler textos em pdf, manipular imagens em jpg e assim por diante e costuma ter em sua máquina os plugins e codecs necessários para acessar os formatos.
Software livre como política pública
A autonomia, o não pagamento de licenças, a apropriação dos conteúdos pela sociedade e a garantia de disponibilização das informações aos cidadãos são algumas das vantagens do uso de software livre na digitalização do patrimônio nacional. Ainda não existe no Brasil uma determinação de padrões para esses processos, mas tudo indica que as diretrizes do governo para adoção de formatos livres como política pública devem ser mantidas.
Essa é, inclusive, uma das discussões que estará presente no Simpósio Internacional de Políticas Públicas para Acervos Digitais, promovido pelo Ministério da Cultura, Biblioteca Digital Brasiliana USP e Casa da Cultura Digital, que acontece de 26 a 29 de abril, em São Paulo. O objetivo do evento é reunir experiências de diversos países na área para promover troca e reflexão sobre o processo e procurar desenhar uma política nacional de acesso a esse conhecimento.
É importante levar a questão dos formatos e padrões a quem estiver por lá. “Não adianta nada ter um documento disponível gratuitamente na internet se a população não puder ter acesso a ele”, alerta Jomar.
fabs 26 de abril
Jpeg também é considerado livre: http://www.faqs.org/faqs/jpeg-faq/part2/section-15.html
Gabriela Agustini 26 de abril
Oi Fabs, tudo bem? Obrigada pelo link. A questão do jpeg é controversa. Pelo o que consta, o formato tem uma série de patentes ocultas por trás. Compartilho com você, em breve, um link a respeito. Abs, Gabriela
Jomar Silva 27 de abril
@Fabs: Não confunda livre com aberto !
Padrão aberto é aquele que:
1. Foi desenvolvido através de um processo aberto e transparente
2. Sua especificação está disponível e acessível a qualquer interessado (e aqui falo de especificação e não de implementação = código fonte)
3. Sua utilização/implementação é livre de royalties
4. Não existe limitação à sua reutilização.
No caso do JPEG especificamente, existem ainda problemas pendentes com patentes (http://en.wikipedia.org/wiki/JPEG#Patent_issues) e dado o número de patentes submarino que existem hoje em dia, não vou me espantar se mais algumas surgirem nos próximos anos.
Por isso é que a utilização do formato PNG para armazenamento de imagens é mais adequada.
Vale a pena ainda lembrar que a ISO aceita como válido o licenciamento RAND de propriedade intelectual, e que este tipo de licenciamento é extremamente controverso e na minha opinião inaceitável para padrões abertos.
fabs 1 de maio
Oi Gabriela e Jomar, grata pelas respostas.
Jomar, agora eu fiquei intrigada: você está querendo dizer que o Jpeg é livre, mas não é aberto? Como algo pode ser livre sem ser aberto? Então na real ele é aberto, mas não é livre, é isso? Tô bem confusa com essas nomenclaturas…
Gabriela, não tem feed pros comentários?