O Arquivo Público do Estado de São Paulo é hoje um dos maiores arquivos públicos brasileiros. Destaca-se pela grande variedade de seu acervo: jornais diários, revistas, bibliotecas pessoais, acervos de órgãos jurídicos, documentos administrativos de órgãos estaduais, fotografias etc. Além de variado, o acervo é enorme. Tão grande que um novo prédio está sendo

Centro de atendimento

construído ao lado do atual, com o objetivo também de abrigar coleções e acervos que foram repassados para a tutela do Arquivo, além de oferecer condições adequadas para o armazenamento de diferentes tipos de materiais – livros, jornais, negativos etc. Atualmente, conta com um centro de atendimento ao público, que permite a consulta de 30 pessoas. No futuro prédio, há espaço previsto para 130 pessoas, acrescido de duas salas para atendimento coletivo.

Historicamente, o principal público atendido foi o acadêmico. No entanto, uma vez que o Estado tem a posse de documentos que compõe a memória pública, é seu dever realizar a devolução para o grande público, seja ele qual for e quaisquer forem seus interesses. O fato de ter sempre servido principalmente à pesquisa não é incompatível com a perspectiva de uma ampliação dos públicos. Assim, a digitalização insere-se numa perspectiva ações sistemáticas para a expansão do foco do Arquivo.

A digitalização do acervo, embora venha sendo feita desde 2000, só foi sistematizada em 2008. Segundo Lauro Ávila, diretor do departamento de Preservação e Difusão de Acervo do Arquivo Público do Estado de São Paulo, não existem ainda parâmetros e resoluções governamentais para a realização desse tipo de trabalho. Cita o exemplo do BNDES, que oferece linhas de financiamento para preservação, mas não para digitalização, justamente por não saber o órgão quais as regras que deveriam balizar iniciativas como essa.

No arquivo, a digitalização vem sendo feita sem prescindir das técnicas analógicas de preservação. “Até agora, a única mídia digital que permanece é o HD”, afirma Lauro. Justamente por isso, a política de preservação de grande parte dos documentos é feita por meio de sua microfilmagem. O caso dos jornais é ilustrativo, já que o papel em que é impresso possui durabilidade muito baixa. Sendo assim, cada exemplar é microfilmado, sendo produzida uma matriz, de primeira geração. É feita uma cópia em prata, de segunda geração, e se guarda a matriz em outro local, fora das dependências do Arquivo. A partir da segunda, são feitas cópias para consulta do público em amônia/diaso, a chamada “cópia de terceira geração”. Com o processo de digitalização, essa última etapa vem sendo substituída pelo arquivo digital. Não se abandona a microfilmagem, que resta como backup persistente, num processo que possui uma durabilidade de séculos.

Tratamento dos negativos do jornal Última Hora

Higienização e novos envelopes para os negativos

Já no caso das fotografias, o processo de digitalização do jornal Última Hora vem sendo feito em paralelo à higienização dos negativos, catalogação e acondicionamento em novas cartelas, com papel neutro e em ambiente climatizado. Todos os escritos das embalagens antigas são transcritos para as novas, adicionados de um número de índice – seu código no banco de dados. A partir de então, o negativo físico é guardado já sob nova organização. No novo prédio, diferentes salas armazenarão cada material, cada qual com a climatização adequada – ex: negativos de diferentes naturezas requerem distintas temperaturas. Os negativos são agrupados por “missões”, ou saídas. O passo seguinte é o preenchimento dos metadados: todas as informações existentes nos envelopes originais são repassadas ao metadado da “missão”, juntamente com a data, nome do/a fotógrafo/a e outras informações adicionais; o preenchimento é feito em lote pelo software Adobe Bridge, que grava o metadado no formato XMP.

Atualmente, os arquivos digitais são disponibilizados por meio de coleções no seu site http://www.arquivoestado.sp.gov.br/ e por meio de acesso local, na central de atendimento ao público do Arquivo. No entanto, está em andamento um projeto de integração de todas os bancos em uma única base de dados, cujo desenvolvimento é realizado internamente pela equipe de informática do Arquivo. Os sistemas para consulta local são feitos em Visual Basic e Microsoft SQL Server, enquanto os serviços web são feitos em PHP e MySQL. A saída do conteúdo é feita nos formatos Jpeg e PDFa – versão atualizada que se propõe como atualização do formato PDF. Os arquivos oferecidos possuem resolução de 150 dpi, mas são mantidas versões de resolução maior (300 dpi) internamente.

As pesquisas com OCR estão ainda em fase experimental. Foi feita uma experiência com fichas do Departamento de Comunicação Social da Polícia Civil, órgão que sucedeu o antigo DOPS e funcionou até 1999. Os arquivos tiveram sua abertura ao público autorizada no final de março de 2010; para que fosse possível sua disponibilização de forma rápida, foi feito o reconhecimento de caracteres por meio de OCR, o que permitiria a busca de informações por texto. Pelo fato de serem fichas datilografadas, a taxa de acerto foi considerada alta – entre 80 e 95% -, obtida sem treinamento da ferramenta. O software utilizado foi o Abbyy Fine Reader.

Tags: , , , ,