Indexação automática de conteúdos: até onde?
Grande parte dos produtores culturais dá importância à realização e a exibição. Nos editais de produção, raramente se vê menção sobre aspectos de preservação para fins de acervo. Os filmes realizados com financiamento público têm a obrigação de uma cópia legal na Ancine. Mas esta cópia legal não se extende para outras fontes de financiamento. Embora sejam duas etapas fundamentais que têm sido incrementadas em termos de produção cultural, a realização e exibição (para não mencionar a distribuição) não garantem a preservação do que foi feito. Acontece que, não é de hoje, que a realidade da documentação é desconhecida. Segundo este artigo aqui, até 1940, grande parte do patrimônio audiovisual se foi. Em compensação, a maior parte do que foi produzido desde então, está em condições não calamitosas, como a primeira parte do material.
Um dos motivos, talvez nem dos maiores, seja o fato de que é muito mais fácil capturar o registro do que descrevê-lo. O que acontece então é que existem milhões de imagens, de textos, musicas, videos, filmes, ou seja, milhões de horas sem descrição. Para isso, já foram tentados vários métodos de descrição automática. O mais recente deles é por meio de uma automação contraste da imagem digital. De maneira bem básica, começa ser possível fazer buscas em áudio, vídeo e texto, sem necessariamente esse material ter sido tratado, em termos humanos de informação.
Estas são imagens que ajudam a pensar a questão:
Inicialmente, as informações eram pensadas em relação aos seus suportes, então, fazia sentido produzir primeiro, e indexar depois…

Com o tempo, ou seja, com a digitalização dos conteúdos, a informação, e sua documentação se alteraram:

Quando temos um acervo de fitas de vídeo, de livros, de moedas, de ossos, de partituras, balas de canhão, potes de barro, quadros, animais empalhados…Enfim tudo que um museu como o Histórico Nacional, ou qualquer museu estadual tem, em maior ou menor grau, como indexar isso?
Como as tecnologias digitais os meios de produção cultural, várias soluções são pensadas em diversos lugares, mas, entretanto, estas não se vêem como tendo relação com outras. Por exemplo, os acervos de instituições como as televisões: públicas e privadas, não se vêem na obrigação de igualar seus bancos de dados com os da biblioteca nacional. A BN, por sua vez, não tem acesso aos bancos de dados dos museus… Assim, não há uma base de dados sobre o que se contém nos computadores desses museus, centros de cultura, institutos, fundações. Novamente, o tamanho do patrimônio brasileiro em terabytes.Todos estes são uns para os outros, e para o público em geral, estanques.