Posts Tagged ‘ busca

Um exemplo de “documentação escolar”.

O trabalho de faculdade de Tomas Nilsson, é um exemplo de como um incontável número de trabalhos “escolares” são criados, nem sempre guardados e, pior, não compartilhados.  O de Tomas, conta a história de chapeuzinho vermelho. A frase mais que gasta sobre nossa época e o ” acúmulo de conhecimento” não seria possível, se dependermos dos conhecimentos contidos nos trabalhos escolares. Está claro que há, sim uma enorme preservação da documentação escolar: trabalhos são premiados, o youtube tem aproximadamente 4510 vídeos descritos com esses termos, mas isso não é nem de longe o possível. O Brasil está inserido na comunidade científica, onde os trabalhos “escolares” mais complexos, como monografias, dissertações e teses, são, em sua maioria, documentados, preservados e indexados em base de dados.

O patrimônio cultural dos bancos de dados.

Não há obra de arte, livro ou filme, que não possam serem incluídos numa coleção. Listar as coisas. A construção de um banco de dados, tem como primeiro passo, uma lista, ou coluna, de elementos. Depois, são adicionadas outras, que dirão as qualidades, atributos, estados e características do que se lista. Por exemplo, uma lista de livros sobre Análise do Discurso, teria que conter, além da primeira coluna, com digamos, o título, outras como autores, ano, e assim por diante. De início, percebe-se que a seleção do que vem depois do nome, não só é arbitrária, como também, digamos, discutível.

O ato de nomear e guardar, a prática da documentação, daqui para frente, neste contexto de uma cultura digital, não pode mais ser visto como algo para especialistas. Eles próprios, ao iniciarem esse movimento, anos atrás, pela compreensão social das informações, tratam de reconhecer que profissões que lidam com a informação, isto é, lidam com a produção cultural, são hoje em dia possíveis a parcelas cada vez maiores da população. A medida que vão sendo gerados mais e mais conteúdos digitais, maior o acesso e maior o acervo desses conteúdos.

Muitos desses acervos, para a memória do futuro, serão decisivos, embora ainda não sejam compreendidos como tal, Serão os bancos compostos por dados. Números, nomes, cores, meta tags.  Sua importância política é, desde já inestimável, visto que ao sistematizar dados sobre por exemplo, as concessões de comunicação social no Brasil, obtém-se um conjunto que permite que a população tome decisões embasadas no acúmulo de suas escolhas passadas.

Diferentes dos bancos de dados utilizados para coleções de objetos, uma coleção como o número de filmes vistos nos últimos vinte anos, vem se tornando tão importante quanto saber quais e onde estão os filmes produzidos nesse mesmo período.

Hoje, os cidadãos estadunidenses podem ter acesso à todas as agências governamentais, por ordem de decreto presidencial, em páginas na internet. Toda agência deve ter um website que contenha a sequência www.nome.gov/data. Isto é, um endereço padronizado de localização. Há também, oito princípios para que estes dados sejam plenamente acessíveis:

Os itens são propostos pelo projeto Open Government Data Principles. Toda informação governamental pública será considerada aberta se estiver nas seguintes condições:

1. Completa
Todos os dados devem ser disponibilizados de forma integral. A informação não está sujeita a restrições de privacidade, segurança ou limitações outras.
2. Primaria
Informações coletadas na fonte. Com o grau mias alto de granularidade, sem estar em formas agregadas ou modificadas.
3. Recente
A informação pública deve ser disponibilizada o mais rápido o possível para preservar seu valor de uso.
4. Acessível
A informação pública deve estar disponível para o maior número de pessoas e usos possíveis.
5. Processável por máquinas
A informação pública deve estar razoalvelmente estruturada para permitir a leitura por máquina.
6. Não-discriminatória
A informação pública deve ser acessível para qualquer pessoa, sem necessidade de registro prévio.
7. Não-proprietária
A informação pública é disponível num formato não controlado de forma proprietária.
8. Licença livre
A informação pública não deve estar submetida a qualquer direito autoral, copyright, patente, marca registrada ou secreta. Privacidade e restrições de segurnça em termos razoáveis serão permitidas.

Aqui no Brasil estamos indo na mesma direção, por caminhos diferentes.  O fato de que há iniciativas como a do LexML, ou  do Transparência Hack Day, mostram que a sociedade está amadurecendo suas formas de participação.  Assim, isto poderia ocorrer com todos os demais bens culturais públicos produzidos. Da mesma forma, outros tipos de informação estatística têm chamado a atenção pelo seu cada vez mais evidente valor. Pense nos números dos orçamentos dos ministérios, tribunais, câmaras e assembléias de todo o Brasil, neste período de vinte anos.

O valor dos dados tem garantido a prospecção de fatos históricos, como num mergulho aos arquivos sobre diversos assuntos: reforma agrária, direitos humanos, política partidária, movimentos sociais, educação, saúde…afora os arquivos mais óbvios culturalmente: os acervos das companhias de cimena, das rádios, televisões, bibliotecas particulares…

Um milhão de arquivos, XML e a transparência das leis.

GT LexML da Comunidade TI Controle, é um grupo de trabalho que reúne vários órgãos do governo federal é um projeto que tem indexados um milhão de arquivos de toda Legislação brasileira. Reunir para consulta um número como esse de documentos em papel, é simplesmente impossível. Por isso, muitas pessoas, a maioria, também simplesmente também não procura seus direitos, que assim como seus deveres, deveriam estar legalmente garantidos em algum lugar da miríade de textos jurídicos.

O acesso à lei das pessoas com menor poder aquisitivo é algo que, perversamente, afasta a justiça de quem menos tem recursos para buscá-la. No portal de buscas tornou-se possível, por exemplo, saber o que já foi proposto, aprovado, ou arquivado sobre a digitalização no Brasil, nesse link. Buscando essa palavra, ou “entrada” para usar o vocabulário mais técnico, descobri que existiu, 1974, a DIGIBRÁS, que hoje se transformou em outra coisa.

clique para ir ao LexML!

clique para ir ao LexML!

O poder do XML, ou xemelê, que também tem um grupo aqui no Fórum da Cultura Digital Brasileira, está, aos poucos, mostrando que organizar, nem sempre é prender, ser rígido. A estruturação de informações, graças a esse protocolo, presta um serviço enorme e, tomara, sirva de exemplo de como é possível realizar o que disse num post anterior:

“A variedade de ações, objetos, políticas, conteúdos, padrões, acervos, propósitos, públicos, legislações entre muitos outros aspectos que constituem e interligam esse sistema é imensa. Do mesmo tamanho, são as realidades da Comunicação, da Ciência e Tecnologia e da Educação, para ficar na esfera do Governo Federal. Soma-se a essas estruturas, outros elementos, como os econômicos, os jurídicos, e os legislativos. Esse quadro complexo, todo ele, pode ser unificado (e não necessariamente de forma centralizada) pela tecnologia Digital.”

Iniciativas como essa, e outras como a do processo colaborativo de discussão e formulação de um marco civil para a Internet brasileira, também esta uma ação interministerial, penso, mostram que caminho está aberto. Não quer dizer que já chegamos, nem que todos vão, mas sim que vamos adiante.

As sociedades e a busca da informação crítica.

Society of the Query conference

Cartaz da Conferência Society of the Query

Muito legal o tema da conferência (dica do efeefe, aqui do Fórum) que vai ocorrer dias 13 e 14 de novembro, em Amsterdam, Holanda. O encontro coloca uma questão muito pertinente, por sinal,  a esse Fórum de Cultura Digital.  Procurar, buscar apenas, ou questionar?  Em termos de fontes confiáveis, essa é uma questão política e tecnológica, o que, em termos antropológicos, é a mesma coisa.

O encontro tem a proposta de discutir os seguintes assuntos:

  • Como a idéia de “máquinas inteligentes” influencia campos do saber que têm a “organização do conhecimento” como área?
  • Como os aspectos jurídicos, legais, estão dispostos nessas configurações tecnológicas?
  • O que fazer com a ubiquidade do Google? Estaria esta empresa afetando os modos como o conhecimento se distribui, bem como as práticas culturais?
  • Há um papel hegemônico na atuação dessas empresas? Não apenas o Google, mas o Bing ( Yahoo/ Microsoft) e outras? Estariam elas alterando os fluxos culturais, como no caso dos saberes tradicionais que não estão na internet? Como seria uma regulação desse fluxo?
  • Levando em conta os avanços trabalhos com arte e design da informação, como obter interfaces mias sofisticadas, mais centradas na usabilidade? Como melhorar as formas de apresentar os resultados?
  • Quais são as alternativas existentes, em software, em redes e, para o usuário, que desafiam os atuais paradigmas ( ou paradogmas, heheh) existentes…

Os temas da Conferência

  • Sociedades de busca
  • Direitos Civis Digitais e Estudo Crítico da Mídia.
  • Buscas Alternativas
  • A “Googlelização” de tudo
  • Arte e Máquinas

Mais na página do evento com outras informações.

O legal disso tudo, é que há uma variedade de sites que se dedicam a discutir isso de vários pontos de vista: de negócios, de publicidade, de Cência da Informação…sinal de que a web é pervasiva. Aqui, por exemplo, uma lista bem legal dos “sites de busca” que já existiram (existe uma lista em português, mas não tão atualizada).

Novamente, o assunto meta tags, em evidência. Indexação e informação. E e ai, na cultura Digital quem diz o que é um documento?