História e Cultura na Web: os restos digitais das ferramentas de buscas do Brasil

maio 9, 2014 § Deixe um comentário

Neste arquivo estão reunidas páginas das principais ferramentas de buscas brasileiras entre  os anos de 1997 e 2013. Trata-se de uma coleção digital constituída com o material do Internet Archive, o principal arquivo de páginas criado em 1996 por Brewster Khayle a partir dos dados da Alexa.com. O Internet Archive permite um livre acesso ao público, mas o seu modo de arquivamento dos dados (WARC) ea ferramenta de busca que disponibiliza (Way Back Machine) exigem que se conheça o endereço eletrônico exato de um site para que se possa pesquisá-lo. O Acervo digital das principais ferramentas de busca brasileiras para História e Cultura (1997 a 2003), assim como outras coleções digitais criadas com o apoio com o Internet Archive, torna possível um acesso aos dados através da busca por palavras. Desse modo, o arquivo disponibiliza uma série de informações que podem ser utilizadas por qualquer pesquisador interessado nos fragmentos da história da internet no Brasil, em especial na atuação das ferramentas de busca antes da chamada Era Google [1].

Em busca das buscas passadas ou qual é o escopo da coleção?

É até possível imaginar um sistema de emulação das interfaces tecnológicas do passado recente da internet onde fosse possível imaginar os resultados de determinadas buscas, digamos, há uma década atrás. Este, porém, seria um projeto de fôlego, envolvendo todo um aparato tecnológico e equipe especializada.  A nossa massa de dados sobre as histórias das ferramentas de busca é bem mais modesta. A intenção foi criar uma coleção que possibilitasse uma investigação das ferramentas de busca brasileiras em seus primeiros desenvolvimentos, focando especialmente no modo como estas ferramentas davam acesso a conteúdos relacionados à história e à cultura. Nos 1,5 Gb da coleção estão reunidas as páginas dos seguintes buscadores: cadê, todobr, yahoo, buscador uol e radix.

Como foi concebida a varredura a ser realizada pelo Internet Archive para a criação da coleção? Os pontos de partida (seeds) são as páginas iniciais de cada portal, que em si mesmas já oferecem uma quantidade relevante de informação sobre o estágio da web no final dos anos 1990. Em seguida, pesquisamos categorias aplicadas em cada buscador: cultura, educação, história, ciências humanas. Na segunda etapa, elaboramos uma listagem das categorias a serem buscadas pelos computadores e em todos os níveis de profundidade existentes no Internet Archive. Assim, cada link interno das categorias selecionadas deveria ser igualmente buscado e preservado. Porém, na maioria dos casos, só  foi possível apenas um nível interno [a cada categoria], pois a maioria dos in-links não estavam previamente arquivados no Internet Archive. Esse fato é constitutivo da materialidade da coleção e revela muito do processo de arquivar conteúdos na web, assim como os links quebrados, as colunas soltas, as imagens perdidas.

* *

Esta coleção é parte do projeto de pesquisa de doutorado  “Entre a narrativa e o banco de dados: criptografias da memória em arquivos nascidos digitais” de Camila Guimarães Dantas,  orientado pela Prof. Dr. Vera Dodebei, vinculado ao Programa de Pós-Graduação em Memória Social (UNIRIO). O projeto investiga as possíveis mudanças e também as continuidades nas práticas de preservação e acesso à memória social em dados nascidos digitais. A criação desta coleção significou mergulhar numa investigação sobre a materialidade dos registros em código binário. Os instantâneos dos primórdios da internet brasileira são vestígios de um sistema de classificação e podem revelar processos históricos por vezes esquecidos diante da proeminência das telas de buscas contemporâneas. Ao navegar pela coleção é possível perceber, por exemplo, um processo de desaparecimento dos diretórios e das classificações hierárquicas organizadas por pessoas, crescentemente substituídas pelas páginas com um visual clean – a popular caixa de buscas do Google. Criar a coleção é, assim, em certa medida, um gesto no sentido de desnaturalizar as telas do presente, chamando atenção para a historicidade das tecnologias a nossa volta[2].  Nossa pesquisa ainda está em fase de finalização e esperamos que a coleção (ainda por receber um tratamento visual) possa contribuir para a reflexão sobre as múltiplas operações da memória nos suportes digitais destes passados recentes.

 

[1] O grupo de pesquisa Society of the Query, do Intitute of Network Cultures disponibiliza uma lista de referências importantes para o estudo das ferramentas de busca.Destacamo os Reader, destacamos a seguinte obra: IPPOLITA [coletivo], The Dark Side of Google . Translator: Patrice Riemens. Editorial support: Miriam Rasch. Publisher: Institute of Network Cultures, Amsterdam 2013. ISBN: 978-90-818575-6-7. Disponível online: http://networkcultures.org/wpmu/query/resources/readImagemings/.

[2]Este gesto segue a trilha de alguns pesquisadores como Richard Rogers, coordenador do Digital Methods Initiative, que chama atenção para a necessidade de se estudar os objetos nascidos digitais a partir de sua dinâmica própria, dando outros usos as ferramentas e explicitando o processo histórico. Ver, ROGERS, R.. Digital methods. MA: The MIT Press, 2013.

Anúncios

Marcado:, ,

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

O que é isso?

Você está lendo no momento História e Cultura na Web: os restos digitais das ferramentas de buscas do Brasil no o passado em bits.

Meta

%d blogueiros gostam disto: