Preservação da Web pela Library of Congress com o LCWA / Minerva – Análise

fevereiro 13, 2010 alexdasilveira 2 comentários

Dando seqüencia as análises dos arquivos da web mundiais (o primeiro que analisamos foi o UK Web Archive da Biblioteca Britânica)  iremos neste tópico abordar o Library of Congress Web Archives (LCWA) também conhecido como Minerva.

Antes da análise em si é necessário entendermos o contexto deste arquivo para abordarmos sua função, seu objetivo. O LCWA pertence a principal biblioteca de um país que foi o pioneiro em arquivamento da web com o Wayback Machine Internet Archive que já faz coletas regulares desde 1996, de forma exaustiva (todo tipo de website é coletado) e não apenas concentrada no conteúdo estado-unidense, de um único país, como ocorre com mais diversos arquivos da web existentes. Neste contexto de pioneirismo de um “concorrente” em um mesmo país que a Library of Congress criou seu arquivo da web que deveria se destacar de outra forma que não fosse pela exaustividade, assim observa-se que esta optou pela qualidade em determinados temas.

O LCWA de certa forma parece um recorte da Web para DETERMINADOS temas históricos, considerados relevantes, e Apresentados em sua página inicial.

São, atualmente, disponibilizadas 13 coleções temáticas de fatos históricos importantes para os EUA (como eleições e guerras) e para o mundo (como a transição do Papa).

Mas a limitação em arquivamento de poucos temas do LCWA permitiu que este especializasse nos mesmos apresentando conteúdos que não estão presentes nos demais arquivos da web.

O primeiro destaque a ser percebido aparece logo após a escolha de um tema para a pesquisa. O LCWA ao invés de apresentar apenas as páginas relacionadas a uma determinada coleção também se preocupa com o histórico temático, apresentando um breve resumo sobre a coleção. Na imagem abaixo, segue a tela capturada após a escolha da coleção Guerra do Iraque 2003.

Outra diferença entre o LCWA e os demais arquivos da web está no refinamento do mecanismo de busca que permite a recuperação específica por nome, título, assunto, resumo, ano de captura e outras características como país de publicação conforme a coleção escolhida. Se o LCWA não é exaustivo em relação a web como um todo, pode-se dizer que ele tem esta característica em relação ao conteúdo temático de suas coleções, o que torna necessário o refinamento dos recursos de consulta.

A Consulta também pode ocorrer através de listagens por nome, título ou assunto, contudo, em determinados temas, como o histórico dia 11 de setembro, há um refinamento maior arrolando categorias como nome do produtor do site, tipo de produtor e país produtor.

Ao usar a coleção 11 de setembro como exemplo para a análise e escolher na listagem de países produtores do conteúdo o Brasil obteve-se uma lista com nome dos produtores seu tipo, país e linguagem, onde é possível não só acessar todo o conteúdo arquivado de “Folha online”, por exemplo, mas também saber que este é um site do tipo “imprensa”.

Ao escolher um produtor pode-se observar mais uma característica de detalhamento do conteúdo pelo LCWA com a exibição de uma catalogação do website apresentado dados como: título, título alternativo, nome, resumo, assunto, língua, gênero, url e coleção.  Esta é uma característica interessante deste arquivo da web, pois agrega valor ao produto analisado e permite que o usuário tenha informações sobre a confiabilidade do conteúdo daquele website. Com isto pode-se dizer que o LCWA seja o principal arquivo da web confiável com fins históricos nos temas em que propõe preservar.

No decorrer da consulta o LCWA apresenta-se idêntico ao Internet Archive com uma listagem das capturas realizadas do website escolhido por data. Pode-se perceber também um desempenho superior ao Internet Archive (mas inferior ao UK Web Archive) em relação ao arquivamento de um maior grupo de aspectos do website assim como no tempo em que a página demora para carregar por completo.

Nota-se também, na parte superior da página, uma barra inserida pelo LCWA que permite a navegação entre as capturas daquele website, como ocorre com o UK Web Archive.

Outra diferença entre o LCWA e os demais arquivos da web é que não há a preocupação em tornar todos os links de uma página ativos, ou seja, todo o conteúdo de uma captura preservado. Isto ocorre pela característica temática deste arquivo, onde só há a garantia de acesso ao conteúdo do website relacionado as coleções do LCWA.

A delimitação de conteúdo torna os critérios de seleção um dos aspectos mais importantes do LCWA. Os critérios podem ser acessários pelo link http://www.loc.gov/acq/devpol/webarchive.pdf .  O que se nota no LCWA é uma maior intervenção humana se comparado aos demais arquivos da web o que torna o conteúdo limitado, porém, com maior qualidade dentro de seus propósitos.




Artigos relacionados (leia também):

  1. Memória da web: o caso da British Library com o UK Web Archive
  2. A Preservação da publicidade online através do conceito de arquivamento da web
  3. A perda da memória ou a preservação digital
  4. Buraco Negro – Web pode “devorar” história mundial
  5. ARQUIVAMENTO DA WEB, WEBJORNAIS,REDES SOCIAIS E HISTÓRIA

, , , , , , , , ARQUIVAMENTO DA WEB

2 comentários → “Preservação da Web pela Library of Congress com o LCWA / Minerva – Análise”

Comente!

Blog WebMastered by All in One Webmaster.