Em agosto de 2008 o Google lançou um novo projeto de digitalização de arquivos históricos de jornais, que devem ser incorporados ao News Archive Search. O projeto de digitalização começou em 2006 com jornais como o New York Times e o Washington Post e agora o Google anuncia a intenção de ampliá-lo com a inclusão de muitos outros títulos. A proposta é ambiciosa: “We’re looking for all the world’s primary sources, and the older, the better” (em “About News Archive Search“), nada menos que isso. E parece que a pretensão é séria, pois em dezembro de 2008 foi anunciada a compra pelo Google da PaperOfRecord.com, uma empresa canadense especializada em digitalização de arquivos históricos de jornais de vários países.
O mecanismo de busca do News Archive Search é flexível, com diversas opções de pesquisa no modo “advanced“: por exemplo, frases, título da publicação, língua original e, talvez a mais interessante, o período da publicação. Assim é possível definir um intervalo de anos para a pesquisa. Outro recurso interessante é “show timeline”, que ordena cronologicamente referências sobre o assunto/nome encontradas na internet, incluindo um gráfico com a frequência das ocorrências por períodos.
Infelizmente, há uma limitação que frustará os historiadores: os arquivos do New York Times, Washington Post e outros são pagos, pay-per-view. Uma matéria do NYT, por exemplo, custa $3,95 (a menos, claro, que a instituição do pesquisador tenha a assinatura do arquivo do jornal). Embora a prometida inclusão futura de novos jornais e revistas possa amenizar o problema, essa é uma restrição que, hoje, limita bastante a utilidade da ferramenta do Google. Por exemplo, um teste com as palavras João Goulart, no período 1959-1965, revela 1.320 ocorrências com jornais pagos e abertos e apenas 98 quando é selecionada somente a opção de jornais abertos, com acesso livre.
Apesar das restrições, já em sua forma atual a nova ferramenta de busca do Google é uma notícia bem-vinda para os pesquisadores que consideram vital reconstituir o contexto das idéias, valores e práticas sociais na história.
[…] aos historiadores econômicos em matéria de fontes digitalizadas – ver também aqui e aqui. A dica é do Michel Marson, aluno do doutorado em Economia da FEA. Desta vez, a revista Conjuntura […]
[…] oportunidades sobre jornais digitalizados como fontes de pesquisa em história econômica (ver aqui e aqui). Além do Ultima Hora que foi digitalizado (parcialmente) pelo Arquivo Público do Estado […]
[…] conforme diz o site) e o Última Hora (ver outros posts sobre arquivos de jornais aqui, aqui e […]