Amostragem

Ao contrário do que muita gente pensa, os historiadores econômicos não enfrentam frequentemente o problema da chamada “falta de dados”. Com um pouco de engenhosidade e bastante trabalho de pesquisa, é quase sempre possível obter dados e fontes até sobre os temas mais complicados, ainda que para isso seja necessário mergulhar em diferentes arquivos em busca das informações. Às vezes, o problema pode ser até que o volume dos dados seja tão grande que torne difícil a conclusão de um projeto de pesquisa em, digamos, 3 ou 4 anos. Nesses casos, dependendo do tipo de informação com que se esteja lidando, é vantajoso recorrer à amostragem estatística para tornar um projeto viável.

Veja o exemplo hipotético de uma pesquisa com fichas de funcionários de uma empresa com milhares de empregados ao longo de dezenas de anos. Se cada ficha possuir várias informações sobre cada funcionário, talvez seja impossível que algum pesquisador, individualmente, disponha de tempo e recursos para armazenar milhares de fichas de funcionários em um banco de dados. Nesse caso, o pesquisador pode ter uma economia substancial de tempo e recursos se puder extrair uma amostra representativa das fichas do arquivo.

A abordagem mais comum é definir uma amostra aleatória, ou seja, uma que garanta que cada ficha possua a mesma chance de ser selecionada. A teoria de amostragem aleatória não é simples, e é necessário consultar inicialmente um bom livro de estatística. Tendo uma introdução ao tema, os historiadores podem adotar uma abordagem prática para o problema.

É preciso, em primeiro lugar, selecionar o tamanho da amostra de uma população finita, que é o caso do exemplo das fichas dos funcionários. Há fórmulas para isso, mas os historiadores podem utilizar programas on-line que calculem o tamanho da amostra de acordo com os critérios estatísticos estabelecidos quanto ao erro amostral. Um bom exemplo é o Raosoft Sample Size Calculator. Preenchendo a margem de erro e o intervalo de confiança desejados, além do tamanho da população que está sendo pesquisada (fichas, no caso), obtém-se o tamanho da amostra que será utilizada na pesquisa. Assim, por exemplo, se existirem 500 fichas relativas a um determinado ano, com uma margem de erro de 5% e intervalo de confiança de 95% a amostra a ser extraída será de 218 fichas.

Em segundo lugar, após a definição do tamanho da amostra, é preciso decidir como selecionar as fichas que farão parte da amostra aleatória. O primeiro passo é numerá-las de alguma forma, idealmente pela ordem da classificação original que eventualmente seja encontrada no arquivo. Se não houver tal classificação, será preciso numerar as fichas segundo algum critério, por exemplo na ordem alfabética dos funcionários. Depois disso, deve-se usar uma tabela de números aleatórios (encontrada em livros de estatística) para a escolha das fichas. Ou então, o que é bem mais prático, utilizar um programa online. Uma das melhores opções é o Research Randomizer. O programa é bem versátil e os campos a serem preenchidos são auto-explicativos. Basta definir a quantidade de números por conjunto (igual ao tamanho da amostra, 218 no exemplo acima), o intervalo da população (500, no exemplo) e que os números sejam selecionados apenas uma vez, gerando a série de números aleatórios correspondentes às fichas que devem ser escolhidas. Os (218) números selecionados no exercício com o exemplo anterior são reproduzidos abaixo (note que cada rodada selecionará números diferentes).  O resultado pode ser impresso ou transferido para uma planilha do excel, o que é muito conveniente para quem estiver trabalhando em arquivo.

Set #1:

396, 313, 213, 57, 466, 224, 192, 301, 50, 457, 123, 58, 60, 66, 357, 103, 463, 413, 28, 244, 242, 267, 386, 265, 488, 382, 125, 328, 324, 400, 106, 422, 320, 116, 12, 61, 268, 291, 451, 258, 101, 403, 388, 394, 132, 307, 419, 208, 100, 358, 19, 228, 74, 392, 408, 80, 207, 179, 282, 127, 349, 34, 186, 214, 47, 171, 135, 371, 2, 75, 97, 163, 474, 365, 248, 141, 327, 465, 24, 409, 351, 473, 174, 206, 225, 366, 122, 218, 184, 322, 415, 223, 38, 161, 111, 99, 165, 459, 3, 140, 405, 368, 52, 383, 96, 7, 144, 414, 121, 169, 283, 255, 448, 240, 180, 162, 253, 418, 152, 211, 151, 454, 182, 138, 166, 35, 137, 326, 288, 339, 292, 204, 20, 421, 231, 332, 210, 286, 285, 104, 159, 181, 395, 337, 183, 375, 77, 331, 233, 438, 107, 273, 495, 78, 84, 439, 498, 360, 429, 203, 334, 294, 496, 227, 91, 147, 356, 287, 13, 63, 425, 260, 345, 314, 330, 406, 164, 354, 83, 308, 155, 79, 450, 45, 391, 216, 194, 142, 212, 264, 173, 472, 88, 364, 126, 139, 4, 302, 222, 402, 11, 410, 98, 86, 23, 199, 338, 167, 22, 491, 187, 369, 90, 209, 298, 94, 469, 27

Um comentário em “Amostragem

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s