
Quando os investigadores pedem uma amostra representativa a nível nacional, querem dizer que a população de interesse é toda a população do país em questão e que a amostra deve refletir isso na sua estrutura.
Uma amostra nacionalmente representativa é um grupo de cidadãos que representa a totalidade de um país e é utilizada para realizar uma investigação que projecta algum resultado que reflicta a realidade nacional, como preferências de qualquer tipo, comportamentos ou perfis sociodemográficos.
Na melhor das hipóteses, a amostra representativa dará a impressão de ser a população total, independentemente da sua aparência. O número de homens e mulheres deve corresponder às proporções nacionais, a percentagem em cada grupo etário ou em cada região deve corresponder exatamente à população, etc. Nas medidas não demográficas (como a propriedade de produtos ou a segmentação psicográfica), a amostra deve corresponder à população.
Para o conseguir, a teoria requer uma amostra aleatória grande e uma taxa de resposta elevada para minimizar o erro sistemático e reduzir o risco de erros assistemáticos resultantes de enviesamento.
No “mundo real” dos inquéritos em linha, as taxas de resposta não são elevadas e as taxas de resposta diferenciadas por resultado demográfico em amostras aleatórias mais puras não representam a população (apesar de técnicas de estratificação sofisticadas). Por conseguinte, é típico, quando se realizam inquéritos, utilizar a amostragem por quotas. É 100% garantido que uma amostra por quotas se assemelha à população no que se refere às caraterísticas demográficas que escolhe como alvo. No entanto, tudo o resto está sujeito a erro de amostragem.
Vejamos o exemplo da idade: se as quotas forem fixadas entre 16 e 34 anos, 35 e 54 anos, ou mais de 55 anos, a amostra será representativa dentro destas proporções, mas se a análise for feita nas faixas etárias de 16 a 20 anos, 21 a 30 anos, 31 a 40 anos, etc., não há garantia de que a amostra continue a ser correta.
A medida em que o controlo de quotas é possível numa amostra depende da dimensão da amostra e dos dados de referência disponíveis num inquérito. Seis períodos etários, dois géneros e 15 regiões criam uma grelha de 180 células. Se a dimensão da amostra for apenas 100, não é possível preencher todas as células. Mesmo com uma amostra de maior dimensão, uma célula pode necessitar apenas de metade de uma pessoa, pelo que não terá os dados necessários.
Para tornar uma amostra mais representativa, pode ser utilizada a ponderação. Como alternativa às células interligadas, as células de quotas podem ser estruturadas de forma independente. A desvantagem neste caso é que podem existir grandes “lacunas” na amostra – se todos os jovens forem do sexo masculino, por exemplo, não será possível utilizar a ponderação para corrigir as lacunas.
Que variáveis devem ser utilizadas para obter uma amostra representativa a nível nacional?
Não há uma resposta definitiva, depende do objetivo da criação de um inquérito e da área geográfica. Por exemplo, podes utilizar a idade, o sexo, a região e a classe social no Reino Unido; a idade, o sexo, a região e a etnia nos EUA; ou a idade, o sexo, a região e a língua falada na Bélgica.
A idade, o sexo e a região geográfica estão normalmente associados a algo que os diferencia em termos de bem-estar económico. Pode ser o rendimento, a educação, a classe social ou a representação pela posse de casa própria.
O que a SSI recomenda:
Na ausência de outras instruções, na América do Norte, o SSI utilizará a idade, o sexo e uma variável adicional que diferencia o bem-estar económico (na América do Norte, a representação por área geográfica é naturalmente ajustada). Na Europa, na ausência de outras instruções, a SSI utilizará a idade, o sexo e a região, uma vez que os dados relativos ao “bem-estar económico” não estão disponíveis nos censos para todas as áreas geográficas.