Como calcular população e amostra

Show

Pesquisa em comunicação

Aplicação da estatística para o cálculo do tamanho da amostra para a realização de pesquisas quantitativas.

Publicado em: 26 de fev. de 2015
Atualizado em: 13 de ago. de 2021

As pesquisas quantitativas têm como objetivo contar quantas vezes um determinado fenômeno acontece em um determinado grupo de pessoas.

Por exemplo, quando uma pesquisa eleitoral diz que o candidato X tem 20% de intenção de voto, significa que em um determinado grupo de pessoas (todos os eleitores), 20 em cada 100 pessoas têm a intenção de votar no candidado X.

Há, porém uma importante limitação técnica para a realização desse tipo de contagem: muitas vezes esse grupo de pessoas pode ser muito grade. No caso de uma eleição a nível nacional no Brasil, por exemplo, são mais de 100 milhões de eleitores.

É inviável em vários sentidos tentar ouvir todos eles para se contar as intenções de votos. Essa contagem total somente será feita no dia da eleição, pois custa muito dinheiro e é difícil de se fazer. Para lidar com essas limitações são necessários os conceitos de polução e de amostragem.

Chama-se população ou de universo o conjunto de todas as pessoas que fazem parte do grupo que se deseja conhecer por meio da minha pesquisa. Por exemplo: todos os eleitores, todos os habitantes de uma cidade ou um bairro, todos os consumidores de uma determinada marca etc. A amostra é um conjunto reduzido ou um recorte da população, mas que mantém todas as características essenciais da mesma, de modo que seja capaz de, estatisticamente, refletir todos os seus atributos. Como ouvir a população toda em uma pesquisa é inviável o até mesmo impossível, opta-se por selecionar uma amostra, para que se faça pesquisa a partir dela. O objetivo é que o resultado encontrado na pesquisa com a amostra possa ser generalizado para toda apopulação (método indutivo). Por isso a amostra precisa ser representativa e imparcial. Para ser representativa uma amostra deve conter todas as características o que uma população possui, respeitando-se as devidas proporções. Por exemplo, se na população 53% são mulheres e 47% são homens, devo respeitar essa mesma proporção na seleção da amostra. E, para que a amostra seja imparcial, o mecanismo de escolha dos elementos para compô-la deve permitir que todos tenham a mesma oportunidade (probabilidade) de ser escolhido. Por exemplo, se vou selecionar uma amostra habitantes de uma determinada cidade, não posso selecionar todos os componentes da amostra em um mesmo bairro.

Respeitando-se os critérios de representatividade e imparcialidade, pode-se fazer a seleção dos indivíduos que farão parte da amostra. Existem várias maneiras de se fazer essa seleção e o método escolhido para isso determina o tipo de amostra que terei: Amostra Simples ao Acaso (ASA): quando todos os elementos de uma população tem a mesma chance (probabilidade) de ser selecionado para a amostra. É aplicado quando a população é considerada homogênea. Amostra Sistemática: aplicada quando a população está organizada em uma listagem segundo alguma ordem lógica (em ordem alfabética, por exemplo). Divide-se o tamanho da população pelo tamanho da amostra desejada, obtendo-se assim o que se chama de Salto Amostral. Amostra Estratificada Proporcional: quando se trabalha com uma população heterogênea, onde se tem elementos discrepantes, há a necessidade de se dividir a população em grupos, com elementos homogêneos, que se chama estrato. Desses estratos são sorteados os elementos que comporão a amostra. O número de elementos sorteados de cada grupo deverá ser proporcional ao tamanho do grupo.

Quantas pessoas devem fazer parte da minha amostra para que ela seja representativa? Essa pergunta é respondida pela estatística por meio do cálculo amostral. O objetivo desse cálculo é garantir que o número de pessoas ouvidas na pesquisa seja estatisticamente suficiente para representar a população, ou seja, para garantir uma alta propabilidade de que os resultados que forem obtidos com a amostra reflitam a realidade da população. Esse cálculo leva em conta as variáveis abaixo: A. Amplitude do universo (ou da população): Os universos de pesquisa podem ser FINITOS ou INFINITOS. Convencionou-se que os finitos são aqueles cujo número de elementos não excede a 100.000. Universos infinitos, por sua vez, são aqueles que apresentam elementos em número superior a esse. B. Nível de confiança desejado: O nível de confiança de uma amostra refere-se à área da curva normal definida a partir dos desvios-padrão em relação à sua média. Significa qual a porcentagem da população estará estatisticamente representada na amostra. Esse número também indica a propabilidade de que os resultados obtidos com a amostra reflitam a realidade da população. 1 desvio padrão = 68% de representatividade ou de chance de que a amostra reflita a realidade da população 2 desvios = 95,5% de representatividade ou de chance de que a amostra reflita a realidade da população 3 desvios = 99,7% de representatividade ou de chance de que a amostra reflita a realidade da população C. Erro máximo permitido: Os resultados obtidos numa pesquisa elaborada a partir de amostras não são rigorosamente exatos em relação à popução. Quanto menor a margem de erro tolerada maior será o tamanho da amostra (mais gente precisará ser ouvida e mais dispendiosa e demorada será a pesquisa). D. Percentagem com que o fenômeno se verifica: Quanto existe alguma informação prévia a respeito da resposta que se pretende encontrar, essa informação pode ser utilizada para diminuir o tamanho da amostra. Quando não é possível fazer esta estimativa, adota-se a probabilidade média de 50% a 50%. Com estes 4 fatores pode-se adotar as seguintes equações para o cálculo do tamanho da amostra ideal. Para POPULAÇÃO FINITA, ou seja, quando a população pesquisada não supera 100.000 indivíduos, a equação para o cálculo amostral é a seguinte: (adsbygoogle = window.adsbygoogle || []).push({}); Onde: n = Tamanho da amostra (número de pessoas que deverão participar da pesquisa); D = Número de desvios padrão adotado (1, 2 ou 3); p e q = Porcentagem em que o fenômeno se verifica (na maioria dos casos 50 e 50); N = Tamanho da população (número total de pessoas que fazem parte do grupo pesquisa); e = Erro percentual máximo permitido (p.ex.: 2, 3, 5); Para POPULAÇÃO INFINITA, ou seja, quando a população pesquisada supera 100.000 indivíduos, a equação para o cálculo amostral é a seguinte: Onde: n = Tamanho da amostra (número de pessoas que deverão participar da pesquisa); D = Número de desvios padrão adotado (1, 2 ou 3); p e q = Porcentagem em que o fenômeno se verifica (na maioria dos casos 50 e 50); e = Erro percentual máximo permitido (p.ex.: 2, 3, 5);

Como citar:
MARI JR. Sergio. Populacao e amostra em pesquisas quantitativas. Infonauta, 2015. Disponível em: <https://infonauta.com.br/pesquisa-em-comunicacao/populacao-e-amostra>. Acesso em: 20 de jun. de 2022.


Quando fazemos uma pesquisa científica estamos querendo responder uma questão de forma a obter uma resposta cientificamente válida.

Na área da saúde as questões a que queremos responder normalmente se referem a uma população de pessoas e não a apenas algumas delas.

Como na grande maioria das vezes é impossível estudar a população toda para qual queremos obter a resposta nós estudamos amostras das populações e não a população toda.

Uma amostra é uma parte da população com finalidade de representá-la na pesquisa. Queremos que nossa amostra seja exatamente igual a população a ser representada. Para termos uma amostra com a “cara” da população precisamos selecionar uma amostra com “qualidade” e “quantidade” suficiente.

A “qualidade” deve ser garantida pelo pesquisador utilizando técnicas de seleção da amostra por sorteio, representar todos os estratos da população, fazer pareamento quando necessário, etc. Já a “quantidade” diz respeito ao número suficiente de elementos na amostra para que a pesquisa consiga atingir o objetivo proposto que é a resposta a questão por meio do método científico.

Em nosso processo de cálculo amostral estaremos supondo que o pesquisador já sabe como garantir a qualidade da amostra e, portanto, só estaremos focando no tamanho da amostra.

A quantidade (tamanho da amostra) pode, e deve ser, calculada matematicamente para que a pesquisa atinja seu objetivo da maneira mais eficiente possível.

Uma amostra maior do que a necessária pode até responder a questão da pesquisa, porém a um custo e tempo maiores do que o necessário. Uma amostra menor do que a necessária pode não responder satisfatoriamente a questão, e consequentemente ser um desperdício de tempo e dinheiro.


Não existe um número padrão de tamanho da amostra, para cada pesquisa vai existir o tamanho adequado.

Vamos supor um exemplo. Queremos responder cientificamente quantos por cento da população (prevalência) adulta da cidade X tem pelo menos um dente cariado. A população de adultos da cidade X é 100.000 habitantes, logo não conseguiremos examinar toda a população, vamos trabalhar com uma amostra. Quantos sujeitos devo examinar (qual o tamanho adequado da amostra)? Dez, 50, 100, 1.000, 10.000?

Qualquer que seja o tamanho da amostra eu terei como resposta a porcentagem de adultos com cárie da amostra, mas o que queremos saber é quantos por cento da população tem cárie, não apenas da amostra.

Vamos supor que todos da população (100%) tem pelo menos uma cárie. Se isso ocorrer minha amostra poderia ser de apenas um sujeito que o obtido na amostra seria exatamente a resposta que estou procurando na população. Minha amostra é de um sujeito ele tem cárie, logo 100% da amostra tem cárie, e eu acerto que 100% da população tem cárie. Nesse caso uma amostra de tamanho 1 é a mais eficiente possível. Mas vamos supor que metade (50%) da população tenha cárie e a outra metade (50%) não tenha. Agora se pegamos uma amostra de tamanho um com certeza erraremos nossa previsão da população. Se o sujeito da amostra tiver cárie vamos achar que 100% da população tem cárie, e se o sujeito da amostra não tiver cárie acharemos que 100% da população é livre de cárie. Repare que o tamanho da amostra nas duas situações é o mesmo (um) e o tamanho da população também é o mesmo (100.000 habitantes). Por que em uma situação o tamanho da amostra foi suficiente para responder corretamente a questão e na outra situação não foi suficiente? A resposta é simples, porque no primeiro exemplo a população era homogênea (todos tinha cárie) enquanto na segunda situação não havia essa homogeneidade total (50% tinham cárie e 50% não tinham).

GRAU DE HETEROGENEIDADE DA POPULAÇÃO

Desse exemplo fictício surge a primeira, e talvez mais importante, regra para se calcular o tamanho da amostra: só podemos calcular o tamanho da amostra se soubermos o grau de heterogeneidade da população. Como regra geral temos que quanto mais heterogênea é a população maior será o tamanho da amostra necessário para representa-la. Não há outra maneira, se não soubermos previamente o que esperar da população não será possível calcular o tamanho da amostra. Mas como posso saber o quanto a população é heterogênea se justamente estou querendo estuda-la porque não sei quantos por cento tem cárie? Para previamente sabermos o grau de heterogeneidade da população temos três soluções:

1) Buscar na literatura algum estudo semelhante ao que estamos fazendo e verificar qual foi o grau de heterogeneidade encontrado. Então assumimos que nossa população de estudo deve ter um grau de heterogeneidade semelhante ao do estudo já publicado.

2) Fazer um “estudo piloto” com um pequeno número de casos para explorar a população e ter uma noção de seu grau de heterogeneidade.

3) Estimar o maior grau de heterogeneidade possível da população.

MÉTODO ESTATÍSTICO QUE SERÁ UTILIZADO PARA ANALISAR OS DADOS

Para o cálculo amostral é necessário primeiramente determinar qual é o objetivo principal da pesquisa. Isto é, qual a questão central que queremos responder, pois nela será baseado o cálculo do tamanho da amostra. Muitas vezes queremos responder várias questões com a pesquisa, mas é necessário eleger a questão principal.

Definida a questão central será necessário determinar qual o método estatístico será utilizado para responder essa questão. Por exemplo, se o objetivo principal de nossa pesquisa é determinar a prevalência de cárie nos adultos e vamos analisar o resultado por meio do Intervalo de Confiança (IC) de uma Proporção o cálculo amostral utilizará a fórmula de cálculo do Intervalo de Confiança para determinar o tamanho da amostra necessário. Já se fizermos uma pesquisa para determinar se existe diferença entre homens e mulheres quanto ao número médio de dentes cariados, e pretendemos utilizar o teste “t” para fazer a comparação entre essas duas médias, o cálculo amostral utilizará agora a fórmula de cálculo do teste t para determinar o tamanho da amostra. Então sempre será necessário saber previamente o procedimento estatístico que utilizaremos para analisar a questão central da pesquisa.

PRECISÃO DA ESTIMATIVA

Outro fator importante no cálculo amostral é determinar previamente o grau de precisão que desejo da minha estimativa baseada na amostra, com relação à população. No nosso exemplo qual o tamanho do erro que estou disposto a cometer na estimativa do porcentual de adultos com cárie na população. Para não haver possibilidade de erro nenhum na estimativa seria necessário pesquisar a população inteira. Cada vez que admitimos um menor erro teremos um tamanho de amostra maior. No nosso exemplo, com nível de confiança de 95%, se quisermos cometer um erro máximo de 5% será necessária uma amostra de 384 sujeitos. Já se quisermos cometer um erro máximo de 1% será necessária uma amostra de 9.604 sujeitos.

É necessário preestabelecer a precisão deseja de acordo com o procedimento estatístico a ser empregado. Assim, no exemplo de determinar a prevalência de adultos com cárie na população é necessário de definir previamente qual o erro máximo que vamos admitir (p.ex. 5%) e também qual o nível de confiança que será adotado (p.ex. 95%), isto é, qual a confiança que temos daquela estimativa estar correta para a população. Já no exemplo da comparação entre homens e mulheres quanto a média de dentes cariados é necessário pré- estabelecer qual nível de significância a ser adotado na aplicação do teste t (p.ex. 5%), o poder da amostra (p.ex. 80%), e a menor diferença entre os grupos que tem relevância clínica (p.ex. 0,5 dentes cariados).

ERRO α ou NÍVEL DE SIGNIFICÂNCIA

Quando a análise da pesquisa será feita por algum teste de hipótese é necessário se determinar qual o nível de significância (Erro α) que será utilizado na interpretação do resultado do teste de hipótese. Erro &alpha é a probabilidade de se estar errado ao aceitar a Hipóstese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor. Quanto menor o erro α adotado maior deverá o tamanho da amostra.

ERRO β ou PODER DA AMOSTRA

O Poder da amostra é igual a 1 menos o Erro β. (PODER = 1 – ERROβ).

Quando a análise da pesquisa será feita por algum teste de hipótese é necessário se determinar qual o Erro β (ou Poder) que se deseja que a amostra tenha. Erro β é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Poder é a probabilidade de corretamente aceitarmos H1 quando essa realmente é verdadeira. Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%. Se utilizarmos Erro β=10% estamos dizendo que queremos Poder=90%. Quanto menor o erro β (consequentemente maior o Poder) adotado maior deverá o tamanho da amostra.

TAMANHO DA POPULAÇÃO

Toda fórmula de cálculo de tamanho da amostra é desenvolvida partindo do princípio que a população que ela pretende representar é infinita. Somente quando trabalhamos com população pequena (menor do que 2.000 elementos) compensa ajustar o tamanho calculado para o tamanho da população. No sistema existe a opção de se ajustar o tamanho da amostra para o tamanho de uma população finita.

EFEITO DO DESENHO

Toda fórmula de cálculo de tamanho da amostra é desenvolvida partindo do princípio cada elemento da amostra é selecionado aleatoriamente (sorteio) e um a um (amostragem aleatória simples). Muitas vezes isso não ocorre e utilizamos sorteio por conglomerados. Por exemplo, ao selecionarmos alunos da rede de ensino sorteamos uma escola, ou uma classe, e não um aluno de cada vez. Isto leva a um desvio do modelo original para o qual a fórmula foi desenvolvida. Nestas situações, para se corrigir esse desvio no desenho amostral utiliza-se um fator de correção que irá aumentar o tamanho necessário da amostra. Esse fator chamamos “Efeito de desenho” e, normalmente, se utiliza um fator de correção entre 1,2 e 2, sendo mais comum se utilizar o fator 1,5.

PERDA DE ELEMENTOS

O cálculo amostral indica o número ideal de elementos que devemos avaliar na pesquisa. Principalmente nas pesquisas longitudinais é comum haver perda de elementos ao longo da pesquisa. Para corrigir essa quantidade que elementos que podem se perder ao longo da pesquisa é necessário começar a pesquisa com um número maior do que o calculado. Para saber o número ideal de se iniciar a pesquisa é preciso ter uma estimativa do percentual de perdas que podem ocorrer durante a pesquisa. Ao entrar com esse percentual de perdas previstas o sistema ajusta o cálculo do tamanho da amostra para compensa-las.


Como dito anteriormente, para cada método de análise dos dados exige certas informações para o correto cálculo amostral. Abaixo segue a relação dos procedimentos estatísticos para os quais o sistema executa o cálculo amostral com uma explicação dos parâmetros necessários para execução do cálculo.


Utilizado quando se deseja determinar a proporção (prevalência) de uma característica em uma população. Por exemplo, determinar qual a proporção de sujeitos com cárie na população adulta brasileira. O resultado será apresentado assim: Prevalência de cárie = 47,6% (IC95%: 44,3 – 50,9%).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Erro (%): margem de erro máximo que o pesquisador admite na sua pesquisa.

- Proporção esperada (%): a proporção (prevalência) que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura, de um projeto piloto, ou adotar 50% que é a maior variabilidade possível pois assim o tamanho da amostra calculado atenderá para qualquer que seja a prevalência encontrada.


Utilizado quando se deseja determinar a média de uma característica quantitativa em uma população. Por exemplo, determinar qual o peso médio da população adulta brasileira. O resultado será apresentado assim: Peso médio = 72,3Kg (IC95%: 70,2 – 74,4Kg).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Erro: margem de erro máximo, na unidade de medida da variável avaliada, que o pesquisador admite na sua pesquisa.

- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.


Utilizado quando se pretende determinar se existe diferença na proporção (prevalência) de uma caraterística entre duas populações. Por exemplo, determinar se existe diferença na prevalência da cárie dentária entre as populações de homens e mulheres brasileiros. O cálculo pressupõe que o pesquisador utilizará o teste do qui-quadrado para fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre as duas populações.

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Estimativa de P1: a proporção (prevalência) que o pesquisador estima que vai encontrar na população1 (P1) com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Estimativa de P2: a proporção (prevalência) que o pesquisador estima que vai encontrar na população2 (P2) com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β): Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre duas populações independentes. Por exemplo, determinar se existe diferença de peso entre as populações de homens e mulheres brasileiros. O cálculo pressupõe que o pesquisador utilizará o teste t de Student fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre as duas populações.

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar nas populações com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Mínima diferença a ser detectada: É a menor diferença que, se existir entre as populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que tem alguma relevância clínica.

- Erro alfa (α): Erro α (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β): Erro β é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.


Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre duas populações dependentes (pareadas). Por exemplo, determinar se existe diferença de peso na população de homens antes e após um regime de 4 semanas. O cálculo pressupõe que o pesquisador utilizará o teste t pareado para fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre as duas populações (a população de medidas antes e a população de medidas depois do regime).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Estimativa do desvio padrão da diferença: o desvio padrão que o pesquisador estima que vai encontrar nas diferenças entre as duas medições. É necessário o desvio padrão da diferença entre os pares de dados. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Mínima diferença a ser detectada: É a menor diferença que, se existir entre as populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que tem alguma relevância clínica.

- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β):Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.


Utilizado quando se pretende determinar se existe correlação entre duas variáveis quantitativas dentro de uma mesma população. Por exemplo, determinar se existe correlação entre o número de vezes que a pessoa escova os dentes por dia e o número de dentes cariados que ele tem. O cálculo pressupõe que o pesquisador utilizará o Coeficiente de Correlação de Pearson para avaliar o grau de correlação entre as duas variáveis. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há correlação entre as duas variáveis.

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Coeficiente de correlação: É um valor entre -1 e +1 que corresponde ao menor coeficiente de correlação, que se existir entre as duas variáveis, o pesquisador deseja provar que há correlação entre elas.

- Erro alfa (α): Erro α (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β):Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

Odds Ratio pode ser traduzido como Razão de Chance. Pode ser definido como uma razão (divisão) entre a chance de um evento ocorrer em um grupo e o mesmo evento ocorrer em outro grupo. P.ex. Qual o Odds Ratio de ocorrer diabetes entre homes e mulheres. Vamos supor que estudamos 100 homens e 3 deles tinham diabetes e estudamos 100 mulheres 2 delas tinha diabetes. A chance de um homem ter diabetes 3 terem e 97 não, ou seja, 3/97. Já a chance das mulheres foi 2/98. O Odds Ratio é a razão destas duas chances, que é, OR = (3/97) / (2/98) que dá OR = 1,52 e podemos interpretar como sendo que os homens têm 1,52 vezes mais chance de ter diabetes do que as mulheres. Esse cálculo foi feito em uma amostra, mas se queremos determinar o verdadeiro OR numa população calculamos o intervalo de confiança do OR para a população. O resultado será apresentado assim: OR = 1,52 (IC95%: 0,25 – 9,27).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Erro (%): margem de erro máximo que o pesquisador admite na sua estimativa do OR

- Proporção no grupo controle (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo controle com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Proporção no grupo experimental (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo experimental com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

Odds Ratio pode ser traduzido como Razão de Chance. Pode ser definido como uma razão (divisão) entre a chance de um evento ocorrer em um grupo e o mesmo evento ocorrer em outro grupo. P.ex. Qual o Odds Ratio de ocorrer diabetes entre homes e mulheres. Vamos supor que estudamos 100 homens e 3 deles tinham diabetes e estudamos 100 mulheres 2 delas tinha diabetes. A chance de um homem ter diabetes 3 terem e 97 não, ou seja, 3/97. Já a chance das mulheres foi 2/98. O Odds Ratio é a razão destas duas chances, que é, OR = (3/97) / (2/98) que dá OR = 1,52 e podemos interpretar como sendo que os homens têm 1,52 vezes mais chance de ter diabetes do que as mulheres. Provar que o OR é diferente de 1 significa provar que a chance de ocorrência do evento em um grupo é diferente da chance no outro grupo.

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Proporção no grupo controle (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo controle com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Proporção no grupo experimental (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo experimental com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- K (n exp / n cont): É a proporção do tamanho da amostra que se deseja entre o Grupo Experimental e o Grupo Controle. Um K = 1 significa que o tamanho dos dois grupos serão iguais. K = 2 implica que o tamanho do Grupo Experimental será o dobro do tamanho do Grupo Controle.

- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β):Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

Risco Relativo (RR) pode ser definido como uma razão (divisão) entre a risco de um evento ocorrer em um grupo e o mesmo evento ocorrer em outro grupo. P.ex. Qual o RR de ocorrer diabetes entre homes e mulheres. Vamos supor que estudamos 100 homens e 3 deles tinham diabetes e estudamos 100 mulheres 2 delas tinha diabetes. O risco de um homem ter diabetes 3 em 100, ou seja 3% Já o risco das mulheres foi de 2%. O RR esses dois riscos, que é, RR = 3% / 2% que dá RR = 1,5 e podemos interpretar como sendo que o risco de um homem ter diabetes é 1,5 vezes o risco das mulheres. Esse cálculo foi feito em uma amostra, mas se queremos determinar o verdadeiro RR numa população calculamos o intervalo de confiança do RR para a população. O resultado será apresentado assim: RR = 1,50 (IC95%: 0,26 – 8,79).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Erro (%): margem de erro máximo que o pesquisador admite na sua estimativa do RR.

- Proporção no grupo controle (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo controle com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Proporção no grupo experimental (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo experimental com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

Sensibilidade de um teste diagnóstico é a capacidade do teste de corretamente identificar os “doentes” de uma população. Um teste que tenha sensibilidade de 80% implica que dos “doentes” da população ele corretamente identificaria 80% deles. Para sua determinação é necessário um “padrão ouro” que identifique os verdadeiramente “doentes”. Assim, se em um grupo de 1.000 pessoas 200 são “doentes” e o teste é aplicado nestas 1.000 pessoas e dos 200 “doentes” o teste identifica corretamente como “doentes” 180 deles, o teste apresenta uma sensibilidade de 90%.

Nesse exemplo o cálculo foi feito em uma amostra de 1.000 pessoas, mas se queremos determinar a verdadeira Sensibilidade do teste numa população calculamos o intervalo de confiança da Sensibilidade. O resultado será apresentado assim: Sensibilidade = 90% (IC95%: 86% – 94%).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Sensibilidade Esperada (%): Sensibilidade estimada do teste diagnóstico.

- Prevalência da Doença (%): Prevalência da doença estudada na população.

- Margem de erro (%): margem de erro máximo que o pesquisador admite na sua estimativa de Sensibilidade.

Especificidade de um teste diagnóstico é a capacidade do teste de corretamente identificar os “não doentes” de uma população. Um teste que tenha especificidade de 80% implica que dos “não doentes” da população ele corretamente identificaria 80% deles. Para sua determinação é necessário um “padrão ouro” que identifique os verdadeiramente “não doentes”. Assim, se em um grupo de 1.000 pessoas 800 são “não doentes” e o teste é aplicado nestas 1.000 pessoas, e dos 800 “não doentes” o teste identifica corretamente como “não doentes” 720 deles, o teste apresenta uma especificidade de 90%.

Nesse exemplo o cálculo foi feito em uma amostra de 1.000 pessoas, mas se queremos determinar a verdadeira Especificidade do teste numa população calculamos o intervalo de confiança da Especificidade. O resultado será apresentado assim: Especificidade = 90% (IC95%: 86% – 94%).

Para calcular o tamanho da amostra são necessárias as seguintes informações.

- Especificidade Esperada (%): Especificidade estimada do teste diagnóstico.

- Prevalência da Doença (%): Prevalência da doença estudada na população.

- Margem de erro (%): margem de erro máximo que o pesquisador admite na sua estimativa de Especificidade.

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre mais duas populações independentes. Por exemplo, determinar se existe diferença de peso entre as populações de adultos brasileiros, adultos argentinos e adultos uruguaios. O cálculo pressupõe que o pesquisador utilizará Análise de Variância para fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre pelo menos duas das populações.

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Número de grupos: número de populações sendo comparadas.

- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar nas populações com a caraterística sendo estudada. É uma estimativa do desvio padrão dentro de cada população e não entre as populações todas. Essa estimativa pode vir da literatura ou de um projeto piloto.

- Mínima diferença a ser detectada: É a menor diferença que, se existir entre pelo menos duas populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que tem alguma relevância clínica.

- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β): Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

Análise de regressão logística múltipla tem por objetivo determinar um modelo matemático que permita predizer o valor de uma variável dependente binária (casos positivos e negativos) em função de um conjunto de variáveis independentes (também chamadas de variáveis preditoras ou explicativas).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Número de Variáveis Independentes: É número de variáveis independentes (preditoras) que serão medidas em cada elemento da pesquisa.

- Menor Proporção Esperada (%): é menor proporção, em %, da ocorrência de casos positivos ou negativos da variável dependente estudada.

Análise de regressão linear múltipla tem por objetivo determinar um modelo matemático que permita predizer o valor de uma variável dependente quantitativa em função de um conjunto de variáveis independentes (também chamadas de variáveis preditoras ou explicativas).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Número de Variáveis Independentes: É número de variáveis independentes (preditoras) que serão medidas em cada elemento da pesquisa.

Análise de sobrevida é um conjunto de técnicas estatísticas para determinar o tempo até que um evento ocorra. Por exemplo determinar o tempo médio de sobrevida após a pessoa ter sido diagnosticada com uma doença grave. Além disso outras questões podem ser respondidas como, por exemplo, após 5 anos do diagnóstico qual a porcentagem esperada de doentes que sobreviverão. No cálculo proposto o tamanho da amostra é calculado para se fazer a comparação da sobrevida entre dois grupos que são chamados de Grupo Experimental (GE) e Grupo Controle (GC).

Para calcular o tamanho da amostra são necessárias as seguintes informações:

- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.

- Erro beta (β): Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

- Proporção GE e proporção GC: É a relação do tamanho da amostra que se deseja entre o Grupo Experimental e o Grupo Controle. Se Proporção GE = 1 e Proporção GC = 1 isso significa que o tamanho dos dois grupos serão iguais. Se Proporção GE = 2 e Proporção GC = 1 isso significa que o tamanho do Grupo Experimental será o dobro do Grupo Controle.

- Risco Esperado GE: É o risco que se espera do evento ocorrer no GE no período avaliado.

- Risco Esperado GC: É o risco que se espera do evento ocorrer no GC no período avaliado.


Endereço de e-mail para contato e dúvidas: