Quando utilizar o teste de comparação múltipla

Os testes de comparações múltiplas podem ser considerados como aqueles que são idealizados e organizados antes da ocorrência do experimento, podendo, dessa maneira, atuar como uma complementação do teste F para a variância.

O objetivo dos testes de comparações múltiplas possui como principal intuito encontrar diferenças existentes entre duas ou até mais médias de tratamento. Tais distinções podem ou não ser ortogonais.

Nesse contexto, vale lembrar que os testes de comparações múltiplas de médias distintas e do tipo não ortogonais devem ser realizados na ocasião em que o teste “F” denotar distinção entre as médias de tratamento.

Os motivos que levam a utilizar a realização de um teste estatístico que aponte uma distinção entre os tratamentos antes de realizar um teste de significância da diferença entre os dois tratamentos são:

– Por causa da elevada quantidade de tratamentos, a probabilidade de encontrar contrastes também sofre um aumento.

– Devido a uma elevada quantidade de tratamentos, a distinção que existe entre duas médias extremas que fazem parte das amostras da mesma população não fica sendo mais considerada apenas casual. Sendo assim, a distribuição de probabilidades que o contraste tem por base não é mais considerado válido.

Diante de tais motivos, os resultados significativos nos testes de comparações múltiplas comparações se tornam mais corretos e seguros a partir do momento em que são efetuados depois da obtenção de significância na análise de variância. Dessa maneira pode ser considerado que o nível de confiabilidade do teste está assegurado pela significância da ANAVA.

Além disso, ao efetuar um comparativo onde o resultado favorável poderia apresentar um equilíbrio entre os tratamentos, como, por exemplo, um produto de fabricação nacional e outro produto importado, seria inapropriado efetuar o uso de um teste que trouxesse benefícios para acontecer o erro tipo II, ou seja, o teste a ser usado deve apresentar um menor rigor.

Por outro lado, diante de uma comparação em que o resultado favorável poderia ser uma melhor eficiência de determinados tratamentos, seria um erro fazer uso de um teste que permitisse ocorrer o erro tipo I, sendo assim necessário optar por um teste que apresente um rigor bem maior.

Vale, nesse caso, destacar que:

– O erro tipo I é aquele que confere diferenças nítidas no momento em que elas não existem.

– O erro tipo II é aquele que confere uma igualdade quando, na verdade, é possível detectar uma diferença.

Além disso, é importante também observar que quando um tipo de erro é reduzido, a probabilidade de um outro tipo de erro sofre um aumento.

Os testes de comparações múltiplas e suas características

Quando o assunto é testes de comparação, é preciso levar em consideração também a existência de alguns testes, tais como:

– O Teste de Tukey – O Teste de Scheffé – O Teste de Bonferroni – O Teste de Dunnet

– O Teste de Duncan

O Teste de Tukey, por exemplo, conta com algumas características bem definidas. Entre elas é possível citar:

– Ele não possibilita a comparação de grupo de tratamentos entre si.

– É um teste usado para analisar qualquer distinção existente entre duas médias de tratamento.

– É um teste usado a partir do momento em que o teste “F” para tratamentos da análise de variância for considerado significativo.

– É um dos testes de comparação mais usados justamente por apresentar um elevado rigor de avaliação e, também, por denotar fácil aplicação.

Já o Teste de Duncan é considerado um teste de caráter menos rigoroso, por exemplo, que o Teste de Tukey.

Os testes de comparações múltiplas e a ANOVA

Os testes de comparações múltiplas levam bastante em consideração à ANOVA – a chamada Análise de Variância. Essa análise consiste em um método muito usado no cenário acadêmico. De uma maneira geral, este método avisa se há a existência de um tratamento que destoe em comparação com os demais tratamentos.

No entanto, ele requer que algumas premissas sejam devidamente obedecidas, especialmente a distribuição normal dos resíduos e também a homogeneidade de variância.

Para a realização de uma ANOVA é preciso que exista uma variável de resposta contínua e, além disso, deve haver também um fator categórico que apresentam mais de um nível. As análises ANOVA necessitam também de dados de populações que, de uma maneira geral, sejam devidamente distribuídas com variâncias equilibradas entre os fatores.

No entanto, os procedimentos ANOVA possuem êxito ainda que a pressuposição de normalidade seja violada. A exceção disso acontece a partir do instante em que uma ou até mais distribuições denotem uma elevada assimetria ou quando as variâncias denotem uma acentuada diferença. Entretanto, as transformações do conjunto de dados original possuem condições de efetuar a correção de tais violações.

O nome “Análise de Variância” é baseado na abordagem em que o procedimento faz uso de variâncias com o objetivo de estipular se as médias denotam diferenças

Depois de usar Ajustar modelo linear generalizado ou Modelo de efeitos mistos de ajuste, use a análise correspondente para obter comparações múltiplas de médias:

Você deve fazer as seguintes opções quando usar comparações múltiplas:

As comparações pareadas ou comparação com um controle
O método de comparação

Escolha Pareado na subcaixa de diálogo Opções quando você não tem um nível de controle e deseja comparar todas as combinações de médias.

Escolha Com um controle para comparar as médias de nível com a média de um grupo de controle. Quando este método é adequado, é ineficiente para usar comparações de pares, porque os intervalos de confiança de pares são mais amplos e os testes de hipóteses são menos poderosos para um determinado nível de confiança.

Escolha o procedimento de comparação com base nas médias do grupo que você quer comparar, o tipo de nível de confiança que você deseja especificar, e o quão conservadores você quer que os resultados sejam. "Conservadores", neste contexto, indica que o verdadeiro nível de confiança provavelmente é maior do que o nível de confiança que está sendo exibido.

Exceto para o método de Fisher, os vários métodos de comparação têm proteção contra falsos positivos incorporados. Ao proteger contra falsos positivos com múltiplas comparações, os intervalos são mais amplos do que se não houvesse nenhuma proteção.

Algumas características dos vários métodos de comparação estão resumidas a seguir:

Método de comparação	Propriedades	Nível de confiança especificado por você
Tukey	Comparações de todos os pares somente, não conservadoras	Simultâneos
Fisher:	Nenhuma proteção contra falsos positivos devido a comparações múltiplas	Individual
Dunnett	Comparação com um controle apenas, não conservadora	Simultâneos
Bonferroni	A mais conservadora	Simultâneos
Sidak	Conservador, mas um pouco menos de Bonferroni	Simultâneos