escolhendo um teste estatístico

Este é o Capítulo 37 da primeira edição de Bioestatísticas intuitivas por Harvey Motulsky. Copyright © 1995 by Oxford University Press Inc. O Capítulo 45 da segunda edição da bioestatística intuitiva é uma versão expandida deste material. este livro discutiu muitos testes estatísticos diferentes. Para selecionar o teste certo, faça duas perguntas a si mesmo: que tipo de dados você coletou? Qual é o teu objectivo? Em seguida, consulte o quadro 37.1.,

Prever o valor de vários medido ou binomial variáveis regressão linear Múltipla*
ou
Múltiplo de regressão não linear** regressão logística Múltipla* proporcionais de Cox perigo de regressão*

REVISÃO DE TESTES não-paramétricos

Escolhendo o direito de teste para comparar as medições é um pouco complicado, como você deve escolher entre duas famílias de testes paramétricos e não-paramétricos., Muitos-testes estatísticos são baseados na suposição de que os dados são amostrados a partir de uma distribuição gaussiana. Estes testes são referidos como Testes Paramétricos. Os testes paramétricos comumente usados são listados na primeira coluna da tabela e incluem o teste t e a análise da variância.os testes que não fazem suposições sobre a distribuição da população são referidos como testes não paramétricos. Você já aprendeu um pouco sobre testes não paramétricos em capítulos anteriores. Todos os testes não paramétricos comumente usados classificam a variável resultado de baixo para alto e, em seguida, analisar as fileiras., Estes testes estão listados na segunda coluna da tabela e incluem os testes Wilcoxon, Mann-Whitney e Kruskal-Wallis. Estes testes também são chamados de testes livres de distribuição.

escolher entre testes paramétricos e não paramétricos: os casos fáceis

escolher entre testes paramétricos e não paramétricos é, por vezes, fácil. Você deve definitivamente escolher um teste paramétrico se você tem certeza de que seus dados são amostrados a partir de uma população que segue uma distribuição gaussiana (pelo menos aproximadamente)., Você deve definitivamente selecionar um teste não paramétrico em três situações:

  • o resultado é um rank ou uma pontuação e a população não é claramente Gaussiana. Exemplos incluem a classe de classificação dos estudantes, o índice de Apgar para a saúde dos recém-nascidos de baixo peso (medido em uma escala de 0 a IO e onde todos os resultados são números inteiros), a pontuação visual analógica para dor (medido em uma escala contínua, onde 0 é ausência de dor e 10 é insuportável a dor), e a estrela escala comumente usada pelo filme e restaurante críticos (* é OK, ***** é fantástico).,
  • alguns valores são “fora da escala”, ou seja, muito alto ou muito baixo para medir. Mesmo que a população seja Gaussiana, é impossível analisar tais dados com um teste paramétrico já que você não conhece todos os valores. Usar um teste não paramétrico com estes dados é simples. Atribuir valores demasiado baixos para medir um valor arbitrário muito baixo e atribuir valores demasiado elevados para medir um valor arbitrário muito elevado. Em seguida, realizar um teste não paramétrico. Uma vez que o teste não paramétrico só sabe sobre as fileiras relativas dos valores, não importará que você não sabia todos os valores exatamente.,
  • As medições do ire de dados, e tem a certeza de que a população não está distribuída de forma Gaussiana. Se os dados não forem amostrados a partir de uma distribuição gaussiana, considere se você pode transformar os valores para fazer com que a distribuição se torne Gaussiana. Por exemplo, você pode tomar o logaritmo ou recíproco de todos os valores. Há muitas vezes razões biológicas ou químicas (bem como estatísticas) para realizar uma transformação particular.,

escolher entre testes paramétricos e não paramétricos: os casos duros

nem sempre é fácil decidir se uma amostra vem de uma população Gaussiana. Considere estes pontos:

  • Se você coletar muitos pontos de dados (mais de uma centena ou assim), você pode olhar para a distribuição de dados e será bastante óbvio se a distribuição é aproximadamente em forma de sino. Um teste estatístico formal (teste Kolmogorov-Smirnoff, não explicado neste livro) pode ser usado para testar se a distribuição dos dados difere significativamente de uma distribuição gaussiana., Com poucos pontos de dados, é difícil dizer se os dados são Gaussianos por inspeção, e o teste formal tem pouco poder para discriminar entre distribuições Gaussianas e não Gaussianas.
  • você deve olhar para os dados anteriores também. Lembre-se, o que importa é a distribuição da população em geral, não a distribuição de sua amostra. Ao decidir se uma população é Gaussiana, veja todos os dados disponíveis, não apenas os dados da experiência atual.considere a fonte de dispersão., Quando a dispersão vem da soma de numerosas fontes (sem nenhuma fonte contribuindo a maior parte da dispersão), você espera encontrar uma distribuição gaussiana aproximadamente.
  • Quando em dúvida, algumas pessoas escolhem um teste paramétrico (porque não têm a certeza de que a suposição Gaussiana é violada), e outras escolhem um teste não paramétrico (porque não têm a certeza de que a suposição Gaussiana é cumprida).

escolher entre testes paramétricos e não paramétricos: isso importa?

importa se você escolhe um teste paramétrico ou não paramétrico? A resposta depende do tamanho da amostra., Há quatro casos para pensar:

  • amostra grande. O que acontece quando você usa um teste paramétrico com dados de uma população nongaussiana? O teorema do limite central (discutido no Capítulo 5) garante que os testes paramétricos funcionam bem com grandes amostras, mesmo que a população não seja Gaussiana. Em outras palavras, Testes Paramétricos são robustos para desvios das distribuições Gaussianas, desde que as amostras sejam grandes. O problema é que é impossível dizer quão grande é o suficiente, pois depende da natureza da distribuição particular não-Gaussiana., A menos que a distribuição da população seja realmente estranha, você provavelmente está seguro escolhendo um teste paramétrico quando há pelo menos duas dúzias de pontos de dados em cada grupo.amostra grande. O que acontece quando você usa um teste não paramétrico com dados de uma população Gaussiana? Os testes não paramétricos funcionam bem com grandes amostras de populações Gaussianas. Os valores de P tendem a ser um pouco grandes demais, mas a discrepância é pequena. Por outras palavras, os testes não paramétricos são apenas ligeiramente menos potentes do que os testes paramétricos com amostras grandes.amostras pequenas., O que acontece quando você usa um teste paramétrico com dados de populações nongaussianas? Você não pode confiar no teorema central do limite, então o valor P pode ser impreciso.amostras pequenas. Quando você usa um teste não paramétrico com dados de uma população Gaussiana, os valores de P tendem a ser muito altos. Os testes não paramétricos carecem de poder estatístico com pequenas amostras.assim, grandes conjuntos de dados não apresentam problemas., Geralmente é fácil dizer se os dados vêm de uma população Gaussiana, mas não importa porque os testes não paramétricos são tão poderosos e os testes paramétricos são tão robustos. Pequenos conjuntos de dados apresentam um dilema. É difícil dizer se os dados vêm de uma população Gaussiana, mas isso importa muito. Os testes não paramétricos não são poderosos e os testes paramétricos não são robustos.valor de P de uma ou duas faces?

    com muitos testes, você deve escolher se deseja calcular um valor P de um ou dois lados (o mesmo que o valor p de uma ou duas caudas)., A diferença entre os valores de P unilateral e bilateral foi discutida no Capítulo 10. Vamos rever a diferença no contexto de um teste T. O valor P é calculado para a hipótese nula de que os dois meios da população são iguais, e qualquer discrepância entre os dois meios da amostra é devida ao acaso. Se esta hipótese nula for verdadeira, o valor de P unilateral é a probabilidade de dois meios de amostra diferirem tanto quanto foi observado (ou mais) na direção especificada pela hipótese apenas por acaso, mesmo que os meios das populações globais sejam realmente iguais., O valor de P bidireccional também inclui a probabilidade de que os meios da amostra diferissem muito na direção oposta (ou seja, o outro grupo tem a média maior). O valor de P de duas faces é o dobro do valor de P unilateral.

    um valor de P unilateral é apropriado quando você pode afirmar com certeza (e antes de coletar quaisquer dados) que não haverá diferença entre os meios ou que a diferença irá em uma direção que você pode especificar antecipadamente (ou seja, você especificou que grupo terá a média maior)., Se você não puder especificar a direção de qualquer diferença antes de coletar dados, então um valor p de dois lados é mais apropriado. Em caso de dúvida, seleccione um valor p de dois lados.

    Se seleccionar um teste unilateral, deverá fazê-lo antes de recolher quaisquer dados e terá de indicar a direcção da sua hipótese experimental. Se os dados vão para o outro lado, você deve estar disposto a atribuir essa diferença (ou associação ou correlação) ao acaso, não importa quão marcantes os dados. Se você ficar intrigado, mesmo um pouco, por dados que vão na direção “errada”, então você deve usar um valor P de dois lados., Por razões discutidas no Capítulo 10, eu recomendo que você sempre calcule um valor p bidireccional.teste emparelhado ou não?

    ao comparar dois grupos, você precisa decidir se deve usar um teste emparelhado. Ao comparar três ou mais grupos, o termo emparelhado não é apt e o termo medidas repetidas é usado em vez disso.

    Use um teste não emparelhado para comparar grupos quando os valores individuais não são emparelhados ou emparelhados uns com os outros., Selecione um teste de medidas emparelhadas ou repetidas quando os valores representam medições repetidas em um indivíduo (antes e depois de uma intervenção) ou medições em indivíduos emparelhados. Os testes emparelhados ou repetidos são também adequados para experiências laboratoriais repetidas realizadas em momentos diferentes, cada uma com o seu próprio controlo.

    deve seleccionar um teste emparelhado quando os valores num grupo estão mais estreitamente correlacionados com um valor específico no outro grupo do que com valores aleatórios no outro grupo., Só é adequado seleccionar um teste emparelhado quando os indivíduos foram emparelhados ou emparelhados antes de os dados serem recolhidos. Você não pode basear o emparelhamento nos dados que está analisando.teste de FISHER ou teste Qui-quadrado?

    ao analisar tabelas de contingência com duas linhas e duas colunas, você pode usar o teste exato de Fisher ou o teste Qui-quadrado. O teste de Fisher é a melhor escolha, pois sempre dá o valor P exato. O teste Qui-quadrado é mais simples de calcular, mas produz apenas um valor p aproximado., Se um computador está fazendo os cálculos, você deve escolher o teste de Fisher a menos que você prefira a familiaridade do teste chi-square. Você deve definitivamente evitar o teste do Qui-quadrado quando os números na tabela de contingência são muito pequenos (qualquer número menor que cerca de seis). Quando os números são maiores, os valores P relatados pelo qui-quadrado e teste de Fisher serão muito semelhantes.

    o teste Qui-quadrado calcula valores aproximados de P, e a correção de continuidade de Yates é projetada para tornar a aproximação melhor. Sem a correção de Yates, os valores de P são muito baixos., No entanto, a correcção vai longe de mais e o valor de P resultante é demasiado elevado. Os estaticistas dão diferentes recomendações sobre a correção de Yates. Com grandes tamanhos de amostra, a correção de Yates faz pouca diferença. Se você selecionar o teste de Fisher, o valor P é exato e a correção de Yates não é necessária e não está disponível.regressão ou correlação?a regressão Linear e a correlação são semelhantes e facilmente confundidas. Em algumas situações faz sentido realizar ambos os cálculos., Calcule a correlação linear se você mediu X e Y em cada assunto e deseja quantificar quão bem eles estão associados. Seleccione o coeficiente de correlação de Pearson (paramétrico) se puder assumir que tanto X como Y são amostrados a partir de populações Gaussianas. Caso contrário, escolha o coeficiente de correlação não paramétrico Spearman. Não calcule o coeficiente de correlação (ou o seu intervalo de confiança) se manipulou a variável X.

    calcular regressões lineares apenas se uma das variáveis (X) for provável que precede ou cause a outra variável (Y)., Definitivamente escolha regressão linear se você manipulou a variável X. Ele faz uma grande diferença que variável é chamada X e que é chamada Y, como cálculos de regressão linear não são simétricos em relação a X e Y. Se você trocar as duas variáveis, você vai obter uma linha de regressão diferente. Em contraste, os cálculos de correlação linear são simétricos em relação a X e Y. Se você trocar as etiquetas X e Y, você ainda terá o mesmo coeficiente de correlação.

Author: admin

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *