26 julho, 2020

Modelo Linear (Regressão Linear Múltipla) aplicada à fibropapilomatose no R


Tartarugas-marinhas são afligidas por tumores chamados fibropapilomatose (FP). Antigamente, alguns cientistas imaginavam que animais doentes (com FP) poderiam não conseguir se alimentar direito e portanto seriam mais magros do que animais saudáveis (sem FP). Hoje, muitos estudos ao redor do mundo indicam que animais com tumores são na verdade mais pesados, possivelmente devido ao peso que os tumores acrescentam na massa total da tartaruga. 

Imagine que você esteve no Projeto TAMAR 🐢 e conseguiu ter acesso aos dados de 29 tartarugas-verdes (Chelonia mydas) para essas variáveis: massa, comprimento curvilíneo da carapaça, largura curvilínea da carapaça, idade e presença/ausência de FP. Como um jovem ecólogo curioso que é, você faz o seguinte questionamento: 


  • Pergunta:“Como o comprimento, largura, idade e FP podem influenciar a massa do animal?”
  • Hipótese: Indivíduos com maior comprimento, maior largura, mais velhos e com FP terão mais massa."


Você então procura no Google alguma maneira de testar sua hipótese no R e lê algo sobre regressão linear múltipla (= modelo linear, na prática). Com ela você pode testar se múltiplas variáveis preditoras quantitativas (no caso, comprimento, largura e idade) ou categórica (no caso, presença/ausência de FP) podem influenciar uma variável resposta (massa). O modelo de regressão linear múltipla pode ser definido como


y = β0 ​+ β1​*x1 ​+ β2*​x2 ​+ ⋯ + βk*​xk


na qual x são as variáveis preditoras, y é a variável resposta, β0 é o ponto de intercepto da linha com o eixo y e βk​ é coeficiente angular da reta. Vamos agora rodar isso no R!