Imagine que você esteve no Projeto TAMAR 🐢 e conseguiu ter acesso aos dados de 29 tartarugas-verdes (Chelonia mydas) para essas variáveis: massa, comprimento curvilíneo da carapaça, largura curvilínea da carapaça, idade e presença/ausência de FP. Como um jovem ecólogo curioso que é, você faz o seguinte questionamento:
- Pergunta:“Como o comprimento, largura, idade e FP podem influenciar a massa do animal?”
- Hipótese: Indivíduos com maior comprimento, maior largura, mais velhos e com FP terão mais massa."
Você então procura no Google alguma maneira de testar sua hipótese no R e lê algo sobre regressão linear múltipla (= modelo linear, na prática). Com ela você pode testar se múltiplas variáveis preditoras quantitativas (no caso, comprimento, largura e idade) ou categórica (no caso, presença/ausência de FP) podem influenciar uma variável resposta (massa). O modelo de regressão linear múltipla pode ser definido como
y = β0 + β1*x1 + β2*x2 + ⋯ + βk*xk
na qual x são as variáveis preditoras, y é a variável resposta, β0 é o ponto de intercepto da linha com o eixo y e βk é coeficiente angular da reta. Vamos agora rodar isso no R!