title: "02-a Application au jeu de données `abalone`"
output:
bookdown::pdf_document2:
number_section: yes
includes:
in_header: preamble.tex
toc: false
classoption: fleqn
---
# Récupération du jeu de données
Téléchargeons le jeu de données [`abalone`](http://archive.ics.uci.edu/ml/datasets/Abalone) depuis le répertoire de l'Université de Californie Irvine (University of California Irvine, UCI, machine learning repository).
Les variables sont très corrélées. Mesurons les colinéarités par les facteurs d'inflation de la variance.
```{r}
library(car)
vif(lm(rings ~ ., data = abalone))
```
Parmi les variables corrélées, nous proposons de conserver celles avec les scores VIF les plus faibles (c'est-à-dire celles dont la variance s'explique le moins par la variance d'autres variables).
Une augmentation de `length` de $1mm$ augmente la prédiction de $1.1$ anneaux avec un intervalle de confiance à $95\%$ qui vaut $[0.95,1.27]$.
De même pour les autres variables continues.
Un passage de la variable `sex` de la catégorie de référence F à la catégorie I entraîne une diminution du nombre d'anneaux prédits de $0.12$ avec un intervalle de confiance à $95\%$ qui vaut $[-0.14,-0.10]$.