Régression linéaire
Last updated
Was this helpful?
Last updated
Was this helpful?
On récupère donc des données intéressantes : le coefficient de la droite et la valeur à l'origine.Prenons un exemple : j'ai généré des données aléatoires, et tracé un graphique
L'idée est de réussir à tracer une régression linéaire, et obtenir l'équation de la droite.
Pour obtenir une régression linéaire à partir de données, et obtenir l'équation de la droite, on utilise un nouveau module : scipy.stats
. C'est à dire le module "stats" contenu dans la librairie "scipy". Et dans ce module, c'est la fonction "linregress" qui nous interesse.
On peut donc au choix importer la fonction seulement :
Ou alors faire comme précédemment, créer un alias et appeler la fonction en passant par l'alias. Étant donné que c'est l'unique fonction de ce module que nous allons utiliser, cette approche n'apporte pas de gain.
Deux approches : par la doc : https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.linregress.html
ou démonstration par l'exemple
Voyons maintenant ce que contient la variable reg
:
slope : la pente
intercept : la valeur à l'origine
rvalue : coefficient de corrélation (le plus proche de 1 est le mieux)
La régression étant une droite du type ax+b
On récupère le coefficient "a" par la première valeur, soit reg[0] ; et l'ordonnée à l'origine par reg[1]
On peut maintenant tracer la droite :
C'est souvent l'un des objectif : trouver l'équation de la droite.
On va donc afficher le "slope", ici reg[0], et l'ordonnée à l'origine "intercept", ici reg[1]
Ca peut être affiché en console. Voici un exemple qui l'affiche à coté de la droite.
Le graphique a été enrichi de décorations et peut vous servir de "mémo"