Qu’est-ce que la régression linéaire Multiple (MLR)?
la régression linéaire Multiple (MLR), également appelée simplement régression multiple, est une technique statistique qui utilise plusieurs variables explicatives pour prédire le résultat d’une variable de réponse. L’objectif de la régression linéaire multiple (MLR) est de modéliser la relation linéaire entre les variables explicatives (indépendantes) et la variable de réponse (dépendante).,
en substance, la régression multiple est l’extension de la régression des moindres carrés ordinaires (OLS) car elle implique plus d’une variable explicative.
formule et calcul de la régression linéaire Multiple
principaux points à retenir
- La régression linéaire Multiple (MLR), également appelée simplement régression multiple, est une technique statistique qui utilise plusieurs variables explicatives pour prédire le résultat d’une variable de réponse.,
- La régression Multiple est une extension de la régression linéaire (OLS) qui utilise une seule variable explicative.
- Le MLR est largement utilisé en économétrie et en inférence financière.
ce que la régression linéaire Multiple (MLR) peut vous dire
la régression linéaire Simple est une fonction qui permet à un analyste ou statisticien de faire des prédictions sur une variable en fonction des informations connues sur une autre variable. La régression linéaire ne peut être utilisée que lorsque l’on a deux variables continues—une variable indépendante et une variable dépendante., La variable indépendante est le paramètre utilisé pour calculer la variable dépendante ou le résultat. Un modèle de régression multiple s’étend à plusieurs variables explicatives.,g hypothèses:
- Il existe une relation linéaire entre les variables dépendantes et les variables indépendantes
- Les variables indépendantes ne sont pas trop fortement corrélées les unes avec les autres
- Les observations yi sont sélectionnées indépendamment et au hasard de la population
- Les résidus doivent normalement être distribués avec une moyenne de 0 et mesure utilisée pour mesurer la part de la variation des résultats qui peut être expliquée par la variation des variables indépendantes., R2 augmente toujours à mesure que plus de prédicteurs sont ajoutés au modèle MLR, même si les prédicteurs peuvent ne pas être liés à la variable de résultat.
R2 en soi ne peut donc pas être utilisé pour identifier quels prédicteurs doivent être inclus dans un modèle et lesquels doivent être exclus. R2 ne peut être compris qu’entre 0 et 1, où 0 indique que le résultat ne peut être prédit par aucune des variables indépendantes et 1 indique que le résultat peut être prédit sans erreur à partir des variables indépendantes.,
lors de l’interprétation des résultats de la régression multiple, les coefficients bêta sont valides tout en maintenant toutes les autres variables constantes (« tout le reste égal »). La sortie d’une régression multiple peut être affichée horizontalement sous forme d’équation ou verticalement sous forme de tableau.
exemple D’utilisation de la régression linéaire Multiple (MLR)
à titre d’exemple, un analyste peut vouloir savoir comment le mouvement du marché affecte le prix D’ExxonMobil (XOM)., Dans ce cas, leur équation linéaire aura la valeur de l’indice S&P 500 comme variable indépendante, ou prédicteur, et le prix de XOM comme variable dépendante.
en réalité, plusieurs facteurs prédisent l’issue d’un événement. Le mouvement des prix D’ExxonMobil, par exemple, dépend de plus que de la performance du marché global. D’autres prédicteurs tels que le prix du pétrole, les taux d’intérêt et le mouvement des prix des contrats à terme sur le pétrole peuvent affecter le prix de XOM et les cours des actions d’autres sociétés pétrolières., Pour comprendre une relation dans laquelle plus de deux variables, régression linéaire multiple est utilisé.
la régression linéaire Multiple (MLR) est utilisée pour déterminer une relation mathématique entre un certain nombre de variables aléatoires. En d’autres termes, MLR examine comment plusieurs variables indépendantes sont liées à une variable dépendante. Une fois que chacun des facteurs indépendants a été déterminé pour prédire la variable dépendante, l’information sur les variables multiples peut être utilisée pour créer une prédiction précise sur le niveau d’effet qu’ils ont sur la variable de résultat., Le modèle crée une relation sous la forme d’une ligne droite (linéaire) qui se rapproche le mieux de tous les points de données individuels.,
- xi2 = prix du pétrole
- xi3 = valeur de S&indice P 500
- xi4= prix du pétrole à terme
- B0 = y-intercept au temps zéro
- B1 = coefficient de régression qui mesure une variation unitaire de la variable dépendante lorsque xi1 change – la variation du prix XOM lorsque les taux d’intérêt changent
- B2 = valeur du coefficient qui mesure une variation unitaire de la variable dépendante lorsque Xi2 change—la variation du prix Xom lorsque les prix du pétrole changent
les estimations des moindres carrés, B0, B1, B2 BP BP, sont généralement calculées par un logiciel statistique., Autant de variables peuvent être incluses dans le modèle de régression dans lequel chaque variable indépendante est différenciée par un nombre—1,2, 3, 4…P. le modèle de régression multiple permet à un analyste de prédire un résultat en fonction de l’information fournie sur plusieurs variables explicatives.
pourtant, le modèle n’est pas toujours parfaitement précis car chaque point de données peut différer légèrement du résultat prédit par le modèle. La valeur résiduelle, E, qui est la différence entre le résultat réel et le résultat prévu, est incluse dans le modèle pour tenir compte de ces légères variations.,
En supposant que nous exécutions notre modèle de régression des prix XOM via un logiciel de calcul statistique, qui renvoie cette sortie:
Un analyste interpréterait cette sortie comme signifiant que si d’autres variables sont maintenues constantes, le prix de Xom augmentera de 7,8% si le prix du pétrole sur les marchés augmente de 1%. Le modèle montre également que le prix de XOM diminuera de 1.,5% suite à une hausse de 1% des taux d’intérêt. R2 indique que 86,5% des variations du cours de L’action D’Exxon Mobil peuvent s’expliquer par des variations du taux d’intérêt, du prix du pétrole, des contrats à terme sur le pétrole et de L’indice S&p 500.
la différence entre la régression linéaire et la régression Multiple
la régression des carrés linéaires ordinaires (OLS) compare la réponse d’une variable dépendante en fonction d’un changement dans certaines variables explicatives. Cependant, il est rare qu’une variable dépendante est expliquée par une seule variable., Dans ce cas, un analyste utilise la régression multiple, qui tente d’expliquer une variable dépendante en utilisant plus d’une variable indépendante. Plusieurs régressions peuvent être linéaires et non linéaires.
les régressions Multiples sont basées sur l’hypothèse qu’il existe une relation linéaire entre les deux variables dépendantes et indépendantes. Il suppose également aucune corrélation majeure entre les variables indépendantes.,