{"id":812530,"date":"2019-03-14T22:43:49","date_gmt":"2019-03-15T05:43:49","guid":{"rendered":"https:\/\/www.questionpro.com\/blog\/analyse-de-la-regression\/"},"modified":"2023-09-05T04:28:42","modified_gmt":"2023-09-05T04:28:42","slug":"analyse-de-la-regression","status":"publish","type":"post","link":"https:\/\/www.questionpro.com\/blog\/fr\/analyse-de-la-regression\/","title":{"rendered":"Analyse de r\u00e9gression : D\u00e9finition, types, utilisation et avantages"},"content":{"rendered":"\n
L’analyse de r\u00e9gression est peut-\u00eatre l’une des m\u00e9thodes statistiques les plus utilis\u00e9es pour \u00e9tudier ou estimer la relation entre un ensemble de variables ind\u00e9pendantes et d\u00e9pendantes. Dans l’analyse statistique, il est essentiel de faire la distinction entre les donn\u00e9es cat\u00e9gorielles et les donn\u00e9es num\u00e9riques<\/a>, car les donn\u00e9es cat\u00e9gorielles impliquent des cat\u00e9gories ou des \u00e9tiquettes distinctes, tandis que les donn\u00e9es num\u00e9riques consistent en des quantit\u00e9s mesurables.<\/p>\n\n Il est \u00e9galement utilis\u00e9 comme terme g\u00e9n\u00e9rique pour les diff\u00e9rentes techniques d’analyse des donn\u00e9es<\/a> utilis\u00e9es dans une m\u00e9thode de recherche qualitative<\/a> pour mod\u00e9liser et analyser de nombreuses variables. Dans la m\u00e9thode de r\u00e9gression, la variable d\u00e9pendante est un pr\u00e9dicteur ou un \u00e9l\u00e9ment explicatif, et la variable d\u00e9pendante est le r\u00e9sultat ou une r\u00e9ponse \u00e0 une requ\u00eate sp\u00e9cifique.<\/p>\n\n \n APPRENDRE SUR :<\/strong>\n<\/em> \n Les m\u00e9thodes d’analyse statistique<\/a>\n<\/em><\/p>\n\n Index du contenu<\/p>\n\n L’analyse de r\u00e9gression est souvent utilis\u00e9e pour mod\u00e9liser ou analyser des donn\u00e9es. La plupart des analystes d’enqu\u00eates l’utilisent pour comprendre la relation entre les variables, qui peut ensuite \u00eatre utilis\u00e9e pour pr\u00e9dire le r\u00e9sultat pr\u00e9cis.<\/p>\n\n Exemple – Supposons qu’une entreprise de boissons non alcoolis\u00e9es souhaite \u00e9tendre son unit\u00e9 de production \u00e0 un nouveau site. Avant d’aller de l’avant, l’entreprise souhaite analyser son mod\u00e8le de g\u00e9n\u00e9ration de revenus et les diff\u00e9rents facteurs susceptibles de l’influencer. L’entreprise m\u00e8ne donc une enqu\u00eate en ligne<\/a> \u00e0 l’aide d’un questionnaire sp\u00e9cifique.<\/p>\n\n Apr\u00e8s avoir utilis\u00e9 l’analyse de r\u00e9gression, il devient plus facile pour l’entreprise d’analyser les r\u00e9sultats de l’enqu\u00eate et de comprendre la relation entre diff\u00e9rentes variables telles que l’\u00e9lectricit\u00e9 et le chiffre d’affaires – ici, le chiffre d’affaires est la variable d\u00e9pendante.<\/p>\n\n APPRENEZ-EN DAVANTAGE SUR LE SUJET :<\/strong> Niveau d’analyse<\/a><\/em><\/p>\n\n En outre, la compr\u00e9hension de la relation entre diff\u00e9rentes variables ind\u00e9pendantes, telles que la tarification, le nombre de travailleurs et la logistique, et le chiffre d’affaires permet \u00e0 l’entreprise d’estimer l’impact de divers facteurs sur les ventes et les b\u00e9n\u00e9fices.<\/p>\n\n Les enqu\u00eateurs utilisent souvent cette technique pour examiner et trouver une corr\u00e9lation entre diff\u00e9rentes variables d’int\u00e9r\u00eat. Elle permet d’\u00e9valuer l’influence de diff\u00e9rentes variables ind\u00e9pendantes sur une variable d\u00e9pendante.<\/p>\n\n Dans l’ensemble, l’analyse de r\u00e9gression permet aux enqu\u00eateurs d’\u00e9conomiser des efforts suppl\u00e9mentaires en organisant plusieurs variables ind\u00e9pendantes dans des tableaux et en testant ou en calculant leur effet sur une variable d\u00e9pendante. Diff\u00e9rents types de m\u00e9thodes de recherche analytique<\/a> sont largement utilis\u00e9s pour \u00e9valuer les nouvelles id\u00e9es commerciales<\/a> et prendre des d\u00e9cisions en connaissance de cause.<\/p>\n\n Cr\u00e9er un compte gratuit<\/strong><\/a><\/p>\n\n Les chercheurs commencent g\u00e9n\u00e9ralement par apprendre la r\u00e9gression lin\u00e9aire et logistique. En raison de la connaissance g\u00e9n\u00e9ralis\u00e9e de ces deux m\u00e9thodes et de leur facilit\u00e9 d’application, de nombreux analystes pensent qu’il n’existe que deux types de mod\u00e8les. Chaque mod\u00e8le a sa propre sp\u00e9cialit\u00e9 et sa propre capacit\u00e9 \u00e0 fonctionner si des conditions sp\u00e9cifiques sont remplies.<\/p>\n\n Ce blog explique les sept types de m\u00e9thodes d’analyse de r\u00e9gression multiple couramment utilis\u00e9es pour interpr\u00e9ter les donn\u00e9es de recensement dans diff\u00e9rents formats.<\/p>\n\n C’est l’une des techniques de mod\u00e9lisation les plus connues, car elle fait partie des premi\u00e8res m\u00e9thodes d’analyse de r\u00e9gression d’\u00e9lite utilis\u00e9es par les gens au moment de l’apprentissage de la mod\u00e9lisation pr\u00e9dictive. Ici, la variable d\u00e9pendante est continue et la variable ind\u00e9pendante est plus souvent continue ou discr\u00e8te avec une ligne de r\u00e9gression lin\u00e9aire.<\/p>\n\n Veuillez noter que la r\u00e9gression lin\u00e9aire multiple comporte plus d’une variable ind\u00e9pendante que la r\u00e9gression lin\u00e9aire simple. Par cons\u00e9quent, la r\u00e9gression lin\u00e9aire ne doit \u00eatre utilis\u00e9e que lorsqu’il existe une relation lin\u00e9aire entre la variable ind\u00e9pendante et la variable d\u00e9pendante.<\/p>\n\n Une entreprise peut utiliser la r\u00e9gression lin\u00e9aire pour mesurer l’efficacit\u00e9 des campagnes de marketing, des prix et des promotions sur les ventes d’un produit. Supposons qu’une entreprise vendant des \u00e9quipements sportifs veuille savoir si les fonds qu’elle a investis dans le marketing et l’image de marque de ses produits lui ont rapport\u00e9 des b\u00e9n\u00e9fices substantiels ou non.<\/p>\n\n La r\u00e9gression lin\u00e9aire est la meilleure m\u00e9thode statistique pour interpr\u00e9ter les r\u00e9sultats. L’avantage de la r\u00e9gression lin\u00e9aire est qu’elle permet \u00e9galement d’analyser l’impact obscur de chaque activit\u00e9 de marketing et de strat\u00e9gie de marque, tout en contr\u00f4lant le potentiel des composants \u00e0 r\u00e9guler les ventes.<\/p>\n\n Si l’entreprise m\u00e8ne simultan\u00e9ment deux ou plusieurs campagnes publicitaires, l’une \u00e0 la t\u00e9l\u00e9vision et les deux autres \u00e0 la radio, la r\u00e9gression lin\u00e9aire permet d’analyser facilement l’influence ind\u00e9pendante et combin\u00e9e de la diffusion simultan\u00e9e de ces publicit\u00e9s.<\/p>\n\n APPRENEZ-EN DAVANTAGE SUR LES PROJETS D’ANALYSE DE DONN\u00c9ES :<\/strong> Projets d’analyse de donn\u00e9es<\/a><\/p>\n\n La r\u00e9gression logistique est couramment utilis\u00e9e pour d\u00e9terminer la probabilit\u00e9 de r\u00e9ussite ou d’\u00e9chec d’un \u00e9v\u00e9nement. La r\u00e9gression logistique est utilis\u00e9e lorsque la variable d\u00e9pendante est binaire, comme 0\/1, Vrai\/Faux ou Oui\/Non. On peut donc dire que la r\u00e9gression logistique est utilis\u00e9e pour analyser soit les questions ferm\u00e9es<\/a> d’une enqu\u00eate, soit les questions exigeant des r\u00e9ponses num\u00e9riques dans une enqu\u00eate.<\/p>\n\n Veuillez noter que la r\u00e9gression logistique ne n\u00e9cessite pas de relation lin\u00e9aire entre une variable d\u00e9pendante et une variable ind\u00e9pendante, tout comme la r\u00e9gression lin\u00e9aire. La r\u00e9gression logistique applique une transformation logarithmique non lin\u00e9aire pour pr\u00e9dire le rapport de cotes ; elle traite donc facilement divers types de relations entre une variable d\u00e9pendante et une variable ind\u00e9pendante.<\/p>\n\n La r\u00e9gression logistique est largement utilis\u00e9e pour analyser les donn\u00e9es cat\u00e9gorielles, en particulier pour les donn\u00e9es \u00e0 r\u00e9ponse binaire dans la mod\u00e9lisation des donn\u00e9es commerciales. Plus souvent, la r\u00e9gression logistique est utilis\u00e9e lorsque la variable d\u00e9pendante est cat\u00e9gorique, par exemple pour pr\u00e9dire si l’all\u00e9gation de sant\u00e9 faite par une personne est r\u00e9elle(1) ou frauduleuse, pour comprendre si la tumeur est maligne(1) ou non.<\/p>\n\n Les entreprises utilisent la r\u00e9gression logistique pour pr\u00e9dire si les consommateurs d’un groupe d\u00e9mographique particulier ach\u00e8teront leur produit ou s’ils ach\u00e8teront \u00e0 leurs concurrents en fonction de l’\u00e2ge, du revenu, du sexe, de la race, de l’\u00e9tat de r\u00e9sidence, d’un achat ant\u00e9rieur, etc.<\/p>\n\n La r\u00e9gression polynomiale est couramment utilis\u00e9e pour analyser des donn\u00e9es curvilignes lorsque la puissance d’une variable ind\u00e9pendante est sup\u00e9rieure \u00e0 1. Dans cette m\u00e9thode d’analyse de r\u00e9gression, la ligne la mieux adapt\u00e9e n’est jamais une \u00ab\u00a0ligne droite\u00a0\u00bb, mais toujours une \u00ab\u00a0ligne courbe\u00a0\u00bb qui s’adapte aux points de donn\u00e9es.<\/p>\n\n Veuillez noter qu’il est pr\u00e9f\u00e9rable d’utiliser la r\u00e9gression polynomiale lorsque deux variables ou plus ont des exposants et que quelques-unes n’en ont pas.<\/p>\n\n En outre, il peut mod\u00e9liser des donn\u00e9es s\u00e9parables non lin\u00e9aires en offrant la libert\u00e9 de choisir l’exposant exact pour chaque variable, et ce avec un contr\u00f4le total sur les fonctions de mod\u00e9lisation disponibles.<\/p>\n\n Combin\u00e9e \u00e0 l’analyse de la surface de r\u00e9ponse, la r\u00e9gression polynomiale est consid\u00e9r\u00e9e comme l’une des m\u00e9thodes statistiques sophistiqu\u00e9es couramment utilis\u00e9es dans la recherche sur le retour d’information multisource. La r\u00e9gression polynomiale est surtout utilis\u00e9e dans les secteurs de la finance et de l’assurance o\u00f9 la relation entre les variables d\u00e9pendantes et ind\u00e9pendantes est curviligne.<\/p>\n\n Supposons qu’une personne veuille budg\u00e9tiser ses d\u00e9penses en d\u00e9terminant le temps n\u00e9cessaire pour gagner une somme d\u00e9finitive. La r\u00e9gression polynomiale, en prenant en compte ses revenus et en pr\u00e9voyant ses d\u00e9penses, peut facilement d\u00e9terminer le temps pr\u00e9cis qu’il doit travailler pour gagner cette somme sp\u00e9cifique.<\/p>\n\n Il s’agit d’un processus semi-automatis\u00e9 qui permet de construire un mod\u00e8le statistique en ajoutant ou en supprimant la variable d\u00e9pendante sur la base des statistiques t de leurs coefficients estim\u00e9s.<\/p>\n\n Si elle est utilis\u00e9e correctement, la r\u00e9gression pas \u00e0 pas vous permettra de disposer de donn\u00e9es plus puissantes que n’importe quelle autre m\u00e9thode. Elle fonctionne bien lorsque vous travaillez avec un grand nombre de variables ind\u00e9pendantes. Il ne fait qu’affiner le mod\u00e8le d’unit\u00e9 d’analyse<\/a> en piquant des variables au hasard.<\/p>\n\n Il est recommand\u00e9 d’utiliser l’analyse de r\u00e9gression par \u00e9tapes lorsqu’il y a plusieurs variables ind\u00e9pendantes, la s\u00e9lection des variables ind\u00e9pendantes se faisant automatiquement sans intervention humaine.<\/p>\n\n Veuillez noter que dans la mod\u00e9lisation de r\u00e9gression par \u00e9tapes, la variable est ajout\u00e9e ou soustraite de l’ensemble des variables explicatives<\/a>. L’ensemble des variables ajout\u00e9es ou supprim\u00e9es est choisi en fonction des statistiques de test du coefficient estim\u00e9.<\/p>\n\n Supposons que vous disposiez d’un ensemble de variables ind\u00e9pendantes telles que l’\u00e2ge, le poids, la surface corporelle, la dur\u00e9e de l’hypertension, le pouls de base et l’indice de stress, dont vous souhaitez analyser l’impact sur la tension art\u00e9rielle.<\/p>\n\n Dans la r\u00e9gression par \u00e9tapes, le meilleur sous-ensemble de la variable ind\u00e9pendante est automatiquement choisi ; il commence soit par ne choisir aucune variable pour continuer (en ajoutant une variable \u00e0 la fois), soit par toutes les variables du mod\u00e8le et proc\u00e8de \u00e0 rebours (en supprimant une variable \u00e0 la fois).<\/p>\n\n Ainsi, l’analyse de r\u00e9gression permet de calculer l’impact de chaque variable ou d’un groupe de variables sur la pression art\u00e9rielle.<\/p>\n\n La r\u00e9gression ridge est bas\u00e9e sur la m\u00e9thode des moindres carr\u00e9s ordinaires qui est utilis\u00e9e pour analyser des donn\u00e9es multicollin\u00e9aires (donn\u00e9es o\u00f9 les variables ind\u00e9pendantes sont fortement corr\u00e9l\u00e9es). La colin\u00e9arit\u00e9 peut \u00eatre expliqu\u00e9e comme une relation quasi lin\u00e9aire entre les variables.<\/p>\n\n En cas de multicolin\u00e9arit\u00e9, les estimations des moindres carr\u00e9s ne seront pas biais\u00e9es, mais si la diff\u00e9rence entre elles est plus importante, elle peut \u00eatre tr\u00e8s \u00e9loign\u00e9e de la valeur r\u00e9elle. Cependant, la r\u00e9gression ridge \u00e9limine les erreurs standard en ajoutant un certain degr\u00e9 de biais aux estimations de r\u00e9gression dans le but de fournir des estimations plus fiables.<\/p>\n\n Si vous le souhaitez, vous pouvez \u00e9galement vous informer sur les biais de s\u00e9lection<\/a> en consultant notre blog.<\/p>\n\n Veuillez noter que les hypoth\u00e8ses d\u00e9riv\u00e9es de la r\u00e9gression ridge sont similaires \u00e0 celles de la r\u00e9gression des moindres carr\u00e9s, la seule diff\u00e9rence \u00e9tant la normalit\u00e9. Bien que la valeur du coefficient soit restreinte dans la r\u00e9gression ridge, elle n’atteint jamais z\u00e9ro, ce qui sugg\u00e8re l’incapacit\u00e9 de s\u00e9lectionner les variables.<\/p>\n\n Supposons que vous soyez fascin\u00e9 par deux guitaristes qui se produisent en direct lors d’un \u00e9v\u00e9nement pr\u00e8s de chez vous, et que vous alliez assister \u00e0 leur performance dans le but de savoir qui est le meilleur guitariste. Mais lorsque le spectacle commence, on remarque que les deux musiciens jouent des notes noires et bleues en m\u00eame temps.<\/p>\n\n Est-il possible de d\u00e9terminer le meilleur guitariste ayant le plus grand impact sur le son parmi eux lorsqu’ils jouent tous les deux fort et vite ? Comme ils jouent tous deux des notes diff\u00e9rentes, il est tr\u00e8s difficile de les diff\u00e9rencier, ce qui en fait le meilleur cas de multicolin\u00e9arit\u00e9, qui tend \u00e0 augmenter les erreurs standard des coefficients.<\/p>\n\n La r\u00e9gression ridge permet de rem\u00e9dier \u00e0 la multicolin\u00e9arit\u00e9 dans de tels cas et inclut un biais ou une estimation de r\u00e9duction pour d\u00e9river les r\u00e9sultats.<\/p>\n\n Lasso (Least Absolute Shrinkage and Selection Operator) est similaire \u00e0 la r\u00e9gression ridge, mais il utilise un biais en valeur absolue au lieu du biais carr\u00e9 utilis\u00e9 dans la r\u00e9gression ridge.<\/p>\n\n Il a \u00e9t\u00e9 d\u00e9velopp\u00e9 en 1989 comme alternative \u00e0 l’estimation traditionnelle des moindres carr\u00e9s dans le but de d\u00e9duire la majorit\u00e9 des probl\u00e8mes li\u00e9s \u00e0 l’ajustement excessif lorsque les donn\u00e9es comportent un grand nombre de variables ind\u00e9pendantes.<\/p>\n\n Lasso a la capacit\u00e9 de faire les deux – s\u00e9lectionner les variables et les r\u00e9gulariser avec un seuil doux. L’application de la r\u00e9gression lasso facilite la d\u00e9rivation d’un sous-ensemble de pr\u00e9dicteurs \u00e0 partir de la minimisation des erreurs de pr\u00e9diction lors de l’analyse d’une r\u00e9ponse quantitative.<\/p>\n\n Veuillez noter que les coefficients de r\u00e9gression atteignant la valeur z\u00e9ro apr\u00e8s le r\u00e9tr\u00e9cissement sont exclus du mod\u00e8le lasso. Au contraire, les coefficients de r\u00e9gression dont la valeur est sup\u00e9rieure \u00e0 z\u00e9ro sont fortement associ\u00e9s aux variables de r\u00e9ponse, les variables explicatives pouvant \u00eatre soit quantitatives, soit cat\u00e9gorielles, soit les deux.<\/p>\n\n Supposons qu’une entreprise automobile souhaite effectuer une recherche sur la consommation moyenne de carburant des voitures aux \u00c9tats-Unis. Pour les \u00e9chantillons, ils ont choisi 32 mod\u00e8les de voitures et 10 caract\u00e9ristiques de la conception automobile – nombre de cylindres, cylindr\u00e9e, puissance brute, rapport de l’essieu arri\u00e8re, poids, temps au \u00bc mile, v\/s moteur, transmission, nombre de vitesses et nombre de carburateurs.<\/p>\n\n Comme vous pouvez le constater, il existe une corr\u00e9lation entre la variable de r\u00e9ponse mpg (miles per gallon) et certaines variables telles que le poids, la cylindr\u00e9e, le nombre de cylindres et la puissance. Le probl\u00e8me peut \u00eatre analys\u00e9 en utilisant le paquetage glmnet dans R et la r\u00e9gression lasso pour la s\u00e9lection des caract\u00e9ristiques.<\/p>\n\n Il s’agit d’un m\u00e9lange de mod\u00e8les de r\u00e9gression ridge et lasso form\u00e9s avec les normes L1 et L2. Le filet \u00e9lastique produit un effet de regroupement dans lequel les variables pr\u00e9dictives fortement corr\u00e9l\u00e9es ont tendance \u00e0 entrer ou sortir ensemble du mod\u00e8le. L’utilisation du mod\u00e8le de r\u00e9gression du filet \u00e9lastique est recommand\u00e9e lorsque le nombre de pr\u00e9dicteurs est largement sup\u00e9rieur au nombre d’observations.<\/p>\n\n Veuillez noter que le mod\u00e8le de r\u00e9gression du filet \u00e9lastique a \u00e9t\u00e9 cr\u00e9\u00e9 en tant qu’option au mod\u00e8le de r\u00e9gression lasso, car la section variable de lasso d\u00e9pendait trop des donn\u00e9es, ce qui la rendait instable. En utilisant la r\u00e9gression \u00e9lastique nette, les statisticiens sont devenus capables de d\u00e9passer les p\u00e9nalit\u00e9s de la r\u00e9gression ridge et lasso uniquement pour obtenir le meilleur des deux mod\u00e8les.<\/p>\n\n Une \u00e9quipe de recherche clinique ayant acc\u00e8s \u00e0 un ensemble de donn\u00e9es de micror\u00e9seaux sur la leuc\u00e9mie (LEU) souhaitait construire une r\u00e8gle de diagnostic bas\u00e9e sur le niveau d’expression des \u00e9chantillons de g\u00e8nes pr\u00e9sent\u00e9s pour pr\u00e9dire le type de leuc\u00e9mie. L’ensemble de donn\u00e9es dont ils disposaient se composait d’un grand nombre de g\u00e8nes et de quelques \u00e9chantillons.<\/p>\n\n En outre, ils ont re\u00e7u un ensemble sp\u00e9cifique d’\u00e9chantillons \u00e0 utiliser comme \u00e9chantillons d’entra\u00eenement, dont certains \u00e9taient infect\u00e9s par une leuc\u00e9mie de type 1 (leuc\u00e9mie lymphoblastique aigu\u00eb) et d’autres par une leuc\u00e9mie de type 2 (leuc\u00e9mie my\u00e9lo\u00efde aigu\u00eb).<\/p>\n\n L’ajustement du mod\u00e8le et la s\u00e9lection des param\u00e8tres d’ajustement par CV d\u00e9cupl\u00e9 ont \u00e9t\u00e9 effectu\u00e9s sur les donn\u00e9es d’apprentissage. Ils ont ensuite compar\u00e9 les performances de ces m\u00e9thodes en calculant leur erreur quadratique moyenne de pr\u00e9diction sur les donn\u00e9es de test afin d’obtenir les r\u00e9sultats n\u00e9cessaires.<\/p>\n\n Une \u00e9tude de march\u00e9 se concentre sur trois matrices principales : la satisfaction du client<\/a>, la fid\u00e9lisation<\/a> du client et la d\u00e9fense des int\u00e9r\u00eats du client<\/a>. N’oubliez pas que si ces matrices nous renseignent sur la sant\u00e9 et les intentions des clients, elles ne nous indiquent pas les moyens d’am\u00e9liorer la situation. Par cons\u00e9quent, un questionnaire d’<\/a> enqu\u00eate approfondi visant \u00e0 demander aux consommateurs les raisons de leur insatisfaction est certainement un moyen d’obtenir des informations pratiques.<\/p>\n\n Cependant, il a \u00e9t\u00e9 constat\u00e9 que les gens ont souvent du mal \u00e0 exprimer leur motivation ou leur d\u00e9motivation ou \u00e0 d\u00e9crire leur satisfaction ou leur insatisfaction. En outre, les gens accordent toujours une importance excessive \u00e0 certains facteurs rationnels, tels que le prix, l’emballage, etc. Globalement, il s’agit d’un outil d’analyse pr\u00e9dictive et de pr\u00e9vision dans le cadre des \u00e9tudes de march\u00e9.<\/p>\n\n Utilis\u00e9e comme outil de pr\u00e9vision, l’analyse de r\u00e9gression permet de d\u00e9terminer les chiffres de vente d’une organisation en tenant compte des donn\u00e9es externes du march\u00e9. Une multinationale r\u00e9alise une \u00e9tude de march\u00e9<\/a> pour comprendre l’impact de divers facteurs tels que le PIB (produit int\u00e9rieur brut), l’IPC (indice des prix \u00e0 la consommation) et d’autres facteurs similaires sur son mod\u00e8le de g\u00e9n\u00e9ration de revenus.<\/p>\n\n De toute \u00e9vidence, l’analyse de r\u00e9gression en tenant compte des indicateurs de marketing pr\u00e9vus a \u00e9t\u00e9 utilis\u00e9e pour pr\u00e9dire les recettes provisoires qui seront g\u00e9n\u00e9r\u00e9es au cours des prochains trimestres et m\u00eame des prochaines ann\u00e9es. Cependant, plus vous avancerez dans le futur, plus les donn\u00e9es deviendront peu fiables, laissant une large marge d’erreur<\/a>.<\/p>\n\n Une entreprise de purificateurs d’eau souhaitait comprendre les facteurs conduisant \u00e0 la popularit\u00e9 de la marque. L’enqu\u00eate \u00e9tait le meilleur moyen d’atteindre les clients existants et potentiels. Une enqu\u00eate \u00e0 grande \u00e9chelle aupr\u00e8s des consommateurs a \u00e9t\u00e9 planifi\u00e9e et un questionnaire discret a \u00e9t\u00e9 pr\u00e9par\u00e9 \u00e0 l’aide du meilleur outil d’enqu\u00eate<\/a>.<\/p>\n\n Un certain nombre de questions relatives \u00e0 la marque, \u00e0 la popularit\u00e9, \u00e0 la satisfaction et \u00e0 l’insatisfaction probable ont \u00e9t\u00e9 pos\u00e9es dans le cadre de l’enqu\u00eate. Apr\u00e8s avoir obtenu des r\u00e9ponses optimales \u00e0 l’enqu\u00eate, une analyse de r\u00e9gression a \u00e9t\u00e9 utilis\u00e9e pour r\u00e9duire les dix principaux facteurs responsables de la favorisation de la marque.<\/p>\n\n Les dix attributs d\u00e9riv\u00e9s (mentionn\u00e9s dans l’image ci-dessous) ont tous, d’une mani\u00e8re ou d’une autre, mis en \u00e9vidence leur importance dans l’impact sur la popularit\u00e9 de cette marque sp\u00e9cifique de purificateur d’eau.<\/p>\n Il est facile d’effectuer une analyse de r\u00e9gression \u00e0 l’aide d’Excel ou de SPSS, mais il faut alors comprendre l’importance des quatre chiffres dans l’interpr\u00e9tation des donn\u00e9es.<\/p>\n\n Dans certains cas, le coefficient simple est remplac\u00e9 par un coefficient normalis\u00e9 qui d\u00e9montre la contribution de chaque variable ind\u00e9pendante \u00e0 l’\u00e9volution ou au changement de la variable d\u00e9pendante.<\/p>\n\n Cr\u00e9er un compte gratuit<\/strong><\/a><\/p>\n\n Savez-vous qu’utiliser l’analyse de r\u00e9gression pour comprendre les r\u00e9sultats d’une enqu\u00eate aupr\u00e8s des entreprises<\/a> revient \u00e0 avoir le pouvoir de d\u00e9voiler les opportunit\u00e9s et les risques futurs ?<\/p>\n\n Par exemple, apr\u00e8s avoir vu un cr\u00e9neau publicitaire particulier \u00e0 la t\u00e9l\u00e9vision, nous pouvons pr\u00e9dire le nombre exact d’entreprises en utilisant ces donn\u00e9es pour estimer une offre maximale pour ce cr\u00e9neau. Le secteur de la finance et de l’assurance dans son ensemble d\u00e9pend beaucoup de l’analyse de r\u00e9gression des donn\u00e9es d’enqu\u00eate pour identifier les tendances et les opportunit\u00e9s en vue d’une planification et d’une prise de d\u00e9cision plus pr\u00e9cises.<\/p>\n\n Savez-vous que les entreprises utilisent l’analyse de r\u00e9gression pour optimiser leurs processus op\u00e9rationnels ?<\/p>\n\n\n\t
D\u00e9finition de l’analyse de r\u00e9gression<\/h2>\n\n
Types d’analyse de r\u00e9gression<\/h2>\n\n
01. Analyse de r\u00e9gression lin\u00e9aire<\/h3>\n\n
Exemple<\/h4>\n\n
02. Analyse de r\u00e9gression logistique<\/h3>\n\n
Exemple<\/h4>\n\n
03. Analyse de r\u00e9gression polynomiale<\/h3>\n\n
Exemple<\/h4>\n\n
04. Analyse de r\u00e9gression par \u00e9tapes<\/h3>\n\n
Exemple<\/h4>\n\n
05. Analyse de r\u00e9gression de la cr\u00eate<\/h3>\n\n
Exemple<\/h4>\n\n
06. Analyse de r\u00e9gression Lasso<\/h3>\n\n
Exemple<\/h4>\n\n
07. Analyse de r\u00e9gression du r\u00e9seau \u00e9lastique<\/h3>\n\n
Exemple<\/h4>\n\n
Utilisation de l’analyse de r\u00e9gression dans les \u00e9tudes de march\u00e9<\/h2>\n\n
\u00c9tude de cas sur l’utilisation de l’analyse de r\u00e9gression<\/h3>\n\n
<\/figure><\/div>\n
Comment l’analyse de r\u00e9gression permet-elle de tirer des enseignements des enqu\u00eates ?<\/h2>\n\n
Les deux premiers chiffres sur les quatre concernent directement le mod\u00e8le de r\u00e9gression lui-m\u00eame.<\/h3>\n\n
\n
Les deux autres nombres se rapportent \u00e0 chacune des variables ind\u00e9pendantes lors de l’interpr\u00e9tation de l’analyse de r\u00e9gression.<\/h3>\n\n
\n
Avantages de l’analyse de r\u00e9gression dans une enqu\u00eate en ligne<\/h2>\n\n
01. Acc\u00e9der \u00e0 l’analyse pr\u00e9dictive<\/h3>\n\n
02. Am\u00e9liorer l’efficacit\u00e9 op\u00e9rationnelle<\/h3>\n\n