{"id":1009940,"date":"2019-03-14T22:43:49","date_gmt":"2019-03-15T05:43:49","guid":{"rendered":"https:\/\/www.questionpro.com\/blog\/analisi-di-regressione-definizione-tipi-utilizzo-e-vantaggi\/"},"modified":"2025-02-13T23:07:06","modified_gmt":"2025-02-14T06:07:06","slug":"analisi-di-regressione-definizione-tipi-utilizzo-e-vantaggi","status":"publish","type":"post","link":"https:\/\/www.questionpro.com\/blog\/it\/analisi-di-regressione-definizione-tipi-utilizzo-e-vantaggi\/","title":{"rendered":"Analisi di regressione: Definizione, tipi, utilizzo e vantaggi"},"content":{"rendered":"\n
L’analisi di regressione \u00e8 forse uno dei metodi statistici pi\u00f9 utilizzati per studiare o stimare la relazione tra un insieme di variabili indipendenti e dipendenti. Nell’analisi statistica<\/a>, la distinzione tra dati categorici e dati numerici<\/a> \u00e8 essenziale, poich\u00e9 i dati categorici comportano categorie o etichette distinte, mentre i dati numerici consistono in quantit\u00e0 misurabili.<\/p>\n\n Viene anche utilizzato come termine generico per varie tecniche di analisi dei dati<\/a> utilizzate in un metodo di ricerca qualitativo<\/a> per modellare e analizzare numerose variabili. Nel metodo della regressione, la variabile dipendente \u00e8 un fattore predittivo o un elemento esplicativo e la variabile dipendente \u00e8 il risultato o la risposta a una domanda specifica. <\/p>\n\n \n IMPARARE SU:<\/strong>\n<\/em> \n Metodi di analisi statistica<\/a>\n<\/em><\/p>\n\n Indice dei contenuti<\/p>\n\n L’analisi di regressione viene spesso utilizzata per modellare o analizzare i dati. La maggior parte degli analisti di sondaggi la utilizza per capire la relazione tra le variabili, che pu\u00f2 essere ulteriormente utilizzata per prevedere un risultato preciso. <\/p>\n\n Ad esempio – Supponiamo che un’azienda produttrice di bevande analcoliche voglia espandere la propria unit\u00e0 produttiva in una nuova sede. Prima di procedere, l’azienda vuole analizzare il suo modello di generazione dei ricavi e i vari fattori che potrebbero influenzarlo. Per questo motivo, l’azienda conduce un’indagine online<\/a> con un questionario specifico. <\/p>\n\n Dopo aver utilizzato l’analisi di regressione, diventa pi\u00f9 facile per l’azienda analizzare i risultati del sondaggio e capire la relazione tra diverse variabili come l’elettricit\u00e0 e il fatturato – in questo caso, il fatturato \u00e8 la variabile dipendente.<\/p>\n\n IMPARARE SU:<\/strong> Livello di analisi<\/a><\/em><\/p>\n\n Inoltre, la comprensione della relazione tra diverse variabili indipendenti come i prezzi, il numero di lavoratori e la logistica con il fatturato aiuta l’azienda a stimare l’impatto dei vari fattori sulle vendite e sui profitti.<\/p>\n\n I ricercatori di sondaggi utilizzano spesso questa tecnica per esaminare e trovare una correlazione tra diverse variabili di interesse. Offre l’opportunit\u00e0 di valutare l’influenza di diverse variabili indipendenti su una variabile dipendente. <\/p>\n\n Nel complesso, l’analisi di regressione risparmia ai ricercatori ulteriori sforzi per organizzare diverse variabili indipendenti in tabelle e testare o calcolare il loro effetto su una variabile dipendente. Diversi tipi di metodi di ricerca analitica<\/a> sono ampiamente utilizzati per valutare nuove idee commerciali<\/a> e prendere decisioni informate. <\/p>\n\n Crea un account gratuito<\/strong><\/a><\/p>\n\n I ricercatori di solito iniziano imparando prima la regressione lineare e quella logistica. A causa della conoscenza diffusa di questi due metodi e della facilit\u00e0 di applicazione, molti analisti pensano che esistano solo due tipi di modelli. Ogni modello ha la sua specialit\u00e0 e la sua capacit\u00e0 di funzionare se vengono soddisfatte determinate condizioni. <\/p>\n\n Questo blog spiega i sette tipi di metodi di analisi di regressione multipla comunemente utilizzati per interpretare i dati enumerati in vari formati.<\/p>\n\n Si tratta di una delle tecniche di modellazione pi\u00f9 conosciute, in quanto \u00e8 tra i primi metodi di analisi di regressione d’elite adottati dalle persone al momento dell’apprendimento della modellazione predittiva. In questo caso, la variabile dipendente \u00e8 continua e la variabile indipendente \u00e8 spesso continua o discreta con una linea di regressione lineare. <\/p>\n\n Tieni presente che la regressione lineare multipla prevede pi\u00f9 di una variabile indipendente rispetto alla regressione lineare semplice. Pertanto, la regressione lineare \u00e8 da utilizzare solo quando esiste una relazione lineare tra la variabile indipendente e quella dipendente. <\/p>\n\n Un’azienda pu\u00f2 utilizzare la regressione lineare per misurare l’efficacia delle campagne di marketing, dei prezzi e delle promozioni sulle vendite di un prodotto. Supponiamo che un’azienda che vende attrezzature sportive voglia capire se i fondi che ha investito nel marketing e nel branding dei suoi prodotti le hanno dato un ritorno sostanziale o meno. <\/p>\n\n La regressione lineare \u00e8 il metodo statistico migliore per interpretare i risultati. L’aspetto migliore della regressione lineare \u00e8 che aiuta anche ad analizzare l’impatto oscuro di ogni attivit\u00e0 di marketing e branding, controllando per\u00f2 il potenziale dei componenti per regolare le vendite. <\/p>\n\n Se l’azienda sta conducendo due o pi\u00f9 campagne pubblicitarie contemporaneamente, una in televisione e due alla radio, la regressione lineare pu\u00f2 facilmente analizzare l’influenza indipendente e combinata di queste pubblicit\u00e0.<\/p>\n\n IMPARARE SU:<\/strong> Progetti di analisi dei dati<\/a><\/p>\n\n La regressione logistica \u00e8 comunemente utilizzata per determinare la probabilit\u00e0 di successo e di fallimento di un evento. La regressione logistica viene utilizzata quando la variabile dipendente \u00e8 binaria, come 0\/1, Vero\/Falso o S\u00ec\/No. Quindi, si pu\u00f2 dire che la regressione logistica viene utilizzata per analizzare le domande a risposta chiusa<\/a> di un sondaggio o le domande che richiedono risposte numeriche in un sondaggio. <\/p>\n\n La regressione logistica non richiede una relazione lineare tra una variabile dipendente e una indipendente, proprio come la regressione lineare. La regressione logistica applica una trasformazione logica non lineare per prevedere l’odds ratio; pertanto, gestisce facilmente vari tipi di relazioni tra una variabile dipendente e una indipendente. <\/p>\n\n La regressione logistica \u00e8 ampiamente utilizzata per analizzare i dati categorici<\/a>, in particolare per i dati a risposta binaria nella modellazione dei dati aziendali. Pi\u00f9 spesso, la regressione logistica viene utilizzata quando la variabile dipendente \u00e8 categorica, come ad esempio per prevedere se la dichiarazione di salute fatta da una persona \u00e8 reale(1) o fraudolenta, per capire se il tumore \u00e8 maligno(1) o meno. <\/p>\n\n Le aziende utilizzano la regressione logistica per prevedere se i consumatori di una determinata fascia demografica acquisteranno il loro prodotto o quello della concorrenza in base a et\u00e0, reddito, sesso, razza, stato di residenza, acquisti precedenti, ecc.<\/p>\n\n La regressione polinomiale \u00e8 comunemente utilizzata per analizzare i dati curvilinei quando la potenza di una variabile indipendente \u00e8 superiore a 1. In questo metodo di analisi della regressione, la linea migliore non \u00e8 mai una “linea retta” ma sempre una “linea curva” che si adatta ai punti dei dati. <\/p>\n\n Tieni presente che \u00e8 meglio utilizzare la regressione polinomiale quando due o pi\u00f9 variabili hanno degli esponenti e altre no.<\/p>\n\n Inoltre, \u00e8 in grado di modellare dati separabili in modo non lineare, offrendo la possibilit\u00e0 di scegliere l’esatto esponente per ogni variabile e con il pieno controllo delle funzioni di modellazione disponibili.<\/p>\n\n Se combinata con l’analisi della superficie di risposta, la regressione polinomiale \u00e8 considerata uno dei metodi statistici sofisticati comunemente utilizzati nella ricerca sul feedback multisorgente. La regressione polinomiale viene utilizzata soprattutto nei settori finanziari e assicurativi in cui la relazione tra le variabili dipendenti e indipendenti \u00e8 curvilinea. <\/p>\n\n Supponiamo che una persona voglia pianificare le spese determinando il tempo necessario per guadagnare una somma definitiva. La regressione polinomiale, prendendo in considerazione il suo reddito e prevedendo le spese, pu\u00f2 facilmente determinare il tempo esatto in cui deve lavorare per guadagnare quella somma specifica. <\/p>\n\n Si tratta di un processo semi-automatico con il quale si costruisce un modello statistico aggiungendo o rimuovendo la variabile dipendente in base alle statistiche t dei coefficienti stimati.<\/p>\n\n Se utilizzata correttamente, la regressione stepwise ti fornir\u00e0 dati pi\u00f9 potenti di qualsiasi altro metodo. Funziona bene quando si lavora con un gran numero di variabili indipendenti. Non fa altro che perfezionare il modello dell ‘unit\u00e0 d’analisi<\/a>, inserendo le variabili in modo casuale. <\/p>\n\n L’analisi di regressione stepwise \u00e8 consigliata quando ci sono pi\u00f9 variabili indipendenti e la selezione delle variabili indipendenti avviene automaticamente senza l’intervento umano.<\/p>\n\n Nella modellazione di regressione stepwise, la variabile viene aggiunta o sottratta dall’insieme delle variabili esplicative<\/a>. L’insieme delle variabili aggiunte o rimosse viene scelto in base alle statistiche di test del coefficiente stimato. <\/p>\n\n Supponiamo di avere una serie di variabili indipendenti come l’et\u00e0, il peso, la superficie corporea, la durata dell’ipertensione, il polso basale e l’indice di stress, in base alle quali si vuole analizzare l’impatto sulla pressione sanguigna.<\/p>\n\n Nella regressione a gradini, il miglior sottoinsieme di variabili indipendenti viene scelto automaticamente; si inizia scegliendo nessuna variabile per procedere oltre (aggiungendo una variabile alla volta) oppure si inizia con tutte le variabili del modello e si procede a ritroso (eliminando una variabile alla volta).<\/p>\n\n Quindi, utilizzando l’analisi di regressione, \u00e8 possibile calcolare l’impatto di ciascuna o di un gruppo di variabili sulla pressione sanguigna.<\/p>\n\n La regressione di Ridge si basa su un metodo dei minimi quadrati ordinari che viene utilizzato per analizzare i dati di multicollinearit\u00e0 (dati in cui le variabili indipendenti sono altamente correlate). La collinearit\u00e0 pu\u00f2 essere spiegata come una relazione quasi lineare tra le variabili. <\/p>\n\n In presenza di multicollinearit\u00e0, le stime dei minimi quadrati saranno imparziali, ma se la differenza tra di esse \u00e8 maggiore, allora potrebbe essere molto lontana dal valore reale. Tuttavia, la regressione ridge elimina gli errori standard aggiungendo un certo grado di distorsione alle stime della regressione con l’obiettivo di fornire stime pi\u00f9 affidabili. <\/p>\n\n Se volete, potete anche imparare a conoscere i bias di selezione<\/a> attraverso il nostro blog.<\/p>\n\n Nota bene: i presupposti derivati dalla regressione ridge sono simili a quelli della regressione ai minimi quadrati, con l’unica differenza della normalit\u00e0. Sebbene il valore del coefficiente sia ristretto nella regressione ridge, non raggiunge mai lo zero suggerendo l’incapacit\u00e0 di selezionare le variabili. <\/p>\n\n Supponiamo che tu sia pazzo di due chitarristi che si esibiscono dal vivo a un evento vicino a te e che tu vada a vedere la loro performance con l’intento di scoprire chi \u00e8 il chitarrista migliore. Ma quando inizia l’esibizione, noti che entrambi suonano note nere e blu allo stesso tempo. <\/p>\n\n \u00c8 possibile individuare il chitarrista che ha il maggiore impatto sul suono quando entrambi suonano forte e veloce? Poich\u00e9 entrambi suonano note diverse, \u00e8 sostanzialmente difficile differenziarli, il che rappresenta il caso migliore di multicollinearit\u00e0, che tende ad aumentare gli errori standard dei coefficienti. <\/p>\n\n La regressione di Ridge affronta la multicollinearit\u00e0 in casi come questi e include una stima della polarizzazione o del restringimento per ottenere i risultati.<\/p>\n\n Lasso (Least Absolute Shrinkage and Selection Operator) \u00e8 simile alla regressione ridge; tuttavia, utilizza un bias in valore assoluto invece del bias quadratico utilizzato nella regressione ridge.<\/p>\n\n \u00c8 stata sviluppata nel 1989 come alternativa alla tradizionale stima dei minimi quadrati con l’intento di risolvere la maggior parte dei problemi legati all’overfitting quando i dati hanno un gran numero di variabili indipendenti.<\/p>\n\n Lasso ha la capacit\u00e0 di eseguire entrambe le operazioni: selezionare le variabili e regolarizzarle con una soglia morbida. L’applicazione della regressione Lasso facilita la derivazione di un sottoinsieme di predittori dalla minimizzazione degli errori di previsione durante l’analisi di una risposta quantitativa. <\/p>\n\n Si noti che i coefficienti di regressione che raggiungono il valore zero dopo il restringimento sono esclusi dal modello Lazo. Al contrario, i coefficienti di regressione che hanno un valore superiore a zero sono fortemente associati alle variabili di risposta, laddove le variabili esplicative possono essere quantitative, categoriche o entrambe. <\/p>\n\n Supponiamo che un’azienda automobilistica voglia effettuare una ricerca sul consumo medio di carburante delle auto negli Stati Uniti. Per i campioni ha scelto 32 modelli di auto e 10 caratteristiche del design dell’automobile: numero di cilindri, cilindrata, potenza lorda, rapporto dell’asse posteriore, peso, tempo di percorrenza di \u00bc di miglio, rispetto a motore, trasmissione, numero di marce e numero di carburatori. <\/p>\n\n Come puoi vedere, la correlazione tra la variabile di risposta mpg (miglia per gallone) \u00e8 estremamente correlata ad alcune variabili come peso, cilindrata, numero di cilindri e cavalli. Il problema pu\u00f2 essere analizzato utilizzando il pacchetto glmnet di R e la regressione lasso per la selezione delle caratteristiche. <\/p>\n\n Si tratta di una miscela di modelli di regressione ridge e lasso addestrati con norme L1 e L2. La rete elastica produce un effetto di raggruppamento per cui i predittori fortemente correlati tendono a entrare\/uscire insieme dal modello. L’utilizzo del modello di regressione a rete elastica \u00e8 consigliato quando il numero di predittori \u00e8 di gran lunga superiore al numero di osservazioni. <\/p>\n\n Si noti che il modello di regressione a rete elastica \u00e8 nato come opzione al modello di regressione lasso, poich\u00e9 la sezione delle variabili di lasso dipendeva troppo dai dati, rendendola instabile. Utilizzando la regressione a rete elastica, gli statistici sono diventati capaci di superare le penalizzazioni della regressione ridge e della regressione lasso solo per ottenere il meglio da entrambi i modelli. <\/p>\n\n Un team di ricerca clinica che ha accesso a un set di dati microarray sulla leucemia (LEU) era interessato a costruire una regola diagnostica basata sul livello di espressione dei campioni di geni presentati per prevedere il tipo di leucemia. Il set di dati a disposizione consisteva in un gran numero di geni e pochi campioni. <\/p>\n\n Inoltre, \u00e8 stato dato loro un set specifico di campioni da utilizzare come campioni di addestramento, di cui alcuni infetti da leucemia di tipo 1 (leucemia linfoblastica acuta) e altri da leucemia di tipo 2 (leucemia mieloide acuta).<\/p>\n\n L’adattamento del modello e la selezione dei parametri di regolazione mediante CV decuplicato sono stati eseguiti sui dati di formazione. Poi hanno confrontato le prestazioni di questi metodi calcolando il loro errore quadratico medio di previsione sui dati di prova per ottenere i risultati necessari. <\/p>\n\n Un’indagine di mercato si concentra su tre matrici principali: la Soddisfazione del Cliente<\/a>, la Fedelt\u00e0 del Cliente<\/a> e l’Advocacy del Cliente<\/a>. Ricorda che, sebbene queste matrici ci parlino della salute e delle intenzioni dei clienti, non ci dicono come migliorare la posizione. Per questo motivo, un questionario<\/a> approfondito volto a chiedere ai consumatori le ragioni della loro insoddisfazione \u00e8 sicuramente un modo per ottenere informazioni pratiche. <\/p>\n\n Tuttavia, \u00e8 stato riscontrato che le persone spesso faticano a esprimere la propria motivazione o demotivazione o a descrivere la propria soddisfazione o insoddisfazione. Inoltre, le persone danno sempre un’importanza eccessiva ad alcuni fattori razionali, come il prezzo, il packaging, ecc. In generale, agisce come strumento analitico e previsionale nelle ricerche di mercato. <\/p>\n\n Se utilizzata come strumento di previsione, l’analisi di regressione pu\u00f2 determinare i dati di vendita di un’organizzazione tenendo conto dei dati di mercato esterni. Una multinazionale conduce un’indagine di mercato<\/a> per capire l’impatto di vari fattori come il PIL (Prodotto Interno Lordo), l’IPC (Indice dei Prezzi al Consumo) e altri fattori simili sul suo modello di generazione dei ricavi. <\/p>\n\n Ovviamente, l’analisi di regressione in considerazione degli indicatori di marketing previsti \u00e8 stata utilizzata per prevedere un’ipotesi di ricavi che saranno generati nei trimestri futuri e persino negli anni futuri. Tuttavia, pi\u00f9 si va avanti nel futuro, i dati diventeranno pi\u00f9 inaffidabili, lasciando un ampio margine di errore<\/a>. <\/p>\n\n Un’azienda produttrice di depuratori d’acqua voleva capire quali fossero i fattori che determinano il gradimento del marchio. Il sondaggio era il mezzo migliore per raggiungere i clienti attuali e potenziali. \u00c8 stata pianificata un’indagine su larga scala tra i consumatori ed \u00e8 stato preparato un questionario discreto utilizzando il miglior strumento di indagine<\/a>. <\/p>\n\n Nel sondaggio sono state poste una serie di domande relative al marchio, alla preferibilit\u00e0, alla soddisfazione e alla probabile insoddisfazione. Dopo aver ottenuto le risposte ottimali al sondaggio, \u00e8 stata utilizzata l’analisi di regressione per restringere la top ten dei fattori che determinano il gradimento del marchio. <\/p>\n\n Tutti i dieci attributi ricavati (citati nell’immagine sottostante) in un modo o nell’altro hanno evidenziato la loro importanza nell’influenzare il gradimento di quello specifico marchio di depuratori d’acqua.<\/p>\n \u00c8 facile eseguire un’analisi di regressione utilizzando Excel o SPSS, ma nel farlo \u00e8 necessario comprendere l’importanza dei quattro numeri nell’interpretazione dei dati.<\/p>\n\n In alcuni casi, il coefficiente semplice viene sostituito da un coefficiente standardizzato che dimostra il contributo di ogni variabile indipendente per spostare o determinare un cambiamento nella variabile dipendente.<\/p>\n\n Crea un account gratuito<\/strong><\/a><\/p>\n\n Sai che utilizzare l’analisi di regressione per comprendere i risultati di un’indagine commerciale<\/a> significa avere il potere di svelare opportunit\u00e0 e rischi futuri?<\/p>\n\n Ad esempio, dopo aver visto una particolare fascia pubblicitaria in televisione, possiamo prevedere il numero esatto di aziende utilizzando quei dati per stimare un’offerta massima per quella fascia. L’intero settore finanziario e assicurativo dipende molto dall’analisi di regressione dei dati delle indagini per identificare tendenze e opportunit\u00e0 per una pianificazione e un processo decisionale pi\u00f9 accurati. <\/p>\n\n Sai che le aziende utilizzano l’analisi di regressione per ottimizzare i processi aziendali?<\/p>\n\n\n\t
Definizione di analisi di regressione<\/h2>\n\n
Tipi di analisi di regressione<\/h2>\n\n
01. Analisi di regressione lineare<\/h3>\n\n
Esempio<\/h4>\n\n
02. Analisi di regressione logistica<\/h3>\n\n
Esempio<\/h4>\n\n
03. Analisi di regressione polinomiale<\/h3>\n\n
Esempio<\/h4>\n\n
04. Analisi di regressione graduale<\/h3>\n\n
Esempio<\/h4>\n\n
05. Analisi di regressione di cresta<\/h3>\n\n
Esempio<\/h4>\n\n
06. Analisi di regressione Lasso<\/h3>\n\n
Esempio<\/h4>\n\n
07. Analisi di regressione della rete elastica<\/h3>\n\n
Esempio<\/h4>\n\n
Utilizzo dell’analisi di regressione nelle ricerche di mercato<\/h2>\n\n
Caso di studio sull’utilizzo dell’analisi di regressione<\/h3>\n\n
<\/figure><\/div>\nIn che modo l’analisi di regressione ricava informazioni dai sondaggi?<\/h2>\n\n
I primi due numeri dei quattro riguardano direttamente il modello di regressione.<\/h3>\n\n
\n
Gli altri due numeri si riferiscono a ciascuna delle variabili indipendenti durante l’interpretazione dell’analisi di regressione.<\/h3>\n\n
\n
Vantaggi dell’utilizzo dell’analisi di regressione in un sondaggio online<\/h2>\n\n
01. Ottenere l’accesso all’analisi predittiva<\/h3>\n\n
02. Migliorare l’efficienza operativa<\/h3>\n\n