Predictive Analytics-Significato e importanti algoritmi per imparare

Propagandato come la prossima grande cosa, un’analisi predittiva è tutto pronto a dominare il panorama di analisi avanzate nei prossimi anni. Analytics India Salary Study 2017 condotto da AnalytixLabs& Analytics India Magazine (AIM) rivela che i professionisti avanzati di analisi/modellazione predittiva sono meglio pagati rispetto ai loro coetanei.,

Stipendio annuale in Lacs

Fonte: AnalytixLabs& AIM

Quindi cerchiamo di capire in dettaglio come costruire un modello predittivo e conoscere gli algoritmi più importanti da imparare in Analisi predittiva.

L’analisi predittiva è una branca dell’analisi avanzata dei dati che prevede l’uso di varie tecniche come l’apprendimento automatico, algoritmi statistici e altre tecniche di data mining per prevedere eventi futuri basati su dati storici.,

Il modello viene quindi applicato ai dati correnti per prevedere quale sarebbe la prossima linea di azione o suggerimento per il risultato.

Ci sono vari algoritmi disponibili nelle categorie di data mining, machine learning e statistiche quando si assembla il modello di analisi predittiva. Mentre esplori i dati diventa più facile prendere ulteriori decisioni.

Come costruire un modello predittivo?,

la Costruzione di un modello predittivo è semplice:

  1. Ottenere i dati da fonti diverse da qualsiasi strumento ETL

Esempio: fare riferimento dati iris – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data

  1. Dividere il set di dati in due parti (campione e verifica dati)

Costruire i Dati di Esempio:

Costruire un modello dal campione di dati che fornisce le informazioni sulla specie di fiore e le sue misure.,ariable stiamo cercando di prevedere)

in generale, ci sono molti modelli di predictive analysis e possono essere suddivise in 2 tipologie:

  • Classificazione – previsione di un valore che è discreto attraverso categoria e finito senza fine
  • Regressione – previsione di un valore che è continuo attraverso quantità numerica e infinito con ordine:

ampiamente utilizzati algoritmi di analisi dei dati sono di regressione lineare e a rete neurale

la regressione Lineare: Il semplice modello di regressione assume che la relazione lineare esistente tra l’input e l’output variabili.,

Rete neurale: una rete neurale ispirata al cervello umano, una rete di neuroni interconnessi che è un insieme di unità computazionali, che prende un insieme di input e trasferisce il risultato a un output predefinito. Le unità computazionali sono ordinate disposte in strati in modo che le caratteristiche di un vettore di input possano essere collegate con la caratteristica di un vettore di output.

L’idea alla base di questo è spesso quella di allenare le reti neurali per modellare le relazioni all’interno dei dati forniti.,

  1. Creare un modello che si basa sulle regole stabilite dall’algoritmo durante la fase di allenamento.
  2. Testare il modello sul set di dati di verifica – i dati vengono inviati al modello e i valori previsti vengono confrontati con i valori effettivi. Così il modello è testato per la precisione.
  3. Utilizzare il modello sui nuovi dati in entrata e agire in base all’output del modello.

Altri importanti algoritmi:

I modelli predittivi sono disponibili in varie forme. Esistono diversi metodi che possono essere utilizzati per creare un modello e la maggior parte di essi viene sviluppata continuamente.,

I modelli predittivi più comuni sono:

Modelli lineari: È un algoritmo statistico molto usato per costruire un modello di relazione tra due variabili. Una variabile è chiamata variabile predittiva il cui valore è raccolto attraverso esperimenti, mentre l’altra variabile è chiamata variabile di risposta il cui valore è derivato dalla variabile predittiva.

Alberi decisionali (noti anche come alberi di classificazione e regressione o CART): è un grafico utilizzato per rappresentare le possibilità e il loro risultato sotto forma di un albero., I nodi nel grafico rappresentano un evento o una scelta e i bordi del grafico rappresentano le regole o le condizioni decisionali.

Support Vector Machines (SVM) Nell’apprendimento automatico: La macchina vettoriale di supporto cerca i punti più vicini ed è nota come “vettori di supporto” ” il nome è il risultato del fatto che i punti sono come vettori da cui la linea più semplice “dipende” o è “supportata” dai punti più vicini.

Una volta che rileva i punti più vicini, disegna una linea che li collega facendo sottrazione vettoriale (punto A – punto B)., La macchina vettoriale di supporto dichiara quindi che la linea di separazione migliore è la linea che taglia in due-ed è perpendicolare-alla linea di collegamento.

Naive Bayes: è un algoritmo di apprendimento automatico utilizzato principalmente per problemi di classificazione. Si basa sul teorema di probabilità di Bayes o in alternativa nota come regola di Bayes o legge di Bayes. Viene utilizzato per la classificazione del testo che comporta set di dati di allenamento ad alta dimensione.

Si tratta di un algoritmo semplice e noto per la sua efficacia per costruire rapidamente modelli e fare previsioni utilizzando questo algoritmo., L’algoritmo Naive Bayes è considerato principalmente per risolvere il problema della classificazione del testo. Quindi, consiglia di imparare a fondo l’algoritmo.,

Esempi: spam filtrazione, la classificazione di notizie, articoli e sentimentale di analisi

il Teorema di Bayes rappresentato dalla seguente equazione:

  • : Probabilità (probabilità condizionata) del verificarsi di un evento dato l’evento è true
  • e: Probabilità di occorrenza di un evento e, rispettivamente,
  • : Probabilità di accadimento dell’evento data evento è true

Conclusione

In un prossimo futuro, la crescente domanda di Predictive Analytics possono vedere i professionisti di altri flussi di unirsi al carrozzone., Se vuoi ottenere un vantaggio rispetto ai tuoi colleghi e far parte di questa nuova strada di crescita, puoi esplorare il nostro corso di analisi aziendale certificato NSE e PGD in Data Science.

Leave a Comment