Angepriesen als die nächste große Sache, ist eine prädiktive Analyse alle gesetzt, um die erweiterte Analyselandschaft in den nächsten Jahren dominieren. Analytics India Salary Study 2017, durchgeführt vom AnalytixLabs & Das Analytics India Magazine (AIM) zeigt, dass fortgeschrittene Analytiker/Predictive Modeling-Profis im Vergleich zu Gleichaltrigen besser bezahlt werden.,
Jahresgehalt in Lacs
Quelle: AnalytixLabs & AIM
So lassen Sie uns im Detail verstehen, wie ein Vorhersagemodell zu bauen und wissen, die wichtigsten Algorithmen in Predictive Analytics gelernt werden.
Predictive Analytics ist ein Zweig fortschrittlicher Datenanalysen, bei dem verschiedene Techniken wie maschinelles Lernen, statistische Algorithmen und andere Data-Mining-Techniken verwendet werden, um zukünftige Ereignisse basierend auf historischen Daten vorherzusagen.,
Das Modell wird dann auf aktuelle Daten angewendet, um vorherzusagen, was die nächste Vorgehensweise oder ein Vorschlag für das Ergebnis wäre.
In den Kategorien Data Mining, Machine Learning und Statistik stehen verschiedene Algorithmen zur Verfügung, wenn Sie Ihr prädiktives Analysemodell zusammenstellen. Wenn Sie die Daten erkunden, wird es einfacher, weitere Entscheidungen zu treffen.
Wie erstelle ich ein Vorhersagemodell?,
Die Erstellung eines Vorhersagemodells ist einfach:
- Holen Sie sich die Daten aus verschiedenen Quellen von jedem ETL – Tool
Beispiel: Beziehen Sie sich auf Daten – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
- Teilen Sie den Datensatz in zwei Teile auf (Beispiel-und Verifizierungsdaten)
Erstellen Sie die Beispieldaten:
Erstellen Sie ein Modell aus den Beispieldaten, die die Informationen über die Arten der Blume und ihre Messungen.,ariable wir versuchen vorherzusagen)
Im Allgemeinen gibt es viele prädiktive Analysemodelle und sie können in zwei Typen eingeteilt werden:
- Klassifikation – Vorhersage eines Werts, der durch die Kategorie diskret und endlich ohne Ordnung ist
- Regression – Vorhersage eines Werts, der durch numerische Quantität kontinuierlich und unendlich mit der Reihenfolge ist:
Die weit verbreiteten Algorithmen in der Datenanalyse sind lineare Regression und neuronales Netzwerk
Lineare Regression: Die einfache das Regressionsmodell geht davon aus, dass die lineare Beziehung zwischen den Eingangs-und den Ausgangsvariablen besteht.,
Neuronales Netzwerk: Ein neuronales Netzwerk, das vom menschlichen Gehirn inspiriert ist, ein Netzwerk von Neuronen, die miteinander verbunden sind Es ist eine Reihe von Recheneinheiten, die eine Reihe von Eingaben annehmen und das Ergebnis auf eine vordefinierte Ausgabe übertragen. Die Recheneinheiten sind in Schichten angeordnet, so dass die Merkmale eines Eingabevektors mit dem Merkmal eines Ausgabevektors verbunden werden können.
Die Idee dahinter ist oft, neuronale Netze zu coachen, um die Beziehungen innerhalb der bereitgestellten Daten zu modellieren.,
- Erstellen Sie ein Modell, das auf den Regeln basiert, die der Algorithmus während der Trainingsphase festgelegt hat.
- Testen Sie das Modell auf dem Verifizierungsdatensatz – die Daten werden dem Modell zugeführt und die vorhergesagten Werte werden mit den tatsächlichen Werten verglichen. Somit wird das Modell auf Genauigkeit getestet.
- Verwenden Sie das Modell für neue eingehende Daten und ergreifen Sie Maßnahmen basierend auf der Ausgabe des Modells.
Weitere wichtige Algorithmen:
Vorhersagemodelle gibt es in verschiedenen Formen. Es gibt verschiedene Methoden, mit denen ein Modell erstellt werden kann, und die meisten werden ständig entwickelt.,
Die gebräuchlichsten Vorhersagemodelle sind:
Lineare Modelle: Es ist ein sehr weit verbreiteter statistischer Algorithmus zum Erstellen eines Beziehungsmodells zwischen zwei Variablen. Eine Variable wird als Prädiktorvariable bezeichnet, deren Wert durch Experimente erfasst wird, während die andere Variable als Antwortvariable bezeichnet wird, deren Wert von der Prädiktorvariablen abgeleitet ist.
Entscheidungsbäume (auch bekannt als Klassifizierungs-und Regressionsbäume oder CART): Es ist ein Diagramm, das verwendet wird, um Möglichkeiten und deren Ergebnis in Form eines Baumes darzustellen., Die Knoten im Diagramm stellen ein Ereignis oder eine Auswahl dar, und die Kanten des Diagramms stellen die Entscheidungsregeln oder-bedingungen dar.
Support Vector Machines (SVMs) im maschinellen Lernen: Die Support Vector Machine durchsucht die nächstgelegenen Punkte und wird als „Support vectors“ bezeichnet “ Der Name ist auf die Tatsache zurückzuführen, dass Punkte wie Vektoren sind, von denen die einfachste Zeile „abhängt“ oder von den nächsten Punkten „unterstützt“ wird.
Sobald es die nächsten Punkte erkennt, zeichnet es eine Linie, die sie durch Vektor – Subtraktion (Punkt A-Punkt B) verbindet., Die Trägervektormaschine deklariert dann die beste Trennlinie als die Linie, die die Verbindungslinie halbiert — und senkrecht dazu steht.
Naive Bayes: Es ist ein maschineller Lernalgorithmus, der hauptsächlich für Klassifizierungsprobleme verwendet wird. Es basiert auf Bayes‘ Wahrscheinlichkeitssatz oder alternativ bekannt als Bayes ‚Regel oder Bayes‘ Gesetz. Es wird für die Textklassifizierung verwendet, die hochdimensionale Trainingsdatensätze umfasst.
Es ist ein einfacher Algorithmus, der für seine Effektivität bekannt ist, um mithilfe dieses Algorithmus schnell Modelle zu erstellen und Vorhersagen zu treffen., Der naive Bayes-Algorithmus wird hauptsächlich zur Lösung des Textklassifizierungsproblems in Betracht gezogen. Empfehlen Sie daher, den Algorithmus gründlich zu lernen.,
Beispiele: Spam-Filtration, Klassifizierung von Nachrichtenartikeln und sentimentale Analyse
Bayes‘ Satz wird durch die folgende Gleichung dargestellt:
- : Wahrscheinlichkeit (bedingte Wahrscheinlichkeit) des Auftretens eines Ereignisses bei gegebener Ereignis ist wahr
- und: Wahrscheinlichkeiten des Auftretens eines Ereignisses bzw.
- : Wahrscheinlichkeit des Auftretens des Ereignisses bei gegebener Ereignis ist wahr
Schlussfolgerung
In naher Zukunft in Zukunft könnte die steigende Nachfrage nach prädiktiven Analysen dazu führen, dass Fachleute aus anderen Streams dem Zug beitreten., Wenn Sie einen Vorteil gegenüber Gleichaltrigen erzielen und Teil dieser neuen Wachstumsallee sein möchten, können Sie unseren NSE-zertifizierten Business Analytics-Kurs sowie PGD in Data Science besuchen.