Predictive Analytics-Meaning and important algorithms to learn

Analytics India Salarisstudie 2017 uitgevoerd door de AnalytixLabs & Analytics India Magazine (AIM) onthult dat geavanceerde analytics/Predictive modeling professionals beter worden betaald in vergelijking met hun collega ‘ s.,

jaarsalaris in Lacs

bron: AnalytixLabs & AIM

dus laten we in detail begrijpen hoe een voorspellend model te bouwen en de belangrijkste algoritmen te leren kennen in Predictive Analytics.

Predictive Analytics is een tak van geavanceerde data-analyse die het gebruik van verschillende technieken omvat, zoals machine learning, statistische algoritmen en andere datamining technieken om toekomstige gebeurtenissen te voorspellen op basis van historische gegevens.,

het model wordt vervolgens toegepast op de huidige gegevens om te voorspellen wat de volgende actie of suggestie voor de uitkomst zou zijn.

Er zijn verschillende algoritmen beschikbaar in de categorieën data mining, machine learning en statistieken wanneer u uw voorspellende analyse model samenstelt. Als u de gegevens te verkennen wordt het gemakkelijker om verdere beslissing te nemen.

Hoe maak je een voorspellend model?,

het construeren van een voorspellend model is eenvoudig:

  1. haal de gegevens – uit verschillende bronnen van een ETL – tool

voorbeeld: refereer iris-gegevens – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data

  1. splits de dataset in twee delen (sample-en verificatiegegevens)

bouw de Samplegegevens:

Bouw een model van de steekproefgegevens die de informatie over de soorten bloemen en de metingen ervan verstrekken.,variabel we proberen te voorspellen)

over het Algemeen zijn er veel predictive analysis-modellen en ze kunnen ingedeeld worden in 2 typen:

  • Classificatie – het voorspellen van een waarde die discreet door de categorie en eindig met geen order
  • Regressie – het voorspellen van een waarde die continue door numerieke hoeveelheid en oneindig te bestellen:

De gebruikte algoritmen in de data-analyse zijn de lineaire regressie en neurale netwerk

Lineaire regressie: De eenvoudige regressie-model veronderstelt dat de lineaire relatie bestaat tussen de input en de output variabelen.,

neuraal netwerk: een neuraal netwerk geïnspireerd door het menselijk brein, een netwerk van neuronen die onderling verbonden zijn, dat wil zeggen het is een set van computationele eenheden, die een set van ingangen neemt en het resultaat naar een vooraf gedefinieerde output overbrengt. De computationele eenheden worden geordend gerangschikt in lagen, zodat de kenmerken van een invoervector kunnen worden verbonden met de eigenschap van een uitvoervector.

het idee hierachter is vaak neurale netwerken te coachen om de relaties binnen de verstrekte gegevens te modelleren.,

  1. Maak een model dat is gebaseerd op de regels die door het algoritme tijdens de trainingsfase zijn vastgesteld.
  2. Test het model op de verificatiegegevensreeks – de gegevens worden aan het model ingevoerd en de voorspelde waarden worden vergeleken met de werkelijke waarden. Zo wordt het model op nauwkeurigheid getest.
  3. gebruik het model op nieuwe inkomende gegevens en onderneem actie op basis van de output van het model.

andere belangrijke algoritmen:

voorspellende modellen komen in verschillende vormen voor. Er zijn verschillende methoden die kunnen worden gebruikt om een model te maken, en de meeste van hen worden de hele tijd ontwikkeld.,

De meest voorkomende voorspellende modellen zijn:

lineaire modellen: Het is een veel gebruikt statistisch algoritme om een relatiemodel tussen twee variabelen te bouwen. Een variabele wordt predictor variabele genoemd waarvan de waarde wordt verzameld door experimenten, terwijl de andere variabele responsvariabele wordt genoemd waarvan de waarde is afgeleid van de predictor variabele.

beslissingsbomen( ook bekend als classificatie – en Regressiebomen of CART): het is een grafiek die wordt gebruikt om de mogelijkheden en de resultaten ervan in de vorm van een boom weer te geven., De knooppunten in de grafiek vertegenwoordigen een gebeurtenis of keuze en de randen van de grafiek vertegenwoordigen de beslissingsregels of voorwaarden.

Support Vector Machines (SVMs) in Machine Learning: de support vector machine doorzoekt de dichtstbijzijnde punten en staat bekend als “support vectoren” ” de naam is het resultaat van het feit dat punten zijn als vectoren waarvan de eenvoudigste Lijn “afhankelijk is van” of wordt “ondersteund door” de dichtstbijzijnde punten.

zodra het de dichtstbijzijnde punten detecteert, tekent het een lijn die hen verbindt door vectoraftrekking (punt A – punt B)., De ondersteuningsvectormachine verklaart vervolgens dat de beste scheidingslijn de lijn is die de verbindingslijn doorsnijdt en loodrecht daarop staat.

Naive Bayes: het is een machine learning algoritme dat meestal gebruikt wordt voor classificatieproblemen. Het is gebaseerd op Bayes’ waarschijnlijkheidsstelling of ook bekend als Bayes’ regel of Bayes ‘ wet. Het wordt gebruikt voor tekstclassificatie waarbij hoogdimensionale trainingsgegevensreeksen worden gebruikt.

het is een eenvoudig algoritme en bekend om zijn effectiviteit om snel modellen te bouwen en voorspellingen te doen met behulp van dit algoritme., Naïef Bayes algoritme wordt voornamelijk beschouwd voor het oplossen van tekstclassificatie probleem. Vandaar, raden aan het leren van het algoritme grondig.,

Voorbeelden: spam filtering, het indelen van het nieuws, de artikelen en sentimentele analyse

Bayes’ Theorema vertegenwoordigd door de volgende vergelijking:

  • : Waarschijnlijkheid (voorwaardelijke kans) van het optreden van een gebeurtenis de gebeurtenis is true
  • en: de Waarschijnlijkheid van het optreden van een gebeurtenis en respectievelijk
  • : Waarschijnlijkheid van het optreden van de gebeurtenis de gebeurtenis is true

Conclusie

In de nabije toekomst een toenemende vraag naar Predictive Analytics kan zien professionals van andere stromen toetreding tot de bandwagon., Als u een voorsprong wilt hebben op uw collega ‘ s en deel wilt uitmaken van deze nieuwe groeiweg, kunt u onze NSE Certified Business Analytics cursus en PGD in Data Science verkennen.

Leave a Comment