Udråbt som den næste store ting, en Intelligent analyse er alle indstillet til at dominere den avancerede analyser liggende i de næste par år. Analytics Indien Løn Undersøgelse 2017 udført af AnalytixLabs & Analytics Indien Magasin (MÅL) afslører, at Avanceret analytics/Prædiktiv modellering fagfolk er bedre betalt i forhold til deres jævnaldrende.,
årsløn i Lacs
Kilde: AnalytixLabs & FORMÅL
Så lad os forstå i detaljer, hvordan at bygge en Prædiktiv model og kende de vigtigste algoritmer til at blive lært i Predictive Analytics.Predictive Analytics er en gren af avanceret dataanalyse, der involverer brug af forskellige teknikker såsom maskinlæring, statistiske algoritmer og andre dataminingsteknikker til at forudsige fremtidige begivenheder baseret på Historiske data.,
modellen anvendes derefter på aktuelle data for at forudsige, hvad der ville være det næste handlingsforløb eller forslag til resultatet.
Der er forskellige algoritmer tilgængelige i kategorierne datamining, maskinlæring og statistik, når du samler din forudsigelsesanalysemodel. Når du udforsker dataene, bliver det lettere at tage yderligere beslutning.
hvordan man opbygger en forudsigelig model?,
Konstruere en prædiktiv model er enkle:
- Få data fra forskellige kilder fra enhver ETL-værktøj
Eksempel: der henvises iris data – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
- Opdele datasættet i to dele (prøve og verifikation af data)
Bygge Prøve Data:
Bygge en model fra prøve data, der giver oplysninger om arter af blomst og dens målinger.,ariable vi forsøger at forudsige)
Generelt er der mange prædiktiv analyse modeller, og de kan inddeles i 2 typer:
- Klassifikation, – at forudsige en værdi, som er diskret gennem den kategori, og finite uden for
- Regression – at forudsige en værdi, der er løbende gennem numeriske kvantitet og uendelige med at bestille:
Den udbredte algoritmer i data analysen er lineær regression og neurale netværk
Lineær regression: Den simple regressionsmodel antager, at den lineære sammenhæng mellem input og output variable.,
neuralt netværk: et neuralt netværk inspireret af den menneskelige hjerne, et netværk af neuroner, der er sammenkoblet, det vil sige det er et sæt beregningsenheder, der tager et sæt input og overfører resultatet til en foruddefineret output. Beregningsenhederne bestilles arrangeret i lag, så funktionerne i en inputvektor kan forbindes med funktionen i en outputvektor.
ideen bag dette er ofte at coache neurale netværk for at modellere forholdene inden for de leverede data.,
- Opret en model, der er baseret på de regler, der er fastlagt af algoritmen i træningsfasen.
- Test modellen på verifikationsdatasættet-dataene føres til modellen, og de forudsagte værdier sammenlignes med de faktiske værdier. Modellen testes således for nøjagtighed.
- brug modellen på nye indgående data og tag handling baseret på modelens output.
andre vigtige algoritmer:
forudsigelige modeller findes i forskellige former. Der er forskellige metoder, der kan bruges til at oprette en model, og de fleste af dem udvikles hele tiden.,
Den mest almindelige prædiktive modeller er:
Lineære modeller: Det er en meget udbredt statistisk algoritme til at opbygge et forhold-modellen mellem to variabler. En variabel kaldes predictor variabel, hvis værdi er indsamlet gennem eksperimenter, mens den anden variabel kaldes respons variabel, hvis værdi er afledt af Predictor variabel.beslutningstræer (også kendt som klassificerings-og Regressionstræer eller vogn): det er en graf, der bruges til at repræsentere muligheder og deres resultat i form af et træ., Knudepunkterne i grafen repræsenterer en begivenhed eller et valg, og kanterne på grafen repræsenterer beslutningsreglerne eller betingelserne.
Support Vector Machines (SVMs) I Machine Learning: support vektor maskine søgninger de nærmeste punkter, og er kendt som “støtte vektorer” ” navnet er som et resultat af den faktiske omstændighed, at point er som vektorer, som den enkleste line “afhængig af” eller er “støttet af” den nærmeste point.
når den registrerer de nærmeste punkter, trækker den en linje, der forbinder dem ved at gøre vektor subtraktion (punkt A – punkt B)., Støttevektormaskinen erklærer derefter, at den bedste adskillelseslinie er den linje, der halverer — og er vinkelret på — forbindelseslinjen.Naive Bayes: det er en maskinlæringsalgoritme, der oftest bruges til klassificeringsproblemer. Den er baseret på Bayes’ Sandsynlighed sætning eller alternativt kendt som Bayes’ regel eller Bayes’ lov. Det bruges til tekstklassificering, der involverer højdimensionelle træningsdatasæt.
det er en simpel algoritme og kendt for sin effektivitet til hurtigt at bygge modeller og lave forudsigelser ved hjælp af denne algoritme., Naive Bayes algoritme anses primært for at løse tekst klassifikation problem. Derfor anbefaler vi at lære algoritmen grundigt.,
Eksempler: spam-filtrering, klassificering af nyheder, artikler og sentimentale analyse
Bayes’ Sætning repræsenteret ved følgende ligning:
- : Sandsynligheden (betinget sandsynlighed) af forekomst af en begivenhed givet tilfælde er true
- og: Sandsynligheden for forekomsten af en begivenhed, og henholdsvis
- : Sandsynligheden for forekomsten af tilfælde givet tilfælde er true
Konklusion
I den nærmeste fremtid, stigende efterspørgsel efter Predictive Analytics kan se fagfolk fra andre vandløb deltage i vognen., Hvis du ønsker at få en fordel over dine jævnaldrende og være en del af denne nye vækst avenue, kan du udforske vores nse Certified Business Analytics kursus samt PGD i Data Science.