Prediktiv Analytics – Mening og viktige algoritmer for å lære

Spioneringen som den neste store tingen, en Intelligent analyse er alle satt til å dominere advanced analytics landskapet i de neste årene. Analytics India Lønn Studie 2017 utført av AnalytixLabs & Analytics India Magazine (AIM) avslører at Avanserte analyser/Prediktiv modellering fagfolk er bedre betalt i forhold til sine jevnaldrende.,

Årslønn i Lacs

Kilde: AnalytixLabs & MÅL

Så la oss forstå i detaljer hvordan å bygge en Prediktiv modell og kjenne til de viktigste algoritmer for å bli lært i Prediktiv Analytics.

Prediktiv Analytics er en gren av avansert dataanalyse som innebærer bruk av ulike teknikker som maskinlæring, statistiske algoritmer og andre data mining teknikker for å forutsi fremtidige hendelser basert på historiske data.,

modellen er deretter anvendt til gjeldende data for å forutsi hva som vil være det neste løpet av handlingen eller forslag for utfallet.

Det finnes ulike algoritmer tilgjengelig i kategorier av data mining, maskinlæring og statistikk når du monterer din prediktiv analyse modell. Som du kan utforske dataene det blir lettere å ta nærmere beslutning.

Hvordan å bygge en prediktiv modell?,

Konstruere en prediktiv modell er enkel:

  1. Hent data fra ulike kilder fra alle ETL verktøy

Eksempel: se iris data – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data

  1. Split datasettet i to deler (prøve og verifisering av data)

Bygge Eksempel Data:

– Bygg en modell fra utvalget data som gir informasjon om arter i blomst og sine målinger.,ariable vi prøver å forutsi)

Vanligvis, det er mange prediktiv analyse modeller, og de kan deles inn i 2 typer:

  • Klassifisering – å forutsi en verdi som er diskret gjennom kategori og endelig med noe for
  • Regresjon – å forutsi en verdi som er kontinuerlig gjennom numeriske mengde og uendelig med bestilling:

Den brukte algoritmene i data-analyse er lineær regresjon og nevrale nettverk

Lineær regresjon: Den enkle regresjonsmodellen antar at lineær relasjon eksisterer mellom input og output-variabler.,

Nevrale nettverk: En nevrale nettverk inspirert av den menneskelige hjerne, et nettverk av nerveceller som er forbundet at det er et sett av beregningsorientert enheter, som tar et sett av innganger og overføre resultatet til en forhåndsdefinerte utgang. Beregningsorientert enheter er bestilt arrangert i lag, slik at funksjoner av en inngang vektor kan være forbundet med funksjon til en utgang vektor.

ideen bak dette er ofte å trene nevrale nettverk til å modellere relasjoner i de angitte dataene.,

  1. Lage en modell som er basert på regler fastsatt av algoritmen under opplæring fase.
  2. Test modell på verifisering av data set – data er matet til modellen og den predikerte verdier i forhold til virkelige verdier. Dermed modellen er testet for korrektheten.
  3. Bruke modellen på nytt innkommende data og iverksette tiltak basert på produksjon av modellen.

Andre viktige algoritmer:

Prediktive modeller kommer i ulike former. Det er forskjellige metoder som kan brukes til å lage en modell, og de fleste av dem er under utvikling hele tiden.,

Den mest vanlige prediktive modeller er:

Lineære modeller: Det er et veldig mye brukt statistiske algoritmen for å bygge en relasjon modell mellom to variabler. En variabel kalles prediktor variabel som har en verdi som er samlet inn gjennom eksperimenter, mens den andre variabelen kalles svar variabel der verdien er avledet fra prediktor variabel.

Avgjørelse trær (også kjent som Klassifisering og Regresjon Trær eller HANDLEVOGN): Det er en graf som brukes til å representere muligheter og deres utfall i form av et tre., Nodene i grafen representerer en hendelse eller valg og kantene i grafen representerer beslutningen om regler eller vilkår.

Support Vector Machines (SVMs) I maskinlæring: support vector machine søk nærmeste poeng og er kjent som «støtte vektorer» » navnet er som et resultat av den faktiske faktum at poeng som vektorer som den enkleste linje «avhengig» eller er «støttes av» nærmeste poeng.

Når det oppdager de nærmeste poeng, det trekker en linje mellom dem ved å gjøre vektor subtraksjon (punkt A – B)., Support vector machine deretter erklærer den beste skille linje for å være den linjen som bisects — og er vinkelrett på — koble linje.

Naive Bayes: Det er en maskin læring algoritme for det meste brukt for klassifisering problemer. Det er basert på Bayes’ sannsynlighet teorem eller også kjent som Bayes’ regel eller Bayes’ lov. Den brukes for tekst-klassifisering som innebærer høy dimensjonal trening datasett.

Det er en enkel algoritme og kjent for sin effektivitet og raskt å bygge modeller og spå ved hjelp av denne algoritmen., Naive Bayes algoritmen er først og fremst ansett for å løse tekst klassifisering problem. Derfor anbefaler læring algoritmen grundig.,

Eksempler: spam filtrering, klassifisere nyheter, artikler og sentimental analyse

Bayes’ Teorem representert ved følgende ligning:

  • : Sannsynlighet (betinget sannsynlighet) av forekomst av en hendelse gitt tilfelle er sant
  • og: Sannsynligheten for forekomsten av en hendelse og henholdsvis
  • : Sannsynligheten for forekomsten av hendelsen gitt tilfelle er sant

Konklusjon

I nær fremtid, økende etterspørselen for Prediktiv Analytics, kan du se fagfolk fra andre bekker bli med i bandwagon., Hvis du ønsker å få et forsprang på dine kolleger og være en del av denne til ny vekst avenue, kan du utforske vår NSE Sertifisert Business Analytics kurs samt PGD i Data Vitenskap.

Leave a Comment