Touted ca următorul lucru mare, o analiză predictivă este pregătită să domine peisajul analitic avansat în următorii câțiva ani. Analytics India studiul salarial 2017 realizat de AnalytixLabs & Analytics India Magazine (AIM) dezvăluie că profesioniștii avansați în analiză/modelare predictivă sunt mai bine plătiți în comparație cu colegii lor.,
Salariu Anual în Lacs
Sursa: AnalytixLabs & SCOP
Deci, haideți să ne înțelegem în detaliu cum să construiască un model Predictiv și cunosc cel mai important algoritmi pentru a fi învățat în Analiză Predictivă.analiza predictivă este o ramură a analizei avansate a datelor care implică utilizarea diferitelor tehnici, cum ar fi învățarea automată, algoritmi statistici și alte tehnici de extragere a datelor pentru a prognoza evenimentele viitoare pe baza datelor istorice.,
modelul este apoi aplicat datelor curente pentru a prezice care ar fi următorul curs de acțiune sau sugestie pentru rezultat.există diverși algoritmi disponibili în categoriile de data mining, machine learning și statistici atunci când asamblați modelul de analiză predictivă. Pe măsură ce explorați datele, devine mai ușor să luați decizii suplimentare.
cum se construiește un model predictiv?,
Construirea unui model predictiv este simplu:
- Obține date din diferite surse de pe orice instrument ETL
Exemplu: se referă iris date https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
- împart setul de date în două părți (eșantion și de verificare de date)
Construi Eșantion de Date:
de a Construi un model de date eșantion, care oferă informații cu privire la speciile de flori și dimensiunile sale.,ariable suntem încercarea de a prezice)
în General, există mai multe modele de analiză predictivă și ele pot fi clasificate în 2 tipuri:
- Clasificare – prezice o valoare care este discret prin categoria finită și cu nici un ordin
- Regresie – prezice o valoare care este în continuă prin numerice cantitatea și infinit cu comanda:
utilizate pe scară largă De algoritmi de analiză a datelor sunt de regresie liniară și rețele neuronale
regresie Liniară: modelul De regresie simplă presupune că relația liniară care există între intrare și variabilele de ieșire.,rețeaua neuronală: o rețea neuronală inspirată de creierul uman, o rețea de neuroni care sunt interconectați, adică este un set de unități computaționale, care ia un set de intrări și transferă rezultatul la o ieșire predefinită. Unitățile de calcul sunt ordonate aranjate în straturi, astfel încât caracteristicile unui vector de intrare pot fi conectate cu caracteristica unui vector de ieșire.
ideea din spatele acestui lucru este adesea de a antrena rețelele neuronale pentru a modela relațiile din datele furnizate.,
- creați un model care se bazează pe regulile stabilite de algoritm în timpul fazei de antrenament.
- testați modelul pe setul de date de verificare – datele sunt alimentate modelului și valorile prezise sunt comparate cu valorile reale. Astfel, modelul este testat pentru precizie.
- utilizați modelul pe noile date primite și luați măsuri pe baza ieșirii modelului.
alți algoritmi importanți:
modelele Predictive vin în diferite forme. Există diferite metode care pot fi folosite pentru a crea un model, iar cele mai multe dintre ele sunt dezvoltate tot timpul.,modelele liniare: este un algoritm statistic foarte utilizat pentru a construi un model de relație între două variabile. O variabilă se numește variabilă predictor a cărei valoare este adunată prin experimente, în timp ce cealaltă variabilă se numește variabilă de răspuns a cărei valoare este derivată din variabila predictor.arborii decizionali (cunoscuți și ca arbori de clasificare și regresie sau CART): este un grafic folosit pentru a reprezenta posibilitățile și rezultatul lor sub forma unui copac., Nodurile din grafic reprezintă un eveniment sau o alegere, iar marginile graficului reprezintă regulile sau condițiile de decizie.
Support Vector Machines (SVM) în Machine Learning: mașina vector support caută cele mai apropiate puncte și este cunoscută sub numele de „vectori support” ” numele este ca urmare a faptului că punctele sunt ca vectori de care linia cea mai simplă „depinde” sau este „susținută de” cele mai apropiate puncte.odată ce detectează cele mai apropiate puncte, trasează o linie care le conectează prin scăderea vectorială (punctul A – punctul B)., Mașina vector suport declară apoi cea mai bună linie de separare ca fiind linia care intersectează — și este perpendiculară pe — linia de legătură.Naive Bayes: este un algoritm de învățare automată folosit mai ales pentru problemele de clasificare. Se bazează pe teorema probabilității lui Bayes sau, alternativ, cunoscută sub numele de regula lui Bayes sau Legea lui Bayes. Este utilizat pentru clasificarea textului care implică seturi de date de formare dimensionale ridicate.este un algoritm simplu și cunoscut pentru eficacitatea sa de a construi rapid modele și de a face predicții folosind acest algoritm., Algoritmul naiv Bayes este considerat în primul rând pentru rezolvarea problemei de clasificare a textului. Prin urmare, recomandăm să învățați bine algoritmul.,
Exemple: spam-ul de filtrare, clasificarea articole de știri și sentimental analiză
Teorema lui Bayes reprezentat prin următoarea ecuație:
- : Probabilitate (probabilitatea condiționată) de apariție a unui eveniment, dat fiind evenimentul este adevărat
- și: Probabilitățile de apariție a unui eveniment și, respectiv,
- : Probabilitatea de apariție a evenimentului dat eveniment este adevărat
Concluzie
În viitorul apropiat, creșterea cererii pentru Analiză Predictivă poate vedea profesioniști din alte fluxuri de aderarea la bandwagon., Dacă doriți să obțineți un avantaj față de colegii dvs. și să faceți parte din această nouă cale de creștere, puteți explora cursul nostru de analiză de afaceri certificat NSE, precum și PGD în știința datelor.