tartják számon, mint a következő nagy dolog, prediktív elemzés minden van beállítva, hogy uralja a fejlett analitikai táj a következő néhány évben. Analytics India fizetés tanulmány 2017 által végzett AnalytixLabs & Analytics India magazin (AIM) kiderül, hogy a fejlett analitika/prediktív modellezés szakemberek jobban fizetnek, mint társaik.,
éves fizetés a Lacs-ben
Forrás: AnalytixLabs & AIM
így értsük meg részletesen, hogyan lehet prediktív modellt felépíteni, és ismerjük a prediktív elemzésben megtanulandó legfontosabb algoritmusokat.
A prediktív analitika a fejlett adatelemzés egyik ága, amely magában foglalja különböző technikák, például gépi tanulás, statisztikai algoritmusok és más adatbányászati technikák használatát a jövőbeli események történelmi adatok alapján történő előrejelzésére.,
a modellt ezután az aktuális adatokra alkalmazzák, hogy megjósolják, mi lenne a következő cselekvési folyamat vagy javaslat az eredményhez.
a prediktív elemzési modell összeállításakor különböző algoritmusok állnak rendelkezésre az adatbányászat, a gépi tanulás és a statisztikák kategóriáiban. Ahogy feltárja az adatokat, könnyebbé válik a további döntés meghozatala.
Hogyan építsünk prediktív modellt?,
ekkor egy prediktív modell egyszerű:
- az adatokat – különböző forrásokból származó bármely ETL eszköz
Példa: lásd iris adatok – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
- Osztott az adatkészlet két részre (minta ellenőrző adat)
Építeni a Minta Adatok:
Építeni egy modell a mintát, adatot, amely az információt a faj a virág, illetve a mérések.,ariable próbáljuk megjósolni)
Általában, sok prediktív elemzési modellek tudnak sorolni 2 típusa van:
- – Osztályozás előre érték diszkrét keresztül a kategóriában, véges nincs rend
- Regresszió – előre érték folyamatos keresztül numerikus mennyiséget, majd végtelen a rendelés:
A széles körben használt algoritmusok az adatok elemzése lineáris regresszió, illetve a neurális hálózat
Lineáris regresszió: Az egyszerű regressziós modell feltételezi, hogy a lineáris kapcsolat áll fenn között a bemenet, mind a kimenet változók.,
neurális hálózat: az emberi agy által inspirált neurális hálózat, összekapcsolt neuronok hálózata, azaz számítási egységek halmaza, amely bemeneteket vesz igénybe, és az eredményt előre meghatározott kimenetre továbbítja. A számítási egységek rétegekben vannak elrendezve, így a bemeneti vektor jellemzői összekapcsolhatók a kimeneti vektor jellemzőivel.
az ötlet mögött ez gyakran coach neurális hálózatok modellezni a kapcsolatokat a megadott adatok.,
- hozzon létre egy modellt, amely az algoritmus által a képzési szakaszban megállapított szabályokon alapul.
- tesztelje a modellt az ellenőrző adathalmazon – az adatokat a modellbe táplálják, az előre jelzett értékeket pedig összehasonlítják a tényleges értékekkel. Így a modell pontosságát tesztelik.
- használja a modellt új bejövő adatokon, majd tegyen lépéseket a modell kimenete alapján.
egyéb fontos algoritmusok:
prediktív modellek jönnek különböző formákban. Vannak különböző módszerek, amelyeket fel lehet használni, hogy hozzon létre egy modellt, a legtöbb közülük folyamatosan fejlesztik.,
a leggyakoribb prediktív modellek a következők:
lineáris modellek: ez egy nagyon széles körben használt statisztikai algoritmus két változó közötti kapcsolatmodell felépítéséhez. Az egyik változót predictor változónak nevezzük, amelynek értékét kísérletek során gyűjtik össze, míg a másik változót válaszváltozónak nevezik, amelynek értéke a predictor változóból származik.
döntési fák( más néven osztályozás és regressziós fák vagy kosár): ez egy gráf, amely a lehetőségeket és azok kimenetelét ábrázolja fa formájában., A gráf csomópontjai egy eseményt vagy választást jelentenek, a gráf szélei pedig a döntési szabályokat vagy Feltételeket.
Support Vector Machines (SVMs) a gépi tanulásban: a support vector machine megkeresi a legközelebbi pontokat, és “support vectors” néven ismert ” a név annak a ténynek a következménye, hogy a pontok olyanok, mint a vektorok, amelyektől a legegyszerűbb sor “függ”, vagy “támogatja” a legközelebbi pontokat.
miután észlelte a legközelebbi pontokat, vektor kivonással (a pont – B pont) húz egy vonalat, amely összeköti őket., Ezután a támasztóvektor gép kijelenti, hogy a legjobb elválasztó vonal az a vonal, amely felezi — merőleges — az összekötő vonalra.
naiv Bayes: ez egy gépi tanulási algoritmus, amelyet többnyire osztályozási problémákra használnak. Bayes valószínűségi tételén, vagy más néven Bayes szabályán vagy Bayes törvényén alapul. Ezt használják a szöveges osztályozás, amely magában foglalja a magas dimenziós képzés adathalmazok.
Ez egy egyszerű algoritmus, és ismert, hogy a hatékonyság, hogy gyorsan építeni modellek és jóslatok segítségével ezt az algoritmust., A naiv Bayes algoritmust elsősorban a szövegosztályozási probléma megoldására tekintik. Ezért javasoljuk, hogy alaposan tanulja meg az algoritmust.,
Példa: spam szűrés, osztályozása hírek, cikkek, szentimentális elemzés
Bayes’ Tétel képviseli a következő egyenlet:
- : Valószínűsége (feltételes valószínűség) előfordulása egy adott esemény az esemény igazi
- s: Valószínűsége az esemény bekövetkezésétől, illetőleg
- : Valószínűsége annak, hogy az esemény bekövetkezésekor az adott esemény igaz
a Következtetést
a közeljövőben egyre nagyobb a kereslet a Prediktív Analitika lehet látni a szakemberek más patakok is csatlakozik a mozgalomhoz., Ha előnyt szeretne szerezni a társaival szemben, és részt kíván venni ebben az új növekedési sugárútban, felfedezheti NSE Certified Business Analytics tanfolyamunkat, valamint a PGD-t az Adattudományban.