Mi az adattárház? Típusok, definíció & példa

mi az adattárolás?

az adattárolás (Dw) a különböző forrásokból származó adatok gyűjtésének és kezelésének folyamata, hogy értelmes üzleti betekintést nyújtson. Az adattárház jellemzően heterogén forrásokból származó üzleti adatok összekapcsolására és elemzésére szolgál. Az adattárház az adatelemzésre és jelentéstételre épülő BI rendszer magja.

olyan technológiák és komponensek keveréke, amelyek segítik az adatok stratégiai felhasználását., Nagy mennyiségű információ elektronikus tárolása egy vállalkozás által, amelyet a tranzakciók feldolgozása helyett lekérdezésre és elemzésre terveztek. Ez egy olyan folyamat, amely az adatokat információvá alakítja, és a felhasználók számára időben elérhetővé teszi a változást.

ebben az adattárház (DWH) bemutató, akkor többet megtudni –

  • története Datawarehouse
  • hogyan Datawarehouse működik?
  • adattárház típusai (DWH)
  • az adattárház Általános szakaszai
  • az adattárház összetevői
  • kinek van szüksége adattárházra?,
  • mire használják az adattárházat?
  • az adattárház megvalósításának lépései
  • legjobb gyakorlatok egy adattárház megvalósításához
  • miért van szükségünk Adattárházra? Előnyök & hátrányok
  • az adattárolás jövője
  • adattárház eszközök

a döntéstámogató adatbázist (adattárház) a szervezet operatív adatbázisától elkülönítve tartják fenn. Az adattárház azonban nem termék, hanem környezet., Ez egy olyan információs rendszer építészeti konstrukciója, amely a felhasználók számára olyan aktuális és történelmi döntéstámogató információkat biztosít, amelyeket nehéz elérni vagy bemutatni a hagyományos operatív adattárban.

sokan tudják, hogy egy 3NF által tervezett adatbázis egy leltárrendszerhez sok táblázatok kapcsolódnak egymáshoz. Például az aktuális készletinformációkról szóló jelentés több mint 12 egyesített feltételt tartalmazhat. Ez gyorsan lelassíthatja a lekérdezés válaszidejét., Az adattárház egy új kialakítást nyújt, amely segíthet csökkenteni a válaszidőt, valamint segít a jelentések és elemzések lekérdezéseinek teljesítményének javításában.,

adattárház rendszer is ismert, a következő név:

  • döntéstámogató Rendszer (DSS)
  • Vezetői Információs Rendszer
  • – Gazdálkodási Információs Rendszer
  • Üzleti Intelligencia Megoldás
  • Analitikus Alkalmazás
  • adattárház

Történelem Datawarehouse

A Datawarehouse előnyei a felhasználók számára, hogy megértse, valamint fokozzák a szervezet teljesítményét., Az adatok raktározásának szükségessége úgy alakult ki, hogy a számítógépes rendszerek egyre összetettebbé váltak, és egyre több információ kezelésére volt szükség. Az adattárolás azonban nem új dolog.

Íme néhány kulcsfontosságú esemény az adattárház fejlődésében –

  • 1960-Dartmouth és General Mills egy közös kutatási projektben, fejlessze ki a dimenziók és tények kifejezéseket.
  • 1970 – A Nielsen és az IRI dimenziós adatokat mutat be a kiskereskedelmi forgalom számára.,
  • 1983-a Tera Data Corporation olyan adatbázis-kezelő rendszert vezet be, amelyet kifejezetten a döntéstámogatásra terveztek
  • az adattárolás az 1980-as évek végén kezdődött, amikor Paul Murphy és Barry Devlin IBM munkás kifejlesztette az üzleti adattárházat.
  • azonban a valódi koncepciót az Inmon Bill adta. Az adattárház atyjának tekintették. Számos témakörben írt a raktár építéséről, használatáról és karbantartásáról & A vállalati információs gyár.

hogyan működik a Datawarehouse?,

az adattárház központi adattárként működik, ahol az információ egy vagy több adatforrásból érkezik. Az adatok a tranzakciós rendszerből és más relációs adatbázisokból egy adattárházba áramlanak.

Az adatok lehetnek:

  1. strukturált
  2. félig strukturált

  3. strukturálatlan adatok

az adatokat feldolgozzák, átalakítják és lenyelik, hogy a felhasználók üzleti intelligencia eszközök, SQL kliensek és táblázatok segítségével hozzáférhessenek az adattárház feldolgozott adataihoz., Egy adattárház egyesíti a különböző forrásokból származó információkat egy átfogó adatbázisba.

az összes információ egy helyen történő egyesítésével a szervezet holisztikusabban elemezheti ügyfeleit. Ez segít annak biztosításában, hogy figyelembe vette az összes rendelkezésre álló információt. Az adattárolás lehetővé teszi az adatbányászatot. Az adatbányászat olyan mintákat keres az adatokban, amelyek magasabb értékesítéshez és nyereséghez vezethetnek.

adattárház típusai

az adattárházak három fő típusa (DWH) a következő:

1., Enterprise Data Warehouse (EDW):

Enterprise Data Warehouse (EDW) egy központi raktár. Döntési támogatási szolgáltatást nyújt a vállalkozás egész területén. Egységes megközelítést kínál az adatok szervezésére és reprezentálására. Lehetővé teszi továbbá az adatok tárgy szerinti osztályozását, valamint a megosztottság szerinti hozzáférést.

2. Operatív Adattárolás:

az operatív Adattárolás, amelyet ODS-nek is neveznek, nem más, mint az adattárolás, ha sem az adattárház, sem az OLTP rendszerek nem támogatják az igényeket bejelentő szervezeteket., Az ODS – ban az adattárház valós időben frissül. Ezért széles körben előnyben részesítik a rutin tevékenységeket, például az alkalmazottak nyilvántartásának tárolását.

3. Data Mart:

a data mart az adattárház egy részhalmaza. Kifejezetten egy adott üzletághoz tervezték, mint például az értékesítés, a finanszírozás, az értékesítés vagy a finanszírozás. A független adatok mart, adatok gyűjthetnek közvetlenül forrásokból.

az adattárház Általános szakaszai

korábban a szervezetek viszonylag egyszerű adattárolást indítottak. Idővel azonban megkezdődött az adattárolás kifinomultabb használata.,

az adattárház (DWH) használatának általános szakaszai a következők:

Offline operatív adatbázis:

ebben a szakaszban az adatokat csak egy operációs rendszerről másolják egy másik szerverre. Ily módon a másolt adatok betöltése, feldolgozása és jelentése nem befolyásolja az operációs rendszer teljesítményét.

Offline adattárház:

A Datawarehouse adatai rendszeresen frissülnek az operatív adatbázisból. A Datawarehouse adatai a Datawarehouse céljainak elérése érdekében kerülnek feltérképezésre és átalakításra.,

valós idejű adattárház:

ebben a szakaszban az adattárházak frissítésre kerülnek, amikor bármely tranzakció operatív adatbázisban történik. Például légitársaság vagy vasúti foglalási rendszer.

integrált adattárház:

ebben a szakaszban az adattárházak folyamatosan frissülnek, amikor az operációs rendszer tranzakciót hajt végre. A Datawarehouse ezután olyan tranzakciókat generál, amelyeket visszaadnak az operációs rendszernek.

az adattárház összetevői

az adattárházak négy összetevője a következő:

terheléskezelő: a Terheléskezelőt elülső komponensnek is nevezik., Ez végzi az összes kapcsolódó műveleteket a kitermelés, valamint a terhelés az adatok a raktárba. Ezek a műveletek magukban foglalják az adattárházba való belépéshez szükséges adatok előkészítését célzó átalakításokat.

raktárkezelő: a raktárkezelő a raktárban lévő adatok kezelésével kapcsolatos műveleteket hajt végre. Olyan műveleteket végez, mint az adatok elemzése a következetesség biztosítása, indexek és nézetek létrehozása, denormalizáció és aggregációk generálása, a forrásadatok átalakítása és összevonása, valamint az archiválás és a sütés-up ADATOK.,

Query Manager: Query manager is ismert backend komponens. Elvégzi a felhasználói lekérdezések kezelésével kapcsolatos összes műveletet. Ezen adattárház-összetevők működése közvetlen lekérdezések a megfelelő táblázatokhoz a lekérdezések végrehajtásának ütemezéséhez.

Végfelhasználói hozzáférési eszközök:

Ez öt különböző csoportba sorolható, például 1. Adatszolgáltatás 2. Lekérdező Eszközök 3. Alkalmazásfejlesztési eszközök 4. Eis eszközök, 5. OLAP eszközök és adatbányászati eszközök.

kinek van szüksége adattárházra?,

DWH (Data warehouse) minden típusú felhasználó számára szükséges, mint például:

  • döntéshozók, akik tömeges adatmennyiségre támaszkodnak
  • felhasználók, akik testreszabott, összetett folyamatokat használnak több adatforrásból származó információk beszerzésére.
  • azokat az embereket is használják, akik egyszerű technológiát akarnak elérni az adatokhoz
  • alapvető fontosságú azok számára is, akik szisztematikus megközelítést akarnak a döntések meghozatalához.
  • ha a felhasználó gyors teljesítményt szeretne hatalmas mennyiségű adaton, amely jelentések, rácsok vagy diagramok szükségessége, akkor az adattárház hasznosnak bizonyul.,
  • az adattárház az első lépés, ha az adatfolyamok és a csoportosítások “rejtett mintáit” szeretné felfedezni.

mire használják az adattárházat?

itt a leggyakoribb ágazatok, ahol adattárház használják:

légitársaság:

a légitársaság rendszer, akkor használják működési célra, mint a személyzet hozzárendelése, elemzések útvonal jövedelmezőség, törzsutas program promóciók, stb ..

Banking:

széles körben használják a bankszektorban az asztalon rendelkezésre álló források hatékony kezelésére., Kevés bank használta a piackutatást, a termék teljesítményelemzését és működését is.

Egészségügy:

az Egészségügyi ágazatban is használják, adattárház, hogy tanácskozni, várható eredményeket, generál beteg kezelése jelentések, adatok megosztását tie -, a biztosító társaságok, orvosi támogatás szolgáltatások, stb.

közszféra:

a közszférában az adattárházat hírszerzési célokra használják. Segít a kormányzati szerveknek, hogy minden egyén számára megőrizzék és elemezzék az adólevelet, az egészségpolitikai nyilvántartást.,

Befektetési és biztosítási ágazat:

ebben az ágazatban a raktárakat elsősorban az adatminták, az ügyfelek trendjeinek elemzésére, valamint a piaci mozgások nyomon követésére használják.

Láncmegőrzés:

kiskereskedelmi láncokban az adattárház széles körben használatos forgalmazásra és marketingre. Segít nyomon követni az elemeket, az ügyfelek vásárlási mintáját, promócióit, valamint az árpolitika meghatározására is.

Telekommunikáció:

ebben az ágazatban egy adattárházat használnak termék promóciókhoz, értékesítési döntésekhez és terjesztési döntések meghozatalához.,

vendéglátóipar:

Ez az iparág raktári szolgáltatásokat használ a hirdetési és promóciós kampányok megtervezéséhez, valamint becsléséhez, ahol visszajelzései és utazási szokásai alapján meg akarják célozni az ügyfeleket.

a Lépések Végrehajtásához adattárház

A legjobb módja annak, hogy foglalkozik a vállalkozás kapcsolódó kockázat Datawarehouse végrehajtás foglalkoztatni, földelt stratégia, mint az alábbi

  1. Vállalati stratégia: Itt azonosítani műszaki beleértve a jelenlegi építészet, eszközök. A tényeket, dimenziókat és attribútumokat is azonosítjuk., Az adatok leképezése és átalakítása is megtörtént.
  2. szakaszos szállítás: a Datawarehouse végrehajtását a tárgyterületek alapján fokozatosan kell végrehajtani. A kapcsolódó üzleti vállalkozásokat, például a foglalást és a számlázást először végre kell hajtani, majd integrálni kell egymással.
  3. iteratív prototípus: a megvalósítás big bang megközelítése helyett a Datawarehouse-t iteratív módon kell kidolgozni és tesztelni.

itt vannak a legfontosabb lépések Datawarehouse végrehajtása mellett a szállítható.,ntegration Térkép 8 Fejleszteni adattárház Adatbázis tervezés D/W Adatbázis Tervezés 9 Kivonat Adatai Operatív adattár Integrált D/W Adatok Kivonatok 10 Terhelés adattárház a Kezdeti Adatok Terhelés 11 Fenntartása adattárház folyik az Adatokhoz való Hozzáférést, valamint az azt Követő Terhelés

a Legjobb gyakorlatok végrehajtásához egy adattárház

  • Dönthet úgy, hogy a terv, hogy tesztelje a következetesség, pontosság, valamint integritását az adatokat.,
  • az adattárháznak jól integráltnak, jól definiáltnak és időbélyegzőnek kell lennie.
  • a Datawarehouse tervezése során ügyeljen arra, hogy a megfelelő eszközt használja, tartsa be az életciklust, vigyázzon az adatkonfliktusokra, és készen álljon arra, hogy megtanulja a hibáit.
  • soha ne cserélje ki az operációs rendszereket és a jelentéseket
  • ne töltsön túl sok időt az adatok kinyerésére, tisztítására és betöltésére.
  • győződjön meg arról, hogy bevonja az összes érdekelt felet, beleértve az üzleti személyzetet a Datawarehouse végrehajtási folyamatába. Állapítsa meg, hogy az adattárolás közös/ csapatprojekt., Nem akar olyan adattárházat létrehozni, amely nem hasznos a végfelhasználók számára.
  • Készítsen képzési tervet a végfelhasználók számára.

miért van szükségünk Adattárházra? Előnyök & hátrányok

az adattárház (DWH) előnyei:

  • az adattárház lehetővé teszi az üzleti felhasználók számára, hogy gyorsan hozzáférjenek bizonyos forrásokból származó kritikus adatokhoz egy helyen.
  • az adattárház következetes információkat nyújt a különböző funkcionális tevékenységekről. Emellett támogatja az Ad hoc jelentéstételt és lekérdezést.,
  • az adattárház számos adatforrás integrálását segíti a termelési rendszerre nehezedő stressz csökkentése érdekében.
  • az adattárház segít csökkenteni a teljes átfutási időt az elemzéshez és a jelentéshez.
  • a szerkezetátalakítás és az integráció megkönnyíti a felhasználó számára a jelentéstételt és az elemzést.
  • az adattárház lehetővé teszi a felhasználók számára, hogy egyetlen helyen hozzáférjenek a kritikus adatokhoz a források számából. Ezért a felhasználó időt takarít meg az adatok több forrásból történő visszakeresésére.
  • az adattárház nagy mennyiségű történelmi adatot tárol., Ez segít a felhasználóknak, hogy elemezzék a különböző időszakokban, trendek, hogy a jövőbeli előrejelzések.

az adattárház hátrányai:

  • nem ideális lehetőség strukturálatlan adatokhoz.
  • az adattárház létrehozása és megvalósítása biztosan idő zavaró.
  • az adattárház viszonylag gyorsan elavult lehet
  • nehéz módosítani az adattípusokat és tartományokat, Az adatforrás sémát, indexeket és lekérdezéseket.
  • az adattárház könnyűnek tűnhet, de valójában túl bonyolult az átlagos felhasználók számára.,
  • a projektmenedzsment legjobb erőfeszítései ellenére az adattárház projekt hatóköre mindig növekedni fog.
  • valamikor a raktárhasználók különböző üzleti szabályokat dolgoznak ki.
  • a szervezeteknek sok erőforrásukat képzési és végrehajtási célra kell fordítaniuk.

az adattárolás jövője

  • a szabályozási korlátok változása korlátozhatja az eltérő adatok forrásának kombinálását. Ezek a különböző források tartalmazhatnak strukturálatlan adatokat, amelyeket nehéz tárolni.,
  • ahogy az adatbázisok mérete növekszik, a nagyon nagy adatbázis becslései továbbra is növekednek. Összetett feladat olyan adattárház rendszerek kiépítése és működtetése, amelyek mérete folyamatosan növekszik. A ma elérhető hardver – és Szoftverforrások nem teszik lehetővé a nagy mennyiségű adat online tárolását.
  • a multimédiás adatokat nem lehet könnyen manipulálni szöveges adatként, míg a szöveges információkat a ma elérhető relációs szoftver képes letölteni. Ez lehet egy kutatási téma.,

adattároló eszközök

számos adattároló eszköz áll rendelkezésre a piacon. Itt van néhány legjelentősebb:

1. MarkLogic:

A MarkLogic hasznos adattárolási megoldás, amely megkönnyíti és gyorsabbá teszi az adatintegrációt vállalati funkciók tömb segítségével. Ez az eszköz segít nagyon összetett keresési műveletek végrehajtásában. Ez lehet lekérdezni a különböző típusú adatok, mint a dokumentumok, kapcsolatok, metaadatok.

https://www.marklogic.com/product/getting-started/

2. Oracle:

Az Oracle az iparág vezető adatbázisa., Az adattárház megoldások széles választékát kínálja mind a helyszínen, mind a felhőben. Segít optimalizálni az ügyfelek tapasztalatait a működési hatékonyság növelésével.

https://www.oracle.com/index.html

3. Amazon RedShift:

az Amazon Redshift adattárház eszköz. Ez egy egyszerű, költséghatékony eszköz, hogy elemezze az összes típusú adatok szabványos SQL, valamint a meglévő BI eszközök. Lehetővé teszi a komplex lekérdezések futtatását a strukturált adatok petabájtjaival szemben, a lekérdezés optimalizálásának technikájával.,

https://aws.amazon.com/redshift/?nc2=h_m1

itt található a hasznos Datawarehouse eszközök teljes listája.

KEY LEARNING

  • Data Warehouse (DWH), is ismert, mint egy Enterprise Data Warehouse (EDW).
  • az adattárház olyan központi adattár, ahol az információ egy vagy több adatforrásból származik.
  • az adattárházak három fő típusa Az Enterprise Data Warehouse (EDW), az Operational Data Store és az Data Mart.,
  • egy adattárház általános állapota Offline operatív adatbázis, Offline adattárház, valós idejű adattárház és integrált adattárház.
  • a Datawarehouse négy fő összetevője a Load manager, Warehouse Manager, Query Manager, End-user access tools
  • a Datawarehouse-t különböző iparágakban használják, mint például légitársaság, banki, egészségügyi, biztosítási, kiskereskedelmi stb.
  • végrehajtása Datawarehosue egy 3 prong stratégia viz. Vállalati stratégia, szakaszos szállítás és iteratív prototípus készítés.,
  • az adattárház lehetővé teszi az üzleti felhasználók számára, hogy gyorsan hozzáférjenek a kritikus adatokhoz egyes forrásokból egy helyen.

Leave a Comment