A tulajdonos az adattárház kell döntenie, hogyan reagál a változások a leírások dimenziós szervezetek, mint például a Munkavállaló, Ügyfél, Termék, Szállító, Hely, majd a többiek. A probléma tanulmányozásának 30 évében azt tapasztaltam, hogy csak három különféle válaszra van szükség. Ezeket a lassan változó dimenziókat (SCD) 1-es, 2-es és 3-as típusoknak hívom. A múlt hónap oszlopában leírtam az 1. típust, amely felülírja a dimenzióban megváltozott információkat., Ebben az oszlopban a 2.és a 3. típust írom le.
2. Típus: egy Új Dimenziót Rekord
nézzük, megváltoztathatja a forgatókönyv az előző oszlop, hol felül az Otthon Város mező Ralph Kimball alkalmazott rekord feltételezni, hogy Ralph Kimball valójában költözött, a Santa Cruz Boulder Creek július 18, 2008. Tegyük fel, hogy politikánk az, hogy pontosan nyomon követjük az alkalmazott otthoni címeit az adattárházban. Ez egy klasszikus 2. típusú változás.
a Type 2 SCD megköveteli, hogy kiadjunk egy új munkavállalói rekordot Ralph Kimball hatékony július 18, 2008., Ennek számos érdekes mellékhatása van:
- a 2. típus megköveteli, hogy általánosítsuk a munkavállalói dimenzió elsődleges kulcsát. Ha Ralph Kimball alkalmazottjának természetes kulcsa a G446, akkor ez a természetes kulcs lesz a” ragasztó”, amely Ralph Kimball több rekordját együtt tartja. Nem javaslom, hogy hozzon létre egy intelligens elsődleges kulcsot a 2.típusú SCD-khez, amely tartalmazza a szó szerinti természetes kulcsot. Az intelligens kulcsokkal kapcsolatos problémák különösen akkor válnak nyilvánvalóvá, ha több inkompatibilis HR rendszert integrál különböző formázott természetes kulcsokkal., Inkább teljesen mesterséges elsődleges kulcsokat kell létrehoznia, amelyek egyszerűen egymás után vannak hozzárendelve egész számok. Ezeket a kulcsokat helyettesítő kulcsoknak hívjuk. Új helyettesítő elsődleges kulcsot kell készítenie, amikor egy Dimenzió 2. típusú változását feldolgozza.
- az elsődleges helyettesítő kulcs mellett azt javaslom, hogy adjunk hozzá öt további mezőt egy 2. típusú feldolgozáson átesett dimenzióhoz. Ezeket a mezőket Az 1.ábra mutatja. A datetimes teljes munkaidős bélyegek, amelyek azt az időtartamot képviselik, amely a változás hatálybalépése és a következő változás hatálybalépése között eltelt., A végén-hatékony-datetime Típusú 2 dimenzióban kell rögzíteni pontosan egyenlő a begin-hatékony-datetime a következő változás, hogy a dimenzió tagja. A legfrissebb dimenziós rekordnak a jövőben egy fiktív datetime-nak kell lennie. A változás okát a változás okainak előre megtervezett listájából kell levonni, példánkban a munkavállalói attribútumokra. Végül, a jelenlegi zászló gyors módot kínál arra, hogy pontosan elkülönítse a dimenzió tagok halmazát, amely a lekérdezés pillanatában érvényes., Ez az öt adminisztrációs terület lehetővé teszi a végfelhasználók és az alkalmazások számára, hogy számos hatékony lekérdezést hajtsanak végre.
- a 2. típusú feldolgozáson átesett dimenzióval nagy figyelmet kell fordítani arra, hogy minden érintett ténytáblázatban a megfelelő kortárs helyettesítő kulcsokat használják ebből a dimenzióból. Ez biztosítja, hogy a megfelelő dimenzióprofilok a fact table tevékenységhez kapcsolódnak. Az extract, transform and load (ETL) folyamat összehangolása a méretezési táblázatok tény, táblázatok a betöltési idő az úgynevezett helyettesítő kulcs csővezeték, valamint a szabályozott körben a cikkek, könyvek.,
3. Típus: Új Mező
Bár a Típus 1, 2 SCDs az elsődleges igásló technikák válaszol, hogy megváltozik a dimenziója, szükségünk van egy harmadik technika kezelése alternatív valóságok. Ellentétben a fizikai attribútumokkal, amelyeknek csak egy értéke lehet egy adott időpontban, egyes felhasználó által hozzárendelt attribútumoknak jogosan lehet egynél több hozzárendelt értéke a megfigyelő szempontjából. Például egy termékkategóriának egynél több értelmezése lehet., Egy írószerboltban jelölő tollat lehet rendelni a háztartási cikkek kategóriájához vagy a művészeti kellékek kategóriájához. A végfelhasználóknak és az alkalmazásoknak képesnek kell lenniük arra, hogy a lekérdezés időpontjában kiválaszthassák, hogy ezek közül az alternatív valóság közül melyik érvényes.
a dimenzió attribútum alternatív valóságnézetének követelményét általában egy finom követelmény kíséri, amely szerint a valóság különálló verziói a múltban és a jövőben mindenkor rendelkezésre állnak, annak ellenére, hogy a realitások láthatóvá tételére irányuló kérés ma megérkezett az adattárházba.,
a legegyszerűbb változatban csak egy alternatív valóság létezik. Ebben az esetben a termékkategória példájához hozzáadunk egy új mezőt a dimenzióba, amelyet talán alternatív kategóriának nevezünk. Ha az elsődleges kategóriában a jelölés toll régen háztartási áru, most kellene művészeti kellékek, akkor egy 3-as Típusú kezelés, mi nyomja a háztartási áruk címke be az Alternatív Kategória mezőt, majd frissíti a rendszeres Kategória mező művészeti kellékek felülírásával. A felülírási lépés hasonló az 1. típusú SCD-hez, és ugyanazokat a figyelmeztetéseket idézi elő a múlt hónap oszlopában.,
a 3-as típusú gépekkel a végfelhasználók és az alkalmazások zökkenőmentesen válthatnak ezen alternatív realitások között. Ha a környezet egynél több alternatív valóságot igényel, ez a megközelítés általánosítható több alternatív mező hozzáadásával, bár nyilvánvalóan ez a megközelítés nem kecsesen lépi túl néhány választást.
az időváltozások dimenziókban történő kezelésének három SCD megközelítése óriási alkalmazhatósággal rendelkezik az adattárház által tapasztalt valós helyzetekben., A 2. típus különösen lehetővé teszi számunkra, hogy az adattárház ígéretet tegyen a történelem hű megőrzésére.