hitaasti muuttuvat mitat, Osa 2

tietovaraston omistajan on päätettävä, miten vastata mittayksiköiden, kuten työntekijän, asiakkaan, tuotteen, toimittajan, sijainnin ja muiden kuvausten muutoksiin. 30 vuotta tätä asiaa tutkittuani olen huomannut, että tarvitaan vain kolme erilaista vastausta. Kutsun näitä hitaasti muuttuvia ulottuvuuksia (SCD) tyypeiksi 1, 2 ja 3. Kuvailin viime kuun kolumnissa tyyppiä 1, joka korvaa muuttuneen tiedon ulottuvuudessa., Tässä sarakkeessa kuvataan tyypit 2 ja 3.

Tyyppi 2: Lisää Uuden Ulottuvuuden Ennätys

– Anna on muuttanut skenaario edellisen sarakkeen, jossa olen korvasivat Kotiin City-kentän Ralph Kimballin työntekijä tallentaa olettaa, että Ralph Kimball on oikeastaan siirtynyt Santa Cruz Boulder Creek 18. heinäkuuta, 2008. Oletetaan, että käytäntömme on seurata tarkasti työntekijöiden kotiosoitteita tietovarastossa. Tämä on klassinen tyypin 2 muutos.

Type 2 SCD edellyttää, että annamme uuden työntekijän ennätys Ralph Kimball tehokas heinäkuu 18, 2008., Tällä on monia mielenkiintoisia sivuvaikutuksia:

  1. Type 2 edellyttää, että yleistämme henkilöstömitoituksen ensisijaisen avaimen. Jos Ralph Kimballin työntekijä natural key on G446, tuo luonnollinen avain on ”liima”, joka pitää Ralph Kimballin useita ennätyksiä kasassa. En suosittele älykkään ensisijaisen avaimen luomista tyypin 2 SCDs: lle, joka sisältää kirjaimellisen luonnollisen avaimen. Älyavainten ongelmat tulevat erityisen ilmeisiksi, jos integroit useita yhteensopimattomia HR-järjestelmiä eri tavoin muotoiltuihin luonnollisiin avaimiin., Pikemminkin sinun pitäisi luoda täysin keinotekoinen ensisijainen avaimet, jotka ovat yksinkertaisesti peräkkäin annettuja kokonaislukuja. Kutsumme avaimia sijaisavaimiksi. Sinun täytyy tehdä uusi sijaissynnyttäjän ensisijainen avain, kun käsittelet tyypin 2 muutosta ulottuvuudessa.
  2. ensisijaisen sijaissynnytysnäppäimen lisäksi suosittelen lisäämään viisi lisäkenttää ulottuvuuteen, joka on tyypin 2 käsittelyssä. Nämä kentät on esitetty kuvassa 1. Se datetimes ovat koko ajan postimerkkejä, jotka edustavat span aikaa välillä, kun muutos tuli voimaan ja kun seuraava muutos tulee voimaan., Tyypin 2 ulottuvuuden tietueen End-effective-datetimen on oltava täsmälleen sama kuin kyseisen ulottuvuuden jäsenen seuraavan muutoksen alkutehokas-datetime. Uusin ulottuvuus ennätys on loppu-tehokas-datetime yhtä kuvitteellisia datetime kaukana tulevaisuudessa. Perusteluteksti muutokselle pitäisi vetää ennalta suunnitellusta luettelosta syitä muutokseen, esimerkissämme, työntekijän ominaisuuksiin. Lopuksi nykyinen lippu tarjoaa nopean keinon eristää täsmälleen ne ulottuvuusjäsenet, jotka ovat voimassa kyselyn hetkellä., Nämä viisi hallinnollista kenttää mahdollistavat loppukäyttäjien ja sovellusten monien tehokkaiden kyselyjen suorittamisen.
  3. tyypin 2 käsittelyssä läpikäyvällä ulottuvuudella on huolehdittava siitä, että kaikissa vaikutusalaan kuuluvissa faktataulukoissa käytetään oikeita tämän ulottuvuuden sijaissynnytysnäppäimiä. Tämä takaa, että oikeat ulottuvuusprofiilit liittyvät faktapöytätoimintaan. Ote, muunnos ja kuormitus (ETL) – prosessia, jossa mittataulukot sovitetaan faktataulukoihin kuormitushetkellä, kutsutaan sijaisavainputkeksi, ja sitä käsitellään laajasti artikkeleissani ja kirjoissani.,

Tyyppi 3: Lisää Uusi Kenttä

Vaikka Tyypin 1 ja 2 SCDs ovat ensisijainen työjuhta tekniikoita reagoida muutoksiin ulottuvuus, tarvitsemme kolmannen tekniikka käsittelyyn vaihtoehtoinen todellisuus. Toisin kuin fyysisiä ominaisuuksia, että voi olla vain yksi arvo ajankohtana, joissakin käyttäjän määrittämä attribuutteja voi perustellusti olla enemmän kuin yksi määritetty arvo riippuen tarkkailijan näkökulmasta. Esimerkiksi tuoteluokassa voi olla useampi tulkinta., Paperitavaraliikkeessä merkintäkynä voitaisiin osoittaa kotitaloustarvikeluokkaan tai taidetarvikeluokkaan. Loppukäyttäjien ja sovellusten on voitava valita kyselyajankohtana, mitä näistä vaihtoehtoisista todellisuuksista sovelletaan.

vaatimus vaihtoehtoisen todellisuuden näkymä ulottuvuuden ominaisuus yleensä on mukana hienovarainen vaatimus, että erilliset versiot todellisuudesta olla käytettävissä kaikkina aikoina, menneisyydessä ja tulevaisuudessa, vaikka pyyntö nämä realiteetit näkyvissä saapunut data warehouse tänään.,

yksinkertaisimmassa muunnelmassa on vain yksi vaihtoehtotodellisuus. Tässä tapauksessa tuoteryhmäesimerkille lisäämme ulottuvuuteen uuden kentän, jota ehkä kutsutaan Vaihtoehtoluokaksi. Jos ensisijainen luokka, merkintä kynä ennen taloustavarat ja nyt pitäisi olla taidetarvikkeita, sitten Tyyppi 3 hoito, me työntää taloustavarat label osaksi Vaihtoehtoinen Luokka-kenttään ja me päivittää säännöllisesti Luokka-kentän kanssa taidetarvikkeita korvaamalla. Päällekirjoituksen vaihe on samanlainen kuin Tyypin 1 SCD ja provosoi kaikki samat varoitukset viime kuun sarakkeessa.,

kun tyypin 3 koneet ovat paikoillaan, loppukäyttäjät ja sovellukset voivat vaihtaa saumattomasti näiden vaihtoehtoisten realiteettien välillä. Jos ympäristö edellyttää useampaa kuin yhtä vaihtoehtoista todellisuutta, tämä lähestymistapa voidaan yleistää lisäämällä Vaihtoehtoisempia kenttiä, vaikka tämä lähestymistapa ei tietenkään laajene sulavasti muutamaa vaihtoehtoa pidemmälle.

kolmella SCD-lähestymistavalla, joilla käsitellään mittojen aikaeroja, on valtava sovellettavuus tietovaraston kohtaamissa tosielämän tilanteissa., Erityisesti tyypin 2 avulla voimme hyvittää tietovaraston lupauksen säilyttää historia uskollisesti.

Leave a Comment