Data Vault 2.0-menetelmä ei vaadi ainoastaan mallinnustekniikkaa, vaan tarjoaa kokonaisen menetelmän kaikkiin Tietovarastoprojekteihin. Indelient see ’ s the Data Vault modeling on erittäin toteuttamiskelpoinen lähestymistapa tietovarastointiprojektien tarpeisiin, joissa sekä historiallinen seuranta että auditoitavuus ovat kaksi tärkeää tekijää.

useiden vuosien ajan business intelligence (BI) – projektit ovat toimineet ja toimivat edelleen vesiputousmallilla. Se on määritelty pitkän venytetty sekvenssi kunkin vaiheen, joka vaatii tyhjentävä luettelo etukäteen vaatimukset, täydellinen tietomalli suunnittelu, jonka jälkeen kodifioidaan kaikki kovat ja pehmeät liiketoiminnan säännöt osaksi ETL prosesseja. Visualisointikerros rakennetaan peräkkäin ja esitetään loppukäyttäjille kuittaus-kuukausia tai jopa vuosia alkuperäisestä aloituspäivämäärästä.

melko usein näemme myös tiimit hyväksyä ”suppeampi soveltamisala” versio vesiputous, jonka tavoitteena on rikkoa suuria BI aloitteita pienempiin projekteihin. Vaikka tämä auttaa vähentämään yleistä monimutkaisuutta, tämä lähestymistapa, kun sitä sovelletaan BI, on edelleen melko riskialtista, koska kaksi ensisijaista huolenaihetta:

  • liiketoiminnan vaatimukset muuttuvat nyt nopeammin kuin kyky tuottaa;
  • ja budjettihenkilöt ovat haluttomia käyttämään pitkän aikavälin projekteihin, joilla ei ole toteutuneita lyhyen aikavälin tuloksia.

edellä mainituista syistä projektimenetelmissä on siirrytty waterfallista ketterän iteratiiviseen ketterään lähestymistapaan, joka tunnistaa ja tarjoaa joitakin vastauksia näihin kysymyksiin.

data analytics-toimialueen sisällä agile ei yksin vastaa niihin merkittäviin haasteisiin, joita kohtaamme tietovarastoinnin tai BI-projektien yksityiskohtaisemmilla tasoilla. Näitä ovat:

  • iterointi datamallinnuksessa
  • refaktoroinnin minimointi
  • sellaisten ETL-tai ELT-rutiinien suunnittelu, jotka mahdollistavat nopean reagoinnin liiketoimintalogiikan muutoksiin tai uusiin tietojen lisäyksiin
  • lähestymistapa liiketoiminnan vaatimusten keräämiseen, joka liittyy läheisesti suunnittelupäätöksiin

näihin haasteisiin vastaamiseksi, Daniel linstedt on kirjoittanut teoksen ”building scalable data warehouse with data Vault 2”.0, määritellään menetelmä, joka keskittyy saamaan kaiken irti ketteriä käytäntöjä muiden todistettu tieteenalojen ja tekniikoita toimittaa mitä näyttää olevan kaikkein iteratiivinen lähestymistapa BI vielä.

Introducing Data Vault

vastoin yleistä uskomusta, Data Vault (dv) ei ole vain mallinnustekniikka, se on kokonainen menetelmä tietovarastoprojekteissa. Se sitoo yhteen agile -, BEAM requirements gathering -, CMMI -, TQM -, Six Sigma-ja Data Vault-mallintamisen näkökohdat määritelläkseen lähestymistavan, joka tähtää BI-projektien nopeuden ja laadun parantamiseen. Viittaan siihen ”ohjusten lähestymistapana”, koska se edistää sekä sopeutumista että tarkkuutta.

DV kattaa myös ketterät menetelmät DW-projektin estimoinnissa ja ketterässä tehtävien mitoituksessa, jotta voidaan määrittää perinteisesti huomiotta jätetty monimutkaisuus tai työpanos, joka liittyy yleisiin DW-komponentteihin. Alemmilla tasoilla siinä esitetään myös hyvin tiivis ja iteratiivinen lähestymistapa yhteisten teknisten tulosten käsittelemiseen (BI-maailmassa) uusilla tai muuttuvilla ominaisuuspyynnöillä. Näitä ovat harkitut, Toistettavat, askel-askeleelta ja ketteriä prosesseja suorittaa usein tehtäviä.

näihin tehtäviin kuuluu (mutta ei rajoittuen) tietojen attribuuttien, viipaleiden, uusien lähteiden, lisättyjen lähteiden, historiallisen seurannan, lähteiden karsimisen ja lähderakenteen muutosten lisääminen sekä ETL-että Mallintamisvaiheessa.

dv-malli, pähkinänkuoressa, on kerros, joka on olemassa säännöllisen dimensiomallinnuksen (OLAP, Star Schema) ja lavastuksen välillä, joka tarjoaa skaalauksen kasvavilla liiketoimintavaatimuksilla ja palvelee sekä mallinnuksen että ETL: n kompleksisuuksien purkamista. Se koostuu solmukohdista (liiketoimintayksiköt), linkeistä (suhteet) ja satelliiteista (kuvailevat attribuutit), jotka on mallinnettu jonnekin 3NF: n ja star-skeeman välille. Malli on sijoitettu tietovaraston data-integraatiokerroksen sisään, jota yleisesti kutsutaan Raakadataholviksi, ja sitä käytetään tehokkaasti yhdessä Kimballin mallin kanssa.

Vinkki:Jos olet kiinnostunut ymmärtämään mallia ja sen alleviivaussääntöjä, suosittelen tarttumaan Danin edellä mainittuun kirjaan.

Dataholvi 2.0 edut

tässä on yleiskatsaus Data Vault 2.0-lähestymistavan keskeisistä eduista:

  • se olettaa pahimman mahdollisen skenaarion tietojen mallinnus suhteita. N:M suhteet liiketoiminnan objektien poistaa tarpeen päivityksiä, jos 1:M muuttuu M: M. mikä edellyttää käytännössä mitään lisätyötä Data Holvi, kun suhde muuttuu.
  • se on suunniteltu kaikkien datasuhteiden ja attribuuttien historialliseen seurantaan sekä siihen, mistä tiedot ovat peräisin ajan kuluessa. Mittoja vastaavat satelliitit toimivat samalla tavalla kuin SCD Type 2.
  • esittää joukon suunnitteluperiaatteita & rakenteita historiallisten seurantatehojen lisäämiseksi holvissa (kuoppa ja silta). Data Holvimalli on riittävän joustava, jotta nämä rakenteet voidaan ottaa käyttöön milloin tahansa iteratiivisen mallinnusprosessin aikana, eikä se vaadi pitkälle kehitettyä suunnittelua.
  • suunniteltu erottelemaan loogisesti tiloja, jotka sisältävät raakaa vs. muutettua tietoa. Raw data vault on perusta tietojen, joka on auditoitavissa lähde järjestelmiä ja business holvi tarjoaa paikan tehokäyttäjille, jotka tarvitsevat pääsyn tietoihin askeleen alaspäin information mart.
  • erottaa pehmeät ja kovat liiketoimintasäännöt tietointegraation eri osiin. Tämä varmistaa tietojen uudelleenkäytettävyyden useissa käyttötarkoituksissa. Esimerkiksi raakadataa hankitaan vain kerran Dataholvissa (vähemmän integrointia vaiheistukseen), ja sitä voidaan syöttää useita kertoja loppupään tarpeisiin.
  • jokaista ketterää iteraatiota varten Dataholvimalli, joka tallentaa kaiken datan historiallisen seurannan, on helposti laajennettavissa ilman, että historiatietojen menettämisestä tarvitsee huolehtia. Myös historiallinen seuranta tallentuu mittamallista riippumatta.
  • Data Vault 2.0 puoltaa hash-avaimen toteutusta liikeavaimissa, jotta hakuja voidaan vähentää ja näin lisätä latausta parallelization. Tämä johtaa vähemmän peräkkäisiä lataus riippuvuuksia.
  • Raakadataholvi on suunniteltu täysin auditoitavaksi.
  • kokonaisuutena Stagingista tähtikuvioon & OLAP on tehty paljon sujuvammaksi & iteratiiviseksi Dataholvin avulla.
  • se tarjoaa hyvin harkitun lähestymistavan datan yhdistämiseen useiden eri liiketoiminta-avainten kanssa heterogeenisistä tietolähteistä (yleinen ongelma tietojen integroimisessa varastoon eri lähdejärjestelmissä). Liikeavaimet eivät ole aina 1: 1 tai samassa muodossa.
  • ”just in time” – mallintamismentaliteetti sopii hyvin yhteen ketterän lähestymistavan kanssa.

haitat

vaikka Tietoholvissa on monia etuja, siinä on myös puutteensa, kuten:

  • Data Vault on lähinnä kerros välillä information mart / star skeema ja lavastus. On joitakin ylimääräisiä yläpuolella, joka tulee kehittää tämän kerroksen sekä kannalta ETL kehitystä ja mallinnus. Jos hanke on pienimuotoinen tai sen elinkaari on lyhytaikainen, Dataholvimallia ei välttämättä kannata tavoitella.
  • yksi tärkeimmistä tekijöistä Dataholvin käytössä on sekä auditointiin että historialliseen seurantaan. Jos mikään näistä ei ole tärkeä sinulle tai organisaatiollesi, voi olla vaikea syödä yleiskustannuksia, joita tarvitaan toisen kerroksen käyttöönottamiseksi mallintamiseesi. Kuitenkin, ottaen huomioon pitkän aikavälin vaatimukset, se voi olla kannattava investointi etukäteen.
  • Dataholvi edustaa hajonnutta lähestymistapaa ihmissuhteisiin, liikeavaimiin ja attribuutteihin, ja siksi luotavien taulukoiden määrä on suuri verrattuna denormalisoituihin rakenteisiin, kuten tähtikaavioon. Kuitenkin, harkita, että Data Vault kohteliaisuuksia star skeema, joten tämä vertailu on vastakkaisiin tarkoituksiin vain. Tästä syystä, monet liitokset ovat tarpeen tarkastella tietoja dv.
  • tätä kirjoitettaessa-DV: n resurssit ovat rajalliset. Dv 2.0: aa käyttävät monimutkaiset projektit eivät ole laajalle levinnyttä tietoa.
  • mallintaminen voi ylipäätään olla hyvin epätavanomaista niille, jotka ovat toimineet Kimballin ja (vähemmän) Inmonin mallien alaisuudessa.

Pitäisikö Sinun Tavoitella Dataholvia?

vastaus riippuu muutamasta muuttujasta.

näemme Tietovarastomallinnuksen erittäin toteuttamiskelpoisena lähestymistapana tietovarastointiprojektien tarpeisiin, joissa sekä historiallinen seuranta että auditoitavuus ovat kaksi tärkeää tekijää.

Lisäksi, jos liiketoimintayksiköiden väliset suhteet kehittyvät jatkuvasti tiedoissasi (esimerkki 1:M-M:M ), Data Vault yksinkertaistaa näiden suhteiden kaappaamista ja antaa sinun keskittyä enemmän todellisen arvon tuottamiseen.

jos organisaatiosi suunnittelee PII-tietojen tallentamista varastoon ja on GDPR: n, Hipa: n tai muiden säännösten alainen, Tietoholvi auttaa tietojen tarkastamisessa ja jäljitettävyydessä.

on tärkeää ottaa huomioon sekä edellä luetellut edut että haitat auttaakseen valitsemaan, onko Dataholvin lähestymistapa hyödyllinen käyttötapauksellesi.

Vastaa

Sähköpostiosoitettasi ei julkaista.

lg