EVENEMENT

SQL Server Data Quality Services

-

Microsoft Data Quality Services (DQS) werd geïntroduceerd in SQL Server 2012 en biedt data stewards de mogelijkheid om de kwaliteit van de bedrijfsdata te onderhouden. DQS maakt gebruik van een user interface waar men de knowledge base kan beheren door domeinen aan te maken en er regels aan te koppelen.

 

Enkele voorbeelden:

  • Verificatie data type
  • Gebruik van synoniemen om data te ontdubbelen
  • Verificatie van data formaten (telefoon nummers, e-mail adressen, ...)
  • Afkortingen omzetten (bijvoorbeeld "KM" omzetten in "Kilometer")
  • Fuzzy look up met een externe data set

Vervolgens kan de knowledge base toegepast worden op een bepaalde databron. Hiervoor moeten de bron kolommen gemapt worden met de domeinen in de knowledge base. Vervolgens worden de regels toegepast op de data en de resultaten geanalyseerd. Correcties, die DQS voorstelt, kunnen al dan niet geaccepteerd worden.

Deze gecorrigeerde data kan vervolgens nog geëxporteerd worden naar een andere data source. De eerste iteratie van een Data Quality project resulteert in een Data Quality knowledge base. Deze kan dan gebruikt worden in SSIS via de "DQS” data flow task om zo je data automatisch op te schonen, vooraleer de data wordt doorgeladen naar je data warehouse.

De kwaliteit van de data is een kritische succes factor, want foutieve data leidt tot foutieve beslissingen. De ontwikkelkost van dergelijke oplossing is omgekeerd evenredig met de kwaliteit van de data. Met deze nieuwe oplossing, biedt Microsoft de mogelijkheid om eerder gedefinieerde data kwaliteitsregels in SSIS te centraliseren en te laten beheren door de eindgebruiker en te hergebruiken tussen verschillende projecten.

 

Neem contact op als je meer wil weten van onze Microsoft consulting diensten of proposities.