Data Quality CZ - portál věnující se tématu kvalitních dat

Výzkum v oblasti řízení datové kvality

Metodika generování testovací populace

Popis záměru

Cílem je poskytnout nástroj pro umělé vygenerování populace na základě znalostí obsažených ve znalostní bázi.

Prohlášení o postupu generování testovacích dat

  • Data byla uměle vygenerovaná, pokud některé údaje odpovídají reálným klientům, jedná se o náhodu;
  • Data PRIVATE PARTY byla vygenerována na základě kombinace veřejně dostupných číselníků a údajů na webu Českého statistického úřadu;
  • Data vzorku COMMERCIAL PARTY byla dohledána v dostupných veřejných registrech;
  • Data adres byla použita z registru UIR ADR a poté uměle „znečištěna“ na základě známých defektů, které se dříve vyskytly v rámci reálných projektů, jichž jsem byl účastníkem;
  • Data mobilních čísel byla uměle vygenerována na základě dostupných informací o předčíslích vyhrazených pro mobilní operátory;
  • Data emailů byla uměle vygenerována na základě kombinace jména, příjmení a vybraných SLD poskytovatelů služeb typu mailbox.

Publikované výstupy

Document Tree