Als data door zorgverleners aan i2i wordt aangeleverd volgen er een aantal controles over de technische en inhoudelijke kwaliteit van de data. Omdat i2i veel complexe analyses doet is het erg belangrijk dat de data op beide vlakken een hoge kwaliteit heeft. Om goed te kunnen beoordelen of data voldoende kwaliteit heeft om in ons datawarehouse op te nemen hebben we een gestroomlijnd proces ingericht.
De controles die worden uitgevoerd bij iedere aanlevering worden individueel beoordeeld. Mochten er aanwijzingen zijn dat er issues in de data zitten, dan worden deze verder uitgezocht. Per aanlevering wordt beoordeeld of de kwaliteit van de data voldoende is aan de hand van controles die in een data-dashboard worden samengevat en teruggekoppeld aan de data-leverancier. In dit data-dashboard zijn een aantal harde criteria opgesteld aan de hand van enkele algemene uitgangspunten.
Algemene uitgangspunten
1) De dataleverancier is verantwoordelijk voor een correcte aanlevering. Het is niet aan ons om de technische problemen in de aanlevering op te lossen zonder dat wij toegang hebben tot de brondata.
2) Tijdens het laden voeren wij een aantal basale technische checks uit op de velden, zoals correct veldformaat, verplicht gevuld en uniciteit van de sleutelvelden. Deze worden dus vroegtijdig in het laadproces ontdekt, vóór ze in de rapportage-data terechtkomen. In principe geldt bij fouten wat onder het eerste uitgangspunt staat beschreven. In een uitzonderlijk geval kunnen bij zeer kleine hoeveelheden fouten met groot business belang of waarvan duidelijk is dat de leverancier ze niet voor ons op kan lossen foute regels standaard uitgesloten worden.
3) Na het laden van de data doen we in een controle-rapportage omgeving statistische en business-inhoudelijke controles. Als hierbij grote inhoudelijke fouten aan het licht komen, wordt de aanlevering alsnog geweigerd. Onder het kopje Beleid wordt nader ingegaan op deze controles.
4) Aanleveringen weigeren we alleen als er een realistische kans is dat de fout door de dataleverancier kan worden opgelost. Een mogelijke reden dat een fout niet meer kan worden opgelost is wanneer de data van zo lang geleden is, dat aanpassingen niet meer mogelijk zijn.
5) Oplossen van fouten in de bestanden tijdens het laadproces doen we alleen als het nalaten hiervan onze doelstellingen in ernstige mate hindert. Oplossen van fouten na inhoudelijke checks wordt altijd gedaan door de data-leverancier zelf.
Beleid
Gebaseerd op deze uitgangspunten heeft i2i een beleid bepaald met betrekking tot de manier waarop met verschillende soorten fouten wordt omgegaan. In tegenstelling tot de algemene uitgangspunten is het beleid meer pragmatisch van aard, dit kan dus met voortschrijdend inzicht aangepast worden. Het beleid is hieronder per type fout weergegeven.
Soort fout | Beleid van i2i | Overweging |
Onleesbaar bestand | Aanlevering weigeren | – |
Bestandsformaatfouten | Aanlevering weigeren | – |
Veldtypefouten | Aanlevering weigeren of regels weigeren. Standaard loopt het laadproces fout als dit type fout voorkomt. Er is een mogelijkheid om het proces door te laten gaan zonder de foutieve regels, er zal echter alleen van deze mogelijkheid gebruik gemaakt worden als het slechts een klein aantal regels betreft. Per aanlevering wordt beoordeeld of dit het geval is. | Het is voor i2i niet mogelijk om voor elke regel met zekerheid een goede conversie naar het juiste veldtype te maken. Mochten er dus te veel regels geweigerd moeten worden dan is een consistente dataset niet meer gegarandeerd. |
Algemeen | Aanlevering weigeren als er grote onverklaarbare uitschieters zijn in bijvoorbeeld aantallen DBC’s per maand of een uitschieter in aantallen patiënten van een bepaalde leeftijd. | Uitschieters kunnen een aanwijzing zijn van problemen met de data. |
Vulling: velden trajecten | De volgende velden moeten voor minstens 95% gevuld zijn met een geldige waarde:
De volgende velden moeten voor minstens 95% gevuld zijn:
|
Deze velden zijn in de meeste gevallen het minimum voor een zinnige analyse. Bij gebrek aan geldige of gevulde data op een van deze velden, kan i2i niet garanderen goede analyses te kunnen doen. |
Vulling: velden zorgactiviteiten | De volgende velden moeten voor minstens 95% gevuld zijn met een geldige waarde:
De volgende velden moeten voor minstens 95% gevuld zijn:
|
Deze velden zijn in de meeste gevallen het minimum voor een zinnige analyse. Bij gebrek aan geldige of gevulde data op een van deze velden, kan i2i niet garanderen goede analyses te kunnen doen. |
Interne consistentie | Per interne inconsistentie is de bovengrens 100 aantallen. Meer dan 100 van dezelfde interne inconsistentie zorgt voor een afkeuring. Als de interne inconsistentie afzonderlijk niet maar cumulatief wel tot hoge aantallen komen, kan de aanlevering geweigerd worden. De interne inconsistenties worden vastgesteld op het niveau van patiënten, trajecten en zorgactiviteiten. De volgende inconsistenties worden geteld:
Patienten:
Trajecten:
Zorgactiviteiten:
Cumulatief en over tijd kunnen de interne inconsistenties oplopen Afhankelijk van de omvang wordt een aanlevering geweigerd of geaccepteerd. |
Vaak is een fout in interne consistentie een aanwijzing voor een groter probleem. Indien mogelijk zal i2i ook onderzoeken of dit het geval is en wat eventueel de oorzaak zou kunnen zijn. |
Inhoudelijk: Onlogische of Onbekende waarden | Wanneer de omvang van de volgende controles boven de grenswaarden komt, wordt de aanlevering geweigerd:
|
Waardes boven de grenswaarden kunnen een aanwijzing zijn voor problemen met de data. |
Inhoudelijk: controle door middel van een grouper | Controle vindt plaats na het laden. Als de mismatch groter is dan 3%, dan weigeren we de hele aanlevering. | Een zinvolle inschatting van welke regels wel of niet goed zijn is niet te maken. Vaak duidt een grote afwijking op een onvolledige aanlevering van de zorgactiviteiten of een afwijking in de registratie. De mismatch zorgt voor aanzienlijke problemen in de rapportages. |