Artikel 10 AI Act: data governance voor hoog-risico AI

Artikel 10 AI Act: data governance voor hoog-risico AI - ActCheck EU AI Act gids

Hoog-risico AI mag alleen worden getraind op data die representatief, accuraat en zo veel mogelijk bias-vrij is. Wat eist artikel 10 concreet, en wat betekent het voor u als deployer of provider?

De grootste oorzaak van problemen met AI-systemen ligt bijna nooit in het model zelf, maar in de data waarmee het getraind is. Artikel 10 van de EU AI Act erkent dat: het stelt strikte eisen aan trainings-, validatie- en testdata voor hoog-risico AI. Voor providers betekent het concreet werk in de ontwikkelfase, voor deployers betekent het uitvragen en controleren.

Wat eist artikel 10 precies?

Artikel 10 lid 1 zegt dat trainings-, validatie- en testdatasets moeten voldoen aan kwaliteitscriteria die in de daaropvolgende leden worden uitgewerkt. Het is geen algemene "doe je best"-bepaling maar een lijst met concrete eisen.

1. Relevantie en representativiteit

Data moet relevant zijn voor het beoogde doel van het systeem en zo veel mogelijk representatief voor de groep mensen op wie het uiteindelijk wordt toegepast. Een fraudemodel dat alleen op data van Nederlandse betalingen is getraind, mag u niet zomaar inzetten op de Duitse markt zonder aanvullende validatie.

2. Accuraatheid en volledigheid

Datasets moeten zo accuraat en volledig zijn als mogelijk gelet op het beoogde doel. Hier komen onmiddellijk lastige afwegingen: labelkwaliteit, ontbrekende waarden, meetfouten. U moet documenteren welke afwegingen u maakt.

3. Statistische eigenschappen

De data moet statistische eigenschappen hebben die geschikt zijn voor de groep op wie het AI-systeem wordt toegepast. Dit is de bias-clausule: als u een CV-screener traint, moet de trainingsdata een redelijk evenwicht hebben tussen mannen, vrouwen, leeftijdsgroepen en, waar relevant, etnische achtergrond.

4. Aandacht voor de specifieke geografische, gedragsmatige of functionele context

Een medische AI getraind op data uit een Amerikaans ziekenhuis zonder Europese validatie? Niet conform. U moet de context van uw deployment-gebied meenemen.

Bias-onderzoek is verplicht, niet optioneel

Artikel 10 lid 2 sub f en g vereisen expliciet dat u onderzoek doet naar mogelijke vooringenomenheid en passende maatregelen neemt om die te detecteren, voorkomen en mitigeren. Dit is geen "best effort" maar een harde verplichting.

Praktische impact van de bias-eis

Voor een Nederlandse provider van een hoog-risico AI betekent dit minimaal: een bias-rapport per beschermde groep (geslacht, leeftijd, herkomst, beperking) met meetbare uitkomsten. Tools als Fairlearn of IBM AIF360 kunnen daarbij helpen. Bewaar de rapporten als bewijs.

De bijzondere uitzondering voor bias-detectie met gevoelige data

Artikel 10 lid 5 bevat een opmerkelijke uitzondering op de AVG: providers mogen onder strikte voorwaarden bijzondere categorieen persoonsgegevens (gezondheid, ras, religie, seksuele orientatie) verwerken om bias in hun AI te detecteren en te corrigeren. Voorwaarden:

Dit is een belangrijk privacy-praktisch instrument: u mag testen of uw AI op leeftijd discrimineert, ook al heeft u die data normaal niet. Maar de drempel is hoog.

Data governance-praktijken: zes elementen die u moet documenteren

Artikel 10 lid 2 noemt expliciet de elementen die uw data governance moet omvatten:

1. Relevante ontwerpkeuzen

Waarom heeft u juist deze datasets gekozen? Welke alternatieven heeft u overwogen?

2. Dataverzameling en -herkomst

Waar komt de data vandaan, wie heeft het verzameld, wat was het oorspronkelijke doel?

3. Verwerkingsoperaties

Annotatie, labeling, cleaning, deduplicatie, augmentatie. Welke transformaties zijn uitgevoerd?

4. Veronderstellingen over wat data moet meten

Wat dacht u dat de data representeert? Waarom denkt u dat dit klopt?

5. Voorafgaande beoordeling van beschikbaarheid en geschiktheid

Heeft u gecheckt of de data beschikbaar en geschikt is voor het doel voor u ermee begon?

6. Onderzoek naar bias en passende maatregelen

De bias-rapportage en -mitigaties zoals hierboven besproken.

Wat doet u als deployer?

Artikel 10 is vooral een provider-verplichting. Maar als u een hoog-risico AI inkoopt, moet u kunnen aantonen dat u de data governance van uw leverancier heeft geverifieerd. Praktisch:

Snelle scan van uw data-governance positie

De gratis ActCheck-scan beoordeelt of u de data-eisen voor uw AI-portfolio op orde heeft, ook als deployer.

Start de gratis check

Volledige kennisbank: alle artikelen

Wetsartikelen
Artikel 2: reikwijdte Artikel 3: definities Artikel 4: AI-geletterdheid Artikel 5: verboden AI Artikel 6: classificatie Artikel 9: risicobeheer Artikel 14: menselijk toezicht Artikel 26: deployers Artikel 27: FRIA Artikel 50: transparantie Artikel 57: sandbox Artikel 73: incidenten Artikel 86: recht op uitleg GPAI & foundation models GPAI Code of Practice
Verboden AI
Verbod emotieherkenning Verbod social scoring Verbod gezichtsherkenning
Sectoren
MKB ZZP Startups & scale-ups MKB vereenvoudigde docs Recruitment HR & personeelsbeleid Financiele sector Verzekeringen Accountancy Advocaten Zorg Onderwijs Gemeenten & overheid Publieke aanbesteding Marketing Media & uitgevers Retail & e-commerce Logistiek & transport Productie & industrie Bouw Vastgoed & makelaars IT-dienstverleners Callcenter & klantcontact Camera & CCTV
AI-tools
ChatGPT Claude (Anthropic) Microsoft Copilot Google Gemini DeepSeek Perplexity Midjourney & DALL-E ElevenLabs & stem-AI Notion AI Open source AI Generatieve AI op werkvloer AI agents
Naleving & governance
EU AI Act naleving Naleving checklist Naleving & toezichthouder Deadlines 2026 AI Act vs AVG AI Act vs NIS2 AI Act vs VS Extraterritorialiteit AI wet boetes High-risk AI systemen AI-register opstellen AI beleid opstellen Conformiteitsbeoordeling ISO 42001 Bias & discriminatie Kosten naleving DPIA + FRIA combineren Audit voorbereiden Vendor due diligence
Actualiteit & Nederland
Digital Omnibus uitstel Uitvoeringswet NL NL toezichthouders Algoritmeregister NL EU AI Office