JURRIAAN RAAIJMAKERS, teamlead AI ministerie van Binnenlandse Zaken en Koninkrijksrelaties: Wat maakt AI nou zo slim?
♪ RUSTIGE MUZIEK ♪
[Logo Rijksoverheid. Microlearnings: starten met AI. Van ruwe data tot AI: hoe het echt begint.]
JURRIAAN: Het begint met iets simpels, namelijk: we moeten allemaal informatie opzuigen van het internet. Maar dat is echt pas het begin. Generatieve AI, zoals VLAM.ai of Robin, draait op enorme hoeveelheden data. Maar waar komen die hoeveelheden data vandaan? Die komen op dit moment allemaal van het internet. Alles wat daar te vinden is aan tekst, afbeeldingen en video's wordt als het ware opgezogen met een gigantische digitale stofzuiger. Maar niet alles gaat zomaar mee. Wat volgt daarop is de datacuratie: een proces waarbij de data wordt geselecteerd, opgeschoond, geanonimiseerd, gelabeld en gefilterd. En dat is superbelangrijk. Maar waarom dan? Dat is omdat deze modellen alleen kunnen leren van gestructureerde, schone en bruikbare informatie. Maar dit proces wordt volledig geautomatiseerd. En daar wringt het. Bijvoorbeeld bij het anonimiseren. Systemen gaan ervan uit dat mensen een voor- en een achternaam hebben. Maar wat als je, zoals heel veel mensen, zoals ik, meerdere naamdelen hebt? Voornaam, achternaam en tussennamen. Dan kun je makkelijk fout geanonimiseerd worden. Met als gevolg: je bent nog steeds herkenbaar in de datasets. En zo sluipen er allemaal verschillende foutjes in. En wat nog belangrijker is: wie bepaalt welke data goed genoeg is? Wat je wel opneemt, wat je niet opneemt, wat AI leert, wat je weg gaat laten. Dit zijn de eerste vormen van bias die ontstaan in deze modellen.
♪ RUSTIGE MUZIEK ♪
[Logo Rijksoverheid. Veilig en verantwoord versnellen met AI.]