Generatieve AI is geen alwetende machine, maar een patroonvoorspeller. Het raadt steeds wat het meest waarschijnlijke volgende woord is. Generatieve AI baseert dit op patronen in trainingsdata. Daardoor hallucineert generatieve AI soms of herhaalt het stereotypes die in de trainingsdata zitten. Blijf dus altijd kritisch. Generatieve AI levert antwoorden die er goed uitzien, maar ze zijn niet altijd juist. Als je weet waar de data vandaan komt, beperk je het risico om bijvoorbeeld beleid te baseren op fouten of vooroordelen. Jij bepaalt of de output bruikbaar is.

Microlearnings: starten met AI. Waarom AI geen zoekmachine is. Spreker: Jurriaan Raaijmakers, teamlead AI, ministerie van Binnenlandse Zaken en Koninkrijksrelaties.
[Microlearnings: starten met AI. Waarom AI geen zoekmachine is.]
JURRIAAN: AI lijkt soms een alwetende machine. Je typt iets in en er rolt een slim antwoord of een prachtig plaatje uit. Maar AI 'weet' zijn antwoorden niet. AI voorspelt ze, en die voorspellingen kunnen vol vooroordelen zitten. Generatieve AI werkt op basis van patroonherkenning en patroonvoorspelling. Dat betekent dat het model steeds probeert te raden: wat komt hier waarschijnlijk als volgende? Het lijkt dus op een zoekmachine, maar het werkt fundamenteel anders. Een zoekmachine wijst je naar de bronnen. Een taalmodel vult zelf de volgende woorden in op basis van patronen uit data.
Stel je hoort 'Old MacDonald had a...' Wat denk je dan? Grote kans dat je meteen denkt 'farm'. En waarom is dat? Omdat je het liedje kent. Je brein heeft dat patroon vaak gehoord. AI doet hetzelfde. Als je dezelfde vraag stelt aan AI, dan voorspelt hij waarschijnlijk ook 'farm'. Niet omdat AI weet wat er echt hoort te komen, maar omdat dit patroon vaak voorkomt in de trainingsdata.
Maar wat als we dit proberen met een minder bekend, Nederlands versje? Een aap op een... Dan krijg je geen eenduidig antwoord. Soms zegt de AI 'takje', soms 'boom', of hij denkt dat het een raadsel is. Waarom is dat? Omdat het rijmpje 'Een aap op een fiets, hoe vind je zoiets?' zelden voorkomt in de voornamelijk Engelstalige trainingsdata van het model. Sterker nog: dit rijmpje komt in de meeste van onze menselijke breinen niet eens meer voor.
Het zijn dus de cultuur, bepaalde normen en waarden die niet vaak voorkomen in de trainingsdata die het opnemen tegen de sterkere datapatronen van andere culturen. De meeste trainingsdata komen uit de Verenigde Staten. Daardoor weerspiegelen deze modellen de Amerikaanse normen, waarden en cultuur. Daarom snapt de AI soms ook helemaal niet wat jij bedoelt. Dit is niet altijd een probleem, maar bedenk je dat je misschien wel beleid gaat schrijven... vanuit die Amerikaanse normen en waarden.
We kijken naar een volgend voorbeeld. Stel je vraagt de AI: Schrijf een recept voor een buitenaards dessert met ingrediënten en technieken die niet bestaan in ons universum. De AI komt dan met iets fantastisch, zoals een recept met 500 gram sterrenstof. Waarom lukt dat? Omdat het model patronen herkent uit bestaande recepten. Het 'weet': een recept begint met ingrediënten, dan stappen, hoeveelheden, bereiding, enzovoorts. Het volgt dat patroon en het vult de lege plekken creatief in met dingen die het kent uit sciencefiction. Dat de AI zomaar een niet-bestaand, onmogelijk recept levert op jouw vraag, dat wordt 'hallucinatie' genoemd.
Stel ik vraag nu de AI om een plaatje te maken, dan komt hij met glitters en galaxy-achtergronden met veel paars, blauw, zwart. Waarom? Omdat de data over 'buitenaards' die het model heeft gezien in boeken, films, et cetera, precies deze kleuren hebben. Dit is bias. Het model kiest automatisch kleuren die passen bij het stereotype 'buitenaards dessert'. Niet omdat dat moet, maar omdat het geleerd heeft dat als 'juist' te zien.
Waarom is dit nou gevaarlijk? Je weet niet wat je niet weet. Als niemand je vertelt waar dit allemaal op gebaseerd is, op de trainingsdata en alle andere informatie, dan denk je dat het een neutraal antwoord is. Terwijl het dat niet is. Je vertrouwt op de output zonder inzicht in het proces en de trainingsdata. Pas als je snapt hoe een AI tot zijn antwoord komt, dan kan je bepalen wat je ermee wilt.
Maar: AI is wel goed bruikbaar als je kritisch blijft en weet op basis van welke data een model tot stand gekomen is. AI helpt, maar beslist niet voor jou. AI 'hallucineert', voorspelt en past zich aan op basis van wat het kent. Maar wat het kent is, net als wij mensen overigens, nooit neutraal en volledig. Daarom is het belangrijk dat je begrijpt hoe de output tot stand gekomen is, waar de data vandaan komt en wat het model wel en niet geleerd heeft.
[Veilig en verantwoord starten met AI. Deze serie is ontwikkeld in opdracht van het CDO Office van BZK door de RijksAcademie voor Digitalisering en Informatisering Overheid (RADIO) in samenwerking met JenV en Rijks ICT Gilde, onderdeel van Rijksorganisatie ODI.]