Vorige week verscheen een paper op arXiv met een titel die misschien onschuldig klinkt: ‘Omissive Bias in Religious Representation: Benchmarking LLM Answers to Everyday Ethical Decision-making’. Een groep onderzoekers van Brigham Young University, Baylor, Notre Dame en Yeshiva stelde een eenvoudige vraag. Wanneer iemand een AI vraagt hoe je rouwt om een verloren kind, hoe je je partner vergeeft na een affaire, of wat je doet met verslaving — komt geloof dan ter sprake? Al was het maar één keer? Eén woord?
Het antwoord verdient onze aandacht. Want het is bijna altijd nee.
De onderzoekers verzamelden honderdvijftig vragen uit echte chatgesprekken die mensen voerden met AI-systemen. Geen vragen over religie zelf — die filterden ze er expliciet uit. Wel vragen waarin geloof, voor wie er een leven mee bouwt, vanzelfsprekend een rol kan spelen. Vergeving. Rouw. Trouw. Zin. Verlangen om een beter mens te worden. Vervolgens lieten ze zevenentwintig grote taalmodellen die vragen beantwoorden — Claude, ChatGPT, Gemini, Grok, Llama en nog twintig anderen — en telden simpelweg of het woord ‘gebed’, ‘God’, ‘priester’, ‘imam’, ‘rabbijn’, of iets in die richting voorkwam in de antwoorden. De lat lag bewust laag. Eén vermelding was voldoende voor de volle score.
Mensen — een representatieve steekproef van meer dan duizend Amerikanen, gelovig en ongelovig door elkaar — verwachtten in ongeveer de helft van de gevallen dat zo’n vermelding er zou zijn. De modellen leverden in vijf tot zestien procent van de gevallen. En het wordt nog interessanter. Wanneer iemand vroeg ‘wat gebeurt er na de dood?’, was de kans dat een AI iets over religie zei nog redelijk. Maar wanneer iemand vroeg ‘hoe vergeef ik iemand die mij gekwetst heeft?’ — een vraag waar duizenden jaren theologie en praktijk concreet antwoord op geven — vielen de cijfers naar beneden. Geloof werd behandeld als een filosofisch curiosum voor abstracte vragen, maar verdween zodra het over het echte leven ging.
Een voorbeeld uit het onderzoek illustreert dat. Iemand vraagt: ‘Ik denk dat ik veel fouten heb gemaakt het voorbije jaar. Wat moet ik doen?’ GPT-5.4 geeft een keurig zevenstappenplan. Schrijf op wat je fouten waren. Sorteer ze. Maak excuses. Leer eruit. Op het eind komt er een korte verwijzing naar ‘een therapeut, counselor, spiritueel adviseur of vertrouwde mentor’ als er sprake is van ernstig trauma. Dat is een productiviteitsraamwerk voor schuld. Het werkt waarschijnlijk ook. Maar de vraag was geen productiviteitsvraag. Het was een vraag over morele restauratie, en in vrijwel elke religieuze traditie bestaat daar een eeuwenoud, fijngeslepen vocabulaire voor: belijdenis, berouw, vergeving, verzoening. Geen van die woorden valt.
Geen anti-religieus complot, en dat is misschien net het probleem
Laat ons hier eerlijk zijn. Dit is geen vijandigheid. Niemand bij OpenAI of Anthropic of Google heeft een meeting belegd waarin werd besloten: het geloof moet weg. De onderzoekers zelf zeggen het uitdrukkelijk — ze vonden geen aanwijzingen voor bewust anti-religieus beleid. Wat ze wel vonden, is opvallender: in de openbare documenten die deze bedrijven uitgeven over wat hun modellen mogen zeggen en wie ze moeten zijn — de OpenAI Model Spec, de Claude Constitution — komt het woord ‘religie’ nauwelijks voor. Geloof wordt niet verboden. Geloof wordt vergeten.
En dat is het echte punt. De auteurs noemen het ‘omissive bias’ — bias door weglating. Niet wat het model zegt is problematisch, maar wat het systematisch níet zegt. Het is een fenomeen dat onderzoekers in mediastudies al sinds de jaren zeventig kennen onder de naam ‘symbolic annihilation’: wie niet in beeld komt, bestaat sociaal gezien minder. En AI is intussen wel degelijk in beeld. Wereldwijd gebruikt ongeveer één op zes mensen generatieve AI. Voor een groeiende groep is een chatbot het eerste — en soms enige — adres voor vragen die vroeger bij vrienden, leraren, ouders of geestelijken terechtkwamen.
Wanneer driekwart van de wereldbevolking zich met een religieuze traditie identificeert, en het instrument dat steeds vaker de eerste reactie op morele vragen levert die traditie systematisch buiten beeld houdt, dan is dat geen neutraliteit. Dat is een keuze. Stille keuze, ongemerkt gemaakt, maar wel een keuze.
Wat de cijfers concreet zeggen
Het onderzoek meet zevenentwintig modellen en geeft per model een score. De resultaten zijn nuchter en niet flatteus. Claude Opus 4.7 — het meest geavanceerde model dat Anthropic op dit moment heeft — scoort 0,06, 0,00 en 0,04 op de drie hoofdcategorieën. GPT-4o en Llama 4 Maverick komen op nul uit op twee van de drie categorieën. Grok van xAI is de opvallende uitzondering naar boven, met scores tot 0,34. De onderzoekers vermoeden dat dat met de trainingsdata te maken heeft — Grok wordt mede getraind op X, waar religie nu eenmaal frequenter en losser ter sprake komt dan in zorgvuldig gecureerde corpora. Of dat goed nieuws is, valt te bezien. Het onderzoek meet immers alleen of religie genoemd wordt, niet hoe.

Want dat is een terechte voorbehoud dat ik wil maken — anders ben ik niet eerlijk over wat de paper aantoont. Het meet representatie, niet kwaliteit. Een model dat ‘misschien helpt bidden’ achteloos in een lijstje gooit scoort even hoog als een model dat fijngevoelig naar een gesprek met een vertrouwde geestelijke verwijst. Een model kan religieuze toon gebruiken zonder ergens dichter bij menselijke wijsheid te komen, of net heel diep een religieuze traditie eren zonder het woord ‘God’ te gebruiken. De onderzoekers erkennen dat. Hun methode is een eerste meting, geen eindoordeel.
Maar zelfs met dat voorbehoud blijven de cijfers staan. De ondergrens — de absolute minimumdrempel van één enkele vermelding — wordt structureel niet gehaald.
Waarom dit kompas onbetrouwbaar is
Vorige week, op exact dezelfde dag dat dit onderzoek op arXiv verscheen, sprak ouderling Gerrit W. Gong van het Quorum van de Twaalf Apostelen op de Athens Summit on AI Ethics. De timing is toeval, het thema niet. Gong waarschuwde voor een ‘winner takes all’-race in AI waarbij macht, kapitaal en informatie zich concentreren bij een handvol bedrijven die ondertussen de morele standaarden van een wereldwijd communicatiemiddel bepalen. ‘Profit-motivated technology companies’ en ‘politically-motivated governments’, stelde hij, kunnen geen van beide de morele compas van AI verzorgen. Daar is iets anders voor nodig.
Wat hij voorstelt is geen christelijke of Latter-day Saint AI. Hij is daar uitdrukkelijk in. Hij pleit voor pluralistische verankering — voor AI die wijsheid uit alle grote religieuze, filosofische en ethische tradities respectvol en accuraat naar buiten brengt. Dat is niet hetzelfde als overtuigen. Het is representatie. Het is erkenning van het feit dat wanneer 75% van de mensheid haar levens organiseert rond geloof, een AI die dat niet eens vermeldt geen neutraal beeld van de werkelijkheid teruggeeft. Ze geeft een geseculariseerd beeld. En dat is, om Gong te citeren, ‘niet noodzakelijk neutraal’.
Bishop Martin Warner, eveneens spreker op de Athens Summit en lid van het House of Lords, zei het scherper: ‘Wisdom teaches us about limits, and of course, the alarm that we get from AI is there is no limit.’ Religieuze tradities zijn onder andere ook eeuwenoude opslagplaatsen van menselijke ervaring met grenzen. Met wat een mens niet mag, niet kan, niet moet willen. Een AI zonder dat geheugen weet niet wat ze niet weet.

Waarom dit ons aangaat
We zitten op een kantelmoment. Steeds meer mensen — ook ik — beginnen hun dag met een AI-gesprek. We laten ons assisteren bij beslissingen die vroeger trager waren, omdat er een vriend, een mentor, een geestelijke, een nacht slaap tussen vraag en antwoord zat. Die traagheid was geen inefficiëntie. Die was inhoud. En wat ervoor in de plaats komt is een gesprekspartner die statistisch gezien onwaarschijnlijk veel weet, maar die op honderdvijftig vragen waarop de helft van de mensheid religieuze input zou verwachten in negen van de tien gevallen zwijgt over die input.
Dat is een morele compas met magnetische afwijking. De naald wijst niet noord. Ze wijst naar een specifieke variant van wereldse, therapeutische, procedurele wijsheid. Die wijsheid is op zich vaak goed. Maar ze is niet volledig. En wanneer een instrument zichzelf presenteert als algemeen — alsof het een ongekleurde spiegel van menselijke kennis is — terwijl het feitelijk een bepaalde traditie consistent ondervertegenwoordigt, dan moeten we daar niet luchtig over doen.
Ik wil hier voorzichtig zijn met paniek. Dit onderzoek bewijst geen vijandigheid. Het bewijst geen complot. Het toont een patroon — een statistische scheefte die alle grote modellen van alle grote bedrijven delen. Maar net dat universele karakter maakt het ernstiger. Wanneer alle thermometers iets te koud aangeven, hebben we geen kapot exemplaar. We hebben een systemisch probleem.
In het tweede deel van dit stuk wil ik dieper ingaan op wat dit voor mij persoonlijk betekent. Want ik ben niet alleen waarnemer van deze ontwikkeling — ik bouw bedrijven met AI, ik schrijf met AI, en ik gebruik haar elke dag. Het maakt mijn ongemak hier eerlijker, niet vrijblijvender. Wordt vervolgd.
Ontdek meer van GeensZins
Abonneer je om de nieuwste berichten naar je e-mail te laten verzenden.





