Het doorzoekbaar maken van het CABR-archief

Leestijd: 3 minuten

Met behulp van AI

AI speelt inderdaad een cruciale en onmisbare rol bij het doorzoekbaar maken van het Centraal Archief Bijzondere Rechtspleging (CABR). Hieronder leg ik uit hoe AI wordt ingezet, met concrete bronnen en feiten.

1. Handschrift- en tekstherkenning (HTR & OCR)

Feiten en cijfers:

Het CABR bevat ongeveer 30 miljoen pagina’s verspreid over 485.000 dossiers van circa 425.000 personen die na de Tweede Wereldoorlog werden onderzocht op verdenking van collaboratie. Dit archief beslaat ongeveer 3,8 kilometer papier. Nationaal Archief & CABR-scan update

Ingezette AI-technologie:

Loghi: Het project Oorlog voor de Rechter gebruikt specifiek Loghi, een Nederlandse open-source HTR-software ontwikkeld door het KNAW Humanities Cluster in samenwerking met het Nationaal Archief. Deze software is speciaal ontworpen voor het transcriberen van handgeschreven en getypte historische documenten. Nationaal Archief – Handschriftherkenning & KNAW Humanities Cluster
Transkribus wordt ook in Nederlandse archieven gebruikt, met name in regionale historische centra. Deze HTR-software maakt gebruik van AI en machine learning om handschriften te transcriberen. Collectie Overijssel

Waarom AI noodzakelijk is:

Traditionele OCR-software faalt bij handgeschreven documenten uit de jaren ’40. HTR-modellen worden getraind op het specifieke handschrift van Nederlandse ambtenaren uit de oorlogsperiode, waardoor ze met hoge nauwkeurigheid zelfs moeilijk leesbare handschriften kunnen ontcijferen. KVAN Kennisdocument AI en Erfgoed

2. Contextueel zoeken en Named Entity Recognition (NER)

AI-toepassingen voor semantisch zoeken:

Naast letterlijke tekstherkenning wordt AI ingezet voor:

Named Entity Recognition (NER): AI identificeert automatisch namen van personen, plaatsen, organisaties en datums in de transcripties. Deze informatie wordt toegevoegd als metadata, waardoor documenten veel beter doorzoekbaar worden. KVAN Kennisdocument AI en Erfgoed, p. 12
Named Entity Linking (NEL): De AI kan entiteiten koppelen aan andere databases, zoals de Oorlogsgravenstichting of het NIOD-instituut, waardoor contextuele verbanden zichtbaar worden.

Hoe dit werkt in de praktijk:

Als je zoekt naar “verzetsactiviteiten in Friesland”, kan de AI ook documenten vinden die gaan over “sabotage bij Leeuwarden” of “onderduikers in Drachten” – zelfs als de exacte zoektermen niet in de tekst staan. Dit heet semantisch zoeken en maakt gebruik van Natural Language Processing (NLP) technieken.

3. Automatische anonimisering en privacy

Het privacyprobleem:

De Autoriteit Persoonsgegevens (AP) gaf in 2025 een formele waarschuwing omdat het CABR gevoelige persoonsgegevens bevat van mogelijk nog levende personen, terwijl er geen wettelijke grondslag was voor online publicatie. Dit leidde tot uitstel van de online openstelling. Rijksoverheid – Ministerraad akkoord

De AI-oplossing:

AI wordt ingezet om:

Automatisch gevoelige persoonsgegevens te detecteren (zoals medische informatie, strafrechtelijke gegevens)
Namen van mogelijk nog levende personen te identificeren (geboren na ca. 1945)
Deze informatie te “vlaggen” voor menselijke beoordeling

Wettelijke basis:

Op 23 januari 2026 stemde de ministerraad in met een wijziging van de Archiefwet. Deze wijziging zorgt voor een betere balans tussen privacybescherming (AVG) en toegang tot cultureel erfgoed. Het wetsvoorstel voorziet in een meldknop waarmee mensen kunnen aangeven dat hun persoonsgegevens in het online archief staan. NOS & Historiek

Zonder AI zou het handmatig scannen van 30 miljoen pagina’s op privacygevoelige informatie vele decennia duren – een praktisch onmogelijke opgave.

4. Hoe kun je dit straks zelf gebruiken?

Tijdelijke voorziening (NU beschikbaar):

Vanaf 2 februari 2026 is het digitale CABR te raadplegen op 13 fysieke locaties in Nederland:

Het Nationaal Archief in Den Haag
11 Regionale Historische Centra
Het NIOD Instituut in Amsterdam

Je moet hiervoor een plek reserveren. Er kan gezocht worden in ongeveer een derde van de 30+ miljoen pagina’s die al gedigitaliseerd zijn. Oorlog voor de Rechter – FAQ & Nationaal Archief

Volledige online toegang (binnenkort):

Na goedkeuring door de Koning en de Tweede Kamer van de gewijzigde Archiefwet wordt het CABR volledig online toegankelijk via een webportaal. Verwacht wordt dat dit eind 2026/begin 2027 het geval is.

Hoe AI het zoeken transformeert:

Natuurlijke taal: Je kunt vragen stellen zoals: “Zijn er dossiers over tewerkstelling van mijn grootvader [Naam] in Duitsland?”
Automatische samenvattingen: De AI kan relevante passages uit lange dossiers markeren
Contextuele links: Verbindingen met andere archieven en databases worden automatisch gelegd
Volledige doorzoeking: Alle 30 miljoen pagina’s worden woordelijk doorzoekbaar, inclusief handgeschreven notities

Belangstelling en impact

De vraag naar het CABR is explosief gestegen. In 2025 reserveerden 11.274 unieke bezoekers stukken uit het CABR – meer dan 5 keer zoveel als in 2024 (1.959 bezoekers). In totaal werden 55.546 stukken opgevraagd, tegenover 11.269 in 2024. Rijksoverheid

Conclusie

AI is niet alleen nuttig, maar essentieel voor het CABR-project:

30 miljoen pagina’s handgeschreven tekst kunnen alleen met HTR-technologie doorzoekbaar worden gemaakt
Automatische entity detection maakt contextueel zoeken mogelijk
AI-gedreven privacybescherming lost het AVG-dilemma op
Het verandert het archief van een statische stapel papier in een actieve, intelligente kennisbron

Laatste nieuws

Het doorzoekbaar maken van het CABR-archief

Met behulp van AI

1. Handschrift- en tekstherkenning (HTR & OCR)

Feiten en cijfers:

Ingezette AI-technologie:

Waarom AI noodzakelijk is:

2. Contextueel zoeken en Named Entity Recognition (NER)

AI-toepassingen voor semantisch zoeken:

Hoe dit werkt in de praktijk:

3. Automatische anonimisering en privacy

Het privacyprobleem:

De AI-oplossing:

Wettelijke basis:

4. Hoe kun je dit straks zelf gebruiken?

Tijdelijke voorziening (NU beschikbaar):

Volledige online toegang (binnenkort):

Hoe AI het zoeken transformeert:

Belangstelling en impact

Conclusie

Bronnenlijst:

By Redaktie

Gerelateerd bericht

Studiohonderd22.nl neemt afscheid van AI-publicaties

Het datacenter-paradox en welke rol spelen oppositie partijen?

Hoe FDS en IBDS worden Herzien door Geopolitieke Realiteit

AGI Nieuws

Studiohonderd22.nl neemt afscheid van AI-publicaties

Het datacenter-paradox en welke rol spelen oppositie partijen?

Hoe FDS en IBDS worden Herzien door Geopolitieke Realiteit

Jouw strategische Gids voor de juiste AI-Implementatie

Wat is IBDS? De Interbestuurlijke Datastrategie uitgelegd

Wanneer technologie de realiteit versluiert

De strip “A Wrinkle in Time”, de wetenschap achter de fantasie

Neuromorphic wat is dat (NC-NL)?

Hoe Nederland in de houdgreep van Big Tech zit – Inclusief de NOS Zelf

Van “Artificial” naar “Ascended” Intelligence

Gaat AI de rol krijgen om absolutie te verlenen

Het doorzoekbaar maken van het CABR-archief