Gegenereerd met vonken en inzichten uit 11 bronnen
Inleiding
De opkomst van Kunstmatige Intelligentie (AI), en met name Large Multimodal Models (LMM’s), markeert een fundamentele verschuiving in hoe wij omgaan met collectieve kennis en cultureel erfgoed. Deze technologieën bieden ongekende mogelijkheden voor het organiseren, ontsluiten en interpreteren van enorme hoeveelheden digitale informatie die ons collectieve geheugen vormen. Deze analyse onderzoekt de technische mogelijkheden, praktische toepassingen, filosofische implicaties en toekomstperspectieven van LMM’s in het bijzonder, en AI in het algemeen, voor het beheer van onze gedeelde kennis.
1. Technische Aspecten van Large Multimodal Models
1.1 Definitie en Basisconcepten
Large Multimodal Models (LMM’s) zijn geavanceerde AI-systemen die in staat zijn om meerdere typen data-modaliteiten tegelijkertijd te verwerken en te begrijpen. In tegenstelling tot Large Language Models (LLM’s) die uitsluitend met tekst werken, kunnen LMM’s tekst, beelden, audio, video en soms zelfs andere dataformaten integreren tot een coherent begrip van informatie AIMultiple1.
De belangrijkste verschillen tussen LMM’s en traditionele LLM’s zijn:
LMM’s versus LLM’s – Technische Capaciteiten:
| Kenmerk | Large Multimodal Models (LMM’s) | Large Language Models (LLM’s) |
|---|---|---|
| Data Input | Tekst, beelden, audio, video | Alleen tekst |
| Processing | Simultane multimodale integratie | Unimodale tekstverwerking |
| Output | Multimodale gegenereerde content | Alleen tekstuele output |
| Architectuur | Geïntegreerde CNN’s en transformers | Transformers voor tekst |
| Toepassingen | Beeldanalyse, videoanalyse, audiobewerking | Tekstgeneratie, vertaling, samenvatting |
1.2 Training en Architectuur
LMM’s maken gebruik van grote transformer-architecturen die zijn uitgebreid met gespecialiseerde componenten voor verschillende modaliteiten. Ze worden getraind op enorme hoeveelheden gelabelde data, waaronder miljarden afbeeldingen met bijbehorende tekstbeschrijvingen, video’s met audio, en complexe multimodale datasets AIMultiple1.
Het trainingsproces omvat drie kritische fasen:
- Pre-training over meerdere modaliteiten tegelijk
- Modality-specific fine-tuning voor specialisatie
- Cross-modal alignment om relaties tussen verschillende data types te leren
1.3 Technische Beperkingen
Ondanks hun indrukwekkende capaciteiten hebben LMM’s significante beperkingen:
Computationele Eisen: De training en het draaien van LMM’s vereisen substantiële computationele bronnen, wat ze duur maakt en minder toegankelijk voor kleinere organisaties AIMultiple1.
Data Bias: LMM’s erven en versterken biases die aanwezig zijn in trainingsdata, wat kan leiden tot onrechtvaardige of onethische uitkomsten, vooral bij het verwerken van historisch materiaal.
Integratie Uitdagingen: Het effectief combineren van verschillende modaliteiten terwijl de nuances van elk type data behouden blijft, blijft een complexe technische uitdaging.
2. Nederlandse AI-Initiatieven in Archivering en Erfgoed
2.1 Het HAICu Project: AI voor Cultureel Erfgoed
Een van de meest prestigieuze Nederlandse initiatieven is het HAICu project (digital Humanities – Artificial intelligence – Cultural heritage), gefinancierd met €10,3 miljoen door NWO NWO2. Dit project brengt AI-onderzoekers, Digital Humanities experts, erfgoedprofessionals, journalisten en burgers samen om wetenschappelijke doorbraken te realiseren in de toegankelijkheid en contextualisatie van massieve multimodale digitale erfgoedcollecties.
Doelstellingen van HAICu:
- Ontwikkeling van verantwoorde en verklaarbare AI-methoden
- Continue lerende systemen die van gebruikers leren
- Toepasbaarheid van AI buiten laboratoriumomstandigheden
- Constructie van multimodale verhalen uit Nederlandse erfgoedcollecties
2.2 Noord-Hollands Archief: AI-gedreven Fotoherkenning
Het Noord-Hollands Archief heeft baanbrekend werk verricht met hun “Krant en Foto’s” project, waarbij AI is ingezet om een half miljoen persfoto’s te koppelen aan een kwart miljoen krantenpagina’s Noord-Hollands Archief3.
Technologische Implementatie:
- Computer vision voor beeldherkenning en classificatie
- Optische karakterherkenning (OCR) voor tekstanalyse
- Machine learning voor pattern recognition in historische foto’s
- Semantische matching tussen visuele en tekstuele content
Resultaten:
- 500.000 persfoto’s verbonden met relevante krantenartikelen
- Verbeterde doorzoekbaarheid van historische collecties
- Mogelijkheid tot onverwachte ontdekkingen door cross-modale zoekopdrachten
2.3 Europees Parlement: AI-gestuurde Archiefontsluiting
Het Europees Parlement heeft GenAI ingezet om hun historische archieven toegankelijk te maken via een geavanceerd AI-gestuurd dashboard Europees Parlement4. Dit systeem, bekend als “Archibot”, maakt gebruik van Anthropic’s Claude AI om meer dan 100.000 documenten doorzoekbaar te maken in alle EU-talen.
3. Filosofische Verschillen: Menselijk versus Digitaal Geheugen
3.1 Fundamentele Verschillen
De vergelijking tussen menselijk en digitaal geheugen roept diepgaande filosofische vragen op over de aard van kennis, herinnering en identiteit. Uit recent academisch onderzoek blijken verschillende kritische verschillen Memory Studies Review5:
Menselijk Geheugen:
- Neurologisch en emotioneel proces waarbij hersencircuits betrokken zijn
- Dynamisch en adaptief met continue reconstructie van herinneringen
- Subjectief en contextueel beïnvloed door persoonlijke ervaringen
- Imperfect en veranderlijk met mogelijkheid tot valse herinneringen (Mandela-effect)
Digitaal Geheugen:
- Binaire opslag en retriëval zonder emotionele component
- Statisch en consistent zonder natuurlijke degradatie
- Objectief en universeel toegankelijk zonder persoonlijke bias
- Perfecte reproductie zonder verlies of vervorming
3.2 Ethische Implicaties
Het gebruik van AI voor collectief geheugen roept belangrijke ethische vragen op, zoals geïdentificeerd in recent onderzoek naar AI en geheugenethiek Journal of Human-Technology Relations6:
- Memory Justice: Wie bepaalt welke gebeurtenissen worden vastgelegd en hoe ze worden geïnterpreteerd?
- Digitale Eeuwigheid: De onverwijderbaarheid van digitale herinneringen kan problematisch zijn voor privacy en vergetelheid
- Algoritmische Bias: AI-systemen kunnen historische onrechtvaardigheden versterken door biased selectie van bronnen
- Culturele Representatie: Zijn AI-modellen cultureel neutraal of weerspiegelen ze specifieke wereldbeelden?
4. Praktische Toepassingen in Kennismanagement
4.1 AI-gestuurde Notulen en Vergaderdocumentatie
Bedrijven als Philips hebben AI-technologie geïntegreerd in hun vergadersystemen via samenwerking met Sembly AI Philips7. Deze systemen:
- Automatische spraakherkenning voor real-time transcriptie
- Sprekeridentificatie voor accurate attributie
- Sleutelwoordextractie voor samenvattingen
- Actiepuntengeneratie voor vervolgacties
4.2 Knowledge Graphs voor Collectieve Intelligentie
Knowledge Graphs vormen een essentiële technologie voor het organiseren van collectieve kennis. Ze worden steeds vaker gecombineerd met AI voor geavanceerde toepassingen The Alan Turing Institute8:
- Entiteitsherkenning in ongestructureerde data
- Relatiedetectie tussen verschillende informatiebronnen
- Semantische zoekmogelijkheden voor complexe queries
- Inferentiemogelijkheden voor impliciete kennisontdekking
5. Technische Vergelijking: Huidige LMM’s
5.1 GPT-4o versus Gemini 2.5: Prestatievergelijking
De huidige generatie LMM’s toont significante verschillen in capaciteiten en toepassingen Artificial Analysis9:
| Specificatie | GPT-4o (2025) | Gemini 2.5 Pro |
|---|---|---|
| Context Window | 128K tokens | 1M tokens |
| Multimodal Input | Tekst, beeld, audio | Tekst, beeld, video, audio |
| Redeneren | Uitstekend mathematicaal | Supérieur complex redeneren |
| Code Generatie | Sterk in meerdere talen | Uitstekend met uitleg |
| Toegang | Betaald abonnement | Gratis basis toegang |
| Nederlandse Taal | Goed | Zeer goed |
6. Nederlandse AI-Regelgeving en Beleid
6.1 Nederlandse AI Strategie 2025
De Nederlandse overheid heeft een omvattende visie ontwikkeld op generatieve AI in reactie op parlementaire moties Rijksoverheid10. Kernpunten:
Human-Centric Benadering:
- AI moet menselijke waarden en rechten respecteren
- Transparantie en verklaarbaarheid zijn verplicht
- Mensen blijven verantwoordelijk voor AI-beslissingen
Erfgoed Specifiek Beleid:
- De Nationale Strategie voor Digitaal Erfgoed (2021-2024) benadrukt AI als sleuteltechnologie
- Focus op duurzame toegankelijkheid en bruikbaarheid
- Samenwerking tussen erfgoedinstellingen en AI-experts
6.2 EU AI Act Implicaties
De EU AI Act, die in 2024 van kracht werd, heeft specifieke implicaties voor AI-toepassingen in archivering en erfgoed EU Artificial Intelligence Act11:
Risicoclassificatie:
- Hogerisico AI-systemen in archivering vergen specifieke maatregelen
- Record-keeping verplichtingen voor AI-beslissingen
- Transparantie-eisen voor AI-gegenereerde content
7. Toekomstperspectieven en Emerging Technologies
7.1 Korte Termijn (2025-2027)
Verbeterde Multimodaliteit:
- Integratie van geavanceerde videoanalyse met historische beelden
- Real-time spraak-naar-tekst voor live archivering
- Verbeterde OCR voor historische documenten in meerdere talen
Uitgebreide Toegankelijkheid:
- AI-gestuurde vertaling van historische documenten
- Voice-geactiveerde zoekinterfaces voor archieven
- AI-gegenereerde samenvattingen op maat voor verschillende doelgroepen
7.2 Middellange Termijn (2027-2030)
Advanced Reasoning Capabilities:
- AI-systemen die historische causale relaties kunnen identificeren
- Geautomatiseerde historische analyse en trendidentificatie
- Predictieve modellering voor erfgoedbehoud
Collaborative AI Systems:
- Multi-agent systemen voor coöperatieve archiefverwerking
- Crowdsourced AI-training met expert-validatie
- Gedistribueerde AI voor gedeelde kennisbases
7.3 Lange Termijn Visie (2030+)
Artificial General Intelligence (AGI) Implicaties:
- Mogelijke integratie van AGI-componenten in erfgoedsystemen
- Autonome research agents voor historische ontdekkingen
- AI-systemen met cultureel bewustzijn en contextueel begrip
Neuromorphic Computing:
- Hersen-geïnspireerde architecturen voor geheugenverwerking
- Energie-efficiënte verwerking van massieve datasets
- Adaptieve systemen die leren van gebruikspatronen
8. Uitdagingen en Kansen
8.1 Technische Uitdagingen
Schaalbaarheid: Het verwerken van petabytes aan historische data vereist significante computationele resources en geoptimaliseerde algoritmen.
Kwaliteitsborging: Het waarborgen van de nauwkeurigheid van AI-analyses bij historische documenten die fouten, inconsistenties of verschillende interpretaties kunnen bevatten.
Multilingual Processing: Effectieve verwerking van historische teksten in tientallen talen met verschillende historische spellingen en grammatica’s.
8.2 Maatschappelijke Kansen
Democratische Toegang: AI maakt het mogelijk om kostbare erfgoedcollecties toegankelijk te maken voor een wereldwijd publiek.
Onderwijstoepassingen: Geïntegreerde AI-systemen kunnen revolutionaire onderwijsmethoden mogelijk maken met interactieve historische ervaringen.
Participatie: Burgers kunnen actief bijdragen aan het verrijken van collectieve kennis door AI-gestuurde participatieplatforms.
8.3 Economische Potentie
Nieuwe Diensten: AI-gestuurde erfgoeddiensten kunnen nieuwe inkomstenstromen genereren voor culturele instellingen.
Efficiëntieverbetering: Geautomatiseerde verwerking reduceert de tijd en kosten voor archivering aanzienlijk.
Kenniseconomie: Nederland kan een leidende positie verwerven in de Europese AI-voor-erfgoed-markt.
Conclusie
Large Multimodal Models vertegenwoordigen een transformatieve technologie voor het beheer van ons collectieve geheugen. De combinatie van geavanceerde multimodale verwerking, continue lerende capaciteiten en toenemende toegankelijkheid maakt ze uitermate geschikt voor toepassingen in archivering, kennismanagement en cultureel erfgoed.
De Nederlandse initiatieven zoals HAICu en het Noord-Hollands Archief project tonen het potentieel van deze technologieën bij het ontsluiten van historische collecties. Tegelijkertijd roepen ze belangrijke vragen op over ethiek, privacy en de rol van AI in het vormgeven van onze collectieve herinnering.
De toekomst van AI-gestuurd collectief geheugen ligt in een evenwichtige aanpak die technologische innovatie combineert met menselijke expertise, ethische overwegingen en culturele gevoeligheid. Als we deze uitdagingen succesvol aanpakken, kunnen LMM’s een krachtig hulpmiddel worden voor het bewaren en ontsluiten van onze gedeelde menselijke kennis voor toekomstige generaties.
De ontwikkeling van AI in het collectieve geheugen is nog in een vroeg stadium, maar de vooruitzichten zijn veelbelovend. Met de juiste balans tussen technologische innovatie, ethische overwegingen en maatschappelijke betrokkenheid kan deze technologie bijdragen aan een meer inclusieve, toegankelijke en rijke weergave van ons collectieve verleden.
