Krachtige AI voor Autonome Agenten
Inleiding
Op 15 december 2025 heeft NVIDIA een nieuwe generatie AI-modellen gelanceerd: de Nemotron-3 familie. Het kleinste maar zeer efficiënte model uit deze serie, Nemotron-3 Nano, markeert een belangrijke doorbraak in de ontwikkeling van “agentic AI” – systemen die niet alleen tekst genereren, maar ook zelfstandig taken kunnen plannen, tools kunnen aansturen en complexe problemen kunnen oplossen. NVIDIA News
De Nemotron-3 Familie
De Nemotron-3 serie bestaat uit drie modellen in verschillende groottes, elk geoptimaliseerd voor specifieke toepassingen:
- Nemotron-3 Nano: Een compact 30 miljard parameter model (waarvan slechts 3 miljard actief per taak) voor zeer efficiënte taken
- Nemotron-3 Super: Een mid-size model met ongeveer 100 miljard parameters (10 miljard actief) voor multi-agent toepassingen
- Nemotron-3 Ultra: Een groot redeneermodel met circa 500 miljard parameters (50 miljard actief) voor complexe AI-applicaties
De Super en Ultra varianten worden verwacht in de eerste helft van 2026. NVIDIA Research
Technische Kenmerken van Nemotron-3 Nano
Hybride Architectuur
Nemotron-3 Nano combineert het beste van twee werelden door gebruik te maken van een hybride Mamba-2-Transformer architectuur. Deze unieke combinatie biedt:
- Mamba-2 lagen: Zorgen voor snelle verwerking en uitstekende prestaties bij het verwerken van lange teksten
- Transformer lagen (Attention): Bieden nauwkeurige redeneervermogens en contextbegrip
Het model gebruikt 23 Mamba-2/MoE lagen en 6 Attention lagen voor optimale balans tussen snelheid en accuratesse. Technical Report
Mixture-of-Experts (MoE) Architectuur
Een van de meest innovatieve aspecten van Nemotron-3 Nano is de granulaire MoE-architectuur:
- Totaal aantal parameters: 31,6 miljard
- Actieve parameters per taak: Slechts 3,2 miljard (3,6 miljard inclusief embeddings)
- MoE configuratie: 128 experts per laag, waarvan er 6 worden geactiveerd plus 2 gedeelde experts
Dit betekent dat het model de intelligentie van een veel groter systeem behoudt, maar met de snelheid en efficiëntie van een klein model. Hugging Face Blog
Enorm Contextvenster
Nemotron-3 Nano ondersteunt contextlengtes tot 1 miljoen tokens, waarmee het behoort tot de modellen met het grootste geheugen. Dit maakt het mogelijk om:
- Hele boeken in één keer te verwerken
- Enorme codebases te analyseren
- Honderden documenten tegelijk te doorzoeken
Het model presteert uitstekend op RULER benchmarks over verschillende contextlengtes (64K, 128K en 256K tokens). DataCamp Analysis
Prestaties en Snelheid
Volgens NVIDIA’s officiële benchmarks levert Nemotron-3 Nano indrukwekkende prestatiecijfers:
- Tot 4x sneller dan zijn voorganger Nemotron 2 Nano
- 3,3x sneller dan Qwen3-30B-A3B-Thinking-2507
- 2,2x sneller dan GPT-OSS-20B
Bij een scenario met 8K input en 16K output tokens bereikt het model ongeveer 377 tokens per seconde op een enkele H200 GPU. eWeek Report
Reasoning Modes
Een unieke eigenschap is de mogelijkheid om te kiezen tussen verschillende redeneermodi:
- Reasoning ON: Voor complexe stapsgewijze logica met gedetailleerde redeneerprocessen
- Reasoning OFF: Voor snelle, directe antwoorden zonder tussenliggende redeneerstappen
Dit biedt flexibiliteit om het model af te stemmen op de specifieke eisen van de taak. NVIDIA Developer Blog
Toepassingsgebieden
Dankzij de combinatie van snelheid, efficiëntie en het vermogen om tools aan te sturen, is Nemotron-3 Nano ideaal voor diverse toepassingen:
AI-Agents en Autonome Systemen
Het model is specifiek ontworpen voor “agentic AI” – systemen die zelfstandig kunnen redeneren, plannen en handelen in software-omgevingen. NVIDIA Model Card
Coding Assistants
Met een score van 78,05% op HumanEval en 75,49% op MBPP presteert het uitstekend bij het schrijven en debuggen van code in grote projecten.
RAG-systemen (Retrieval-Augmented Generation)
Het enorme contextvenster van 1 miljoen tokens maakt het ideaal voor het doorzoeken van grote hoeveelheden bedrijfsdata.
Multi-Agent Systemen
De efficiënte architectuur maakt het mogelijk om meerdere AI-agents tegelijkertijd te draaien zonder dat de kosten uit de hand lopen.
Edge AI en Lokale Deployment
Met slechts 3,6 miljard actieve parameters is het model klein genoeg om lokaal te draaien op krachtige workstations, zonder afhankelijkheid van cloud-diensten.
Training en Datasets
Nemotron-3 Nano is getraind op een indrukwekkende hoeveelheid data:
- Pre-training: 25 triljoen tokens over 15 categorieën
- Nieuwe unieke tokens: Meer dan 3 triljoen ten opzichte van Nemotron 2
- Specialized datasets: Inclusief wetenschappelijke code, STEM-redeneren en synthetische data
NVIDIA heeft ook een groot deel van de trainingsdata openbaar gemaakt, waaronder:
- Nemotron-CC-v2.1: 2,5 triljoen nieuwe English tokens
- Nemotron-CC-Code-v1: 428 miljard code tokens
- Nemotron-Pretraining-Code-v2: Vernieuwde GitHub code
- Nemotron-Pretraining-Specialized-v1: Gespecialiseerde STEM datasets
Beschikbaarheid en Licentie
Nemotron-3 Nano is open source beschikbaar onder de NVIDIA Open Model License. Deze permissieve licentie staat toe:
- Commercieel gebruik zonder royalty’s
- Modificatie en aanpassing
- Distributie en deployment
- Gebruik voor zowel onderzoek als productie
Waar kun je het model vinden?
Het model is beschikbaar via diverse platformen:
- Hugging Face: Direct te downloaden in FP8 en BF16 formaten
- NVIDIA NIM: Als microservice voor enterprise deployment
- Inference providers: OpenRouter, Together AI, DeepInfra, Fireworks AI, Baseten
- Cloud platformen: AWS Bedrock, Google Cloud, Microsoft Azure (binnenkort)
Benchmark Prestaties
Nemotron-3 Nano scoort competitief tegen grotere modellen: Benchmark Nemotron-3 Nano Qwen3-30B-A3B GPT-OSS-20B AIME25 (Math) 89.1% 85.0% – Arena-Hard v2 71.5% 67.7% 66.0% SWE-Bench (Coding) 49.0% 47.5% 47.7% RULER @ 1M 51.0% 47.0% N/A HumanEval 78.05% 70.73% – GSM8K (Math) 92.34% 89.01% –
Conclusie
NVIDIA Nemotron-3 Nano vertegenwoordigt een belangrijke stap voorwaarts in efficiënte AI-modellen. Door een slimme combinatie van hybride architectuur, MoE-technologie en uitgebreide training biedt het de prestaties van veel grotere modellen tegen een fractie van de kosten en met aanzienlijk hogere snelheid.
Met zijn open-source beschikbaarheid, commerciële licentie en uitgebreide ondersteuning voor autonome agenten is Nemotron-3 Nano een aantrekkelijke keuze voor ontwikkelaars en bedrijven die geavanceerde AI-toepassingen willen bouwen zonder de hoge kosten van cloud-gebaseerde frontier modellen.
Bronnen:
- NVIDIA Official Announcement
- Technical Report (PDF)
- Hugging Face Model Card
- NVIDIA Developer Blog
- NVIDIA Research Page
