NVIDIA Nemotron-3 Nano

Leestijd: 3 minuten

Krachtige AI voor Autonome Agenten

Inleiding

Op 15 december 2025 heeft NVIDIA een nieuwe generatie AI-modellen gelanceerd: de Nemotron-3 familie. Het kleinste maar zeer efficiënte model uit deze serie, Nemotron-3 Nano, markeert een belangrijke doorbraak in de ontwikkeling van “agentic AI” – systemen die niet alleen tekst genereren, maar ook zelfstandig taken kunnen plannen, tools kunnen aansturen en complexe problemen kunnen oplossen. NVIDIA News

De Nemotron-3 Familie

De Nemotron-3 serie bestaat uit drie modellen in verschillende groottes, elk geoptimaliseerd voor specifieke toepassingen:

Nemotron-3 Nano: Een compact 30 miljard parameter model (waarvan slechts 3 miljard actief per taak) voor zeer efficiënte taken
Nemotron-3 Super: Een mid-size model met ongeveer 100 miljard parameters (10 miljard actief) voor multi-agent toepassingen
Nemotron-3 Ultra: Een groot redeneermodel met circa 500 miljard parameters (50 miljard actief) voor complexe AI-applicaties

De Super en Ultra varianten worden verwacht in de eerste helft van 2026. NVIDIA Research

Technische Kenmerken van Nemotron-3 Nano

Hybride Architectuur

Nemotron-3 Nano combineert het beste van twee werelden door gebruik te maken van een hybride Mamba-2-Transformer architectuur. Deze unieke combinatie biedt:

Mamba-2 lagen: Zorgen voor snelle verwerking en uitstekende prestaties bij het verwerken van lange teksten
Transformer lagen (Attention): Bieden nauwkeurige redeneervermogens en contextbegrip

Het model gebruikt 23 Mamba-2/MoE lagen en 6 Attention lagen voor optimale balans tussen snelheid en accuratesse. Technical Report

Mixture-of-Experts (MoE) Architectuur

Een van de meest innovatieve aspecten van Nemotron-3 Nano is de granulaire MoE-architectuur:

Totaal aantal parameters: 31,6 miljard
Actieve parameters per taak: Slechts 3,2 miljard (3,6 miljard inclusief embeddings)
MoE configuratie: 128 experts per laag, waarvan er 6 worden geactiveerd plus 2 gedeelde experts

Dit betekent dat het model de intelligentie van een veel groter systeem behoudt, maar met de snelheid en efficiëntie van een klein model. Hugging Face Blog

Enorm Contextvenster

Nemotron-3 Nano ondersteunt contextlengtes tot 1 miljoen tokens, waarmee het behoort tot de modellen met het grootste geheugen. Dit maakt het mogelijk om:

Hele boeken in één keer te verwerken
Enorme codebases te analyseren
Honderden documenten tegelijk te doorzoeken

Het model presteert uitstekend op RULER benchmarks over verschillende contextlengtes (64K, 128K en 256K tokens). DataCamp Analysis

Prestaties en Snelheid

Volgens NVIDIA’s officiële benchmarks levert Nemotron-3 Nano indrukwekkende prestatiecijfers:

Tot 4x sneller dan zijn voorganger Nemotron 2 Nano
3,3x sneller dan Qwen3-30B-A3B-Thinking-2507
2,2x sneller dan GPT-OSS-20B

Bij een scenario met 8K input en 16K output tokens bereikt het model ongeveer 377 tokens per seconde op een enkele H200 GPU. eWeek Report

Reasoning Modes

Een unieke eigenschap is de mogelijkheid om te kiezen tussen verschillende redeneermodi:

Reasoning ON: Voor complexe stapsgewijze logica met gedetailleerde redeneerprocessen
Reasoning OFF: Voor snelle, directe antwoorden zonder tussenliggende redeneerstappen

Dit biedt flexibiliteit om het model af te stemmen op de specifieke eisen van de taak. NVIDIA Developer Blog

Toepassingsgebieden

Dankzij de combinatie van snelheid, efficiëntie en het vermogen om tools aan te sturen, is Nemotron-3 Nano ideaal voor diverse toepassingen:

AI-Agents en Autonome Systemen

Het model is specifiek ontworpen voor “agentic AI” – systemen die zelfstandig kunnen redeneren, plannen en handelen in software-omgevingen. NVIDIA Model Card

Coding Assistants

Met een score van 78,05% op HumanEval en 75,49% op MBPP presteert het uitstekend bij het schrijven en debuggen van code in grote projecten.

RAG-systemen (Retrieval-Augmented Generation)

Het enorme contextvenster van 1 miljoen tokens maakt het ideaal voor het doorzoeken van grote hoeveelheden bedrijfsdata.

Multi-Agent Systemen

De efficiënte architectuur maakt het mogelijk om meerdere AI-agents tegelijkertijd te draaien zonder dat de kosten uit de hand lopen.

Edge AI en Lokale Deployment

Met slechts 3,6 miljard actieve parameters is het model klein genoeg om lokaal te draaien op krachtige workstations, zonder afhankelijkheid van cloud-diensten.

Training en Datasets

Nemotron-3 Nano is getraind op een indrukwekkende hoeveelheid data:

Pre-training: 25 triljoen tokens over 15 categorieën
Nieuwe unieke tokens: Meer dan 3 triljoen ten opzichte van Nemotron 2
Specialized datasets: Inclusief wetenschappelijke code, STEM-redeneren en synthetische data

NVIDIA heeft ook een groot deel van de trainingsdata openbaar gemaakt, waaronder:

Nemotron-CC-v2.1: 2,5 triljoen nieuwe English tokens
Nemotron-CC-Code-v1: 428 miljard code tokens
Nemotron-Pretraining-Code-v2: Vernieuwde GitHub code
Nemotron-Pretraining-Specialized-v1: Gespecialiseerde STEM datasets

NVIDIA Research Data

Beschikbaarheid en Licentie

Nemotron-3 Nano is open source beschikbaar onder de NVIDIA Open Model License. Deze permissieve licentie staat toe:

Commercieel gebruik zonder royalty’s
Modificatie en aanpassing
Distributie en deployment
Gebruik voor zowel onderzoek als productie

Waar kun je het model vinden?

Het model is beschikbaar via diverse platformen:

Hugging Face: Direct te downloaden in FP8 en BF16 formaten
NVIDIA NIM: Als microservice voor enterprise deployment
Inference providers: OpenRouter, Together AI, DeepInfra, Fireworks AI, Baseten
Cloud platformen: AWS Bedrock, Google Cloud, Microsoft Azure (binnenkort)

NVIDIA Official Site

Benchmark Prestaties

Nemotron-3 Nano scoort competitief tegen grotere modellen: Benchmark Nemotron-3 Nano Qwen3-30B-A3B GPT-OSS-20B AIME25 (Math) 89.1% 85.0% – Arena-Hard v2 71.5% 67.7% 66.0% SWE-Bench (Coding) 49.0% 47.5% 47.7% RULER @ 1M 51.0% 47.0% N/A HumanEval 78.05% 70.73% – GSM8K (Math) 92.34% 89.01% –

Artificial Analysis Rankings

Conclusie

NVIDIA Nemotron-3 Nano vertegenwoordigt een belangrijke stap voorwaarts in efficiënte AI-modellen. Door een slimme combinatie van hybride architectuur, MoE-technologie en uitgebreide training biedt het de prestaties van veel grotere modellen tegen een fractie van de kosten en met aanzienlijk hogere snelheid.

Met zijn open-source beschikbaarheid, commerciële licentie en uitgebreide ondersteuning voor autonome agenten is Nemotron-3 Nano een aantrekkelijke keuze voor ontwikkelaars en bedrijven die geavanceerde AI-toepassingen willen bouwen zonder de hoge kosten van cloud-gebaseerde frontier modellen.

Bronnen:

Laatste nieuws

Krachtige AI voor Autonome Agenten

De Nemotron-3 Familie

Technische Kenmerken van Nemotron-3 Nano

Hybride Architectuur

Mixture-of-Experts (MoE) Architectuur

Enorm Contextvenster

Prestaties en Snelheid

Reasoning Modes

Toepassingsgebieden

AI-Agents en Autonome Systemen

Coding Assistants

RAG-systemen (Retrieval-Augmented Generation)

Multi-Agent Systemen

Edge AI en Lokale Deployment

Training en Datasets

Beschikbaarheid en Licentie

Waar kun je het model vinden?

Benchmark Prestaties

Conclusie

By Redaktie

Gerelateerd bericht

Studiohonderd22.nl neemt afscheid van AI-publicaties

Het datacenter-paradox en welke rol spelen oppositie partijen?

Hoe FDS en IBDS worden Herzien door Geopolitieke Realiteit

AGI Nieuws

Studiohonderd22.nl neemt afscheid van AI-publicaties

Het datacenter-paradox en welke rol spelen oppositie partijen?

Hoe FDS en IBDS worden Herzien door Geopolitieke Realiteit

Jouw strategische Gids voor de juiste AI-Implementatie

Wat is IBDS? De Interbestuurlijke Datastrategie uitgelegd

Wanneer technologie de realiteit versluiert

De strip “A Wrinkle in Time”, de wetenschap achter de fantasie

Neuromorphic wat is dat (NC-NL)?

Hoe Nederland in de houdgreep van Big Tech zit – Inclusief de NOS Zelf

Van “Artificial” naar “Ascended” Intelligence

Gaat AI de rol krijgen om absolutie te verlenen

Het doorzoekbaar maken van het CABR-archief