Token-Oriented Object Notation — een compact gegevensformaat ontworpen voor LLM-toepassingen.
TOON (Token-Oriented Object Notation) is een compact gegevensserialisatieformaat gebouwd voor LLM-toepassingen. Hier wat het is, waarom het is gemaakt en wanneer je het moet gebruiken.
JSON is universeel. TOON is token-efficiënt. Beide vertegenwoordigen gestructureerde gegevens — maar voor zeer verschillende doeleinden. Een praktische vergelijking met echte voorbeelden en een duidelijke beslissingsgids.
Drie formaten, drie verschillende taken. JSON verwerkt geneste gegevens, CSV domineert platte tabellen en TOON overbrugt beide terwijl LLM-tokenbudgetten worden geoptimaliseerd. Hier hoe te beslissen.
Een volledige referentie voor TOON-syntax: schaalwaarden, objecten, arrays en de tabelnotatie die TOON bijzonder efficiënt maakt voor gestructureerde datasets.
Elk token dat je naar een LLM-API stuurt kost geld. TOON kan het tokenaantal voor gestructureerde gegevens aanzienlijk verminderen. Hier hoe je het in de praktijk gebruikt met de OpenAI- en Anthropic-API's.
Documentatievoorbeelden gebruiken speelgoedgegevens. Dit toont TOON met de gegevensvormen waarmee je echt werkt: productcatalogi, auditlogs, API-statistieken, financiële transacties en gemengde documenten.
Beide zien er schoner uit dan JSON, maar YAML is geoptimaliseerd voor menselijke bewerking en TOON voor machineverwerking. Hier waar elk formaat wint.
De praktische kant van TOON: .toon-bestanden lezen en schrijven, een request body parser bouwen, valideren op systeemgrenzen en TOON koppelen aan een database-naar-LLM-pipeline.