Token-Oriented Object Notation — un format de données compact conçu pour les applications LLM.
TOON (Token-Oriented Object Notation) est un format de sérialisation de données compact conçu pour les applications LLM. Voici ce que c'est, pourquoi il a été créé et quand l'utiliser.
JSON est universel. TOON est économe en tokens. Tous deux représentent des données structurées — mais à des fins très différentes. Comparaison pratique avec des exemples concrets et un guide de décision clair.
Trois formats, trois rôles distincts. JSON gère les données imbriquées, CSV domine les tableaux plats, et TOON fait le pont entre les deux tout en optimisant les budgets de tokens LLM. Voici comment décider.
Référence complète de la syntaxe TOON : scalaires, objets, tableaux et la notation tabulaire qui rend TOON particulièrement efficace pour les jeux de données structurés.
Chaque token envoyé à une API LLM coûte de l'argent. TOON peut réduire significativement le nombre de tokens pour les données structurées. Voici comment l'utiliser en pratique avec les APIs OpenAI et Anthropic.
Les exemples de documentation utilisent des données jouets. Voici TOON avec les formes de données que vous rencontrez vraiment : catalogues produits, journaux d'audit, métriques API, transactions financières et documents mixtes.
Les deux semblent plus lisibles que JSON, mais YAML est optimisé pour l'édition humaine et TOON pour le traitement machine. Voici où chacun l'emporte.
Le côté pratique de TOON : lire et écrire des fichiers .toon, construire un parser de corps de requête, valider aux frontières du système et intégrer TOON dans un pipeline base de données vers LLM.