Token-Oriented Object Notation — kompaktowy format danych zaprojektowany dla aplikacji LLM.
TOON (Token-Oriented Object Notation) to kompaktowy format serializacji danych stworzony dla aplikacji LLM. Oto czym jest, dlaczego powstał i kiedy po niego sięgnąć.
JSON jest uniwersalny. TOON jest oszczędny dla tokenów. Oba reprezentują dane strukturalne — ale w bardzo różnych celach. Praktyczne porównanie z przykładami i jasnym przewodnikiem decyzyjnym.
Trzy formaty, trzy różne zadania. JSON obsługuje dane zagnieżdżone, CSV dominuje płaskie tabele, a TOON łączy oba, optymalizując budżety tokenów LLM.
Kompletny przewodnik po składni TOON: skalary, obiekty, tablice i notacja tabelaryczna, która sprawia, że TOON jest wyjątkowo wydajny dla strukturalnych zbiorów danych.
Każdy token wysłany do API LLM kosztuje pieniądze. TOON może znacznie zmniejszyć liczbę tokenów dla danych strukturalnych. Oto jak używać go w praktyce z API OpenAI i Anthropic.
Przykłady z dokumentacji używają danych zabawkowych. To pokazuje TOON z kształtami danych, z którymi naprawdę pracujesz: katalogi produktów, dzienniki audytu, metryki API, transakcje finansowe i mieszane dokumenty.
Oba wyglądają czyściej niż JSON, ale YAML jest zoptymalizowany do edycji przez ludzi, a TOON do przetwarzania maszynowego. Oto gdzie każdy z nich wygrywa.
Praktyczna strona TOON: odczyt i zapis plików .toon, budowanie parsera treści żądania, walidacja na granicach systemu i podłączanie TOON do potoku baza danych — LLM.