Token-Oriented Object Notation — LLM 애플리케이션을 위해 설계된 컴팩트한 데이터 형식.
TOON(Token-Oriented Object Notation)은 LLM 애플리케이션을 위해 만들어진 컴팩트한 데이터 직렬화 형식입니다. 무엇인지, 왜 만들어졌는지, 언제 사용해야 하는지 알아봅니다.
JSON은 범용적입니다. TOON은 토큰 효율적입니다. 둘 다 구조화된 데이터를 표현하지만 목적이 매우 다릅니다. 실제 예제와 명확한 결정 가이드가 있는 실용적인 비교입니다.
세 가지 형식, 세 가지 다른 역할. JSON은 중첩 데이터를 처리하고, CSV는 플랫 테이블을 지배하며, TOON은 LLM 토큰 예산을 최적화하면서 둘 사이를 연결합니다.
TOON 구문에 대한 완전한 참조: 스칼라, 객체, 배열, 그리고 구조화된 데이터셋에 TOON을 특히 효율적으로 만드는 표 형식 표기법.
LLM API에 보내는 모든 토큰은 비용이 듭니다. TOON은 구조화된 데이터의 토큰 수를 크게 줄일 수 있습니다. OpenAI 및 Anthropic API와의 실제 사용법을 소개합니다.
문서 예제는 장난감 데이터를 사용합니다. 실제로 작업하는 데이터 형태로 TOON을 보여줍니다: 제품 카탈로그, 감사 로그, API 메트릭, 금융 거래, 혼합 문서.
둘 다 JSON보다 깔끔해 보이지만 YAML은 사람이 편집하기 최적화되어 있고 TOON은 기계 처리에 최적화되어 있습니다. 각각이 이기는 곳을 알아봅니다.
TOON의 실용적인 면: .toon 파일 읽기 및 쓰기, 요청 본문 파서 구축, 시스템 경계에서 유효성 검사, TOON을 데이터베이스에서 LLM 파이프라인으로 연결.