TOON — как JSON, только лучше
Последние дни в AI-тусовке кипит одно обсуждение — TOON (Token-Oriented Object Notation). Формат, который пытается решить простую вещь: сделать передачу данных точнее и дешевле по токенам.
Сначала я, честно, думал, что это мем. Очередной формат, очередной хайп. Но после разборов и тестов — история оказалась интереснее.
Почему я считаю, что TOON может реально иметь значение:
– Точность растёт, токенов тратим меньше. Да, уже есть исследования, показывающие рост точности запроса при меньшем количестве токенов.
– Эффективность токенов — критически важна для агентных систем. Мы ограничены контекстом. Чем меньше токенов тратим, тем больше можем делать. Мы постепенно входим в фазу, где оптимизация обязательна.
Коротко о TOON:
– Минус 30–60% токенов на больших однотипных массивах по сравнению с JSON. – Более дружелюбные guardrails: заранее известные поля и длины позволяют валидировать ввод. – Минимальная синтаксическая нагрузка — почти без кавычек, без лишних скобок. – Структура через отступы, как YAML.
Пример: JSON: { "stores": [ { "id": "user", "value": { "name": "Alex", "isAdmin": false } }, { "id": "theme", "value": { "mode": "dark" } }, { "id": "cart", "value": { "items": 3 } } ] }
TOON:
stores: items[3]{id,value}: user:{name:Alex,isAdmin:false} theme:{mode:dark} cart:{items:3}
Результат: 43% экономии токенов
Подробней можете ознакомиться тут: https://github.com/toon-format/toon
Я считаю, что это отличный релиз и технология.
Вайбкодеры и программисты нового поколения переизобрели .csv!
· 15.11
Примерно так делает каждый второй, когда получает задание родить сердес на курсах по программированию: первым делом указывает количество объектов. Название полей для своих объектов передавать не обязательно. Но, если уж топить за распространение нового формата, то возможность указывать количество надо оставить. Иначе в потоковых сервисах придется заголовок с "1" передавать каждый раз. Как думаете?
ответить
коммент удалён