AI-агенты над DWH красиво на демо. В проде интереснее.

Когда менеджер пишет вопрос обычным языком, а агент сам строит SQL и возвращает ответ — это выглядит почти магией. На демо обычно так и есть.

Но в проде быстро выясняется, что главная сложность не в том, чтобы “сгенерировать запрос”. Главная сложность — сделать так, чтобы результату можно было доверять.

Вот где начинаются реальные проблемы:

— один и тот же бизнес-показатель может считаться по-разному в зависимости от контекста — в DWH почти всегда есть неочевидные связи, о которых модель сама не догадается — даже корректный SQL не гарантирует корректный смысл — пользователю нужен не просто ответ, а понимание, что именно было посчитано

У нас поэтому сработал не подход “пусть LLM просто ходит в базу”, а связка из трёх вещей:

1. модель знает DDL и примеры реальных запросов 2. пользователь видит не только ответ, но и сам SQL 3. на критичных сценариях важнее прозрачность, чем магия

В итоге AI-агент действительно снимает часть рутины с аналитиков и ускоряет доступ к данным. Но только если относиться к нему не как к оракулу, а как к ещё одному слою интерфейса над вашей data-системой.

Самый полезный сдвиг в голове был такой: text-to-SQL — это не про “заменить аналитика”. Это про “снизить стоимость первого вопроса к данным”.

Кто уже пробовал что-то похожее в проде? Где у вас оказалось самое узкое место: качество SQL, бизнес-контекст или доверие к ответу?

#DataEngineering #ClickHouse #DWH #AIагент #LLM #Автоматизация #данные

AI-агенты над DWH красиво на демо. В проде интереснее. | Сетка — социальная сеть от hh.ru