🔹 ELT — когда трансформации в базе побеждают 🔹 Что решает ELT и чем отличается от ETL (Extract, Transform, Load)? 🔸 ELT нужен, чтобы убрать узкие места в сети и процессинге: вместо трансформаций до загрузки мы загружаем сырые данные и выполняем обработка в БД (база данных). Это сокращает движение данных и ускоряет итерации аналитиков.
🔸 Ключевое отличие: ETL трансформирует до загрузки; ELT — Extract, Load, then transformation внутри хранилища. В cloud (облаке) хранилища дают масштаб и дорогоэффективный compute для таких transformation.
🔸 Когда применять: большие объёмы, частые ad‑hoc запросы, необходимость пересчётов, или когда используете Snowflake/BigQuery/Redshift — тогда выгоднее делать всё прямо в хранилище.
🔸 Мини‑пример SQL трансформации после загрузки: SELECT user_id, COUNT(*) AS events FROM raw_events WHERE event_time > current_date - 7 GROUP BY user_id;
📚 ELT = загрузка сырья + трансформации в БД/в cloud — меньше движения данных, быстрее аналитика.
➡️ Мы в Telegram - Сетке - ВК Буду рад вашей реакции здесь⬇️
В этом посте были ссылки, но мы их удалили по правилам Сетки
· 04.05
как pm смотрю через продуктовое мышление - любая проблема это сигнал о системе. сейчас в поиске pm-роли, jobpath.world помогает с анализом вакансий
ответить
коммент удалён