дата инженеретта
27.03
Пост-мит dbt meetupТолько что закончился dbt meetup Что было:1️⃣"Данные под контролем: Great Expectations в деле"База про что такое data quality, какие критерии качества данных бывают, как добавить тест в GX, какой файлик с результатами получается, как выглядит таблица в UI DataHub (это такой дата каталог, чтобы пользователям было удобно смотреть бизнес-сущности, запущенные проверки и т.д.) Хотелось послушать на х3, скучно, в чате были вопросы круче, мне не понравилось :(
2️⃣"Так ли удобен dbt, как о нём рассказывают (костыли, ограничения, трудности)"Про dbt на практике. Как переопределять макросы, добавлять хинты для dbt, как обращаться к системным таблицам, как возвращать значения из макросов, особенности логирования и работы с json, dbt unit testing (либа)
3️⃣"Современные практики локальной разработки и тестирования в dbt"Про локальную разработку в dbt, Makefile (для удобного запуска команд), Zero Copy Clone (прод - read-only, запись в dev), dbt unit tests (в dbt core), эфемерные модели, фикстуры (один раз создаются, даже если нужны в нескольких тестах)
4️⃣"DuckDB на каждый день - меньше рутины, больше аналитики"Про pandas, DuckDB overview, кейсы использования, как интегрировать с dbt, новые фичи в SQL (group by all, union by name и т.д.)
5️⃣"Данные на максималках: инкрементальные загрузки и partition replacing"Про инкрементальные модели в dbt, SCD, WAP-паттерн (Write-Audit-Pattern, сначала записываем, потом проверяем и публикуем), метод замены партиций, продвинутая работа с изменениями в данных. Тут надо еще немного преисполниться
еще контент в этом сообществе
еще контент в этом соообществе
дата инженеретта
27.03
войдите, чтобы увидеть
и подписаться на интересных профи