🔹 NoSQL vs SQL и pandas: итоги недели 🔹 Что выбрать для конкретной задачи — реляция, гибкость или единое хранилище? 🔸 NoSQL vs SQL появились потому что разные данные требуют разных компромиссов: SQL (Structured Query Language) даёт строгую схему и сильную согласованность, NoSQL (Not Only SQL) — гибкость и горизонтальную масштабируемость. Без правильного выбора данные быстро станут тяжёлыми для изменений и аналитики.
🔸 Data Lakehouse решает проблему дублирования и разрыва между сырыми данными и аналитикой: объединяет Data Lake и хранилище, чтобы хранить сырьё и одновременно давать структуру для BI.
🔸 pandas read_csv загружает CSV в DataFrame; после чтения делайте data filtering (boolean-маски, .query) чтобы уменьшить объём перед загрузкой в хранилище или отправкой в ML.
🔸 Практика: возьмите реальный CSV, загрузите через pandas read_csv, отфильтруйте и сохраните результаты в SQL и в NoSQL/лаке — сравните сложность запросов и производительность.
📚 Сделайте небольшое сравнение — это развивает архитектурное чутьё.
➡️ Мы в Telegram - Сетке - ВК Буду рад вашей реакции здесь⬇️
В этом посте были ссылки, но мы их удалили по правилам Сетки