Что такое сегментация в компьютерном или машинном зрении.
Если детекция объектов — это как нарисовать рамку вокруг машины на фото, то сегментация — это как точно закрасить каждый пиксель, принадлежащий машине.
🔍 Сегментация — это распознавание с точностью до пикселя.
Представь картинку с дорогой, машинами, людьми и деревьями. Детектор скажет: вот тут машина, вот тут человек. А сегментация скажет: вот эти конкретные пиксели — машина, а вот эти — фон, а эти — пешеход.
Есть два типа:
Semantic segmentation — каждый пиксель получает метку: «это дорога», «это небо», «это здание». Но не различает объекты одного класса (две машины — просто «машины»). Instance segmentation — идёт дальше: говорит не только, что это, но и какой именно объект. То есть: машина 1, машина 2, пешеход 1 и т. д.
🧠 Как это работает?
В основе — нейросети, например, U-Net или Mask R-CNN. Они учатся на размеченных изображениях, где каждый пиксель помечен вручную. Сложно, но результат — точный.
📍 Где используется?
- Медицина — выделение опухолей на МРТ.
- Автопилоты — точное понимание сцены вокруг.
- Агротехника — подсчёт растений на поле. Роботы — понимание, что брать и где.
💡 Простой пример: если робот-пылесос «видит» только рамку вокруг ковра — он может заехать на него. А если он «понимает», где именно начинается ковер (благодаря сегментации), он аккуратно его обойдёт.
Сегментация — это про точность. Не просто увидеть, а понять форму, границы и контекст.
#КомпьютерноеЗрение #ИИ #Сегментация #SemanticSegmentation #InstanceSegmentation #MachineLearning #CV #DeepLearning #ai