📈Разброс данных: дисперсия и стандартное отклонение (5/15)

Мы подошли к более сложным темам в математической статистике, поэтому без формул обойтись не получится. Их будет не очень много. Если вам нужно более подробный разбор формул на реальных кейсах, поставьте ✍ под постом.

В аналитике важно не только знать средние значения, но и понимать, насколько данные разбросаны вокруг этого среднего. Представьте, что у вас есть два магазина с одинаковой средней выручкой - 100 тысяч рублей в месяц. Но в одном из них выручка стабильно колеблется от 95 до 105 тысяч, а в другом - скачет от 50 до 150 тысяч. Среднее одинаковое, а вот разброс совершенно разный, и именно это важно учитывать при принятии решений.

Чтобы понять, насколько каждое значение отличается от среднего, используют понятие отклонения - это разница между конкретным значением и средним значением выборки. Например, если средняя выручка 100 тысяч, а в один из месяцев она была 110 тысяч, то отклонение равно +10 тысяч. Если в другой месяц было 90 тысяч - отклонение -10 тысяч.

Однако просто складывать отклонения нельзя, ведь положительные и отрицательные значения взаимно компенсируют друг друга. Для решения этой проблемы используют квадрат отклонения - отклонение умножают само на себя, чтобы получить всегда положительное число. Например, отклонение +10 тысяч даст 100 млн., а -10 тысяч тоже 100 млн.

Дисперсия - это среднее значение всех таких квадратов отклонений. Она показывает, насколько в среднем данные разбросаны вокруг среднего. Формула дисперсии для выборки приложена скрином.

Стандартное отклонение - это квадратный корень из дисперсии. Его часто используют, потому что оно выражено в тех же единицах, что и сами данные, и легко интерпретируется. Например, если средний доход сотрудников 50 тысяч рублей, а стандартное отклонение - 5 тысяч, то большинство доходов находится в интервале от 45 до 55 тысяч.

Понимание дисперсии и стандартного отклонения помогает аналитикам оценивать стабильность процессов, выявлять аномалии и принимать обоснованные решения.

Запомните, даже самый спокойный медведь умеет рычать, когда надо. Берегите голову, берегите данные - и пусть в вашем дне будет немного тишины, ясности и добрых переменных.


В этом посте были ссылки, но мы их удалили по правилам Сетки

📈Разброс данных: дисперсия и стандартное отклонение (5/15)
Мы подошли к более сложным темам в математической статистике, поэтому без формул обойтись не получится. Их будет не очень много | Сетка — социальная сеть от hh.ru
📈Разброс данных: дисперсия и стандартное отклонение (5/15)
Мы подошли к более сложным темам в математической статистике, поэтому без формул обойтись не получится. Их будет не очень много | Сетка — социальная сеть от hh.ru 📈Разброс данных: дисперсия и стандартное отклонение (5/15)
Мы подошли к более сложным темам в математической статистике, поэтому без формул обойтись не получится. Их будет не очень много | Сетка — социальная сеть от hh.ru
repost

325

input message

напишите коммент

Где вы были когда в университете мне вот это все рассказывали? 🤣🤣🤣

ответить

Закину себе в канал, может кому из подрастающего поколения пригодится на экзамене 😅

ответить

· 17.07

Скорее всего сидел и тупил на лекциях по матану🤣

ответить

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь