Главный аналитик в Альфа-Банк
· 14.07📈Для лучшего понимания, что такое отклонение, квадрат отклонения, дисперсия и стандартное отклонение, дополню предыдущий пост простым примером(5.1/15):
Представьте, что у вас есть пятеро друзей, и вы хотите узнать, насколько они разные по росту. Вот их рост в сантиметрах: 160, 165, 170, 175 и 180.
1. Сначала найдём средний рост. Складываем все росты и делим на количество друзей: (160 + 165 + 170 + 175 + 180) / 5 = 850 / 5 = 170 см. Средний рост — 170 см.
2. Теперь посмотрим, насколько каждый друг отличается от среднего. Для каждого роста вычитаем средний: - 160 — 170 = -10 - 165 — 170 = -5 - 170 — 170 = 0 - 175 — 170 = +5 - 180 — 170 = +10
Эти числа называют отклонениями. Они показывают, насколько каждый рост выше или ниже среднего.
3. Почему мы не просто складываем эти отклонения? Если сложить -10, -5, 0, +5 и +10, то получится 0, потому что отрицательные и положительные значения взаимно компенсируют друг друга. Нам нужно узнать, насколько сильно данные разбросаны, а не просто сумму отклонений.
4. Что такое квадрат отклонения? Чтобы избавиться от проблемы с отрицательными числами, каждое отклонение умножаем само на себя (возводим в квадрат): - (-10)² = 100 - (-5)² = 25 - 0² = 0 - 5² = 25 - 10² = 100
Теперь все числа положительные и отражают, насколько сильно каждое значение отличается от среднего.
5. Далее вычисляем среднее этих квадратов — это называется дисперсией. Складываем квадраты и делим на количество значений минус один (это техническое уточнение для выборки): (100 + 25 + 0 + 25 + 100) / (5 - 1) = 250 / 4 = 62.5
6. Стандартное отклонение — это корень квадратный из дисперсии. Вычисляем квадратный корень из 62.5: √62.5 ≈ 7.9 см.
Это число говорит нам: в среднем, рост друзей отклоняется от среднего значения (170 см) примерно на 7.9 см.
Почему это важно? Если стандартное отклонение маленькое — значит все друзья примерно одного роста. Если большое — рост сильно варьируется.
Таким образом, стандартное отклонение помогает понять, насколько данные «разбросаны» вокруг среднего, а квадрат отклонения — просто шаг в вычислении этого показателя.
P.S. В нашем примере, дисперсия является промежуточным этапом между квадратом отклонениям и стандартным отклонением. Но в реальной статистике она очень часто применяется как конечная величина анализа последовательности, например в финансах при оптимизации рисков портфеля.
еще контент автора
еще контент автора
Главный аналитик в Альфа-Банк
· 14.07войдите, чтобы увидеть
и подписаться на интересных профи