📈Для лучшего понимания, что такое отклонение, квадрат отклонения, дисперсия и стандартное отклонение, дополню предыдущий пост простым примером(5.1/15):

Представьте, что у вас есть пятеро друзей, и вы хотите узнать, насколько они разные по росту. Вот их рост в сантиметрах: 160, 165, 170, 175 и 180.

1. Сначала найдём средний рост. Складываем все росты и делим на количество друзей: (160 + 165 + 170 + 175 + 180) / 5 = 850 / 5 = 170 см. Средний рост — 170 см.

2. Теперь посмотрим, насколько каждый друг отличается от среднего. Для каждого роста вычитаем средний: - 160 — 170 = -10 - 165 — 170 = -5 - 170 — 170 = 0 - 175 — 170 = +5 - 180 — 170 = +10

Эти числа называют отклонениями. Они показывают, насколько каждый рост выше или ниже среднего.

3. Почему мы не просто складываем эти отклонения? Если сложить -10, -5, 0, +5 и +10, то получится 0, потому что отрицательные и положительные значения взаимно компенсируют друг друга. Нам нужно узнать, насколько сильно данные разбросаны, а не просто сумму отклонений.

4. Что такое квадрат отклонения? Чтобы избавиться от проблемы с отрицательными числами, каждое отклонение умножаем само на себя (возводим в квадрат): - (-10)² = 100 - (-5)² = 25 - 0² = 0 - 5² = 25 - 10² = 100

Теперь все числа положительные и отражают, насколько сильно каждое значение отличается от среднего.

5. Далее вычисляем среднее этих квадратов — это называется дисперсией. Складываем квадраты и делим на количество значений минус один (это техническое уточнение для выборки): (100 + 25 + 0 + 25 + 100) / (5 - 1) = 250 / 4 = 62.5

6. Стандартное отклонение — это корень квадратный из дисперсии. Вычисляем квадратный корень из 62.5: √62.5 ≈ 7.9 см.

Это число говорит нам: в среднем, рост друзей отклоняется от среднего значения (170 см) примерно на 7.9 см.

Почему это важно? Если стандартное отклонение маленькое — значит все друзья примерно одного роста. Если большое — рост сильно варьируется.

Таким образом, стандартное отклонение помогает понять, насколько данные «разбросаны» вокруг среднего, а квадрат отклонения — просто шаг в вычислении этого показателя.

P.S. В нашем примере, дисперсия является промежуточным этапом между квадратом отклонениям и стандартным отклонением. Но в реальной статистике она очень часто применяется как конечная величина анализа последовательности, например в финансах при оптимизации рисков портфеля.

repost

134

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь