5 стульев Ratio метрик Осторожно, технопост!

После разбора про ratio метрики (= метрики-дроби) несколько человек спросили, какой же из 5 способов работы с ними лучше выбрать? От А/В тестирования мы хотим глобально 3 вещи:

  • Статитстическая корректность (Имеем реальных ошибок 1 и 2 рода не больше alpha и 1-мощность)
  • Можно крутить много тестов параллельно по 1-2 недели, а не по 100 лет
  • Легко и быстро считается аналитика АВ. Желательно еще и информационные метрики по срезам (платформы, типы пользователей, ...) Как ни крути, все эти 3 условия соблюдаются только в таком сетапе

Если у компании >100К пользователей Обычно это крупные продуктовые компании (Авито, Яндекс, Netflix, ...) Тут выгоднее применять бакетный Т-тест. Кстати, это можно считать облегченной версией бутстрапа

Проблем с длительностью теста тут особо нет, потому что пользователей много = ускорять через условный cuped не обязательно А вот проблемы со временем подсчета по каждому пользователю - еще как есть, если таких пользователей миллоны. Поэтому выгоднее обьединить пользователей в 10К бакетов (групп). Считать среднее внутри каждой группы, строить их распределение. И потом проводить обычный Т-тест над таким распределением. Это помогает:

  • Экономить ресурсы на подсчет АВ
  • Считать практически любые метрики внутри бакета

Если у компании <100K пользователей Обычно это небольшие компании или оффлайн бизнесы. Часто тут наблюдение - это даже не пользователь, а курьер, магазин, географическая зона или B2B клиент

Тут главная проблема - как проводить много А/В тестов за приемлемое время. Поэтому очень важно ускорение тестов через CUPED, CUPAC или линейную регрессию. Единственный способ ускорять тесты и все еще иметь статистическую корректность - это комбинация: Линеаризация + CUPED / Линейная регрессия

При этом дельта-метод все еще полезен для расчета дисперсии исходной ratio-метрики, но скорее как вспомогательный инструмент, а не основной Дополнительный бонус этого подхода - вы получаете промежуточный датасет статистик на уровне пользователь-день (потом он саггрегигруется до пользователя!). Его можно переиспользовать для обычных дэшбордов, ML-моделей и много где еще.

Можно ли попробовать другие варианты? Можно, успешные подходы есть. Но шансов накосячить в этих вариантов кратно больше. А/В полиция рекомендует вам выбрать более простой и быстрый путь - следовать советом выше 👮