Семплирование и выборка

При построении отчетов Метрика использует детальные данные о визитах и посетителях. Вычисление показателей по большому количеству данных может потребовать значительного количества времени и ресурсов, поэтому для построения отчетов Метрика может использовать только часть из них, то есть применять семплирование. Так Метрика обеспечивает быструю скорость построения отчетов.

Что такое семплирование

Семплирование — это статистический способ обработки данных, при котором общее представление о них строится на основе определенной части всех данных, называемой выборкой.

Предположим, речь идет о прямых заходах на сайт. Посчитав, сколько их было в 1/10 от всех визитов, можно умножить результат на 10 и получить примерное число прямых заходов. В результате времени на получение ответа понадобится в 10 раз меньше, но полученный ответ будет приблизительным.

Подробно о семплировании

Механизм семплирования в Метрике

Алгоритм семплирования выбирает данные равномерно по посетителям сайта, сохраняя корреляцию и распределения атрибутов в семплированном отчете относительно полного.

Примечание

  • Семплирование применяется только при построении аналитических отчетов в Метрике. При этом исходные данные не удаляются и не изменяются.
  • Семплирование не применяется в отчетах группы «Директ» в Метрике.
  • Сегменты Аудиторий создаются и сохраняются по 100% данным в отчете.
  • В отчетах в Директе отображаются полные данные.
  • Семплирование не влияет на эффективность рекламы.

Когда семплирование может применяться в Метрике

Семплирование может применяться при построении отчетов как в веб-интерфейсе, так и в API.

Семплирование может применяться при превышении 500 000 визитов в исходной выборке запроса (или 2 млн просмотров в соответствующих отчетах). Коэффициент семплирования динамически определяется таким образом, чтобы обеспечить построение отчета по максимальному количеству данных в зависимости от нагрузки.

Как управлять семплированием

Вы можете изменять уровень семплирования в отчетах с помощью Выборки.

В случае увеличения выборки отчет может строиться дольше или не сформироваться. Чтобы обеспечить загрузку отчета, Метрика может ограничивать ручное увеличения выборки, если количество визитов в исходных данных больше 500 000.

Примечание

Ограничение начнет действовать с сентября 2023 г.

Как получить отчеты по 100% данных

Уменьшить период построения отчета

Семплирование начинает применяться при превышении количества исходных данных в запросе. Вы можете скорректировать запрос таким образом, чтобы в него попадало не больше 500 000 визитов, уменьшив период построения отчета.

Например, если у сайта посещаемость составляет порядка 100 000 визитов в месяц, то коэффициент семплирования будет следующий при построении отчета за разные периоды:

Период отчета

Всего визитов в исходной выборке

Доля данных, которые будут использоваться при построении отчета

Один месяц

100 000

100%

Пять месяцев

500 000

100%

Шесть месяцев

600 000

83,3%

Двенадцать месяцев

1 200 000

41,7%

Подключить Метрику Про

В Метрике Про можно задать уровень выборки на уровне 100% в любой момент времени. Посмотрите другие преимущества и условия подключения в разделе О Метрике Про.

Стать партнером Рекламной сети Яндекса

Возможность построения любого отчета по 100% данных доступна партнерам РСЯ, если объем видимых показов стабильно составляет не меньше 10 млн в месяц.

Написать в чат

Написать письмо

Обратите внимание: служба поддержки не обзванивает пользователей. Не следуйте указаниям людей, которые вам звонят и представляются службой поддержки Яндекс Метрики.

Написать в службу поддержки

Обратите внимание: служба поддержки не обзванивает пользователей. Не следуйте указаниям людей, которые вам звонят и представляются службой поддержки Яндекс Метрики.