Поиск функции корреляции

50 000 руб. за проект
15 июля 2021, 20:03 • 7 откликов • 71 просмотр
**Общая информация:**
Существует сервис [alexa.com](http://alexa.com) ; Каждый день он с помощью своих алгоритмов сортирует все сайты в интернете и выставляет каждому сайту rank. Например google.com имеет rank=1, а habr.com rank=1702. Чем выше ранк, тем ниже посещаемость сайта. Например, сайт с ранком = 1млн. имеет в среднем 10-20к посещений в месяц.

**Задача**:
У нас есть alexa rank за июнь для 3 миллионов доменов, а также есть реальная посещаемость по этим доменам. Необходимо найти функцию корреляции между alexa_rank и реальной посещаемостью сайта. Задача не получиться решить обычной апроксимацией, так как в данных alexa много выбросов, которые нужно как-то фильтровать.

На выходе мы хотим видеть алгоритм, который принимает на вход alexa_rank и возвращает диапазон возможного числа посещений за месяц.