Скрипт формирования прогноза на основе экспорта нейросети H2O AutoML

20 000 руб. за проект
31 мая 2020, 17:18 • 3 отклика • 51 просмотр
С использованием opensource версии H2O AutoML была сформирована и обучена нейросеть.
Нужно как-то из командной строки отправлять в нее набор данных (аналогичной структуры как было использовано для обучения) для получения процента предсказания.
Нейросеть простая: на выходе может быть только или «0», или «1». Планируем увеличить кол-во вариантов на выходе. Важно видеть именно %.
Сейчас все работает на Google AutoML Tables, но там переобучать дорого в современных реалиях.

Примерная строка запроса должна быть такая (в случае если используем Java):
java – jar predict.jar -model="mymodel.java" -data="1,2,0.4,0.9,-3,............"

Если Python — придумаем что-то похожее.

На выходе:
0: 0.3
1: 0.7

Или лучше, конечно, ответ в JSON массиве [Key:0, Probability: 0.3], [Key:1, Probability: 0.7] с округлением до 4х знаков после запятой.

Моделей будет много. С разными наборами параметров на вход для обучения и на выход в виде результата. Поэтому, нужно именно средство автоматизации – в параметрах будем передавать только название файла модели и готовый набора данных для формирования предсказания. На выходе – проценты по каждому варианту ответа, сколько заложено в модель.

Модель для теста предоставить не смогу (жесткий NDA). Поэтому, вам придется взять любые данные и сформировать любую модель самостоятельно (в H2O Flow есть примеры).
Мы используем в основном модели XGBoost и DeepLearning. Но скрипт должен уметь работать со всеми, которые доступны в текущей версии H2O AutoML 3.30.0.3.

Скорее всего, этот скрипт будет и дальше дорабатываться. Возможно, вашими силами. Либо у сторонних разработчиков (если у вас не будет времени/желания).
Поэтому, код скрипта должен быть чистый и структированный, чтобы другим разработчикам было просто в нем разобраться. Так же, планируем разместить его в свободном доступе на Github, чтобы другим разработчикам было проще использовать H2O (можем указать вас как автора).

Информация о H2O: https://www.h2o.ai/products/h2o-automl/
Документация: https://docs.h2o.ai/h2o/latest-stable/h2o-docs/ind...
POJO документация: https://docs.h2o.ai/h2o/latest-stable/h2o-docs/pro...

Бюджет обсуждаемый.