Разработать модуль ML для готового проекта по анализу данных. Kaggle

15 000 руб. за проект
03 января 2023, 21:48 • 6 откликов • 112 просмотров
Имеющийся проект реализует основные аспекты анализа количественных данных : пред-обработка, кластеризация, классификация, а так же (в прототипном варианте),-регрессия. Реализовано в виде Web-проекта на django (владение django необязательно, эту часть вполне закрывают др.разработчики)
По возможности, -кратко о сути: на выходе к исходному массиву данных произвольной размерности добавляется столбец(столбцы) кластерной разметки типа "cluser_id" - один, либо несколько (-для отображения многоуровневой кластерной иерархии). А так же - столбцы значений функций принадлежности каждой точки (синонимично:примера,объекта,вектора) данных к каждому из образованных кластеров (интерпретируемых теперь уже как классы). И кроме того, разработано пара прототипов, реализующих задачу регрессии -т.е. построение прогноза неизвестных признаков, на остове значений известных признаков, А ТАК ЖЕ - с учётом полученной кластерной разметки и значений вычисленных функций принадлежности, характеризующих "вероятность" отнесения примера/объекта/вектора к тому или иному из найденных классов. Реализовано в виде а) взвешенного МНК и б) нейронки на Керасе.
Что нужно:
1. Разработать модуль регрессии (Нейросеть) на высокопрофессиональном и высокопроизводительном уровне. Можно, без интеграции с имеющимся проектом, - достаточно лишь чтобы он работал с данными его выходного формата. Так же - по мере надобности, нужно закрывать возможные задачи, связанные с предварительной обработкой входных данных.
2. Помочь с тестированием на реальных данных, наиболее реалистичным и интересным способом чего видится участие в соревнованиях типа Kaggle, хотя если у кого-то имеются собственные бизнес-задачи под Анализу данных, - можно рассмотреть и подобные варианты. Единственно -стоит учитывать, что разработанный аналит.аппарат прежде всего заточен под количественный анализ и прогноз, под всякую многомерную статистику, вроде скоринга,страхования, мед.диагностирования и т.п., нежели, под задачи распознавания изображений. звуков и т.п.. Соответственно, интересен практический опыт участия на Kaggle и подобных соревнованиях, умение ориентироваться в размещаемых там задачах и теоретическая база в сфере ML.
3. Необязательно, но приветствуется и доп.оплачивается наличие собственных вычислительных мощностей, достаточных для разворачивания модуля машинного обучения под обработку достаточно больших объемов данных.