Решить kaggle на написание Neural classification

Цена договорная
04 октября 2022, 11:16 • 3 отклика • 43 просмотра
Column target corresponds to target variable in train.csv

  • Есть два агента, которые взаимодействуют друг с другом, в результате чего каждый агент либо получает выигрыш (yi = 1), либо нет (yi = 0). Таргет в данной задаче = (y1 >= 1 & y2 >= 1)
  • Для тренировочной выборки известно некое матожидание выигрыша агента, рассчитанное на основании их взаимодействия с другим агентом - т.е. насколько вероятно, что после их взаимодействия агент i получил бы выигрыш (train_expected_target_agent_1.csv и train_expected_target_agent_2.csv)
  • Возможно имеет смысл строить отдельную модель для предсказания таргета под каждого агента по отдельности, а затем просто делать конъюнкцию предсказаний моделей (реальный таргет имеет схожую зависимость). Для этого есть train_target_agent_1.csv и train_target_agent_2.csv
======= Для чего это нужно =======

  • Можно поэкспериментировать с удалением выбросов из тренировочной выборки - н-р, если expected_target был близок к 1 у обоих агентов, а реальный таргет = 0, скорее всего, это зашумленное наблюдение, которое может негативно повлиять на качество сети.
  • Аналогично (и это даже не можно, а нужно) поэкспериментировать с удалением бесполезных признаков. У вас их по 117 на каждого агента (в сумме 234), а примеров в трейне чуть больше двух тысяч - есть несколько способов проверить, насколько важен признак для обучения, рекомендую хотя бы одним воспользоваться.
  • Last but not least - у вас таргет зависит от признаков первого агента и признаков второго агента - можно поэкспериментировать с сиамскими сетями (когда один и тот же экстрактор признаков для обоих агентов, "полученные признаки" обоих агентов конкатенируются, дальше обрабатывается совместно и получаем итоговый результат).


    Итог:
    нужно преодолеть hard baseline
  • You can only use neural networks / linear / nearest neighbors models for this task - tree-based models are forbidden!
  • All the parts must be done independently.

Отзывы
R50 9280dd5be6a2949922b5894d63a6a43e
Заказчик
Отлично справился с задачей! Быстро вникает в суть дела и точно знает что делает
Советую для kaggle соревнований и разработке в сфере ML
~ 2 года назад
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Фрилансер
Точное описание задания, оперативные ответы помогли выполнить задание быстро. Рекомендую!
~ 2 года назад