Создать модель в GoogleCollab/Jupyter Notebook на языке Python

8 000 руб. за проект
04 апреля 2022, 20:00 • 5 откликов • 54 просмотра
На основе данных создать модель и классификацию. Сами данные - здесь. Задание должно быть выполнено на английском, это учебный проект. ДЕДЛАЙН - 12 АПРЕЛЯ.


ОПИСАНИЕ НА РУССКОМ

Вы будете обрабатывать реальные данные, включающие исторические результаты выборов в США.

Задачи обеих групп:
● Ваша задача заключается в следующем:
● Каковы шаги, если бы набор данных был "большими данными"?
○ Теоретический вопрос!
○ Пожалуйста, создайте код в ячейке markdown, который представляет собой базовый конвейер больших данных (с явными шагами).
○ Если хотите, используйте псевдокод.
● Загрузите набор данных "Выборы" с Github
○ Практические шаги
! wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'
● Моделирование
○ Команда A
■ Классификация
 Decision Tree (baseline)
 Random Forest Classifier
 Split data into inputs and outputs
 Split data into train and test set
 Input features:
 year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein
 Output feature(s):
 (one-hot encoded) party_simplified

Пожалуйста, обратите внимание на следующее:
● Вы должны использовать один отдельный Jupyter Notebook для решения задачи и отправки.
○ файл .ipynb, и
○ файл .pdf, созданный на основе блокнота.
Примечание для тех, кто работает в Google Colab: ссылки на ваш блокнот будет недостаточно: вы должны загрузить и отправить сам файл.
Следуйте принципу грамотного программирования и используйте ячейки блокнота в формате markdown.


ОПИСАНИЕ НА АНГЛИЙСКОМ

You will process real-life data which includes historic US election results.



The tasks of both groups:

Your task is as follows:

●What are the steps if the dataset were "big data"?

○Theoretical question!

○Please create a code in a markdown cell, which represents a basic big data pipeline (with explicative steps).

○If you want use pseudo-code.

●Download the Election dataset from Github

○Practical steps
!wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'

●Modeling

Team A

■Classification

lDecision Tree (baseline)

lRandom Forest Classifier

lSplit data into inputs and outputs

lSplit data into train and test set

lInput features:

� year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein

lOutput feature(s):

� (one-hot encoded) party_simplified



Please observe the following:

●You must use a single standalone Jupyter Notebook to solve the task and submit

○the .ipynb file, and

○a .pdf file generated from the notebook.

Note for those working on Google Colab: a link to your notebook will not suffice: you have to download and submit the file itself.

Follow the principle of literate programming, and make use of the markdown cells of the notebook.

Файлы
Отзывы
Добрый день! Оставляю исключительно положительный отзыв на исполнителя. Работа выполнена раньше дедлайна, по ТЗ. Исполнитель всегда был на связи, задал уточняющие вопросы в начале, благодаря чему получилась отличная работа - проверена с другим разработчиком, который подтвердил ее качество :) Спасибо!
2 года назад
Avatar r50 a6ce93fe35b158fd29ba0e8681c918c22117160e9586a56eee4ffbc20df9bda1
Фрилансер
 
2 года назад