Создать модель в GoogleCollab/Jupyter Notebook на языке Python
8 000 руб. за проект
На основе данных создать модель и классификацию. Сами данные - здесь. Задание должно быть выполнено на английском, это учебный проект. ДЕДЛАЙН - 12 АПРЕЛЯ.
ОПИСАНИЕ НА РУССКОМ
Вы будете обрабатывать реальные данные, включающие исторические результаты выборов в США.
Задачи обеих групп:
● Ваша задача заключается в следующем:
● Каковы шаги, если бы набор данных был "большими данными"?
○ Теоретический вопрос!
○ Пожалуйста, создайте код в ячейке markdown, который представляет собой базовый конвейер больших данных (с явными шагами).
○ Если хотите, используйте псевдокод.
● Загрузите набор данных "Выборы" с Github
○ Практические шаги
! wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'
● Моделирование
○ Команда A
■ Классификация
Decision Tree (baseline)
Random Forest Classifier
Split data into inputs and outputs
Split data into train and test set
Input features:
year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein
Output feature(s):
(one-hot encoded) party_simplified
Пожалуйста, обратите внимание на следующее:
● Вы должны использовать один отдельный Jupyter Notebook для решения задачи и отправки.
○ файл .ipynb, и
○ файл .pdf, созданный на основе блокнота.
Примечание для тех, кто работает в Google Colab: ссылки на ваш блокнот будет недостаточно: вы должны загрузить и отправить сам файл.
Следуйте принципу грамотного программирования и используйте ячейки блокнота в формате markdown.
ОПИСАНИЕ НА АНГЛИЙСКОМ
You will process real-life data which includes historic US election results.
The tasks of both groups:
Your task is as follows:
●What are the steps if the dataset were "big data"?
○Theoretical question!
○Please create a code in a markdown cell, which represents a basic big data pipeline (with explicative steps).
○If you want use pseudo-code.
●Download the Election dataset from Github
○Practical steps
!wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'
●Modeling
○Team A
■Classification
lDecision Tree (baseline)
lRandom Forest Classifier
lSplit data into inputs and outputs
lSplit data into train and test set
lInput features:
� year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein
lOutput feature(s):
� (one-hot encoded) party_simplified
Please observe the following:
●You must use a single standalone Jupyter Notebook to solve the task and submit
○the .ipynb file, and
○a .pdf file generated from the notebook.
Note for those working on Google Colab: a link to your notebook will not suffice: you have to download and submit the file itself.
Follow the principle of literate programming, and make use of the markdown cells of the notebook.
ОПИСАНИЕ НА РУССКОМ
Вы будете обрабатывать реальные данные, включающие исторические результаты выборов в США.
Задачи обеих групп:
● Ваша задача заключается в следующем:
● Каковы шаги, если бы набор данных был "большими данными"?
○ Теоретический вопрос!
○ Пожалуйста, создайте код в ячейке markdown, который представляет собой базовый конвейер больших данных (с явными шагами).
○ Если хотите, используйте псевдокод.
● Загрузите набор данных "Выборы" с Github
○ Практические шаги
! wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'
● Моделирование
○ Команда A
■ Классификация
Decision Tree (baseline)
Random Forest Classifier
Split data into inputs and outputs
Split data into train and test set
Input features:
year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein
Output feature(s):
(one-hot encoded) party_simplified
Пожалуйста, обратите внимание на следующее:
● Вы должны использовать один отдельный Jupyter Notebook для решения задачи и отправки.
○ файл .ipynb, и
○ файл .pdf, созданный на основе блокнота.
Примечание для тех, кто работает в Google Colab: ссылки на ваш блокнот будет недостаточно: вы должны загрузить и отправить сам файл.
Следуйте принципу грамотного программирования и используйте ячейки блокнота в формате markdown.
ОПИСАНИЕ НА АНГЛИЙСКОМ
You will process real-life data which includes historic US election results.
The tasks of both groups:
Your task is as follows:
●What are the steps if the dataset were "big data"?
○Theoretical question!
○Please create a code in a markdown cell, which represents a basic big data pipeline (with explicative steps).
○If you want use pseudo-code.
●Download the Election dataset from Github
○Practical steps
!wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'
●Modeling
○Team A
■Classification
lDecision Tree (baseline)
lRandom Forest Classifier
lSplit data into inputs and outputs
lSplit data into train and test set
lInput features:
� year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein
lOutput feature(s):
� (one-hot encoded) party_simplified
Please observe the following:
●You must use a single standalone Jupyter Notebook to solve the task and submit
○the .ipynb file, and
○a .pdf file generated from the notebook.
Note for those working on Google Colab: a link to your notebook will not suffice: you have to download and submit the file itself.
Follow the principle of literate programming, and make use of the markdown cells of the notebook.
- Файлы
Отзывы
Добрый день! Оставляю исключительно положительный отзыв на исполнителя. Работа выполнена раньше дедлайна, по ТЗ. Исполнитель всегда был на связи, задал уточняющие вопросы в начале, благодаря чему получилась отличная работа - проверена с другим разработчиком, который подтвердил ее качество :) Спасибо!
2 года
назад
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.