Создать модель в GoogleCollab/Jupyter Notebook на языке Python

8 000 руб. за проект

04 апреля 2022, 20:00 • 5 откликов • 55 просмотров

На основе данных создать модель и классификацию. Сами данные - здесь. Задание должно быть выполнено на английском, это учебный проект. ДЕДЛАЙН - 12 АПРЕЛЯ.

ОПИСАНИЕ НА РУССКОМ

Вы будете обрабатывать реальные данные, включающие исторические результаты выборов в США.

Задачи обеих групп:
● Ваша задача заключается в следующем:
● Каковы шаги, если бы набор данных был "большими данными"?
○ Теоретический вопрос!
○ Пожалуйста, создайте код в ячейке markdown, который представляет собой базовый конвейер больших данных (с явными шагами).
○ Если хотите, используйте псевдокод.
● Загрузите набор данных "Выборы" с Github
○ Практические шаги
! wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'
● Моделирование
○ Команда A
■ Классификация
 Decision Tree (baseline)
 Random Forest Classifier
 Split data into inputs and outputs
 Split data into train and test set
 Input features:
 year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein
 Output feature(s):
 (one-hot encoded) party_simplified

Пожалуйста, обратите внимание на следующее:
● Вы должны использовать один отдельный Jupyter Notebook для решения задачи и отправки.
○ файл .ipynb, и
○ файл .pdf, созданный на основе блокнота.
Примечание для тех, кто работает в Google Colab: ссылки на ваш блокнот будет недостаточно: вы должны загрузить и отправить сам файл.
Следуйте принципу грамотного программирования и используйте ячейки блокнота в формате markdown.

ОПИСАНИЕ НА АНГЛИЙСКОМ

You will process real-life data which includes historic US election results.

The tasks of both groups:

Your task is as follows:

●What are the steps if the dataset were "big data"?

○Theoretical question!

○Please create a code in a markdown cell, which represents a basic big data pipeline (with explicative steps).

○If you want use pseudo-code.

●Download the Election dataset from Github

○Practical steps
!wget "https://drive.google.com/uc?export=download&id=1aw0kM5a4Q-bhbHyqK4Hl-tHrvxVpxpWm" -O 'election.csv'

●Modeling

○Team A

■Classification

lDecision Tree (baseline)

lRandom Forest Classifier

lSplit data into inputs and outputs

lSplit data into train and test set

lInput features:

� year, state_fips, state_cen, state_ic, candidatevotes, totalvotes, (one-hot encoded) writein

lOutput feature(s):

� (one-hot encoded) party_simplified

Please observe the following:

●You must use a single standalone Jupyter Notebook to solve the task and submit

○the .ipynb file, and

○a .pdf file generated from the notebook.

Note for those working on Google Colab: a link to your notebook will not suffice: you have to download and submit the file itself.

Follow the principle of literate programming, and make use of the markdown cells of the notebook.

Файлы

DA2-Individual-Ho...

Ксения Парфенова

Заказчик

Добрый день! Оставляю исключительно положительный отзыв на исполнителя. Работа выполнена раньше дедлайна, по ТЗ. Исполнитель всегда был на связи, задал уточняющие вопросы в начале, благодаря чему получилась отличная работа - проверена с другим разработчиком, который подтвердил ее качество :) Спасибо!

3 года назад

Fleibiger Wiedehopf

Фрилансер

3 года назад

Войдите или зарегистрируйтесь, чтобы откликаться на заказы