Реализовать скрипт на языке php 7.1 используя Laravel 5.8
5 000 руб. за проект
Реализовать скрипт на языке php 7.1 используя Laravel 5.8.
Параметры скрипта:
Шаг 1.
Для каждого строки определяем список слов.
Код данного шага вынести в отдельный класс и покрыть тестами.
Шаг 2.
Для каждого слова (кроме заключенных в кавычки и в квадратные скобки) определяем лемму (яблоки - яблоко).
Для этого использовать https://yandex.ru/dev/mystem/
Учесть, что данный скрипт может запускать на windows, то есть взять соответствующий файл.
Код данного шага вынести в отдельный класс и покрыть тестами.
Шаг 3.
Для каждого слова ищем синоним в таблице Синонимы. Далее берем его.
Содержание таблицы будет заполняться вручную.
Структура таблицы Synonyms:
Шаг 4.
Каждое слово добавляем в таблицу СтатистикаСлов. Увеличиваем счетчик.
Структура таблицы WordsStats:
В результате мне нужен:
Параметры скрипта:
- Путь к файлу со списком наименований. В данном файле более 150 000 строк, поэтому его проходить построчно, а не загружать целиком.
- Флаг создать все необходимые таблицы mysql
Шаг 1.
Для каждого строки определяем список слов.
- Заменить символы (, . - ( ) ) пробелами
- Слова заключенные в кавычки (учесть разные варианты: “ ` ’ « ») и в квадратные скобки [], считаются как одно слово.
- Удалить все предлоги и союзы (https://russky.info/ru/grammar/prepositions)
- Получаем список слов, путем разделения строки пробелом.
Код данного шага вынести в отдельный класс и покрыть тестами.
Шаг 2.
Для каждого слова (кроме заключенных в кавычки и в квадратные скобки) определяем лемму (яблоки - яблоко).
Для этого использовать https://yandex.ru/dev/mystem/
Учесть, что данный скрипт может запускать на windows, то есть взять соответствующий файл.
Код данного шага вынести в отдельный класс и покрыть тестами.
Шаг 3.
Для каждого слова ищем синоним в таблице Синонимы. Далее берем его.
Содержание таблицы будет заполняться вручную.
Структура таблицы Synonyms:
- id
- lemma
- synonym - синоним для леммы
Шаг 4.
Каждое слово добавляем в таблицу СтатистикаСлов. Увеличиваем счетчик.
Структура таблицы WordsStats:
- id
- lemma - с учетом синонима
- count - счетчик, увеличивается при каждом добавлении
- forms - данное поле содержит исходные слова (Шаг 1) + счетчик для каждого исходного слова.
В результате мне нужен:
- Файлы проекта
- Выгруженная таблица WordsStats в csv. Необходимо для приемки работы.
- Справка как запускать скрипт
- Файлы
Отзывы
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.