Написать скрипт для выделения параметров из текста

11 000 руб. за проект
26 января 2022, 10:56 • 9 откликов • 71 просмотр
Описание кратко
На вход подается таблица. В таблице одна из колонок содержит строки с параметрами товара. Нужно из этой строки выделить параметры и сохранить в отдельные колонки.

Описание задачи подробно
Мы развиваем платформу для оптовой торговли рыбой и морепродуктами. Чтобы посетители сайта могли выбрать нужные товары, эти товары нужно добавить на платформу.

На вход приходит, например, такие строки
  • ОКУНЬ БГ 300-500 ШТ.МОРОЗКА
  • ФОРЕЛЬ БГ 0,9-1,
На нашей платформе все параметры товара хранятся в виде отдельных сущностей
  • Вид рыбы: окунь
  • Вид разделки: без головы (БГ)
  • и т.д.
Нужно на входе получать файл в формате как нам компании присылают, а на выходе выдать файл в нужном нам формате.

Что такое нужный нам формат
Чтобы упростить обновление товаров на нашей платформе, мы реализовали загрузку всего ассортимента компании через гугл док.
Требования к файлу
  • каждый товар — это отдельная строка
  • колонка соответствует параметру товара. Например, в колонке «Производитель» для каждого товара будет указан производитель. Важно, что параметр в гугл доке должен соответствовать параметру в нашей базе данных

Что еще есть
У нас есть словарь что означают аббревиатуры и сокращения из файлов компаний. Они любят использовать сокращения, например, «см» — это свежемороженая.

В чем задача
Нужно помочь написать скрипт, который будет получать на вход файл, где все параметры слеплены в одну строку, а на выходе выдавать файл в нужном нам формате.

Не нужна 100% точность. Это окей, что потом человек доработает файл и поправит ошибки.
Мне посоветовали использовать библиотеку Yargy, но может другое решение предложите.