Извлечение данных из документов в формате docx, разработка на Python
2 000 руб. за проект
Проект из Колледжа.
Можете предлагать свою цену, если она будет обоснована.
Задача заключается в разработке утилиты с помощью программы Python, которая
способна из файлового массива выделить файлы в формате DOCX. Если первое
слово в документе – «Акт», то необходимо извлечь часть текста документа,
начинающуюся после слова «Акт» и заканчивающуюся перед фразой «Мы,
нижеподписавшиеся».
Методические рекомендации:
Можете предлагать свою цену, если она будет обоснована.
Задача заключается в разработке утилиты с помощью программы Python, которая
способна из файлового массива выделить файлы в формате DOCX. Если первое
слово в документе – «Акт», то необходимо извлечь часть текста документа,
начинающуюся после слова «Акт» и заканчивающуюся перед фразой «Мы,
нижеподписавшиеся».
Методические рекомендации:
- Следует определить, относится ли документ к типу «Акт». В качестве критерия предлагается следующий набор признаков: а). текст документа начинается со слова «акт», б). в тексте встречается фраза «мы, нижеподписавшиеся»
- Следует выделить для поиска метаданных часть текста с начала документа до фразы «мы, нижеподписавшиеся».
- Значения атрибутов «Организация-заказчик», «Организация-исполнитель», «Скважина», «Месторождение», «Лицензионный участок» и «Площадь» употребляются в тексте, как правило, вместе с наименованием атрибутов. Примеры: ПлощадьВерхнекамовская, Скважина № 1, Организация – заказчик: ООО «Газпром добыча Красноярск» и т.п.
Отзывы
Задача была выполнена отлично и быстро, фрилансер хорошо справился со своим заданием)
2 года
назад
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.