Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 41289015fea3b84acc19292eb3d63063
Программирование на C++,Python

Скрипт для поиска слов в файлах [C+Python]

Добавлено 12 авг 2024 в 23:24
Нужно написать (желательно на C) DLL-плагин для Python, который будет принимать на вход путь к папке на локальном компьютере, проходить рекурсивно все файлы в этой указанной папке и анализировать текст внутри этих файлов.
Анализ текста внутри файлов заключается в следующем:
У меня есть текстовый файл со списком определенных слов. Их - несколько тысяч. Нужно искать эти слова в файлах. Но только в том случае, если эти слова идут подряд (важно!) с длиной от 9 до 25 слов включительно. Между этими словами не должно быть других слов (не из списка). То есть, если мы находим 9-25 слов из списка, которые идут одно за другим - мы сохраняем эти слова в текстовый файл (одна фраза из слов на одной строке).
Почему надо написать такой модуль на C? Потому что нужно обрабатывать файлы очень быстро. Python не лучший вариант для этого. Поэтому я хотел бы взять DLL с таким алгоритом и подключить его внутри кода Python. Из кода на Python я бы передавал внутрь DLL путь к папке. После завершения работы DLL, я бы читал текст из временного текстового файла, который создал DLL, в котором построчно были бы найденные фразы из слов (длиной от 9 до 25 слов).
C05a741574