R50 41289015fea3b84acc19292eb3d63063
Программирование на C++,Python

Скрипт для поиска слов в файлах [C+Python]

Добавлено 12 авг 2024 в 23:24
Нужно написать (желательно на C) DLL-плагин для Python, который будет принимать на вход путь к папке на локальном компьютере, проходить рекурсивно все файлы в этой указанной папке и анализировать текст внутри этих файлов.
Анализ текста внутри файлов заключается в следующем:
У меня есть текстовый файл со списком определенных слов. Их - несколько тысяч. Нужно искать эти слова в файлах. Но только в том случае, если эти слова идут подряд (важно!) с длиной от 9 до 25 слов включительно. Между этими словами не должно быть других слов (не из списка). То есть, если мы находим 9-25 слов из списка, которые идут одно за другим - мы сохраняем эти слова в текстовый файл (одна фраза из слов на одной строке).
Почему надо написать такой модуль на C? Потому что нужно обрабатывать файлы очень быстро. Python не лучший вариант для этого. Поэтому я хотел бы взять DLL с таким алгоритом и подключить его внутри кода Python. Из кода на Python я бы передавал внутрь DLL путь к папке. После завершения работы DLL, я бы читал текст из временного текстового файла, который создал DLL, в котором построчно были бы найденные фразы из слов (длиной от 9 до 25 слов).
C05a741574