В данном проекте исходные данные по моделям электрооборудования уже сформированы и выбираются из файла Excel (десятки тысяч строк).
Задачей проекта парсинга моделей электрооборудования является разработка макроса, который:
- проанализирует наличие ключевых характеристик в ячейках Excel с исходными данными, и
- выведет полученные данные в формате таблицы на отдельный лист Excel.
Обработка исходных данных. В данном случае для обработки неструктурированной информации
была разработана методика 2-х этапной обработки данных:
На первом
этапе каждая ячейка исходных данных трансформируется в отдельный столбец на
выделенном листе Excel «Модель» с помощью функции Split (расщепление)
на основе пробела в качестве разделителя данных.- На втором этапе полученный столбец с расщепленными данными анализируемой ячейки
построчно исследуется на предмет содержания в нем ключевых характеристик. В полученном
столбце каждая характеристика (если она существует) содержит свою величину в
нижележащей ячейке столбца. Далее
операторы VBA последовательно записывают значения характеристик
таблицу с результатами парсинга.