R50 0bea59cb73409d443965a33e88b3cfaf
PHP, C#, Pyrhon, iOS, Android

Разработка умного поиска с учетом морфологии в BigData решениях

Добавлено 31 авг 2023 в 13:31
Заказчик – пос­тавщик и арен­до­датель обо­рудо­вания для ат­трак­ци­онов. Перед нами была пос­тавле­на задача раз­ра­бот­ки умного поиска по сайту www.art-active.ru/. Также тре­бова­лось раз­ра­ботать парсинг с сайта по его фиду – потоку контента, который ав­то­мати­чес­ки под­гру­жа­ет­ся блоками на веб-странице или в при­ложе­нии.

Фид пред­став­ля­ет из себя XML-файл, со­дер­жа­щий всю ин­форма­цию, о товарах, отоб­ра­жа­ющу­юся на сайте: на­име­нова­ние, цена, ка­тего­рия и прочее. Эти данные оп­ре­деля­ют объекты, хранимые в базе данных.

Был ре­али­зован поиск с учетом мор­фо­логии, до­бав­ле­на не­об­хо­димая при­ори­тет­ность поиска, скор­ректи­рова­но раз­би­ение фразы на токены, пе­рера­ботан поиск по ключевым словам. Токены пред­став­ля­ют из себя массив слов из которых состоит запрос. Например, то­кени­затор пробелов, который ис­поль­зу­ет­ся по стан­дарту, разделит текст на токены, когда увидит пробел. Текст «Быстрая ко­рич­не­вая лиса!» Пре­об­ра­зу­ет­ся в [«Быстро», «ко­рич­не­вая», «лиса!»].

Заказ­чи­ку были пре­дос­тавле­ны кон­суль­та­ции по тон­костям работы и нас­трой­ке поиска.

Мы в telegram:
Евгений Сомов @john081076
Анна Сабадаш @TatankaYotanka

Почта
hello@softorium.pro

Телефоны
+7 (384-2) 32-67-98
+7 913 301-93-90
Aefb015f00