Мы с важной новостью: с 28 февраля 2025 года сервис Хабр Фриланс прекратит свою работу.

Купить услуги можно до 28 февраля 2025, но пополнить баланс уже нельзя. Если на вашем счете остались средства, вы можете потратить их на небольшие услуги — служба поддержки готова поделиться бонусами, на случай, если средств немного не хватает.
R50 79af97882d26fc1c6a99c3cbcfc9756e
Data-scientist, ML- engineer,

Автоматическое распознавание и классификация изображений продуктов пит

Добавлено 21 мая 2024 в 22:43
Моя задача заключалась в создании системы компьютерного зрения, способной распознавать и классифицировать продукты питания на изображениях. Это проект, который объединяет мои навыки в области программирования на Python, глубокого обучения, обработки естественного языка и компьютерного зрения.

Сбор данных:
Для начала работы над проектом, я собрал обширный набор данных, содержащий изображения различных продуктов питания. Я использовал открытые базы данных, такие как Open Images Dataset и Food-101, а также собрал дополнительные изображения из интернета.

Предварительная обработка данных:
Одним из важных этапов была предварительная обработка собранных данных. Я провел масштабирование изображений, чтобы они имели одинаковый размер, а также выполнил уменьшение размерности для ускорения обучения модели.

Обучение модели:
Для обучения модели я использовал библиотеки TensorFlow и Keras. Я начал с дообучения предварительно обученной модели VGG16 на моем наборе данных с использованием метода передаточного обучения. После этого я провел эксперименты с различными архитектурами нейронных сетей, включая сверточные нейронные сети глубокого обучения (CNN), чтобы достичь наилучших результатов классификации.

Оценка производительности модели:
После обучения модели я оценил ее производительность на тестовом наборе данных. Я использовал метрики, такие как точность (accuracy), полнота (recall), точность (precision) и F1-мера, чтобы оценить качество классификации.

Интеграция с NLP:
Дополнительно к распознаванию продуктов по изображениям, я решил расширить функциональность проекта, добавив возможность ввода текстовых описаний продуктов. Для этого я использовал методы обработки естественного языка (NLP), чтобы анализировать и классифицировать текстовые данные о продуктах.

Развертывание системы:
Наконец, после успешного обучения и тестирования модели, я развернул систему в продакшн с помощью фреймворка Flask, создав API, который принимает изображения или текстовые описания продуктов в качестве входных данных и возвращает предсказания классов продуктов.

Заключение:
Этот проект позволил мне продемонстрировать мои навыки в области глубокого обучения, компьютерного зрения, обработки естественного языка и программирования на Python. Он также открыл для меня новые возможности в области разработки приложений, объединяющих различные технологии для решения сложных задач.

08abb9162b De555ef8d7