Извлечение информации о таблицах из изображения на C++ с OpenCV Нужна программа на C++, использующая OpenCV. На вход поcтупают изображения, которые могут содержать таблицы. Если таблица имеется, необходимо извлечь номер таблицы и название таблицы. Другие данные извлекать НЕ нужно.
Прикрепил фото, на нём отметил, какие данные нужно извлекать, другие не нужно. В изображениях такого выделения не будет, нужно определять программе самой. #include <opencv2/opencv.hpp> #include <tesseract/baseapi.h> #include <leptonica/allheaders.h> #include <iostream> #include <regex>
using namespace cv;
int main(int argc, char** argv) { // Загрузка изображения с помощью OpenCV Mat image = imread("your_image.jpg");
// Инициализация Tesseract OCR tesseract::TessBaseAPI* api = new tesseract::TessBaseAPI(); if (api->Init(NULL, "eng")) { fprintf(stderr, "Не удалось инициализировать Tesseract\n"); exit(1); }
// Установка параметров распознавания текста api->SetPageSegMode(tesseract::PSM_AUTO);
// Преобразование изображения в формат, подходящий для Tesseract api->SetImage(image.data, image.cols, image.rows, 3, image.step);
// Распознавание текста с помощью Tesseract char* outText = api->GetUTF8Text(); printf("Распознанный текст:\n%s", outText);
// Обработка распознанного текста для извлечения номера и названия таблицы std::string recognizedText(outText);