Winsoft Optical Character Recognition چیست؟
Winsoft Optical Character Recognition یک component برای شناسایی متن داخل عکس ها است. به کمک این component می توانید متون موجود در تصاویر اسکن شده را به راحتی استخراج کنید. این component از Tesseract OCR engine و هم چنین library پردازش تصویر Leptonica استفاده می کند. از این component می توانید برای Delphi/C++ Builder 5 - 10.4 و Lazarus 2.0.10 به راحتی استفاده کنید. هدف اصلی این ابزار، decode کردن متن داخل تصاویر به plain text است.
در Winsoft Optical Character Recognition دو پنل اصلی وجود دارد، یکی در سمت چپ و دیگری در سمت راست که تمام component های visual دیگر را داخل خود نگه می دارد. در سمت چپ TPanel قرار دارد که حاوی TImage است. هنگامی که یک تصویر در سمت راست از روی فایل load می شود می توانید دکمه Recognize را بزنید تا فرآیند تشخیص متن در تصویر را شروع کند. هنگامی که فرآیند در حال اجرا باشد دکمه Active تبدیل به cancel می شود و می توانید پیش از آنکه فرآیند تمام شود آن را متوقف کنید. خود فرآیند شناسایی متن از TOcr component استفاده می کند که هدف اصلی آن دقیقاً تشخیص متن های داخل تصاویر است. با استفاده از TPageControl component می توان تمام تنظیمات را بررسی کرد. این ابزار مثل یک tab control کار می کند که محتوای سمت راست را بسته به صفحه انتخابی تغییر می دهد. صفحه اول متن را به فرم ساده آن نمایش می دهد. صفحه بعد یک فرمت html از متن را به نمایش می گذارد و بعد از آن UNLY و Regions قرار دارند که پاراگراف ها را داخل فریم قرار می دهند. تب The Paragraph متن تقسیم شده را پاراگراف بندی می کند (اگر بیش از یک پاراگراف وجود داشته باشد). تب Text Lines نیز تعداد خط های متن را شمارش می کند. در کنار آن تب Words قرار دارد که دور هر کلمه تشخیص داده شده در متن یک کادر می کشد. و در نهایت تب Components نیز متن را به component های مختلف تقسیم بندی می کند. اگر هنگامی که فرآیند تشخیص متن در حال اجرا است دکمه cancel را بزنید flag مربوط به CancelRequest برابر true قرار گرفته و با توقف فرآیند نتایج در سمت راست نمایش داده می شوند. در ادامه لینک دانلود Winsoft Optical Character Recognition به همراه source کامل آن ارائه شده است.
ویژگی ها و قابلیت های Winsoft Optical Character Recognition:
- امکان شناسایی متن داخل تصاویر یا OCR
- استفاده از Tesseract OCR engine برای تشخیص متن
- بهره گیری از library پردازش تصویر Leptonica
- قابل استفاده برای Delphi/C++ Builder 5 - 10.4 و Lazarus 2.0.10
- گنجاندن source کامل در مجموعه
- و بسیاری موارد دیگر.