ByteScout Text Recognition SDK چیست؟
ByteScout Text Recognition SDK همان گونه که از نام آن پیداست ابزاری برای خواندن و استخراج متن های موجود در فایل های تصویری اسکن شده یا ساخته شده با نرم افزار است. این ابزار به توسعه دهندگان اجازه می دهد تا متن های موجود در اسناد اسکن شده را تشخیص داده و به راحتی استخراج کنند. برای ورودی می توان از فرمت های PDF، PNG، TIFF و یا JPEG استفاده کرد. تشخیص متن یا Text Recognition فرآیند شناسایی و تبدیل تصاویر یا document هایی مثل فایل های PDF که حاوی متن تایپ شده یا پرینت شده هستند به یک متن encode شده توسط کامپیوتر است که با استفاده از OCR و به کمک Machine Learning و AI انجام می شود. برای استفاده از این ابزار نیازی به اتصال به اینترنت نیست و می توان به صورت offline از آن استفاده کرد.
ByteScout Text Recognition SDK به شما کمک می کند تا کارهای تکراری مثل وارد کردن data از اسناد خاصی مثل گواهینامه های رانندگی، پاسپورت، رسیدهای مختلف، اسناد فنی، statement های بانک و غیره را خودکار سازی کنید و دیگر نیازی به تایپ دستی آن ها وجود نخواهد داشت. برای استفاده از این ابزار نیازی به نصب نرم افزارهای جانبی مثل Adobe Reader و غیره وجود ندارد و بدون وابستگی به نرم افزارهای third party کار می کند. تشخیص متن این ابزار بیش از ۱۰۰ زبان را پشتیبانی می کند. از جمله قابلیت های مهم این ابزار این است که بعد از تشخیص متن موجود در تصاویر یا فایل ها، ساختار و layout متن اصلی را حفظ می کند. ByteScout Text Recognition SDK از فیلترهای پیش پردازشی یا preprocessing filter هایی برای بهبود دقت تشخیص در اسکن های با کیفیت پایین استفاده می کند. همچنین به کمک function های low level می تواند موقعیت هر قطعه از متن تشخیص داده شده را به دست آورد. علاوه بر آن function هایی را نیز برای مشخص کردن بخش هایی از تصویر به کار می گیرد که در صورت نیاز می توان از rotation و flipping نیز روی آن ها استفاده کرد. این ابزار از فیلترهای متنی استفاده می کند تا خطاهای متداول در OCR را به صورت خودکار رفع کند. در ادامه لینک دانلود ByteScout Text Recognition SDK به همراه کرک آن ارائه شده است.
ویژگی ها و قابلیت های ByteScout Text Recognition SDK:
- پشتیبانی از PDF, PNG, JPG, TIFF به عنوان ورودی
- پشتیبانی از کنترل های ActiveX/COM برای زبان های برنامه نویسی legacy
- حفظ ساختار و layout متن تشخیص داده شده
- امکان عملکرد offline
- پشتیبانی OCR از بیش از ۱۰۲ زبان
- بدون نیاز به ابزارها و نرم افزارهای جانبی
- رفع خطاهای معمول OCR به صورت خودکار
- و بسیاری موارد دیگر.