نویسه خوان به جای تایپ مجدد

چرا اسناد خود را دوباره تایپ می‌کنید؟

تشخیص حروف نوری (با نام دیگر حروف خوان نوری، OCR) تبدیل مکانیکی یا الکترونیک تصویر متون تایپ شده، دستنویس یا چاپ شده به متن دیجیتال و قابل ویرایش است، این تصویر می‌تواند یک سند اسکن شده، یک عکس از یک سند، یک عکس صحنه (برای مثلا متن در نشانه ها و بیلبوردها در یک عکس منظره) و یا از متن زیرنویس بر روی یک تصویر (به عنوان مثال از یک پخش تلویزیونی) باشد.  این به طور گسترده ای به عنوان یک فرم ورود اطلاعات از سوابق داده های کاغذ چاپ، به استثنای اسناد گذرنامه، صورتحساب، صورت حساب های بانکی، رسید های کامپیوتری، کارت های کسب و کار، پست الکترونیکی، چاپ داده های استاتیک یا هر اسنادی مناسب استفاده می شود. این روشی معمول برای دیجیتالی کردن متون چاپی است تا بتوان آنها را به صورت الکترونیکی ویرایش، جستجو، یا به صورت فشرده‌تر ذخیره سازی نمود. به صورت آنلاین و در فرایندهای ماشین مانند محاسبات شناختی، ترجمه ماشین، (استخراج) متن به گفتار، داده های کلیدی و استخراج متن مورد استفاده قرار می‌گیرد. OCR زمینه تحقیق در شناخت الگوی، هوش مصنوعی و بینایی کامپیوتری است.

چرا اسناد خود را دوباره تایپ می‌کنید؟

به سوی آینده!

نسخه های اولیه نیاز به آموزش تصویری شکل هر حرف داشتند و در یک زمان با یک فونت کار می کردند. سیستم های پیشرفته ای که قادر به تولید درجه بالای دقت تشخیص بیشتر فونت ها هستند، در حال حاضر رایج و با پشتیبانی از انواع ورودی های فرمت فایل تصویر دیجیتال هستند. بعضی از سیستم ها قادر به تولید خروجی فرمت شده هستند که تقریبا نزدیک به صفحه اصلی از جمله تصاویر، ستون ها و سایر اجزا غیر متنی است.

 

برخی از نظرات

ارسال نظر

نام
ایمیل
وب سایت
پیام