توضیحات
ABSTRACT
Considerable progress has been made in handwriting recognition technology over the last few years. Thus far, handwriting recognition systems have been limited to small and medium vocabulary applications, since most of them often rely on a lexicon during the recognition process. The capability of dealing with large lexicons, however, opens up many more applications. This article will discuss the methods and principles that have been proposed to handle large vocabularies and identify the key issues affecting their future deployment. To illustrate some of the points raised, a large vocabulary off-line handwritten word recognition system will be described.
INTRODUCTION
Handwriting recognition technology is steadily growing toward its maturity. Significant results have been achieved in the past few years both in on-line and off-line handwriting recognition. While generic content text recognition seems to be a long-term goal – , some less ambitious tasks are currently being investigated that address relevant problems such as the recognition of postal addresses , and the legal amount on bank cheques . Current systems are capable of transcribing handwriting with average recognition rates of 90–99%, depending on the constraints imposed (e.g. size of the vocabulary, writer-dependence, writing style, etc.), and also on the experimental conditions . The recognition rates reported are much higher for on-line systems when considering the same constraints and experimental conditions. One of the most common constraints of current recognition systems is that they are only capable of recognising words that are present in a restricted vocabulary, typically comprised of 10–1000 words . The restricted vocabulary, usually called a lexicon, is a list of all valid words that are expected to be recognised by the system. There are no established definitions, however, the following terms are usually used: small vocabulary – tens of words; medium vocabulary – hundreds of words; large vocabulary – thousands of words; ery large vocabulary – tens of thousands of words.
چکیده
پیشرفت قابل توجهی در فن آوری تشخیص دست خط طی چند سال گذشته صورت گرفته است. تا کنون، سیستم های تشخیص دست خط محدود شده است به برنامه های کاربردی واژگان کوچک و متوسط، از آنجا که اکثر آنها اغلب در طول فرآیند شناختن به یک واژگان متکی هستند. با این حال، توانایی برخورد با لغات بزرگ، بسیاری از برنامه های کاربردی دیگر را باز می کند. این مقاله در مورد روش ها و اصولی است که پیشنهاد شده است تا با استفاده از واژگان کلیدی و شناسایی مسائل کلیدی موثر بر استقرار آینده خود بحث کنند. برای نشان دادن بعضی از نکات مطرح شده، یک سیستم تشخیص لغوی دست خطی خارج از خط فارسی بزرگ توضیح داده خواهد شد.
مقدمه
تکنولوژی تشخیص دست خط به سرعت در حال رشد است. در چند سال گذشته، به رسمیت شناختن دست خط در خط و خارج از خط، نتایج قابل توجهی به دست آمده است. در حالی که به رسمیت شناختن متن کلی محتوای به نظر می رسد یک هدف بلند مدت است، در حال حاضر برخی از وظایف کم اهمیت تر در حال بررسی است که به مشکلات مربوطه مانند شناخت آدرس های پستی و میزان قانونی چک های بانکی پرداخت. سیستم های فعلی قادر به ضبط کردن دست خط با نرخ تشخیص متوسط 90-99٪ هستند، بسته به محدودیت های اعمال شده (مثلا اندازه واژگان، وابستگی نویسنده، سبک نوشتن و غیره)، و همچنین در شرایط آزمایشی. نرخهای تشخیصی گزارش شده برای سیستم های On-Line بسیار بیشتر از نظر محدودیت های مشابه و شرایط آزمایشی است. یکی از رایج ترین محدودیت های سیستم های تشخیص فعلی این است که آنها تنها قادر به تشخیص کلمات هستند که در یک واژگان محدود هستند که معمولا شامل 10 تا 1000 کلمه هستند. واژگان محدود، معمولا یک واژگونی نامیده می شود، لیستی از تمام کلمات معتبر است که انتظار می رود که توسط سیستم شناسایی شود. تعاریف مشخصی وجود ندارد، اما موارد زیر معمولا استفاده می شود: واژگان کوچک – ده ها کلمه؛ واژگان متوسط - صدها کلمه واژگان بزرگ – هزاران کلمه؛ ery واژگان بزرگ – ده ها هزار نفر از کلمات است.
Year: 2003
Publisher : SPRINGER
By : A. L. Koerich, R. Sabourin, C. Y. Suen
File Information: English Language/ 25 Page / size: 346 KB
Only site members can download free of charge after registering and adding to the cart
سال : 1391
ناشر : SPRINGER
کاری از : A. L. Koerich، R. Sabourin، C. Y. Suen
اطلاعات فایل : زبان انگلیسی / 25 صفحه / حجم : KB 346
نقد و بررسیها
هنوز بررسیای ثبت نشده است.