توضیحات
چکیده
اگر چه تبديل موجك قابليت تفكيك چندرزولوشني را دارا مي باشد، اما هنوز به درستي براي بازشناسي گفتار مناسب سازي نشده در اين مقاله است. دو روش تازه براي استخراج پارامترهاي بازنمايي گفتار بر مبناي موجك هاي داراي افزونگي ارائه مي شود. اين موجك ها كمتر تغيير پذير با زمان هستند. بنابراين به نظر مي آيد براي بازشناسي گفتار مناسب تر روش است چهار تحقيقدر اين باشند. خراج ويژگي از طريق موجك ارائه مي شود كه شامل استخراج توسط يك تبديل موجك ساده، تركيبي از چند موجك مناسب و استخراج توسط دو نوع فيلتر بانك سه كانالي داراي افزونگي مي .دنباش طراحي فيلتربانك هاي چند كانالي ساده تر است و امكان داشتن تقارن و تعامد به طور هم زمان را ممكن مي سازند. در پايان اين روش ها با استفاده از شبكه عصبي جلوسو با تاخير زماني مقايسه مي شوند و نشان داده خواهد شد كه در بازشناسي گفتار فيلتر بانك هاي سه كانالي داراي افزونگي، بهتر از موجك هاي عادي عمل مي كنند و هر چه ساختار فيلتربانك كمتر تغيير پذير با زمان باشد، درصد صحت بازشناسي بالاتر خواهد بود.
مقدمه
تبـديل موجـك (ويولــت) بـه عنـوان يــك ابـزار قدرتمنــد در پـردازش سـيگنال تصاویر شـناخته شـده اسـت . ايـن تبـديل به دليل توانايي هايي كـه دارد، بـراي بازشناسـي گفتـار هـم بـه كــار گرفتــه مــي شــود. تبــديل موجــك داراي پنجــره ي زمــاني بــا طــول متغيــر مــي باشــد و ايــن مســئله يكــي از مزاياي مهم آن مـي باشـد. ايـن تبـديل . در فركـانس هـاي پايين سـيگنال رزولوشـن فركانسـي بـالا دارد، در حـالي كـه در فركانس هاي بـالا، رزولوشـن زمـاني دارد كـه تقريبـا بـا سـامانه ادراكـي شـنيداري مشـابه مـي باشـد. ضـرايب كپسـترال در مقيــاس مــل (MFCC) يكــي از رايــج تــرين روش هــاي بازشناسـي گفتــار بــر مبنــاي تبـديل فوريــه مــي باشـد . ايــن روش بــا بــه كــارگيري فيلترهای مل ( 1شــكل ) که مبتنــي بــر ويژگــي هــاي ادراكــي شــنيداري هســتند بــراي بازشناسي گفتـار مناسـب سـازي شـده اسـت. اگـر چـه قابليـت محلــي ســازي زمــاني- فركانســي تبــديل موجــك از تبــديل كسينوسـي گسسـته بهتـر اسـت و همچنـين ايـن تبـديل داراي قابليــت تفكيــك چنــد رزولوشــني اســت.
ABSTRACT
Although the wavelet transform has a multidisciplinary resolution, it is still not well suited for recognizing unsupported speech in this article. Two new methods for extracting speech representation parameters based on redundant wavelets are presented. These wavelets are less variable with time. Therefore, it seems that there is a quadrilateral approach to recognizing more appropriate speech. Characteristic tribute is provided through a wavelet, which involves extraction by a simple wavelet transform, a combination of several suitable wavelets, and extraction by two types of three channel channel filters. It is easier to design multichannel filter banks, and the possibility of having symmetry and opacity Simultaneously, they make it possible. At the end, these methods are compared with time delay using the neural network, and it will be shown that in the speech recognition of the filter, the three-channel banks with redundancy are better than normal wavelets, and the lower the filter bank structure is less variable. With time, the percentage of recognition accuracy will be higher.
INTRODUCTION
Wavelet transform (Wi-Lite) is known as a powerful tool for image signal processing. This conversion, due to its abilities, is also used to recognize speech. The wavelet conversion has a time-varying variable window, and this is one of its important benefits. This conversion. At low frequencies, the signal has a high frequency resolution, while at high frequencies it has a time resolution that is similar to that of the perceptual auditory system. The Maltese Scale Copper Coefficients (MFCC) is one of the most commonly used methods for speech recognition based on Fourier transforms. This method is suited to the use of Mel filters (Fig. 1) based on auditory perceptual properties for speech recognition. Although the temporal-frequency localization capabilities of the wavelet transform are better than the discrete cousin converting, it also has a multi-resolution resolution.
Year: 2010
Publisher : Eighteenth International Energy Conference of Iran
By : Hamidreza Tohidipour, Seyyed Ali Seyyed Salehi, Hossein Improvement
File Information: persian Language/ 6 Page / size: 499 KB
سال :1389
ناشر : هجدهمین کنفرانس بین المللی برق ایران
کاری از : حميدرضا توحيدي پور ، سيدعلي سيد صالحي, حسین بهبود
اطلاعات فایل : زبان فارسی / 6 صفحه / حجم : KB 499
نقد و بررسیها
هنوز بررسیای ثبت نشده است.