توضیحات
چکیده
در اين مقاله يك سيستم آناليز/سنتز، بر اساس مدل طبيعي حلزوني گوش و ويژگي هاي درك شنوايي انسان ارائه شده كه قادر به كد كردن سيگنال گفتار در شرايط دشوار آكوستيكي است. بدين منظور، سيگنال نويزي توسط يك بانك فيلترگاماتن مختلط به تعدادي زيرباند شنوايي تجزيه شده و سيگنالِ هر زيرباند بطور مستقل و وفقي، ازجهت حذف نويز پردازش مي شود. استخراج پارامترها و فشرده سازي نيز از طريق ماسك گذاري كوتاه مدت، يك روش كوانتيزاسيون غيريكنواخت جديد و الگوريتم هاي كدينگ بدون تلفات صورت مي گيرد. ارزيابي كيفيت با آزمون هاي استاندارد عيني و ذهني ،نشان مي دهد كه عليرغم كاهش قابل توجه نرخ بيت تا حدود ، 14.6 Kbpsكيفيت سيگنال هاي سنتزشده بهبود معناداري يافته ، و عملكرد سيستم در برابر انواع نويزهاي سفيد، رنگي و پريوديك، باثبات و مؤثر است. همچنين كيفيت سيگنال هاي خروجي در مقايسه با نتايج چند نمونه كدينگ استاندارد ، قابل رقابت ارزيابي شده است.
مقدمه
ضبط سيگنال صحبت با استفاده از سنسورهاي آكوستيك و در حـضور نويزهـاي پـس زمينـه و محيطـي، عملكـرد سيـستم كدينگ در تخمين و استخراج پارامترها را مختل نمـوده و باعـث افت شديد كيفيت در سيگنال سنتزشده مي شود. از اينرو بهمراه سيستم كدينگ، اعمال تكنيك هاي مؤثر ارتقاء ، اهميت زيـادي دارد. الگوريتم هاي بسياري نيـز در ايـن زمينـه ارائـه شـده انـد. بعنوان مثال در يك تكنيك ارتقاء كيفيت دو شـاخه قبـل از كدينگ ،LPCدر يك كدكننـده درشـرايط نـويزي بـصورت كوانتيزاسيون برداري چند لايه، و دريك سيستم با نرخ بيت بسيار پايين بر اساس مدل ماركف مخفي ارائه شده است. اخيراً توانايي عملكرد سيستم شنوايي انسان در محيط هـاي نويزي، محققين را به استفاده از اين ويژگي در سيـستم هايـشان تشويق كرده است. برهمين مبنا دراين مقاله، يك سيستم كدينگ/ ديكدينگ ارائه شده كه قادربه بهبود كيفيت سيگنال هاي نويزي، عليرغم فشرده سازي و كاهش نرخ بيت . آن اسـت درايـن سيستم، ابتدا سيگنال ورودي از طريق مدلسازي حلزونـي گـوش به زيرباند هاي شنوايي تجزيه مي شود.
ABSTRACT
In this paper, an analytical / synthesis system is presented based on the natural cochlear model of the ear and features of human hearing as capable of coding the speech signal in difficult acoustic conditions. To this end, the noise signal is decomposed into a number of hearing aids by a mixed filter filament bank, and the signal of each subband is independently and adaptively processed to remove noise. Extracting parameters and compression also through short-term masking, a new non-uniform quantum method and lossless coding algorithms are carried out. Quality evaluation with objective and subjective standard tests shows that, despite a significant drop in bit rate up to about 14.6 Kbps, the quality of the synthesized signals has improved significantly, and the system’s performance against all kinds of noise, color and periodic, stable and effective. Also, the quality of the output signals is evaluated in comparison with the results of several standard coding examples.
INTRODUCTION
Speaking signal recording using acoustic sensors and in the presence of background and environmental noise, disrupts the function of the coding system in estimating and extracting the parameters and results in a loss of quality in the synthesized signal. Therefore, with the coding system, the application of effective promotion techniques is very important. Many algorithms are presented in this regard. For example, in a technique for enhancing the quality of the two branches before the coding, the LPC is presented in a noise-inducing encoder for multi-layer quantization, and in a very low bit rate system based on the secret Markov model. Recently, the ability of the human hearing system to operate in noise-free environments has encouraged researchers to use this feature in their systems. Based on this, there is a coding / dictation system that can improve the quality of noise signals, despite compression and bit rate reduction. In this system, the incoming signal is first decomposed through the cochlear modeling of the ear into the auditory sub-band.
Year: 2010
Publisher : Eighteenth International Energy Conference of Iran
By : Seyyed Iman Abtahi, Mohammad Reza Ashoori, Rasool Amir Fatahi
File Information: persian Language/ 6 Page / size: 657 KB
سال :1389
ناشر : هجدهمین کنفرانس بین المللی برق ایران
کاری از : سيد ايمان ابطحي ،محمد رضا آشوري ، رسول امير فتاحي
اطلاعات فایل : زبان فارسی / 6صفحه / حجم : KB 657
نقد و بررسیها
هنوز بررسیای ثبت نشده است.