no-img
ایران رساله| پایان نامه آماده| پروپوزال آماده | تحقیق آماده | مقاله آماده |سمینار آماده

کاربرد فیلتر کالمن عصبی در بهبود سیگنالهای صوتی | ایران رساله| پایان نامه آماده| پروپوزال آماده | تحقیق آماده | مقاله آماده |سمینار آماده


ایران رساله| پایان نامه آماده| پروپوزال آماده | تحقیق آماده | مقاله آماده |سمینار آماده
مطالب ویژه
گزارش خرابی لینک
اطلاعات را وارد کنید .

ادامه مطلب

<span itemprop=کاربرد فیلتر کالمن عصبی در بهبود سیگنالهای صوتی" />
zip
مرداد ۲۶, ۱۳۹۸

کاربرد فیلتر کالمن عصبی در بهبود سیگنالهای صوتی">کاربرد فیلتر کالمن عصبی در بهبود سیگنالهای صوتی


کاربرد فیلتر کالمن عصبی در بهبود سیگنالهای صوتی:پایان نامه ایران رساله


عنوان فایل: پایان نامه ارشد برق :فیلتر کالمن عصبی در بهبود سیگنال های صوتی

نوع فایل:ورد

تعداد صفحات : ۲۴۰

رشته مرتبط: ارشد برق


مقدمه :

پایان نامه ایران رساله: موضوع بهبود گفتار با نیاز به افزایش کیفیت عملکرد سیستمهای ارتباطی صوتی در محیط هـای نویزی ، مطرح گردید . رنج عملکردی وسیعی برای سیستمهای تشخیص گفتار جهت بهبود ارتبـاط از راه دور در هوانوردی ، صنایع نظامی ، گفتگوهای راه دور و محیط های سلولی وجود دارد . هـدف ما نیز در این پایان نامه بهبود کیفیت قابل ملاحظه گفتار یا افزایش قابلیت فهم آن می باشد.

کاربردهای فراوانی از بهبود گفتارهای صوتی تا پیش بینـی هـای اقتـصادی و کنتـرل تطبیقـی نیازمند تخمین و مدلسازی دنباله های زمانی نویزی می باشند. از ایـن جملـه مـی تـوان بـه بهبـود گفتارهای صوتی ، پیش بینی اقتصادی ، مدلسازی ژئو فیزیکی و بـسیاری کاربردهـای دیگـر اشـاره کرد. یک دنباله زمانی نویزی می تواند با یک مدل احتمـالی کـه هـر دوی اجـزای تقریبـی و دقیـق دینامیک ها را تخمین می زند ، توصیف شود. چنین مدلی می تواند به همراه فیلتر کالمن (یا فیلتـر کالمن توسعه یافته ) جهت تخمین و پیش بینی سری زمانی از مشاهدات نویزی بکار گیری شود.

پایان نامه ایران رساله::فیلتر کالمن یک فیلتر بهینه خطی است که بر روی فضای حالت سیتمهای خطـی اسـتاتیکی و دینامیکی اثر گذاشته و یک تخمین بهینه از حالتهای سیستم با استفاده از معادلات بر گشت پذیر و دینامیکی خود در شرایطی که دسترسی به آنها میسر نباشد ارائه می دهد. همچنین این فیلتـر مـی تواند تاثیر کلیه اطلاعات گذشته و ابتدایی سیستم را نیز در تخمین هر لحظه خود لحاظ نماید.

بنابراین با توضیحات ارائه شده در بالا می توان فهمید که جهت بازیابی یک سیکنال صـوتی بـه یک تخمین خوب نیاز است اما موضوع مهم این است که فیلتر کالمن خطی قادر به ارائه تخمـین از مدلهای سیستمهای غیر خطی نمی باشد حال آنکه اکثر سیستمهای واقعی که سیـستمهای صـوتی نیز از این جمله می باشند ماهیت غیر خطی دارند. لذا در این پایان نامه بر آن شدیم تا با مطالعه بر روی فیلتر کالمن توسعه یافته و به کمک شبکه های عـصبی بتـوانیم موضـوع مدلـسازی و تخمـین سیگنال صوتی را با فرض غیر خطی بودن آن بررسی نماییم .

 

– فیلتر وینر:

روبرت وینر۱ به همراه نویلسون از دانشگاه MIT امریکا در خلال سالهای ۱۹۴۰ تا ۱۹۴۹ تحقیق گسترده ای را جهت یافتن یک فیلتر بهینه به منظور تخمین حالتهای سیستمهای خطی انجام دادند[۱] که نهایتا در سال ۱۹۴۹ منجر به معرفی فیلتر وینر گردید. این فیلتر یک تخمین خطی با حداقل کردن میانگین مربعات خطا (LMMSE)۲ برای سیگنال مشاهده شده ارائه می دهد. اما این فیلتر دارای چند مشکل بود. اول آنکه ما نیازمند تخمینهای علی هستیم و در نتیجه برای تخمین علی بایستی از فیلتر وینر علی استفاده شود در حالیکه فیلتر وینر فقط N مشاهده جدید را جهت تخمین بکارگیری می کرد و در نتیجه ممکن بود اطلاعاتی از سیگنال در مشاهدات گذشته وجود داشته باشد که در این صورت از بین می رفت . دوم آنکه این فیلتر فقط برای نویزهای ثابت با میانگین صفر طراحی شده بود در حالیکه در دنیای واقعیت انواع نویزهای غیر ثابت وجود دارد. سوم آنکه فیلتر وینر جهت ارائه تخمین سیگنال نیاز به چگالی طیفی و تابع خود همبستگی سیگنال دارد که در همه مواقع در دسترس نمی باشد. وچهارم آنکه تخمینهای LMMSE :پایان نامه ایران رساله:

 

٣ML و MAP ۴که جهت محاسبات این فیلتر بکار می روند در هر زمان نیاز به مشاهدات جدید بودند که مستلزم حافظه بالا  بود. همه این عوامل محققان را در طی سالهای ۱۹۵۰ تا ۱۹۶۰ به فکر انداخت تا در پی معرفی فیلتری جدید با قابلیت ارائه تخمین خطی بهینه از طریق مینیمم کردن میانگین خطا و عاری از مشکلات فیلتر وینر باشند.[۲-۴]

 

۱-۲- فیلتر کالمن :

لذا رادولف المان کالمن ۵ در سال ۱۹۶۰ [۲-۳] روش معروف خود را به همراه نتایج آن مبنی بر ارائه یک روش بازگشتی فیلتر سازی اطلاعات زمان گسسته مطرح نمود که بر مبنای تخمین

۶MSE طراحی شده بود و دارای هیچ یک از مشکلات فیلتر وینر نبود. به تدریج این نظریه به نام فیلتر کالمن معرفی شد و در محاسبات دیجیتال و کنترل دیجیتال بکارگیری شد اما توانایی فوق العاده و بالای این فیلتر در تخمین حالتهای سیستمهای خطی باعث فراگیر شدن آن در حوزه های مختلف کاربردی گردید. این فیلتر با مینیمم کردن میانگین مربعات خطای تخمین می توانست تخمینهای بسیار خوبی را از حالتهای گذشته –  حال و آینده سیستم ارائه دهد. در حقیقت این فیلتر نیاز به پارامترهای سیستم مورد تخمین داشت که در صورت ناشناس بودن سیستم بایستی توسط یکی از روشهای خطی شناسایی سیستمها (…,ARMAX9-ARX8-AR7) این پارامترها در اختیار فیلتر کالمن جهت تخمین حالتهای مورد نظر قرار می گرفت . قابلیت های این فیلتر در

مقایسه با فیلتر وینر به شرح ذیل است :

۱-  نیاز به فضای حالت سیستم بجای طیف فرکانسی جهت محاسبه تخمین .

۲-  دارای قابلیت ارائه تخمین در حضور انواع نویز و فضای حالت متغیر با زمان .

 

۳-  عدم نیاز به دانستن اطلاعات در مورد نحوه تولید سیگنال مورد تخمین . یعنی اطلاعات مربوط به سیستم از طریق روشهای شناسایی سیستم به فیلتر کالمن داده می شود و اطلاعات سیستم بطور مستقیم در تخمین کالمن وارد نمی شود.

لذا در خلال سالهای ۱۹۶۰ تا ۱۹۷۰ کاربردهای بیشماری از فیلتر کالمن خطی در حوزه های مختلف کنترل و مخابرات مطرح گردید که البته محدود به سیتمهای خطی می شد نمونه هایی از آن در[۳] و [۴] و [۵] آمده است ..

 

۱-۳- فیلتر کالمن توسعه یافته :

پایان نامه ایران رساله::اما یک مشکل عمده در اواسط سال ۱۹۷۵ دانشمندان را به فکر انداخت تا به فکر توسعه فیلتر کالمن باشند. مشکل عمده فیلتر کالمن این بود که محدود به سیستمهای خطی می شد و قابلیت تخمین حالتهای سیستمهای غیر خطی را نداشت حال آنکه در دنیای واقعیت اکثر سیستمها دارای ماهیت غیر خطی می باشند. لذا با ایجاد تغییراتی در فیلتر کالمن ، فیلتری بنام فیلتر کالمن توسعه یافته ١٠ معرفی شد که قابلیت تخمین حالتهای سیستمهای غیر خطی را نیز دارا بود. در واقع این فیلتر مدل غیر خطی را با عنوان مدل خطی تغییر پذیر با زمان تخمین می زد. از آنجائیکه ماهیت صوت نیز غیر خطی است در نتیجه با معرفی این فیلتر محققان توانستند زمینه جدیدی را در تخمین و بهبود واقعی تر سیگنالهای صوتی مطرح کنند.

در سال ۱۹۷۹ دکتر لونگ ، پیشنهاد ترکیب بردار سیگنال تاخیر دار ۱−X k و پارامترهای ناشناس W را در یک بردار حالت ترکیبی جهت تشکیل یک نمایش فضای حالت غیر خطی مطرح کرد. که در آن فیلتر کالمن توسعه یافته جهت تخمین غیر خطی سیگنال بکارگیری می شد. این

روش بنام فیلتر کالمن توسعه یافته مشترک ١١ (Joint EKF) [۷] بود. که البته این روش بدلیل پیچیدگی محاسباتی آن ، مورد توجه محققان قرار نگرفت و خیلی کاربردی نشد.

در سال ۱۹۸۷ پروفسور کی پالیوال بحث کابرد فیلتر کالمن در بهبود گفتار را در مقاله خود در کنفرانس بین المللی پردازش سیگنال امریکا مطرح کرد[۸]. او در این مقاله با استفاده از شناسایی

AR سیستم خطی که همان گفتار تمیز بود و تلفیق فیلتر کالمن با آن توانست سیگنال صوتی را بازیافت کند. که البته او فرض کرده بود که واریانسهای نویز قابل شناسایی است و سپس با مقایسه نسبت سیگنال به نویز (SNR12 ) سیگنال اصلی و نویزی ، بهبود سیگنال را اثبات کرده بود. طی سالهای ۱۹۸۷ تا ۱۹۹۷ مقالات متعددی در خصوص حذف نویز از سیگنالهای صوتی توسط محققان مطرح گردید که اکثر آنها بر استفاده از فیلتر کالمن تاکید داشتند البته در خلال این سالها از فیلتر کالمن توسعه یافته در بسیاری ار تخمینهای سیستمهای غیر خطی بهره گیری شد اما بدلیل وجود مشکل اصلی دیگری که فیلتر کالمن توسعه یافته نتوانسته بود به آن پاسخ دهد و آن عدم توانایی تخمین واریانس نویزهای پروسه و مشاهده بود، محققان در پی معرفی یک فیلتر جدید بودند که توانایی تخمین نویز را داشته باشد زیرا در سیستمهای واقعی پردازش صوت ، ما به سیگنال تمیز دسترسی نداریم و در نتیجه در بهره گیری از فیلتر کالمن با مشکل مواجه می شدند.

 

۱-۴- روشهای کاهش طیفی :

پایان نامه ایران رساله::تلاشهای زیادی در سالهای ۱۹۷۹ تا ۱۹۸۳ توسط دانشمندان مختلف از جمله اپنهایم ، لیم و مالپاس [۹-۱۱] در مورد روش کاهش طیفی جهت بهبود سیگنالهای صوتی انجام شد تا سرانجام روشی بنام روش کاهش طیفی نیز توسط دکتر هیرچ در سال ۱۹۹۳ مطرح گردید[۱۲]. مبنای این روش بر این اساس بود که بایستی سیگنال نویزی و نویز توسط تبدیل فوریه به حوزه فرکانس تصویر شوند و سپس توان طیفی سیگنال نویزی (Pˆy) و نویز (Pˆn) محاسبه گردد و پس از تفریق

 

این ۲ پارامتر از یکدیگر مجددا سیگنال بدست امده ( γ[αPˆnγ  −Pγ  ] =x ) با عکس تبدیل فوریه به حوزه زمان تصویر گردند. که این روش دارای ۴ مشکل عمده بود. اول آنکه این روش نیازمند بود تا سیگنال در دسترس به ۲ بخش گفتار و غیر گفتار تقسیم شود که این امر به سادگی امکان پذیر نبود و در نتیجه در تفریق ۲ سیگنال از هم معمولا خواص سیگنال تمیز نیز از بین می رفت و سیگنال بازیافتی از مرغوبیت خوبی برخوردار نبود و دوم آنکه نیاز به داشتن اطلاعات کافی از نویزی بودیم که سیگنال تمیز به آن آغشته شده است که این هم در بسیاری از موارد میسر نبود. سوم آنکه اطلاعات بازیافت شده فقط شامل اطلاعات بهره سیگنال بود و اطلاعات مربوط به فاز آن از بین می رفت . چهارم آنکه بایستی به کل سیگنال در ابتدای پردازش بصورت بسته ای دسترسی می داشتند که این باعث محدودیت این روش به کاربردهای نابهنگام می گشت . لذا این روش نیز خیلی مورد توجه محققان واقع نگردید.

 

۱-۵- استفاده مستقیم از شبکه عصبی :

همچنین در خلال سالهای ۱۹۸۶ تا ۱۹۹۶ دانشمندان متخصص شبکه هـای عـصبی روشـهای مستقیم پردازش سیگنالهای صوتی توسط شبکه های عصبی را مطـرح و آزمـایش نمودنـد در واقـع برای اولین بار دکتر تامورا در سال ۱۹۸۷ [۱۳] این موضوع را مطرح کرد. مبنای کـار او و محققـان دیگر که تا سال ۱۹۹۶ این حوزه را دنبال کردند [۱۴- ۱۶] بر این اساس بود که یک شبکه عـصبی چند لایه جهت تصویر کردن بخش های پنجره شده گفتار نویزی بـه تخمـین سـیگنال تمیـز بکـار گیری می شد . تعداد ورودی ها به نرخ نمونه برداری سیگنال گفتار بستگی داشـت و معمـولاً بـرای پوشش ۵ تا ۱۰ میلی ثانیه اطلاعات تنظیم می شد. همچنین تعداد خروجـی هـا معمـولاً بـا تعـداد ورودی ها برابر بود . برای آموزش شبکه ، گفتار تمیز به طور مصنوعی تخریب می شد تـا اطلاعـات ورودی نویزی را بسازد .سپس سیگنال گفتار تمیز به عنوان هدفی که با ورودی ها بـه طـور زمـانی

فهرست مطالب:

پایان نامه ایران رساله پایان نامه ایران رساله پایان نامه ایران رساله

 



موضوعات :
ads

درباره نویسنده

mrk kiani 45 نوشته در ایران رساله| پایان نامه آماده| پروپوزال آماده | تحقیق آماده | مقاله آماده |سمینار آماده دارد . مشاهده تمام نوشته های