تشخیص مقاوم گفتار به روش دستهبندی نویز+ نسخه انگلیسی
Robust voice activity detection directed by noise classification
چکیده
در این مقاله تشخیص گفتار (VAD) به کمک ماشین بردار پشتیبان (SVM) به صورت یک مساله دستهبندی دو کلاسه فرموله شده است. روش ارائه شده، برای دستهبندی گفتار/غیرگفتار، یک فرایند استخراج ویژگی پردازش گفتار مقاوم به نویز را با مدلهای ماشین بردار پشتیبان آموزش دیده در انواع نویز زمینهها ترکیب میکند. همچنین از یک ماشین بردار پشتیان چندکلاسه به منظور دستهبندی نویزهای زمینه به کار رفت تا برای تشخیص گفتار، مدل ماشین بردار پشتیبان انتخاب شود. روش تشخیص گفتار ارائهشده در این مقاله، توسط دادههای TIMIT که به صورت مصنوعی و با کمک انواع نویزهای افزوده شده به آن معوج شدهاند، تست شده و با تشخیصگفتارهای بروز و پیشرفته مقایسه میوشد. نتایج شبیهسازی نشان میدهند که روش تشخیص گفتار ارائه شده میتواند گفتار را تحت شرایط نسبت سیگنال به نویز ضعیف استخراج کند و اینکه به سطوح مختلفی از نویز حساس نیست.
1 مقدمه
تشخیص گفتار (VAD) فرایندی است که میتواند بخشهای گفتاری و غیرگفتاری را از یک سیگنال گفتار جدا کند. یک گفتار مکالمهای معمولی دارای نسبت گفتار به غیرگفتار چهل به شصت است. لذا، استفاده از تشخیص گفتار میتواند ظرفیت کانال و نیز مصرف توان سیستمهای مخابره صدا را بهبود بخشد. همچنین تشخیص گفتار به کاربردهای مختلف مربوط به گفتار مثل رمزگذاری گفتار، بازشناسی خودکار گفتار و سیستمهای بهبود گفتار کمک میکند.
فایل ورد 21 صفحه ای