Вплив фазових спотворень на якість мовлення та музики

Лабораторія акустичної експертизи та корекції
Проект: “Оцінювання впливу фазових спотворень на якість мовлення та музики”

Куратори проекту:

аспірант Ігор Котвицький (igorktvzk@gmail.com)
проф. Аркадій Продеус (aprodeus@gmail.com)

Активні учасники проекту: студенти 3-го курсу

Актуальність та мета проекту. Як це не дивно, але досі не можна вважати розв’язаною до кінця задачу оцінювання впливу фазових спотворень на якість мовлення та музики. Як наслідок, все ще часто можна почути, що фазові спотворення наше вухо не сприймає. Це зовсім не так. Правда в тім, що нашу вухо не сприймає малі фазові спотворення, але значні фазові спотворення є досить відчутними. Тому питання правильно ставити так: де границя між малими й припустимими та значними й неприпустимими фазовими спотвореннями? Пошук відповіді на це питання і є метою даного проекту. А актуальність проекту полягає в можливості краще обгрунтувати вимоги до електроакустичних систем, що нині використовуються широким загалом, від державних телерадіокомпаній – й до кожного з користувачів побутової електроакустичної техніки.

Перспективи проекту:

Даний проект дозволяє одержати реальні граничні значення дозволених фазових спотворень, котрі ще практично не сприймаються слуховою системою людини. Ці значення потрібні фахівцям-зв’язківцям, архітекторам, будівельникам, звукорежисерам, музикантам та інженерам звукозапису, оскільки дозволяють встановити зв’язок між об’єктивними та суб’єктивними показниками для реальних мовленнєвих та музичних сигналів. Крім того, даний проект, що виконується у формі поєднання практичних занять та самостійної роботи студентів, дає змогу студентам познайомитись із сучасними комп’ютерними методиками суб’єктивного та об’єктивного оцінювання якості спотворених акустичних сигналів, й таким чином допомагає розвинути в собі риси інженера-дослідника. Куратори проекту впевнені, що результати його виконання будуть цікавими навіть спеціалістам високого рівня, оскільки, повторюємо, чіткої та обгрунтованої відповіді в науковій літературі на поставлене питання знайти практично неможливо.

Технічне завдання:

1. Постановка завдання. Оцінювання якості спотворених сигналів здійснюється суб’єктивно, шляхом порівняння, із застосуванням комп’ютерної програми, звучання спотвореного сигналу із звучанням чистого сигналу. Оцінку виставляють за 5-бальною шкалою (шкала DMOS):

Шкала суб’єктивного оцінювання DMOS
ЯКІСТЬ СИГНАЛУ ОЦІНКА
Спотворення не чутні 5
Спотворення чутні, але не турбують 4
Спотворення турбують, але не сильно 3
Спотворення турбують 2
Спотворення сильно турбують 1

Важливо пам’ятати, що припустимими є дробові значення оцінки (наприклад, 3.7 – три цілих та сім десятих). Це особливо важливо при оцінюванні дуже слабких спотворень, що є типовими для музики.

Ще одна важлива деталь: прослуховування сигналів бажано виконувати за допомогою навушників – це підвищить достовірність одержаних результатів.

2. Сигнали, що оцінюються, та відповідні комп’ютерні програми. Оцінюється якість 2-х різновидів сигналів: мовленнєвих та музичних.

Комп’ютерні програми для аналізу мовленнєвих сигналів та самі сигнали можна вивантажити тут (zip-архів).Після розархівації треба запустити спочатку програму

expertiza_speech_nonlin.m   – для прослуховування звукових файлів із спотворенням типу ФЧХ1

Потім, після одержання результатів у вигляді mat-файлу та рисунків, слід запустити програму

expertiza_speech_non_lin.m   – для прослуховування звукових файлів із спотворенням типу ФЧХ2

Музичні сигнали та відповідні комп’ютерні програми можна вивантажити тут (zip-архів). Після розархівації треба запустити спочатку програму

expertiza_music_nonlin.m   – для прослуховування звукових файлів із спотворенням типу ФЧХ1

Потім, після одержання результатів у вигляді mat-файлу та рисунків, слід запустити програму

expertiza_music_non_lin.m   – для прослуховування звукових файлів із спотворенням типу ФЧХ2

3. Передача одержаних результатів кураторам проекту. Після одержання результатів оцінювання їх слід передати кураторам проекту – на заняттях (за допомогою флешки) або через e-mail.

При аналізі мовленнєвих сигналів студент с прізвищем Maksimov повинен одержати 2 mat-файли:

speech_nonlin_Maksimov.mat           – результати для ФЧХ1
speech_non_lin_Maksimov.mat           – результати для ФЧХ2

Крім цього, результатом виконання кожної програми є 3 рисунки, що дозволяють контролювати правильність виконання завдання. Ці рисунки бажано зберегти на диску із розширенням bmp під аналогічними іменами та також передати кураторам проекту (підкреслимо: файли-рисунки передавати кураторам бажано, але не обов’язково, оскільки правльність результатів куратори все одно будуть перевіряти по вмісту файлу із розширенням mat).

Наприклад, для ФЧХ1 це будуть файли:

speech_nonlin_Maksimov_ris1.bmp
speech_nonlin_Maksimov_ris2.bmp
speech_nonlin_Maksimov_ris3.bmp,

а для ФЧХ2 це будуть файли:

speech_non_lin_Maksimov_ris1.bmp
speech_non_lin_Maksimov_ris2.bmp
speech_non_lin_Maksimov_ris3.bmp

Аналогічно зберігаються результати аналізу музики – відмінність лише в тім, що в назвах файлів замість слова speech буде слово music.

Етапи виконання проекту:

Старт проекту (видача Технічного завдання)
Передача результатів кураторам проекту
Кінець проекту (оформлення звіту про одержані результати)

Результати виконання проекту:

1) результати роботи за даним проектом надіслали 32 студенти (середній вік 22 роки); із них 2 студенти виконали роботу недостатньо сумлінно, тому одержані ними результати не можуть вважатися достовірними; таким чином, одержано 30 файлів кожної із 4-х категорій: мовлення-ФЧХ1, мовлення-ФЧХ2, музика-ФЧХ1, музика-ФЧХ2.

2) крім того, свої результати надали також: 1 аспірант кафедри (вік 24 роки) та 1 викладач кафедри (вік 67 років);

3) за результатами обробки одержаних даних побудовано графіки залежності усереднених суб’єктивних оцінок якості звучання сигналів (шкала DMOS) від ступеню фазових спотворень (максимальна різниця часу затримки гармонічних компонент сигналу на низьких та високих частотах діапазону 100-4000 Гц) – ці графіки наводимо нижче;

4) крім того, побудовано карти відповідності результатів об’єктивного та суб’єктивного оцінювання якості спотворених сигналів – ці та інші результати наведено в публікації журналу Electronics and Communications.

   

Наведені графіки, по-перше, наочно демонструють, що слухова система людини є більш чутливою до фазових спотворень мовлення, ніж музики. А по-друге, ці графіки є уточненням результатів, наведених в роботах [2,3].

Література:

1. Blauert J. Group delay distortions in electroacoustical systems / Blauert J. // J. Acoust. Soc. Am. – Vol.63, No.5. – 1978. – P. 1478-1483.
2. Продеус А.Н., Пилипенко К.П., Калюжный А.Я., Бартенев С.Г. Оценка влияния нелинейности фазовой частотной характеристики системы на качество речевых сигналов / Электроника и связь, т.20, №2(85), 2015. – С.33-40.
3.  Продеус А.Н., Богданова Н.В., Оценка влияния нелинейности фазовой частотной характеристики тракта на качество музыкальных сигналов. Electronics and Communications, Vol. 20, No. 4(87), 2015. – P. 29-35
4.  Котвицкий И.В., Продеус А.Н. Объективное и субъективное оценивание качества речевых и музыкальных сигналов, подвергнутых фазовым искажениям. – ISSN 1811-4512. Electronics and Communications, 2016, Vol.21, No.2(91). – P.25-31