У США створили навушники з «розумним» шумозаглушенням усього зайвого

Щоб вони працювали, треба пильно поглянути на бажане джерело звуку.

Фахівці Вашингтонського університету (UW) в Сіетлі створили навушники з шумозаглушенням на основі штучного інтелекту (ШІ). Про це повідомили на університетському сайті.

Система отримала назву Target Speech Hearing («цільовий мовленнєвий слух»): користувачеві в навушниках необхідно натиснути спеціальну кнопку на девайсі та дивитися на людину, яка розмовляє, протягом трьох-п’яти секунд, щоб «зареєструвати» її. Після цього гаджет пригнічує всі інші звуки в навколишньому середовищі та відтворює тільки голос зареєстрованого мовця в реальному часі, навіть коли слухач переміщується в галасливих місцях і більше не дивиться на того, кого прагне чути.

AI headphones filter out noise so you hear one voice in a crowd

Гарнітура здатна виділити основний голос, збільшити його гучність і прибрати всі сторонні шуми. Це стане в пригоді для спілкування в умовах зовнішнього шуму – на жвавій вулиці, в метро, на будівельному майданчику, в нічному клубі, поруч із водоспадом або іншим джерелом гучного звуку.

Як пояснили в університеті, сучасні навушники з шумозаглушенням дуже добре справляються зі створенням слухового чистого аркуша. Але стирання обраних звуків є складним завданням. Звичайні навушники з шумозаглушенням зменшують небажані звуки, як-от гул двигуна автобуса, але, оскільки технологія повністю пригнічує певні частоти, вона також може пригнічувати звуки, які треба чути.

Наприклад, остання версія Apple AirPods Pro автоматично регулює рівні звуку для користувачів, визначаючи, коли вони розмовляють, але користувач практично не контролює, кого слухати та коли це відбувається.

Прототип навушників із шумозаглушенням дає змогу обирати, які фонові шуми слід заглушити, даючи змогу спрямувати своєрідний «аудіопрожектор» на один конкретний голос, щоб зосередитися на ньому.

Звукові хвилі від голосу мовця повинні одночасно досягати мікрофонів на обох сторонах гарнітури. Навушники відправляють цей сигнал на бортовий вбудований комп’ютер, де програмне забезпечення машинного навчання вивчає голосові зразки. Система фіксує голос мовця і продовжує відтворювати його слухачеві, навіть коли пара переміщується. Здатність системи концентруватися на зареєстрованому голосі поліпшується в міру того, як мовець продовжує говорити, надаючи системі більше навчальних даних.

Команда протестувала свою систему на 21 добровольці, які в середньому оцінили чіткість голосу зареєстрованого мовця майже вдвічі вищою, ніж нефільтрований звук.

Більше публікацій за темою