Штучний інтелект навчили розпізнавати мову серед шумів

вівторок, 13 червень 2017, 15:47

Штучний інтелект тепер вміє самостійно виділяти мову однієї людини із загального потоку різних звуків і шумів.

Технологія Deep Clustering допоможе відфільтрувати мову від шуму. Фото: ukrainianwall.com.

Віртуальні асистенти і системи розпізнавання голосу досить добре навчилися «розуміти» те, що їм говорить людина, і виконувати її команди. Але для коректної роботи тих же Siri і Cortana сторонній шум може стати великою проблемою. Справитися з цією технічною недоробкою можуть допомогти експерти компанії Mitsubishi Electric, які представили нову технологію виділення мови однієї людини із загального шуму, пишуть Патріоти України з посиланням на Нескучные новости.

Технологія японської компанії отримала назву Deep Clustering, функціонування якої побудовано на принципах машинного вивчення. Штучний інтелект для початку навчився самостійно виділяти мову однієї людини із загального потоку різних звуків і шумів. Нейронна мережа розділяє вхідні звукові дані на різні елементи і аналізує кожен окремо, після чого вже може обробляти голос людини. Подібна робота спостерігається і при «приєднання» двох і більше співрозмовників.

В ході демонстрації технології японської компанії система змогла успішно розділити мову двох людей, які говорять на один мікрофон одне і те ж речення на різних мовах. Вся обробка проводилася в режимі реального часу, а затримка не перевищувала трьох секунд. Точність розпізнавання склала 90 відсотків, а коли в мікрофон почали говорити три людини, відсоток «попадання» впав до 80, що теж є хорошим результатом.

Як розповідають автори проекту Ентоні Ветро і Йохеі Оката: "На відміну від виділення мови з фонових шумів, виділення мови однієї людини з «голосового» шуму людей, що говорять одночасно, є складним завданням, так як у звуків голосу різних людей є маса особливостей.

У більшості систем завдання поділу голосу вирішується за допомогою установки двох або більшої кількості мікрофонів, але в разі використання навіть одного мікрофона, з завданням поділу голосу може впоратися тільки штучний інтелект. Використовувати цю технологію можна там, де потрібна висока точність розпізнавання голосових повідомлень. Наприклад, в системах голосового керування автомобілями, ліфтами, побутовими та іншими електронними пристроями".

Неприємний "сюрприз": ТОП-5 уживаних авто, які витрачають найбільше бензину

понеділок, 8 грудень 2025, 19:25

У 2025 році ціни на пальне зросли настільки, що економічність стала одним із ключових критеріїв під час вибору автомобіля. Та на вторинному ринку досі є моделі, які у міському режимі реально спалюють від 12 до 20+ літрів бензину. Редакція SUVNews зібра...

Українців попередили про здорожчання продуктів до Різдва: Ось на що ціни підскочать найбільше

понеділок, 8 грудень 2025, 18:44

В Україні перед Різдвом найбільше подорожчають яйця, свинина, делікатеси та частина молочної продукції. Зокрема, ціни підскочать на консерви та інгрідієнти до святкових страв. Пік зростання вартості очікується після 20 грудня, коли попит досягне максим...

Останні

По теме

Штучний інтелект навчили розпізнавати мову серед шумів

Читайте також на сайті:

Неприємний "сюрприз": ТОП-5 уживаних авто, які витрачають найбільше бензину

Українців попередили про здорожчання продуктів до Різдва: Ось на що ціни підскочать найбільше

Патріоти в FaceBook