Випускник Українського католицького університету навчив штучний інтелект імітувати спів птахів

Випускник Українського католицького університету Андрій Шевцов розробив унікальну штучно-інтелектуальну модель, здатну генерувати звуки сотень видів птахів — від співу вивільги до вокалізації страуса. Його проєкт уже привернув увагу екологів і може стати інноваційним інструментом для біоакустичного моніторингу довкілля.
Про це повідомляє dev.ua, інформує Рубрика.
Як зазначають, розробка може відіграти важливу роль у збереженні природи в Україні, особливо в умовах повномасштабної війни, яка спричинила значне знищення середовища існування диких тварин.
Зауважують, що у дипломній роботі Андрія Шевцова "Генерація вокалізації птахів за допомогою глибокого навчання"генеруються звуки сотень видів птахів.
Як заявив представник спільноти бердвотчерів Борис, є декілька основних причин, чому це варто робити.
"Як людина, що половину життя провела з біноклем у руках і диктофоном у кишені, не можу не поділитися — звуки птахів сьогодні стають справжнім інструментом науки, охорони природи й навіть мистецтва.
Науковці зможуть скористатись цими технологіями для вивчення комунікації й соціальної поведінки птахів. Виявляється, що деякі види мають цілі "словники" для залицянь і сварок", зазначив він.
Андрій зазначає, що тема досі майже не досліджувалась: більшість ШІ-моделей зосереджені на музиці або голосі людини, тоді як тваринні вокалізації, зокрема складні й різноманітні пташині звуки, залишались поза увагою.
Вивільга. Фото: vseosvita.ua
За словами автора, його мотивацією стали як науковий інтерес до нової теми, так і розуміння прикладного значення роботи:
"Врятувати завжди простіше, ніж реанімувати чи тим паче воскресити. Подібними дослідженнями займається, зокрема, Google, щоправда, на прикладі дельфінів".
У своїй дипломній роботі він поєднав кілька технічних підходів:
-
інференс готових моделей "текст-в-аудіо",
-
їхнє донавчання на пташиному матеріалі,
-
зміна архітектури під завдання,
-
тренування власної моделі з нуля.
На демонстраційній сторінці проєкту вже доступні голоси 12 видів птахів — як поширених, так і рідкісних. Система працює як Python-модуль і буде викладена у відкритий доступ. Також готується публікація наукової роботи.
Окрім екологічного моніторингу, технологія може знайти застосування в:
-
відлякуванні птахів з аеропортів і сільськогосподарських угідь,
-
зниженні стресу у птахів у реабілітаційних центрах,
-
дослідженнях поведінки та комунікації пернатих,
-
створенні освітніх додатків, інсталяцій і навіть аудіоконтенту для кіно.
"Птахи — це лише верхівка екосистеми, але й зручний індикатор її стану, адже вони активно й гучно комунікують. В умовах втрат природного середовища через бойові дії, забруднення й замінування збереження решток флори й фауни стане національним завданням.
Пасивний акустичний моніторинг дасть змогу виявляти ділянки з рідкісними видами для охорони, фіксувати порушення і реагувати на детонації в ізольованих районах, знижуючи ризики для людей", — зазначає Андрій Шевцов.
У перспективі технологію планують адаптувати для симуляції звукових ландшафтів, що дозволить моделювати наслідки зміни клімату чи міграції видів.
Наразі автор не має комерційних планів щодо проєкту, проте активно комунікує з екологами та фахівцями з машинного навчання для практичного впровадження своєї розробки.
Послухати згенеровані звуки можна на демосторінці.