Музыка нулей и единиц: аспирант Университета ИТМО упростит работу звукорежиссерам. Источник: depositphotos.com

Музыка нулей и единиц: аспирант Университета ИТМО упростит работу саунд-дизайнеров

Компьютер перестал быть тривиальной печатной машинкой или монтажной студией для тех, кто сочиняет музыку: искусственный интеллект берет на себя все больше функций поэтов, музыкантов и режиссеров. Сотрудник международной научной лаборатории «Интеллектуальные методы обработки информации и семантические технологии», аспирант Евгений Черный работает в Университете ИТМО над развитием принципов вычислительной креативности — он разрабатывает онтологическую систему для работы со звуковыми библиотеками и автоматического создания звуков.

Аспирант кафедры прикладной информатики и математики Университета ИТМО Евгений Черный рассказывает, что в последнее время в исследованиях искусственного интеллекта выделяется область так называемой вычислительной креативности. В отличие от машинного обучения, которое используется в основном для решения бизнес-задач, принципы computational creativity помогают выполнять задачи, связанные с творчеством, и призваны не заменить человека, а дать ему новые инструменты для самовыражения.

«Вопрос, что такое креативность, носит скорее философский характер — вы вряд ли сможете найти единое определение в профессиональной литературе, равно как и определение для интеллекта. Философ Маршалл Маклюэн писал о том, что палка-копалка, которую взял человек, стала продолжением его руки, добавила ему новые возможности. Вычислительная креативность — это та же палка, которая расширяет творческий инструментарий», — объясняет аспирант.

В Университете ИТМО Евгений Черный работает над внедрением принципов computational creativity в области саунд-дизайна. Музыканты и звукорежиссеры, которые используют библиотеки сэмплов — предзаписанных звуковых инструментов и эффектов — часто сталкиваются с трудностями, связанными с метаданными. Ключевые слова могут недостаточно точно описывать содержание звуковых файлов, а некоторые их особенности могут быть вовсе не указаны в описании. Библиотека сэмплов может занимать на диске несколько терабайт, а за профессиональные программы для ведения каталога придется заплатить внушительную сумму, при том что специализированный софт многие проблемы решить не может. Например, основной трудностью поиска звуков является огромный размер поисковой выдачи, что существенно замедляет творческий процесс. Кроме того, используемые метаданные представляют собой простой текст, вводимый вручную для каждого добавляемого звука, поэтому в разных библиотеках могут использоваться разные написания и синонимы одного концепта (armor — armour — chainmail), и дизайнеру приходится вводить их отдельно.

Университет ИТМО. Евгений Черный
Университет ИТМО. Евгений Черный

«Мой проект связан с разработкой онтологии, которая описывает термины и концепции в предметной области саунд-дизайна. К примеру, один сэмпл может содержать музыкальные инструменты, другой — нет, этот звук можно описать как „темный“, другой как „пустой“. Эти слова и термины я извлекаю из существующих библиотек, структурирую, формирую иерархию и расставляю связи, чтобы объединить поиск семантическими связями. К примеру, пользователь ищет звук по запросу „машина“, онтологическая надстройка „понимает“, что ему нужен звук хлопнувшей двери, и мы можем помочь сузить поиск», — рассказывает Евгений Черный.

Похожий принцип реализовал Google с помощью технологии Knowlege Graph, поясняет аспирант: поисковая система выдает дополнительные сведения о том, что ищет пользователь, непосредственно в результатах выдачи — например, рейтинг фильма, даты основания населенных пунктов, словарные определения терминов и так далее. Итогом своей работы Евгений Черный видит создание программы, которая будет выполнять функции онтологического каталога, а также будет по запросу синтезировать звук.

«Когда я закончу работу, связанную с разработкой онтологии, я хочу ввести элементы computational creativity. Допустим, саунд-дизайнеру нужен „пустой“ звук с „водяным“ оттенком, он вводит описание вручную или выбирает нужные параметры в конструкторе, и система предлагает базовые скетчи, которые можно обрабатывать дальше. Это автоматизирует рутину и поможет в поиске нужного звучания, — говорит ученый. — С проектом связано много интересных задач: можно обучить нейросеть распознавать звуки, используя онтологические термины, есть задачи, связанные с синтезом. Если кто-то из бакалавров или магистров Университета ИТМО захочет заняться похожей темой, мы будем рады видеть их в лаборатории „Интеллектуальные методы обработки информации и семантические технологии“».

Добавим, что Евгений Черный обучается в Университете ИТМО по программе двойной аспирантуры, которая реализуется совместно с Академией Або (Åbo Akademi University, Турку, Финляндия). Финансирование ведется за счет стипендии Президента Р Ф на обучение за рубежом.

Редакция новостного портала
Архив по годам:
Пресс-служба