Источник: depositphotos.com

Собрать метагеном за 24 часа: результаты первой олимпиады по биоинформатике Bioinformatics Contest 2017

В конце февраля завершилась первая олимпиада по биоинформатике Bioinformatics Contest 2017. Соревнования были организованы Институтом биоинформатики, а все задачи готовили выпускники и студенты Университета ИТМО. На протяжении двух недель три тысячи программистов и специалистов по биоинформатике со всего мира пытались пробиться в финальный раунд, где всего за 24 часа им предстояло заново собрать метагеном, найти неизвестную вставку в модифицированной ДНК, а также многое другое. О результатах соревнований и о том, почему ответы на некоторые задачи изначально не знало на 100% даже само жюри, нам рассказал один из координаторов олимпиады, аспирант Университета ИТМО Виталий Аксенов.

Олимпиада проходила на популярной образовательной платформе Stepik и была разбита на два этапа: квалификационный раунд, который продолжался одну неделю, и финал. Чтобы попасть на завершающий этап испытаний, участникам предстояло набрать 600 очков, решив задачи двух типов. Первые предполагали точные ответы, и для их решения необходимо было написать код с помощью одного из поддерживаемых языков программирования. Во втором же случае программистам и специалистам по биоинформатике следовало найти наиболее приемлемое решение тестов и загрузить его в систему.

Как отмечает Виталий Аксенов, Bioinformatics Contest 2017 можно считать первой олимпиадой по биоинформатике в мире. Уникален как сам формат соревнований, так и содержание задач.

«До этого момента олимпиад по биоинформатике в мире не проводилось. Существовали просто архивы задач (например, архив имеется на платформе для обучения биоинформатике Rosalind). Но дело в том, что на Rosalind представлены только точные задачи, то есть те, в которых требуется найти конкретный ответ. Мы же еще на первом этапе подготовки к соревнованиям решили расширить формат. После того, как Николай Вяххи из Института биоинформатики, зная, что у нас на кафедре компьютерных технологий организовываются олимпиады по программированию, предложил нам сделать соревнования по биоинформатике, мы обсудили ситуацию и поняли, что биоинформатика — предмет неточный. Как, например, заранее определить на 100%, что человек болен или не болен раком? Рано или поздно мы к этому придем, но на данном этапе люди не знают таких способов. Поэтому необходимо было придумать задачи неточные, где непонятен алгоритм, нет точных, заранее известных решений, чтобы участники могли лучше ответить на поставленный вопрос, насколько это только возможно. Пусть даже на 75%, а не 100%», — рассказывает координатор Bioinformatics Contest 2017.

Поврежденная ДНК. Источник: anh-usa.org
Поврежденная ДНК. Источник: anh-usa.org

Помимо точных задач, в квалификационном раунде и в финале участникам предстояло решить в общей сложности четыре задачи с расширенным ответом. Это, например, «задача на ГМО», где программистам и специалистам по биоинформатике предлагалось, имея на руках последовательность уже модифицированной ДНК какого-либо растения или существа, с помощью алгоритмов, специализированных библиотек и фреймворков определить, где именно спрятан измененный участок. Или же путем общения с системой им следовало понять, какими белками управляются реакции в клетке. Авторами задач стали выпускники и студенты Университета ИТМО — Алексей Сергушичев, Виталий Демьянюк, Анна Малова и Артем Васильев, которые занимались или занимаются биоинформатикой, а также Виталий Аксенов, Илья Збань и Григорий Шовкопляс, выступающие координаторами различных интернет-олимпиад по информатике.

На решение задач в финале участникам было дано всего 24 часа. Они могли пользоваться всеми инструментами специалистов по биоинформатике — библиотеками и специальными фреймворками, единственное условие: не просить помощи у других. Как отмечает Виталий Аксенов, уже первые соревнования такого формата приобрели международный охват: в олимпиаде приняли участие программисты и специалисты по биоинформатике из России, США, Европы, Китая и Индии — всего несколько тысяч человек.

В финал пробились 379 человек из 3000 зарегистрировавшихся на этапе квалификации. А попробовать свои силы на заключительном отрезке соревнований смогли лишь 282 человека. Попасть в финальный зачет удалось 177 участникам, уже среди них жюри определило первую двадцатку. Победителем соревнований с результатом 7218 очков (95%) стал двукратный чемпион ACM ICPC, студент Университета ИТМО Геннадий Короткевич, опередив ближайшего соперника из Нидерландов Тимона Книгге почти на 300 очков.

Университет ИТМО. Геннадий Короткевич
Университет ИТМО. Геннадий Короткевич

«В первой пятерке победителей — известные в олимпиадной среде программисты. Но в целом в соревнованиях принимали участие как типично олимпиадные программисты, так и специалисты-биоинформатики, аспиранты, уже состоявшиеся ученые, — комментирует координатор Bioinformatics Contest 2017. — На первом этапе регистрировались даже „чистые“ биологи, которые не сильны в программировании, а также начинающие специалисты, которым, возможно, квалификационный раунд показался несколько сложнее, чем они ожидали. Из 3000 зарегистрировавшихся на начальном этапе квалификации хотя бы одно задание смогли выполнить чуть более 800 человек, а в финале смогли проявить себя менее половины».

В следующем году организаторы олимпиады планируют продолжить соревнования, однако, как отмечает Виталий Аксенов, в будущем необходимо расширять формат задач и добавлять новые, в том числе более практические задания, которые смогут предоставить непосредственно институты по биоинформатике и компании, занимающиеся соответствующими расчетами на практике.

Отметим, что соревнования по биоинформатике в России — явление относительно молодое. Два года назад в Москве был проведен первый хакатон, а в этом году подобные соревнования состоялись и в Петербурге, на площадке Университета ИТМО: первый хакатон по биоинформатике BioHack, продолжавшийся 48 часов и собравший 24 команды, завершился в минувшее воскресенье.

Редакция новостного портала
Архив по годам:
Пресс-служба