Как базы данных помогают быстрее находить нужные данные для научных исследований

В Университете ИТМО состоялся открытый семинар Springer Nature, организованный Центром научной коммуникации, на котором представители компании рассказали об онлайн-ресурсах для упрощения исследовательской работы, то есть о специализированных базах данных Springer Materials и Springer Nano. Спикеры пояснили, как использование этих инструментов сокращает время на поиск необходимых данных и как эти базы данных решают рутинные проблемы ученых.

Зачем использовать базы данных

Российские ученые больше всего публикуются в журналах издательства Springer Nature: семь из десяти наиболее используемых для публикаций журналов принадлежат издательству. При этом публикационная активность российских исследователей с 2010 года растет на 4% ежегодно. Этот показатель выше, чем у западной Европы. Больше всего научных статей у российских ученых выходит по физике и химии, а также в области клинической медицины, естественных наук, геологии.

Растет количество публикаций в области нанотехнологий. Если в 2000 году российские ученые публиковали не более 1000 статей по этой тематике, то сейчас это примерно 5,5 тысяч. При этом больше публикуют только иранские, китайские, индийские ученые и исследователи из Южной Кореи. Научная активность в этой сфере оправдывается статистикой о том, что объемы использования нанотехнологий в индустрии увеличиваются более чем на 18% каждый год. Сегодня существует более 8000 продуктов, для производства которых была задействована хотя бы одна нанотехнология. Новые решения в этой области разрабатывают почти в двух тысячах компаний в 53 странах.

Springer Nano. Источник: nano.nature.com
Springer Nano. Источник: nano.nature.com

Использование баз данных, где научные статьи не только собраны в одном месте, но и отсортированы по определенным критериям, может существенно упростить работу ученого, уверены в Springer Nature. На семинаре представители компании рассказали о двух базах: Springer Materials и Springer Nano.

«Значимость этих баз в том, что ученый может на одном ресурсе посмотреть необходимую по его проблеме литературу, сформулировать гипотезу, проанализировать относящуюся к ней информацию, а также интерпретировать ее для своей работы. У наших баз данных есть продвинутые поисковые механизмы, то есть фильтры, благодаря которым можно заранее сортировать поисковую выдачу», – отметил Майкл Лехнер, вице-президент по продажам баз данных Springer Nature.

Для составления баз данных Springer Nature используется машинное обучение, которое сортирует тексты статей по параметрам и онтологиям. Также в экспертном отборе материалов участвуют рецензенты издания, то есть ученые. Поисковики баз позволяют ученым сэкономить время на сборе информации, чтобы сфокусироваться на экспериментах или решении фундаментальных вопросов.

Какие проблемы ученые не могут решить другими онлайн-инструментами

Представители Springer Nature проводили опрос среди ученых-нанотехнологов о том, с какими проблемами они сталкиваются при пользовании, например, базами данных Google Scholar или Web of Science. Наиболее болезненными оказались пять проблем:

  1. Огромное количество несоответствующих тематике запроса результатов в поисковой выдаче.
  2. Чтобы проверить, содержится ли в статье необходимая информация, нужно прочитать всю статью полностью, даже если из нее полезным окажется только один абзац.
  3. Количество публикаций растет каждый год, но все они разбросаны по разным журналам и источникам: ученым не хватает трансфера знаний из разных областей исследования нанотехнологий.
  4. Не существует списка различных наноматериалов и устройств на их основе, в котором были бы описаны свойства материалов и их специфичные приложения. При этом характеристики и физические свойства наноматериалов зависят от их размера и формы.
  5. В статьях очень много объема занимает описание методов подготовки к самому научному исследованию, что далеко не всегда интересно читать ученому, который пишет статью по смежной теме.

Эти проблемы призваны решить базы данных Springer Materials и Springer Nano, о которых подробно рассказал Амир Гейзи, представитель подразделения Nature Research и один из создателей Springer Nano.

Springer Nano

Сейчас в базе данных содержится более 630 тысяч статей в области нанотехнологий и более 240 тысяч описаний различных наноматериалов. Поиск на платформе начинается с ввода ключевых слов, например, «электрическая проводимость». После этого в списке выпадают статьи, в заголовках которых есть это словосочетание. Однако пользователь может конкретизировать условия поиска, выбрав, например, статьи из конкретных журналов, с определенным уровнем цитирования. То, насколько статья подходит ученому под его проблему, можно также определить из других ключевых слов, которые встречаются в статье и которые можно посмотреть, не открывая саму статью. Также можно сортировать статьи по типу наноматериала.

Кроме того, в базе данных сортированы сами наноматериалы. Если взять те же самые золотые наночастицы, то пользователь может просмотреть их свойства в зависимости от размера и формы, а также связанные с этими материалами статьи, список их приложений, биологические эффекты. В той же подбазе можно прочитать о различных физических методиках получения наноматериалов и тут же увидеть связанные с этим научные статьи. При этом можно отсортировать поиск так, чтобы сначала он выдавал методы получения наноматериалов, которые наиболее используются учеными, то есть которые нашли много положительных отзывов. В целом, методы сортировки поисковой выдачи работают на всех этапах работы с платформой.

Springer Materials

Для ученых в области естественных наук более интересна будет база данных Springer Materials – инструмент, с помощью которого исследователи смогут определять свойства различных материалов, изучать их структуры, сравнивать с другими материалами, а также, конечно, искать нужные материалы для проведения экспериментов и фундаментальных исследований. База сформирована из 290 тысяч различных материалов. Обновления платформы производятся в ручном режиме учеными-рецензентами научных статей в области естественных наук, которые поступают в журналы Springer Nature.

Особенность базы в том, что поиск можно вести как по элементу, так и по его структуре. В первом случае ученый пишет название элемента с ключевым словом в зависимости от проблематики. Поисковые результаты также можно отфильтровать. Во втором случае пользователь выбирает из шаблонов структуру соединения, в случае необходимости, дорисовывает схему, и получает все элементы, в которых есть похожая структура. Также можно добавлять различные элементы структуры, чтобы подробнее узнать о том, как они влияют на свойства материала. И в первом, и во втором случаях исследователь видит связанные с этим соединением научные статьи, кроме того, он может сравнить разные материалы между собой.

Таким образом, время поиска информации с помощью этих баз данных сокращается в несколько раз по сравнению с другими базами, подчеркнул Амир Гейзи. Структурированная информация позволяет быстрее понимать, какие статьи релевантны нуждам ученого, а какие нет.

Редакция новостного портала
Архив по годам:
Пресс-служба