Издатели начали выкладывать в открытый доступ данные о цитировании научных работ

+7 926 604 54 63 address
В распоряжении I4OC пока не так много данных, но будем надеяться, что однажды она догонит Scopus и Web of Science.
В распоряжении I4OC пока не так много данных, но будем надеяться, что однажды она догонит Scopus и Web of Science.

Если вы учёный и хотите узнать, как часто цитируют ваши статьи, вам, скорее всего, придётся заплатить. Десятилетиями исследователи полагались на данные двух крупнейших библиографических баз — Web of Science и Scopus. Для доступа к ним нужно оформить дорогую подписку, которую могут себе позволить разве что крупные учреждения. Но скоро всё может измениться. 6 апреля официально запустилась Инициатива за открытые данные о цитировании (Initiative for Open Citations, I4OC) — проект, который объединил 29 организаций, и в их числе — крупные издатели научных журналов.

Чтобы проиллюстрировать, почему учёным нужен свободный доступ к данным о цитировании, можно вспомнить историю, которую один из активистов рассказал журналу Nature. Канадка Хизер Пивовар (Heather Piwowar) работала в Университете Дьюка (Duke University) в штате Северная Каролина. Для научной работы ей нужно было проанализировать количество цитирований 10 000 статей, но получить доступ к университетской подписке на Scopus Пивовар не могла. Так что ей пришлось заключить соглашение с Национальной научной библиотекой Канады, а для этого — получить справку о несудимости, поскольку она находилась на территории США дольше 6 месяцев. На всё это ушло несколько дней.

Данные о цитировании очень редко выкладывают в свободный доступ, их публикуют под разными лицензиями и в таком формате, который сложно обрабатывать программно. Для хранения информации о списках источников большинство издателей пользуется системой Crossref, но до недавнего времени в открытом доступе можно было найти только 1% данных этого реестра. Теперь благодаря усилиям I4OC учёные могут совершенно бесплатно использовать 40%. «Впервые в истории данные о цитировании от крупнейших издателей — данные, которые составляют саму ткань научного знания — стали доступны широкой общественности без каких-либо ограничений, связанных с авторскими правами, — объявил руководитель исследовательского отдела Wikimedia Foundation (Фонд Викимедиа) Дарио Тараборелли (Dario Taraborelli). — Наша цель — достичь 100% охвата и привлечь больше издателей и организаций, выступающих за распространение открытых данных».

Основатели Инициативы — уже упомянутый Wikimedia Foundation, издательства и журналы PLOS и eLife, репозитории DataCite и OpenCitations, а также Центр культуры и технологий (Centre for Culture and Technology) при Университете имени Кэртина (Curtin University). Среди партнёров такие крупные издатели как Springer Nature, Cambridge University Press, MIT Press и BMJ. Все они выложили данные о цитировании в открытый доступ через Crossref, и теперь любой желающий может скачать их через Crossref REST API или базу OpenCitations Corpus.

Однако пока пользоваться этим богатством не очень удобно. Записи CrossRef — это «сырые» данные, они никак не организованы и не структурированы, поэтому непрофессионалам работать с ними будет сложно. «На то, чтобы создать структурированную базу данных, в которой пользователи смогут создавать запросы и таким образом извлечь из данных максимальную пользу, уйдёт несколько лет», — говорит представитель издательства PLOS Катриона Маккаллум (Catriona MacCallum).

I4OC ещё не может тягаться со Scopus и Web of Science. «Эти базы данных на порядки крупнее того, что мы можем предложить сегодня», — говорит Тараборелли. Однако он надеется, что к проекту присоединятся новые крупные игроки, и со временем Инициатива превзойдёт коммерческие сервисы. Как пример он приводит Википедию, которая обошла по популярности многие традиционные энциклопедии.

.
Комментарии