ArXiv.org

arXiv
Изображение логотипа
URL arxiv.org
Коммерческий Нет
Тип сайта Наука
Язык(-и) Английский
Владелец Корнеллский университет
Автор Пол Гинспарг
Начало работы 14 августа 1991; 30 лет назад (1991-08-14)
Рейтинг Alexa 2075[1]
Логотип Викисклада Медиафайлы на Викискладе

arXiv.org (произносится [архи́в], X читается как греческая буква «Хи») — бесплатный электронный архив научных статей и препринтов по физике, математике, астрономии, информатике, биологии, электротехнике, статистике, финансовой математике и экономике. Перед публикацией статьи не рецензируются, однако проходят первичную проверку модераторов[2].

Портал был создан физиком Полом Гинспаргом в 1991 году и был назван LANL (или xxx.lanl.gov) в честь Лос-Аламосской национальной лаборатории, в которой исследователь в то время работал. В 1998 году сайт был переименован в arXiv.org. Когда в 2001-м Гинспарг перешёл работать на факультет физики Корнеллского университета и перевёз сервера с собой, а местная университетская библиотека[en] взяла на себя обязательства по администрированию и финансированию arXiv[3].

Согласно данным портала, по состоянию на май 2021 года на сайт было загружено 1,88 млн работ[4].

История

Контекст

Примерно с середины XX века в научном сообществе появилась неформальная практика обмена препринтами — ещё не опубликованными отчётами об экспериментах или черновыми версиями статей. Главной причиной этому послужил слишком долгий процесс публикации в журналах, который мог достигать несколько лет с момента подачи работы. При этом в отдельных отраслях науки обмен результатами новейших исследований представлял для учёных критическую важность ввиду опасности дублирования данных[5] — поэтому всё больше исследователей делились своими препринтами с коллегами одновременно с подачей статьи в журнал[6]. Помимо этого, подобная система коммуникации позволяла закреплять первенство открытия — для этого научные работники отправляли результаты успешных экспериментов по почте в другие исследовательские центры, а также отдельно подписавшимся на рассылку учёным. Распространение препринтов позволяло получить комментарии от коллег перед отправкой на рецензию в журнал, а в некоторых случаях исследователи делились результатами экспериментов со статистически незначимыми результатами, которые все равно представляли научную ценность[5][7][8][9].

В 1970—1980-е годы наибо́льшую роль в распространении препринтов сыграли учёные, работающие в области физики высоких энергий, — этому способствовало создание Европейской организации по ядерным исследованиям в 1954 году, а также характерные для этой отрасли большие массивы данных и скорость их создания[10]. В 1967 году в Стэнфордском университете началась работа над созданием компьютерной базы данных, которая смогла бы обрабатывать неограниченное количество библиографических записей. Для тестирования был использован каталог препринтов, собираемый Национальной ускорительной лабораторией SLAC. На его основе была создана SPIERS (впоследствии переименованная в Stanford Public Information Retrieval System) — база данных работ в области физики высоких энергий, содержащая библиографические данные о получаемых лабораторией препринтах[11].

Сложившаяся система рассылки препринтов позволяла авторам предотвращать ненужное дублирование исследований и при этом продвигаться вверх по карьерной лестнице, поскольку распространяемые отчёты впоследствии публиковались в рецензируемых журналах[9]. При этом бумажные препринты по-прежнему обладали рядом существенных недостатков, главным из которых было ограниченное распространение — только определённые научные учреждения были включены в рассылку, в то время как большинство учреждений в развивающихся странах были исключены из обмена. Одновременно с этим препринты по-прежнему не решали все споры о приоритете исследователей над открытиями[5][7][8].

Создание

Создатель портала Пол Гинспарг в 2006 году

Период конца 1980-х годов характеризовался массовым распространением компьютеров и новых способов электронной коммуникации. На замену рассылки бумажных версий препринтов пришла новая система — аннотации отчётов посылались физикам по электронной почте, после чего исследователи искали интересующую их статью в базе данных SPIERS и самостоятельно запрашивали копию у авторов. Работы по-прежнему высылались по обычной почте, и могло пройти до нескольких месяцев прежде чем запрашиваемый препринт попадал в руки получателя. Для решения этой проблемы исследователи начали использовать систему компьютерной вёрстки TeX, позволяющую легко работать с математическими формулами и генерировать электронные документы. Использование TeX позволило перейти от бумажного распространения препринтов и отправлять файлы по e-mail[11].

К 1990 году исследователь в области теории струн Джоан Кон из Принстонского Института перспективных исследований начал распространять электронные препринты по физике через электронный список рассылок, насчитывавший около ста человек. Кон и другой физик из Лос-Аламосской национальной лаборатории в Нью-Мексико Пол Гинспарг вместе посещали семинар по теории струн в Центре теоретической физики Аспена летом 1991 года[en][2]. Во время семинара Гинспарг услышал жалобы других коллег о быстрой заполняемости дискового хранилища из-за слишком большого количества присылаемых через рассылку препринтов (по 40-100 страниц) и понял необходимость централизации и систематизирования системы обмена[6][12][13][8].

В этом же году Гинспарг создал LANL или xxx.lanl.gov — почтовый FTP-сервер или электронную доску объявлений, рассчитанную на размещение примерно 100 заявок в год от исследователей, работающих в сфере физики элементарных частиц высоких энергий[14][7]. Работы передавались через протокол передачи данных по сети. LANL являлось сокращением от Лос-Аламосской национальной лаборатории, в которой Гинспарг на тот момент работал[15]. Только в течение первого полугодия с момента существования к серверу присоединилось более 400 пользователей[16][10].

LANL появился как способ автоматизации уже существующих практик по обмену препринтами[17]. Гинспарг написал программное обеспечение, позволяющее загружать работы на центральный сервер, осуществлять поиск и скачивать. Доступ к хранилищу выполнялся через электронную почту. Физики могли подавать собственные препринты или сканировать уже имеющиеся в системе файлы, а также читать аннотации к работам и впоследствии запрашивать полный текст. Также была внедрена возможность подписки на обновления в выбранных категориях, просмотр названий и аннотации новых работ. Несмотря на то что LANL был изначально создан для организации ранее бессистемной и хаотичной системы распространения препринтов, вскоре портал стал основной площадкой для обмена мнениями и дискуссиями о текущих исследованиях в области физики. Согласно Гинспаргу, популярность сайта частично объяснялось отсутствием инициативы со стороны научных журналов по переходу к онлайн-форматам — LANL появился задолго до первых сайтов академических изданий[18][13]. С появлением всемирной паутины LANL стал известен по URL-адресу xxx.lanl.gov[7]. Создание подобной системы стало возможно благодаря распространению недорогих дисковых накопителей — чтобы хранить статью среднего размера требовалось всего 50 килобайт пространства. Гигабайтный диск в то время вмещал около 20 000 статей, средняя стоимость хранения статьи составляла 10 центов[6].

Спустя полтора года после создания на портале зарегистрировалось 2000 пользователей. В феврале 1992 года были добавлены восемь других разделов физики: от экспериментальной ядерной физики до нелинейной динамики и материаловедения. Уже в 1993 году на хранилище было подписано больше 8000 человек, ежемесячное количество новых препринтов составляло 600[6]. В 2003 году на портал был добавлен раздел биологии[19][20].

В 1997 году в результате совместного сотрудничества LANL и Астрофизической информационной системы НАСА (ADS) был создан индекс электронных печатных изданий по астрофизике, делающий их доступными через службу рефератов ADS[16].

В конце 1998 года Гинспарг переименовал xxx.lanl.gov в arXiv[16] — к этому моменту портал в общей сложности обработал около 500 000 заявок[21] и рассматривался большинством учёных-физиков как основное место для обмена новейшими результатами исследований[6].

В 2001 году Гинспарг перешёл работать на факультет физики Корнеллского университета и перевёз сервера arXiv’а с собой, а в 2011 году исследователь полностью передал права на администрирование arXiv’а университетской библиотеке[en][3]. Исследователь остался в научно-консультативном совете, а также продолжил принимать участие в проектах по обработке данных и автоматизированному поиску для улучшения работы хранилища[18] и консультировать по вопросам политики в отношении контента[12]. В 2002 году за создание arXiv Гинспарг стал стипендиатом премии Макартура, получив в качестве награды грант в размере $500 000[22].

Финансирование

До переезда в Корнеллский университет административная ответственность за портал лежала на плечах Лос-Аламосской национальной лаборатории. В 2001 году Библиотека Корнеллского университета[en] взяла на себя расходы по содержанию хранилища и административное управление, чтобы Гинспарг мог больше времени уделять своим исследованиям — будучи физиком-теоретиком, он внёс существенный вклад в квантовую теорию поля, теорию струн, конформную теорию поля и квантовую гравитацию[14]. Помимо своих исследований в области физики, Гинспарг работал с группой цифровых библиотек над усовершенствованием возможностей arXiv[12][15].

На 2021-й, на постоянной основе портал поддерживают 123 университета, библиотеки, исследовательских лабораторий и фонда, каждый из которых вносит от $2300 до $4000 в год. По состоянию на 2012-й годовой бюджет библиотеки оценивался в $500 000[12]. В 2014 году прогнозируемые годовые расходы на персонал и серверы составили $885 987 — менее $10 на обработку одной статьи[23]. В 2016 году к 25-летней годовщине arXiv группа учёных и библиотекарей Корнеллского университета предприняла попытку привлечь от 2,5 до 3-х млн на модернизацию платформы[24]. В 2020-м хранилище поддерживало 243 организации из 30 стран. Главными спонсорами стали Simons Foundation, Allen Institute for AI[en] и Google[25]. Общий годовой бюджет на 2021-й составил $2 423 994, а источниками доходов arXiv являлись спонсорская поддержка, предоставляемая Корнеллским университетом на покрытие всех косвенных затрат (около 37 % от всех операционных затрат), Фонд Саймонса[en], а также отдельные пожертвования членских организаций и гранты от фондов и агентств[26].

Статистика

Первая статья была загружена в arXiv 14 августа 1991 года. Спустя двадцать лет портал насчитывал около 700 тысяч статей, среднее количество публикуемых материалов составляло 75 000 в год, а ежегодное количество загрузок — около 1 млн. При этом количество пользователей достигало 400 000[14][27][18][18]. Уже на декабрь 2014 года портал обработал более 10 млн запросов на скачивание[23]. Спустя пять лет, в декабре 2019-го, arXiv насчитывал более 1,6 млн статей. Для сравнения, на других крупных репозиториях SSRN и RePEc числилось 770 000 и 800 000 соответственно[28]. Только за июнь 2020 года на портал было загружено 17 000 препринтов, а общее количество загрузок составило 1,89 млрд на 1,8 млн статей[25].

Программное обеспечение

Первоначально arXiv функционировал через интерфейс электронной почты, а в 1992 году был добавлен протокол передачи файлов по сети. В декабре 1993-го arXiv перешёл на веб-интерфейс, а уже спустя год основная коллекция arXiv’а была продублирована на зеркальных сайтах. К 2001-му приложения arXiv состоял примерно из 30 000 строк Perl, которые работали на системе Linux с использованием других программ, включая TeX, Ghostscript, tar, gzip. Поддержанием деятельности портала и зеркальных сайтов, корректировкой аннотаций и переписыванием модульного а Perl занималась команда из четырёх человек[15].

В 2012 году было создано приложение для iOS !ArXiv, предоставляющее доступ к репозиторию с мобильного устройства. Через приложение пользователи могут осуществлять поиск по каталогу через ключевые слова или фильтры по заголовкам, автору, аннотациям и цифровому идентификатору[29]. Для смартфонов на системе Android существует приложение ArXiv Mobile[30].

Модерация

Пользователи могут добавить препринты в arXiv до, одновременно с или после публикации в научных журналах[31]. Все работы модерируются администраторами, которые оценивают препринты на предмет их соответствия основным требованиям выбранной дисциплины. В отличие от научных журналов, для публикации на arXiv работы не рецензируются, однако все модераторы обладают высокой квалификацией и следуют принятым рекомендациям по приёму материалов. Выбором модераторов занимаются специально созданные консультативные комитеты, в которых состоят сотрудники библиотеки Корнеллского университета[3]. С 2009 по 2019 административной деятельностью портала руководила сотрудник библиотеки Ойя Ригер[32][12], которую сменила Элеонора Презани[33].

Подать работы на размещение в хранилище могут только авторы, имеющие академическую аффилиацию, — таким образом модераторы проверяют насколько публикуемые материалы имеют «рецензируемое качество» и удовлетворяют минимальным критериям для размещения в научном журнале[31]. С января 2004 года было введено дополнительное правило, согласно которому все новые авторы перед публикацией должны быть одобрены уже зарегистрированными пользователями[3]. Согласно Гинспаргу, подобная система позволяет гарантировать статус arXiv как платформы для общения профессиональных исследователей[31].

Система подачи работ полностью автоматизирована — алгоритм считывает не только материал, но и индексирует названия, имена авторов, аннотации. Поскольку все статьи arXiv’а разделены на категории и подкатегории, авторы могут самостоятельно указывать один или несколько перекрёстных разделов, к которым относится их работа[3][34]. Во время модерации администратор рассматривает целесообразность размещения статьи в каждый предметный класс перекрёстного списка[3].

Плагиат

В разные годы пользователи и модераторы платформы сталкивались с плагиатом в статьях. Так, в июне 2002 года с физиком-энергетиком Токийского технологического института Ясуши Ватанабе связался Рами Набулси — физик-математик без институциональной аффилиации. Набулси попросил Ватанабе разместить его научные статьи в arXiv — он не мог этого сделать самостоятельно из-за отсутствия институциональной привязки. Ватанабе впечатлили препринты Набулси и он согласился разместить в хранилище 22 статьи. Однако вскоре пользователи портала обнаружили, что статьи Набулси содержат плагиат. После этого препринты были удалены с сайта[35].

В 2007 году около 70 статей 15 авторов из четырёх университетов Турции были удалены с портала из-за обвинений в плагиате. Скандал начался в ноябре 2006 года, когда два аспиранта Салти и Октай Айдогду сдавали устные экзамены по защите степени доктора философии. Согласно члену их комиссиий Озгюру Сариоглу, несмотря на список обширных публикаций по гравитационной физике, оба аспиранта не смогли ответить на базовые вопросы по классической механике. По этой причине члены кафедры начали анализировать список публикаций докторантов и обнаружили плагиат десятков работ с arXiv. Впоследствии Пол Гинспарг начал собственное расследование и обнаружил 67 статей с плагиатом[36][37]. Несмотря на то что все финальные версии статей были удалены, варианты некоторых черновых статей сохранились на сайте[38]. После инцидента портал ввёл встроенную систему антиплагиата, которая автоматически проверяет загруженные работы[39].

Форматы

Предлагаемая для публикации статья должна быть подготовлена в одном из принимаемых arXiv форматах[5]. Первое время после создания хранилища пользователей обязывали использовать TeX или LaTex для оформления публикации, поскольку обе программы позволяют создать высококачественный формат PDF и выводить сложные расчётные формулы. arXiv начал принимать статьи в PDF, сгенерированные через другие текстовые процессоры, такие как Microsoft Word[3]. Графические вложения и расчёты могут быть поданы в нескольких форматах — PostScript для рисунков и сюжетов, JPEG для фотографических изображений, PNG и GIF для не фотографических изображений[13].

Интерфейс

Скриншот основной страницы сайта arXiv.org, 6 июля 2014 год

Все коллекции arXiv имеют крупные подколлекции, каждой из которых присвоена соответствующая идентификационная категория. Так, в Физике имеются такие подколлекции как Астрофизика , Общая теория относительности и Квантовая космология, Ядерная теория и Квантовая физика. Выбранные подколлекции также включают соответствующие подклассы (Предметные классы). Существует возможность поиска или извлечения записей по одному или нескольким предметным классам[13].

Для пользователей доступны подразделы «электронная печать», «авторы», «комментарии», «формат документа» и связанные ссылки — альтернативные платформы, где статьи могли быть также опубликованы. Недавно добавленные препринты распределены между двумя категориями — новые (добавлены в текущий день недели) или недавние (добавлены, обработаны и приняты в течение последних пяти рабочих дней). Каждой новой работе автоматически присваивается стандартный буквенно-цифровой идентификатор, состоящий из а конкретной подколлекции (например, astro-ph), за которым следует косая черта (/) и семизначное число (например, 0003425). Первые две цифры номера означают последние две цифры года, в котором статья обработана (например, 17 для 2017 ), следующие две — месяц обработки заявки (03 — март), а оставшиеся составляют произвольные инвентарный номер, присвоенный каждой работе для отдельной подколлекции. Когда для работы есть предметный класс, её аббревиатура или ставится после названия а подколлекции и перед косой чертой (например, math.AT/9910001 или Physics.acc-ph / 9911027)[13]. Внесение любых изменений приводит к созданию новой версии, при этом arXiv предоставляет доступ и к предыдущим, даже если текущая версия препринта помечена как «отозванная»[15]. Пользователи могут осуществлять поиск по каталогу как коллекции, так и подколлекции. Помимо этого, доступен поиск по временному показателю (Прошлый год , Все годы, 2000)[13]. На апрель 2021 года arXiv принимает работы по физике, математике, компьютерным наукам, биологической статистике, финансовой математике, статистике, электротехнике, экономике[40].[3].

ArXiv не предоставляет библиометрическую информацию, такую как цитируемость, однако интегрирован со многими библиографическими базами данных — SPIRES, NASA ADS и Citebase[41]. Так, SPIRES подсчитывает цитирование препринтов и перенаправляет исследователей на arXiv. Опрос работающих в этой сфере учёных показал, что почти 90 % физиков полагаются на SPIERS и arXiv как отправную точку для поиска нужной литературы[16].

После публикации работы на портале другие пользователи узнают о новой работе либо через систему оповещения по электронной почте (если они подписали на рассылку по теме коллекции или подколлекции), либо через обновление сайта. Автор также может отредактировать статью в ответ на полученные комментарии или обновить препринт после рецензирования и публикации в журнале. Некоторые издатели журналов разрешают подавать документы в виде номера документа arXiv — для доступа к ней рецензенты переходят по ссылке, ведущей на портал[5].

Копирайт

Публикация в arXiv не требует передачи имущественных прав. Однако для распространения материалов через портал необходимо предоставить хранилищу лицензию на распространение статьи и подтвердить, что автор имеет право на предоставление этой лицензии. Для этого работа должна соответствовать одной из следующих лицензий Creative Commons[42][43][44]:

  • CC BY: Creative Commons Attribution — лицензия позволяет пользователям распространять, адаптировать и изменять материал на любом носители и в любом формате, при указании авторства первоначальной работы. Лицензия разрешает коммерческое использование.
  • CC BY-SA: Creative Commons Attribution-ShareAlike — лицензия позволяет пользователям распространять, адаптировать и развивать материал на любом носителе или в любом формате, при условии указания авторства первоначальной работы. Лицензия разрешает коммерческое использование. При этом полученный вторичным автором результат должен распространяться по идентичной лицензии.
  • CC BY-NC-ND: Creative Commons Attribution-Noncommercial-NoDerivatives — лицензия разрешает вторичным пользователям копировать и распространять материал на любом носителе или формате только в неадаптированной форме, только для некоммерческих целей и только при условии указания авторства на имя создателя.
  • Бессрочная неисключительная лицензия arXiv.org — лицензия дает arXiv ограниченные права на распространение статьи, а также ограничивает повторное использование любого типа другими организациями или частными лицами.
  • CC Zero — позволяет авторам отказаться от имущественных прав и сделать свою работу общественным достоянием. CC0 позволяет вторичным пользователям распространять, адаптировать и развивать материал на любом носителе или в любом формате без каких-либо ограничений.

Влияние

Открытый доступ

Создание arXiv в 1991 году считается отправной точкой движения за открытый доступ, продвигающего бесплатный, оперативный, постоянный и полнотекстовый онлайн-доступ к научным публикациям[45]. Благодаря arXiv практики открытого доступа в физике и астрономии стали нормой гораздо раньше других отраслей наук[46]. В 2002 году была выпущена Будапештская инициатива открытого доступа, основанная на результатах проведённой Институтом открытого общества конференции. Инициатива предложила два основных пути достижения ОД — «золотой» и «зелёный». Пример arXiv, сделавший статьи до рецензирования и публикации в журналах такими же востребованными, как и опубликованные, лёг в пример «зелёного» пути или самоархивирования в открытых репозиториях[47][48]. Согласно предложенной стратегии, одновременно с отправкой в журнал исследователи должны размещать свои работы в открытых онлайн-архивах. Таким образом статьи будут доступны общественности до или сразу после публикации в журнале[49]. Многие исследователи и организации рассматривают лежащий в основе arXiv принцип самоархивирования наиболее эффективным и демократичным способом перехода к ОД, поскольку он не подразумевает резкого изменения традиционной модели издательского бизнеса[50]. Авторы могут размещать статьи как в виде препринтов, так и уже опубликованных версий[51][52]. Согласно исследованию 2012 года, пользователи гораздо чаще предпочитали «зелёный путь» (21,4 %) «золотому» (2,4 %) во всех научных дисциплинах, кроме биомедицины, потому что он не требовал от исследователей дополнительных затрат в виде платы за публикацию, как в случае с публикацией в журналах открытого доступа[53]. Размещение препринтов в открытых репозиториях по типу arXiv обладает рядом достоинств по сравнению с другими форматами ОД, главным из которых является скорость публикации — статья становится общедоступной практически немедленно[54]. При этом многие издательства налагают на авторов так называемое «эмбарго» — период, во время которого исследователям запрещено публиковать статьи в альтернативных источниках. Длительность ограничений чаще всего составляет до 12 месяцев, что значительно затрудняет внедрение «зелёного доступа»[55][52][56].

В 2013 году Европейский исследовательский совет объявил о сотрудничестве с arXiv, сформировав международное партнёрство для поддержки репозитория. Несмотря на то, что сумма финансирования была больше символической и в разные годы составляла $1500- $3000, это событие сыграло важную роль в контексте поддержки принципов «зелёного пути» на национальном уровне[57].

Наука

ArXiv помог сделать препринты основным способом обмена и хранения научными данными в таких областях как астрономия, астрофизика, ядерная физика и физика элементарных частиц[58]. Помимо этого, arXiv помог систематизировать существующую систему распространения препринтов и способствовал преодолению неравенства к научному знанию — исследователи из развивающихся стран имеют такой же доступ к исследовательским материалам, что и преподаватели из Лиги плюща[12]. Согласно исследованию 2015 года, около 75 % работ физиков по теме конденсированного состояния депонируются в arXiv’е. Опрос профессорского состава Оклахомского университета показал, что 92 % преподавателей математики и 67 % физики использовали препринты arXiv для поддержки и распространения своих исследований[59].

Начиная с 2012 года в arXiv’е начали публиковать работы в сфере биологии. Одним из первых известных препринтов этой области стало микробиологическое исследование, оспаривающее публикации Science 2011 года. Исследование, размещённое в открытом доступе, опровергло возможность штамма бактерий Halomonas titanicae содержать мышьяк в своей ДНК[60].

В arXiv часто публикуются работы, оказывающие существенное влияние на развитие науки. Одним из самых громких случаев произошёл в 2002—2003 годах, когда математик Григорий Перельман опубликовал в arXiv’е три статьи, в которых доказал решение проблемы Пуанкаре — одной из семи задач тысячелетия, сформулированной в 1904 году французским математиком Анри Пуанкаре. В 2006 году решение Перельмана было официально признано верным, и журнал Science назвал доказательство научным «прорывом года»[61][62][59]. В 2010 году математику была присуждена Премия Задачи тысячелетия (Millennium Prize Problems) — для этого Математический институт Клэя впервые нарушил одно из основных правил номинации, согласно которому получение приза возможно только после публикации автором работы в рецензируемых журналах, поскольку в случае Перельмана, публикация осталась формально набором препринтов на arXiv.org[63][64][65][66].

Цитирование

В 2007 году исследователь Саутгемптонского университета Тим Броуди измерил временной промежуток между публикацией статей в arXiv и началом цитирования. Согласно полученным результатам, с каждым годом этот интервал всё больше сокращался, что свидетельствует о том, что основанная на открытом доступе система публикаций позволяет сокращать цикл исследования и повышает эффективность распространения научного знания[46][67]. Более поздние исследования показали, что в разделах по физике, математике, а также в астрономии и астрофизике версии arXiv цитируют быстрее, чем уже опубликованные в научных журналах статьи[16].

Анализ 2765 статей, опубликованных в четырёх математических журналах с 1997 по 2005 год, показывает, что депонированные в arXiv статьи в среднем получали на 35 % больше цитирований, чем не депонированные, с преимуществом около 1,1 цитирования на статью[68]. При этом на предметном уровне препринты arXiv больше цитируются математиками[59].

Выделяют три основные причины для преимущества в цитировании депонированных в arXiv статей. Первой является так называемое «преимущество открытого доступа» — открытые статьи видят больше пользователей. Помимо этого, существует возможная «предвзятость самоотбора» в выборке статей — исследователи публикуют в открытом доступе только свои лучшие работы. ArXiv также индексируется Google, и многими специальными поисковыми инструментами, такие как Scopus, OAIster[en], Web of Science, Citebase. Благодаря этому существует так называемое «преимущество arXiv»: размещённые на портале статьи появляются в приоритете в поисковых службах. Помимо этого, хранилище представляет ценный ресурс для исследователей и пользуется большой популярностью[69]. Все эти факторы увеличивают доступность препринтов и влияние их авторов[70].

Другие репозитории

Опыт и структура arXiv легли в основу других онлайн репозиториев. В 1994 году было запущено SSRN — хранилище препринтов по социальным и гуманитарным наукам. В 2016 году Elsevier выкупил SSRN, где на тот момент было около 2 млн пользователей. Сделка вызвала неоднозначную общественную реакцию, поскольку исследователи опасались, что издательство ограничит доступ к препринтам и будет препятствовать распространению открытого доступа[71][72][73]. В 2013 году был создан отдельный репозиторий для работ по биологии — bioRxiv[74]. Спустя три года Американское химическое общество (ACS) объявило о создании архива препринтов по химии — ChemRxiv[en]. В этом же году был запущен SocArXiv — онлайн сервис статей по социальным наукам, основанный социологом Филипом Коэном[en] в партнёрстве с некоммерческим Центром открытой науки (Center for Open Science)[75][76]. Также в 2016 году были созданы архивы для исследователей в областях инженерии engrXiv[en] и психологии PsyArXiv[en][77][77].

Крупнейшие научные издательства также участвуют в создании онлайн-репозиториев. Например, сервер In Review был создан при поддержке Springer Nature, а ChemRN спонсировал Elsevier. Ряд национальных серверов, таких как арабский Arabirxiv, французский сервер Frenxiv, индонезийский портал INArxiv, индийский Indiarxiv были созданы при поддержке Центра открытой науки[78].

С увеличением количества размещаемых в электронных архивах препринтов возникла потребность в разработке новых порталов, способных выполнять поиск по нескольким репозиториям одновременно. Созданный в 2002 году при финансировании Andrew W. Mellon Foundation[en] и Open Archives Initiative[en] портал OAIster[en] позволяет осуществлять поиск по каталогу более чем 200 репозиториев[79][80][81]. Это особенно помогало исследователям из развивающихся стран, чьи работы оказались включены во всемирные научные библиотеки[52][56].

Критика

Отдельные исследователи отмечают, что несмотря на свои преимущества, arXiv не является идеальной системой для распространения научных данных. Проблемой является отсутствие системы рецензирования — модераторы не оценивают загруженные материалы с точки зрения достоверности или научной значимости. Таким образом подобные arXiv репозитории являются только дополнением, а не замещением традиционных академических журналов[82].

В 2002 году креационист Роберт Джентри из Теннесси подал в суд на операторов сервера препринтов arXiv, утверждая, что они отклонили десять его работ из-за их религиозного содержания. Адвокат, представляющий Корнельский университет в Итаке, заявил, что претензии не имеют оснований и что университет имеет право выбирать какой контент публиковать на сайте. До этого в 1960 и 1970-х годах Джентри публиковал работы по ядерной геофизике в таких ведущих журналах, как Science и Nature. Впоследствии исследователь выдвинул альтернативную гипотезу Большого взрыва, которую он безуспешно пытался опубликовать в академических журналах. После неудачных попыток Джентри решил выставить свои работы в arXiv, однако модераторы arXiv удалили документы и отозвали его права на публикацию в 2001 году. Джентри подал иск о восстановлении доступа в августе 2002 года[83]. В 2004 году иск был отклонён[84].

В 2009 году физик Филипп Гиббс создал viXra — альтернативный электронный архив для публикации работ, которые не прошли модерацию в arXiv[85]. На сайте публикуются все работы, независимо от качества, количества или соответствия научным стандартам[86][87]. В 2016 году квантовый физик из Женевского университета Николас Гизин[en] заявил, что модераторы arXiv ошибочно поместили в чёрный список работу двух его студентов — Тьяго Геррейро и Фернандо Монтейро, в которой они рассматривали теоретическую проблему падения человека в чёрную дыру. В ответ на жалобу Гизина модераторы портала заявили, что они имеют право на неразглашение причины, по которой было принято отрицательное решение. При этом жалоба Гизина вызвала волну критики портала со стороны других физиков, заявивших, что процесс модерации препринтов должен быть более прозрачным. Впоследствии работа Геррейро и Монтейро была опубликована в Physics Letters A1[en][88][89].

Примечания

  1. https://www.alexa.com/siteinfo/arxiv.org
  2. 1 2 Boldt, 2011, с. 238—242.
  3. 1 2 3 4 5 6 7 8 Ramlo, 2007, с. 374—375.
  4. Monthly Submissions. Cornell University. Дата обращения: 2021-04-37.
  5. 1 2 3 4 5 Pinfield, 2001.
  6. 1 2 3 4 5 Taubes, 1993, с. 1246—1248.
  7. 1 2 3 4 Meyer, 2002.
  8. 1 2 3 Jackson, 2002, с. 23—32.
  9. 1 2 Vivienne Bachelet. What are preprints?. Medwave (2017). Дата обращения: 1 мая 2021.
  10. 1 2 Зельдина, 2020, с. 287—294.
  11. 1 2 O'Connell, 2002, с. 1—12.
  12. 1 2 3 4 5 6 Steele, 2012.
  13. 1 2 3 4 5 6 McKiernan, 2000, с. 127—138.
  14. 1 2 3 Ginsparg, 2011, с. 145—147.
  15. 1 2 3 4 Luce, 2001.
  16. 1 2 3 4 5 Macaluso, 2014, с. 1157—1169.
  17. Jacobs, 2006, с. 55.
  18. 1 2 3 4 Создатель хранилища научных статей ArXiv.org покидает проект. РИА Новости (11 августа 2011). Дата обращения: 2 мая 2021.
  19. Butler, 2003, с. 548.
  20. Charles Choi. Biology's new online archive. The Scientist (29 сентября 2003). Дата обращения: 30 апреля 2021.
  21. The global-village pioneers. Physics world (1 октября 2008). Дата обращения: 29 апреля 2021.
  22. Bill Steele. Cornell professor Paul Ginsparg, science communication rebel, named a MacArthur Foundation fellow; three other alumni also receive 'genius award' fellowships. Cornell University Press (24 сентября 2002). Дата обращения: 3 мая 2021.
  23. 1 2 Richard Van Noorden. The arXiv preprint server hits 1 million articles. Nature (30 декабря 2014). Дата обращения: 29 апреля 2021.
  24. Richard Van Noorden. ArXiv preprint server plans multimillion-dollar overhaul. Nature (29 июня 2016). Дата обращения: 1 мая 2021.
  25. 1 2 ArXiv, 2020.
  26. Business Model. Arxiv.org. Дата обращения: 30 апреля 2021.
  27. Josh Fischman. The First Free Research-Sharing Site, arXiv, Turns 20 With an Uncertain Future. The Crhonicle of Higher Education (10 августа 2011). Дата обращения: 29 апреля 2021.
  28. Baumann, 2020, с. 2433—2441.
  29. Kamil Mizera. Green Open Access on your iPhone: ArXiv Mobile App. Open Science (22 октября 2013). Дата обращения: 30 апреля 2021.
  30. Kamil Mizera. Green Open Access on your Android device: ArXiv mobile. Open Science (6 ноября 2013). Дата обращения: 30 апреля 2021.
  31. 1 2 3 Ginsparg, 2006, с. 9606—9608.
  32. Oya Y. Rieger. ITHAKA S+R. Дата обращения: 11 мая 2021.
  33. arXiv Leadership Team. arXiv. Дата обращения: 11 мая 2021.
  34. Ginsparg, 2014, с. 44.
  35. Giles, 2003, с. 7.
  36. Brumfiel, 2007.
  37. Turkish Professor uncover plagiarisn in papers posted on physics server. The Chronicle of Higher Education (6 сентября 2007). Дата обращения: 3 мая 2021.
  38. John Timmer. Plagiarism and falsified data slip into the scientific literature: a report. Ars Technica (8 августа 2007). Дата обращения: 3 мая 2021.
  39. Experimenting with plagiarism detection on the arXiv. Physics Today (1 марта 2007). Дата обращения: 3 мая 2021.
  40. About ArXiv.org. arXiv.org. Дата обращения: 3 мая 2021.
  41. Двадцать лет спустя. Троицкий вариант – Наука (16 августа 2011). Дата обращения: 3 мая 2021.
  42. Hall, 2008, с. 45—46.
  43. arXiv License Information. Cornell University Library. Дата обращения: 3 мая 2021.
  44. arXiv License Information. arXiv. Дата обращения: 3 мая 2021.
  45. History of Open Access. Open Access. Дата обращения: 28 апреля 2021.
  46. 1 2 Alma Swan. Open Access and the Progress of Science. American Scientist (2007). Дата обращения: 30 апреля 2021.
  47. Jacobs, 2006, с. 50—58.
  48. Open Access: пейзаж после битвы за открытый доступ к научным статьям. Новости сибирской науки (Екатерина Мищенко). Дата обращения: 3 мая 2021.
  49. Jacobs, 2006, с. 57—59.
  50. Кулаженко, 2019, с. 63.
  51. Liesegang, 2013, с. 425.
  52. 1 2 3 Leslie Chan and Barbara Kirsop and Subbiah Arunachalam. Open access archiving: the fast track to building research capacity in developing countries. Sci Dev Net (27 марта 2008). Дата обращения: 5 апреля 2021.
  53. Gargouri, 2012.
  54. Rodríguez, 2019, с. 1—27.
  55. Трищенко, 2017, с. 23.
  56. 1 2 Martin Lochman. Enhancing the visibility of Maltese research. Times Malta (25 декабря 2016). Дата обращения: 5 апреля 2021.
  57. Kamil Mizera. ArXiv to receive funds from the European Research Council. Open Science (24 сентября 2013). Дата обращения: 30 апреля 2021.
  58. Macaluso, 2014, с. 1157–1169.
  59. 1 2 3 Li, 2015, с. 614—635.
  60. Callaway, 2012, с. 19.
  61. Mackenzie, 2006, с. 1848—1849.
  62. Григорий Перельман. Полит.ру (13 июня 2020). Дата обращения: 22 февраля 2021.
  63. Доказательство длиною в век. Lenta.ru (19 марта 2010). Дата обращения: 22 февраля 2021.
  64. Трищенко, 2017, с. 40—44.
  65. Marc Kaufman. Russian mathematician wins $1 million prize, but he appears to be happy with $0. Washington Post (2 июля 2010). Дата обращения: 30 апреля 2021.
  66. Препринт обгоняет научную статью. Коммерсантъ (23 декабря 2019). Дата обращения: 3 мая 2021.
  67. Jacobs, 2006, с. 46.
  68. Fromerth, 2007, с. 1—17.
  69. Jacobs, 2006, с. 49.
  70. Jacobs, 2006, с. 50.
  71. Robert Cookson. Elsevier buys research sharing website. Financial Times (17 мая 2016). Дата обращения: 3 мая 2021.
  72. George H. Pike. Elsevier Buys SSRN: What It Means for Scholarly Publication. Information Today, Inc. (08-2016). Дата обращения: 3 мая 2021.
  73. Nature Cancer, 2020, с. 1025—1026.
  74. Ewen Callaway. Preprints come to life. Nature (12 ноября 2013). Дата обращения: 3 мая 2021.
  75. Ученые создают SocArXiv - открытый архив препринтов и исследований по социальным наукам. Ноосфера (26 июля 2016). Дата обращения: 2 мая 2021.
  76. Angela Cochran. What Is SocArXiv?. The Scholarly Kitchen (25 июля 2016). Дата обращения: 3 мая 2021.
  77. 1 2 У химиков появится свой архив препринтов — ChemRxiv. Научная Россия (12 августа 2016). Дата обращения: 30 апреля 2021.
  78. Александр Кузнецов. Препринт обгоняет научную статью. Коммерсантъ (23 декабря 2019). Дата обращения: 23 февраля 2021.
  79. Gaines, 2015, с. 5—11.
  80. Prosser, 2003.
  81. Bailey, 2005, с. 1—19.
  82. Nature Photonics, 2012.
  83. Geoff Brumfiel. Ousted creationist sues over website (2002). Дата обращения: 3 мая 2021.
  84. News in brief. Nature (2004). Дата обращения: 3 мая 2021.
  85. Geoffrey Brumfiel. What's arXiv spelled backwards? A new place to publish. Nature (16 июля 2009). Дата обращения: 30 апреля 2021.
  86. What's arXiv spelled backwards? A new place to publish. Nature News blog (16 июля 2009). Дата обращения: 3 мая 2021.
  87. Kate Becker. What Counts as Science?. Nautilus (27 октября 2016). Дата обращения: 3 мая 2021.
  88. Zeeya Merali. ArXiv rejections lead to spat over screening process. Nature (29 января 2016). Дата обращения: 30 апреля 2021.
  89. arXiv screening process called into question. Physics Today (1 февраля 2016). Дата обращения: 3 мая 2021.

Литература

  • Bailey C. Open Access Bibliography (англ.) // Association of Research Libraries. — 2005.
  • Baumann A, Wohlrabe K. Where have all the working papers gone? Evidence from four major economics working paper series // Scientometrics. — 2020. — Вып. 124. — С. 2433—2441. — doi:10.1007/s11192-020-03570-x.
  • Boldt A. Extending ArXiv.org to Achieve Open Peer Review and Publishing (англ.) // Journal of Scholarly Publishing. — 2011. — doi:10.3138/jsp.42.2.238.
  • Brumfiel, G. Turkish physicists face accusations of plagiarism // Nature. — 2007. — Т. 449, вып. 8. — doi:10.1038/449008b.
  • Butler D. Biologists join physics preprint club (англ.) // Nature. — 2003. — Vol. 425. — P. 548.
  • Callaway E. Geneticists eye the potential of arXiv (англ.) // Nature. — 2012. — Vol. 488. — P. 19.
  • Gargouri Y., Larivière V., Gingras Y., Carr L., Harnad S. Green and Gold Open Access Percentages and Growth, by Discipline // ArXiv. — 2012.
  • Davis P., Fromerth M. Does the arXiv lead to higher citations and reduced publisher downloads for mathematics articles? (англ.) // Scientometrics. — 2007. — Vol. 71, no. 2.
  • Eve P. M. Open Access ad the Humanities. Contexts, Controversies and the Future (англ.). — Cambridge University Press. — 2014. — 210 p. — doi:10.1017/CBO9781316161012.
  • Hall S. Digitize This Book! The Politics of New Media, or Why We Need Open Access Now (англ.). — University of Minnesota Press. — Minneapolis, London, 2008. — 312 p. — ISBN 978-0-8166-4871-9.
  • Galbán Rodríguez E. Preprints and preprint servers as academic communication tools (англ.) // Revista Cubana de Información en Ciencias de la Salud. — 2019. — Vol. 30, iss. 1. — P. 1—27.
  • Gaines D., Fagan J. OAIster on EBSCO Discovery Service, FirstSearch, and OAIster.worldcat.org // Libraries. — 2015. — Вып. 54. — С. 5—12.
  • Giles J. Preprint server seeks way to halt plagiarists (англ.) // Nature. — 2003. — Vol. 426, iss. 6. — doi:10.1038/426007a.
  • Ginsparg P. ArXiv screens spot fake papers // Nature. — 2014. — Т. 508, вып. 44. — doi:10.1038/508044a.
  • Ginsparg P. ArXiv at 20 (англ.) // Nature. — 2011. — P. 145—147.
  • Ginsparg P. As we may read (англ.). — 2006. — Vol. 26, iss. 38. — P. 9606—9608. — doi:10.1523/JNEUROSCI.3161-06.2006.
  • Jacobs N. Open Access: Key Strategic, Technical and Economic Aspects (англ.). — Chandos Publishing. — 2006. — 239 p.
  • Jackson A. From Preprints to E-prints: The Rise of Electronic Preprint Servers in Mathematics // Notices of the AMS. — 2002. — Т. 49, вып. 1. — С. 23—32.
  • Larivière V., Sugimoto C., Macaluso B., Milojevic S., Cronin B., Thelwall M. arXiv E-Prints and the Journal of Record: An Analysis ofRoles and Relationships (англ.) // Journal of the Association for Information Science and Technology. — 2014. — Vol. 65, iss. 6. — P. 1157—1169. — doi:10.1002/asi.23044.
  • Li X., Thelwall M., Kousha K. The role of arXiv, RePEc, SSRN and PMC in formal scholarly communication (англ.) // Aslib Journal of Information Management. — 2015. — Vol. 67, no. 6. — doi:10.1108/AJIM-03-2015-0049.
  • Liesegang T. Perspectives. The continued movement for open access to peer-reviewed literature // American Journal of Ophthalmology. — 2013. — Т. 156, вып. 3. — С. 423—432. — doi:10.1016/j.ajo.2013.04.033.
  • Luce R. E-prints Intersect the Digital Library: Inside the Los (англ.) // ACRL Science & Technology Section. — 2001.
  • Mackenzie D. Breakthrough of the year: The Poincaré Conjecture-Proved (англ.) // Science. — 2006. — Vol. 314, no. 5807. — P. 1848—1849. — doi:10.1126/science.314.5807.1848.
  • Meyer E., Kling R. Leveling the playing field, or expanding the bleachers? Socio-Technical Interaction Networks and arXiv.org (англ.) // CSI Working Paper No. WP-02-10. — 2002.
  • McKiernan G. arXiv.org: the Los Alamos National Laboratory e-print server // International Journal on Grey Literature. — 2000. — Т. 1, вып. 3. — С. 127—138. — doi:10.1108/14666180010345564.
  • O'Connell H. Physicists Thriving with Paperless Publishing (англ.) // High Energy Physics Libraries Webzine. — 2002. — Iss. 6.
  • Pinfield S. How Do Physicists Use an E-Print Archive? (англ.) // D-lib magazine. — 2001. — Vol. 7, iss. 12. — ISSN 1082-9873.
  • Prosser, D. The Next Information Revolution - How Open Access repositories and Journals will Transform Scholarly Communications // LIBER Quarterly. — 2003. — Т. 14, вып. 1. — doi:10.18352/lq.7755.
  • Ramlo S. ArXiv.org and Physics Education (англ.) // The Physics Teacher. — 2007. — Vol. 45, iss. 374. — doi:10.1119/1.2768698.
  • Steele B. Library-managed 'arXiv' spreads scientific advances rapidly and worldwide (англ.) // Cornell's quarterly magazine. — 2012. — Vol. V, iss. 1.
  • Taubes G. Publication by Electronic Mail Takes Physics by Storm // Science. — 1993. — Т. 259. — С. 1246—1248.
  • ArXiv Annual Report 2020 // ArXiv. — 2020.
  • Rise of the preprints (англ.) // Nature Cancer. — 2020. — Iss. 1. — P. 1025—1026. — doi:10.1038/s43018-020-00151-y.
  • Celebrating the arXiv (англ.) // Nature Photonics. — 2012. — Vol. 6, iss. 1.
  • Зельдина М. Препринты: история развития и современное состояние // Наука и научная информация. — 2020. — Т. 3, вып. 4. — doi:10.24108/2658-3143-2020-3-4-287-294.
  • Кулаженко В.Г. "Зелёная революция" в науке и её последствия // ХIХ Международная научно-практическая конференция "Менеджмент вузовских библиотек». «Открытая наука: практики и модели сотрудничества». — Минск, 2019. — С. 60—75.
  • Трищенко Н. Открытый доступ к науке. Анализ преимуществ и пути перехода к новой модели обмена знаниями. — Ассоциация интернет-издателей Издательство «Кабинетный учёный». — 2017. — 200 с. — ISBN 978-5-7584-0154-5.

Ссылки

Original: Original:

https://ru.wikipedia.org/wiki/ArXiv.org