И. В. Бегтин,
А. С. Горбунова
Электронная библиотека:
инструкция по установке
Рекомендации для библиотек по организации
собственных репозиториев открытого доступа
Москва
Ваш формат
2017
УДК 025.2.004(075.8)
ББК 78.3с51я73
Б37
Бегтин И. В., Горбунова А. С.
Б37 Электронная библиотека: инструкция по установке. Рекомендации для библиотек по организации собственных репозиториев открытого доступа / И. В. Бегтин,
А. С. Горбунова. — М.: Ваш формат, 2017. — 136 с.
ISBN 978-5-906982-39-1
В данном пособии рассматриваются основные правовые и
технические проблемы, с которыми сталкиваются библиотеки и архивы при организации собственных электронных ресурсов. Основной акцент делается на выбор платформы для
создания электронной библиотеки или репозитория: сравниваются зарубежные и российские программные продукты, платные системы и проекты с открытым исходным кодом. К тем платформам, которые были признаны лучшими
по результатам исследования, прилагаются инструкции по
установке. Важной частью пособия являются рекомендации
по описанию фондов (метаданные) и интеграции с проектами открытого доступа: свободной библиотекой «Викитека»,
централизованным виртуальным хранилищем «Викисклад»
и проектом «Федеральная резервная система банков знаний».
Издание подготовлено в рамках проекта Ресурсного центра
«Открытая библиотека», реализуемого НП «Викимедиа РУ»
с использованием гранта Президента Российской Федерации
на развитие гражданского общества, предоставленного Фондом президентских грантов.
ISBN 978-5-906982-39-1
Настоящие издание публикуется на условиях открытой лицензии Creative
Commons Attribution 4.0 в соответствии со ст. 1286.1 ГК РФ.
Содержание
Глава 1.
Обеспечение доступа к библиотечным коллекциям
в интернете 4
Глава 2.
Платформы для построения цифровых библиотек
и репозиториев 19
Глава 3.
Специфика и рекомендации по описанию фондов 63
Глава 4.
Рекомендации по интеграции библиотек и репозиториев с
проектами открытого доступа 74
Глава 5.
Общие рекомендации 91
Библиографический список 97
Приложение 1.
Справка об открытых лицензиях Creative Commons 102
Приложение 2.
Инструкции по установке платформ DSpace, Omeka
и «ИнфоРост» 109
Приложение 3.
Инструкции по реализации интерфейсов передачи и обмена
данными для подключения к «Федеральной резервной
системе банков знаний» 124
Глава 1. Обеспечение доступа
к библиотечным коллекциям
в интернете
Создатель Всемирной паутины Бернерс-Ли всегда выступал за открытость знаний в сети и общедоступность интернета. Он же отмечал, что со временем эта среда меняется: например, появляются закрытые системы — приложение iTunes на iPhone и даже социальная
сеть Facebook, — а знания из общедоступных превращаются в элитарный ресурс, пользоваться которым может ограниченное число
людей — слишком высока для всех остальных его стоимость.
При этом в интернете до сих пор можно найти далеко не все: там
нет анатомических атласов, необходимых для обучения на медицинских факультетах; там нет важных пособий по физике, математике и астрономии, по которым до сих пор занимаются в вузах;
там нет многих классических произведений русской литературы, не
говоря уже о книгах современных писателей и поэтов. Наконец, там
почти нет нот и партитур: Чайковского, Римского-Корсакова, Кюи.
Огромная часть доступной информации представлена или в очень
плохом качестве, или исключительно на пиратских ресурсах, например, торрент-трекерах, зайти на которые с недавнего времени
тоже стало потенциально проблематично.
Получается, что ученого, исследователя, прилежного школьника
или студента, наконец, человека, который пытается занять свой досуг, ставят перед достаточно сложным выбором: или он становится
пиратом (при условии, что то или иное произведение все-таки есть
в сети), или идет в библиотеку (в которой необходимого источника
информации тоже может не оказаться, если, например, речь идет
о провинциальном городе). Самое простое и очевидное в этой ситуации — отказаться от поисков.
Все это не выглядело бы так критично, если бы не происходило
достаточно часто. Одна из основных причин этой ситуации — отсутствие или малая наполненность электронных библиотек и архи4
вов, на которых пользователи могли бы свободно читать и скачивать
произведения, делиться ими, тем самым распространяя знания.
Как показывает практика, благодаря размещению произведений
науки, литературы и искусства в сети, растет их цитируемость: например, после того, как Метрополитен-музей выложил в открытый
доступ 375 тысяч фотографий, поместив их под свободную лицензию Creative Commons Zero (CC0), количество скаченных с сайта
изображений увеличилось на 64%, а трафик посещений онлайн-коллекции — на 17% [1]. Кроме этого, пользователи начали делиться
ими в твиттере (Face-Swap the Met и Public Domain Cut-Up делали из
изображений смешные картинки), а портал FiveThirtyEight провел
анализ данных сайта музея, выяснив страну происхождения, год
создания и приобретения каждого объекта коллекции [2].
То, что библиотека постепенно должна становиться не только хранителем, но в большей степени распространителем знаний,
платформой для инноваций, в какой-то мере даже дискуссионным
клубом для его участников, отлично понимают и в Британской библиотеке: например, с 2012 года она предлагает возможность профессиональному сообществу изучить ряд тем, связанных с существованием библиотеки в сети посредством серии курсов Digital
Scholarship Training Programme [3]. Часть курсов посвящена управлению контентом на электронных порталах библиотек и архивов,
часть — интеграции информации (mash-ups, API, семантическая
сеть), краудсорсингу в библиотеках и музеях и даже программированию [4]. Большинство лекций опубликовано под лицензиями
Creative Commons, так что ознакомится с ними может любой желающий.
[1]
Cascone S. With ‘Open Access,’ the Met Museum’s Digital Operation
Has a Bona Fide Hit on Its Hands. [Электронный ресурс]. URL: https://
goo.gl/1cygWb
[2]
Там же.
[3]
Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/jD3J5E
[4]
British Library Digital Scholarship Training Programme: a round-up
of resources you can use. [Электронный ресурс]. URL: https://goo.gl/
yCTdjA
5
О популяризации информации в области науки и культуры думают и более крупные проекты. Europeana — цифровая библиотека,
запущенная в ноябре 2008 года Европейским союзом — в «Стратегии развития на 2015-2020 год» указывала, что ее основополагающей целью является развитие инфраструктуры, максимально удобной для читателя. В связи с этим она налаживает сотрудничество
с обширной сетью европейских библиотек, музеев и архивов (более
3 тысяч учреждений), увеличивает объемы цифровых материалов,
разрабатывает стандарты обработки и предоставления данных, модернизирует как портал, так и систему распространения электронных произведений [5].
Оцифровка и публикация произведений в сети способна обеспечить большую сохранность аналоговым носителям, которые, несмотря на развитие технологий, до сих пор остаются под угрозой:
например, в 2005 году публичная библиотека в Нортене (графство
Дэвон, Англия) сгорела из-за того, что свет от увеличительного
стекла упал на груду листовок, находящихся поблизости с коробками книг. По словам экспертов, тогда было утрачено 90% коллекции, в том числе и редкие экземпляры [6]. В 2003 году Национальная библиотека и архив Ирака (NLA), основанная в 1920-м, была
разграблена и подожжена в ходе военных действий. По оценкам
экспертов, было уничтожено 60% архивных материалов, среди которых — исторические фотографии, карты, книги, например, древнейшие копии Корана [7].
То, что обеспечить полную защиту бумажным носителям невозможно, доказывает и пожар в ИНИОН РАН, случившийся в январе 2015 года. По оценкам президента РАН Владимира Фортова,
в результате пожара погибло более 20% фонда, то есть 5,42 млн
экземпляров изданий, среди которых — материалы генеральной
ассамблеи ООН на русском языке, документы НАТО, материалы
[5]
Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/FC5zrr
[6]
Горбунова А. С. Оцифровка как стратегия обеспечения сохранности коллекций. [Электронный ресурс]. URL: https://goo.gl/fmvwRj
[7]
Iraqi Libraries Devastated in War. [Электронный ресурс]. URL: https://
goo.gl/yFdEcR
6
международного суда, часть библиотеки Института мировой литературы и Института славяноведения [8]. Те издания, которые удалось спасти, были залиты водой и заморожены, и теперь пролежат в
криокамерах долгие годы, ожидая восстановления.
В конце концов, публикация фондов библиотек и архивов в сети
способна сгладить информационное неравенство, которое негативно влияет на культурный обмен, развитие науки и образования и
даже на экономическую эффективность. В более локальном масштабе подобная программа была реализована в США: проект Open
eBooks, созданный по инициативе Белого дома, нацелен на обеспечение электронными ресурсами 20 млн детей из малообеспеченных
семей. За время существования проекта было распространено более 170 млн экземпляров книг [9].
О том, что электронные книги необходимы цифровому обществу,
начинают задумываться и в России: с 2004 года в стране реализуется
проект Министерства культуры Российской Федерации, так называемая Национальная электронная библиотека (НЭБ). Изменяется
и общее видение роли библиотечных сотрудников в процессе дистрибуции книг: например, на портале Российской национальной
библиотеки есть онлайн-консультант, который может посоветовать книгу, рассказать пользователю, можно ли найти ее на сайте,
прочитать или скачать к себе на компьютер. К сожалению, пока что
реализация этих проектов оставляет желать лучшего: в электронных библиотеках нет многих даже классических книг (например,
на сайте НЭБ пользователь не сможет найти известнейшее стихотворение М. Ю. Лермонтова «Белеет парус одинокий…». На портале
присутствуют только два романса, один из которых — на древнерусском [10]), а консультанта на сайте РНБ можно прождать не один
час. Сложный поиск и зачастую неудобная инфраструктура сайта
только усугубляют ситуацию.
[8]
Книги ИНИОНа будут сушить в криокамере госархива научно-технической документации. [Электронный ресурс]. URL: http://tass.ru/
nauka/1782553
[9]
Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/FC5zrr
[10]
Сайт нэб.рф. [Электронный ресурс]. URL: https://goo.gl/uXBLtq
7
По словам партнера архитектурного бюро SVESMI (Ротердам —
Москва) и программного директора магистерской программы НИУ
ВШЭ/ Институт Стрелка «Advanced Urban Design» Анастасии Смирновой, «по сути библиотеки перестают быть публичными — огромное количество людей предпочитает проводить время где-то еще.
Посещаемость стабильно падает, обстановка в большинстве библиотек остается довольно унылой — по сравнению, скажем, с антикафе или новейшими книжными магазинами» [11].
Однако упадок библиотек объясняется все же не их обстановкой,
а новыми потребностями людей. Эта подтверждают данные социологических опросов: например, согласно исследованию ВЦИОМ
за 2015 год, каждый четвертый россиянин не видит необходимости
в посещении библиотек из-за того, что читает книги в интернете.
В 2011 году 63% россиян предпочитали бумажные книги электронным, тогда как 4 года спустя их доля снизилась до 47% [12]. Вполне
возможно, что даже эта цифра сейчас стала значительно ниже. При
этом посещаемость электронных порталов библиотек непрерывно
растет: например, на том же портале Europeana ежемесячно бывает
от 11 до 13 млн человек [13].
Читатели считают, что привлечь аудиторию в библиотеки мог бы
обновленный книжный фонд, доступ к электронным версиям изданий через интернет, оборудованные читальные залы с доступом
в сеть, а также кружки, секции и рекламная информация о пользе чтения. Тем не менее, все очевиднее становится факт того, что
возвращать людей в библиотеки старого образца смысла нет — они
все равно туда не вернутся, и в этом не помогут ни семинары, ни
открытые дни, ни мероприятия для школьников, студентов и их
родителей. Единственное, что может спасти ситуацию, — организация библиотеки нового типа, библиотеки, существующей в сети,
[11]
Позднякова Ю. «Надо быть готовым к тому, что 8 из 10 проектов
не закончатся ничем». [Электронный ресурс]. URL: http://www.
itsmycity.ru/blog/post/id/7057
[12]
Пресс-выпуск №2850. Как пройти в библиотеку? / ВЦИОМ. [Электронный документ] URL: https://goo.gl/36wsDN
[13]
Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/FC5zrr
8
библиотеки, которая была бы максимально удобной для пользователей.
1.1. Основные проблемы
Авторское право
Одна из основных проблем в организации электронной библиотеки
связана с правовыми вопросами, которые актуальны как в России,
так и за рубежом. Логично, что организация библиотечных электронных фондов должна происходить без ущемления прав и авторов, и читателей, однако на практике осуществить одновременно
и первое, и второе, достаточно сложно.
Во-первых, библиотека может беспрепятственно оцифровывать
и распространять только те издания, которые находятся в общественном достоянии (т. е. срок охраны авторских прав, составляющий в нашей стране всю жизнь автора и 70 лет после его смерти, уже
истек) или были опубликованы на условиях открытых лицензий [14].
Вопросы возникают уже на этом этапе и связаны они в большинстве случаев со статьей № 1281 Гражданского кодекса РФ. Согласно 5 пункту, «если автор работал во время Великой Отечественной
войны или участвовал в ней, срок действия исключительного права <…> увеличивается на четыре года». То есть срок охраны таких
произведений составит уже не 70 лет, а 74 года. Согласно 4 пункту
статьи, произведение, автор которого был репрессирован и посмертно реабилитирован, переходит в общественное достояние через
70 лет после года реабилитации [15].
При этом в законе не поясняется, например, считать ли автора работавшим во время ВОВ, если он еще не приступил к своей должности (как Марина Цветаева, которая 26 августа 1941 года устроилась
на работу посудомойкой, 28 августа поехала в Елабугу за вещами,
где через два дня покончила жизнь самоубийством), умер в первый
[14]
См. Приложение 1
[15]
ГК РФ Статья 1281. Срок действия исключительного права на произведение. [Электронный ресурс]. URL: https://goo.gl/NPeB2d
9
день войны (как советские писатели Александр Гаврилюк и Степан Тудор, погибшие от взрыва немецкой бомбы 22 июня 1941 г.,
не доехав до работы), «писал в стол», не будучи официально трудоустроенным, или же трудился, но в колонии или лагере (потому что
был репрессирован, как, например, Варлам Шаламов). При ошибочной интерпретации срок авторского права может увеличиться на
несколько десятилетий, а то и перевалить за половину века [16].
На еще большее время продлевается срок охраны произведений
реабилитированных авторов: например, Николай II был расстрелян 17 июля 1918 года, а реабилитирован — 1 октября 2008 года.
Теперь его дневники перейдут в общественное достояние только
в 2079 году. При этом согласно статье 11 ФЗ № 1761-I «О реабилитации жертв политических репрессий», на территории РФ имеют
силу и документы о реабилитации, выданные в государствах-бывших союзных республиках СССР или бывшими государственными
органами СССР [17]. Это значит, что для определения сроков охраны таких произведений необходимо изучить биографию автора и
архивные документы всех союзных республик. С учетом исторического прошлого, репрессированных и в последствии реабилитированных авторов у нас немало: это и Гумилев, произведения
которого перейдут в общественное достояние только в 2062 году,
и Шаламов, чьи произведения будут в общественном достоянии в
2071 году, и тысячи других, менее известных, но не менее важных
для нашей культуры и истории писателей и поэтов.
Рассчитать, когда произведение перейдет в общественное достояние, отчасти могут помочь так называемые «калькуляторы общественного достояния». За рубежом одним из первых такой калькулятор появился на сайте проекта Europeana, у нас — на портале
Noosphere.ru [18]. Однако для адекватного расчета библиотекарю все
[16]
Доклад об общественном достоянии с акцентом на произведениях и авторах, работы которых переходят в режим общественного
достояния с 2016 года. НП «Викимедиа РУ». [Электронный ресурс].
URL: https://goo.gl/d7nRk3
[17]
Там же.
[18]
Калькулятор правового статуса. Сервис для расчёта срока охраны
авторских прав произведений науки и литературы. Сайт noosphere.
ru. [Электронный ресурс]. URL: http://calc.noosphere.ru/
10
равно придется знать основные вехи жизни автора, иначе срок будет определен неверно.
Во-вторых, помимо защищенных авторским правом произведений существует и отдельная категория так называемых «произведений-сирот», или произведений с недоступным правообладателем
(orphan work). Это произведение, чей автор неизвестен, то есть непонятно, перешло оно в общественное достояние или нет. Точные
объемы всех произведений-сирот неизвестны, но, к примеру, по
подсчетам Библиотеки Конгресса, к ним относятся около 85% музыкальных записей, созданных до 1968 года и хранящихся в стенах этой библиотеки [19]. Согласно исследованию, проведенному
HathiTrust, из произведений, изданных в США и за их пределами
после 1977 года, более 60% являются произведениями-сиротами [20].
В Европе и США эту проблему пытаются решить не первый год.
Например, в соответствии с директивой «О некоторых случаях
разрешённого использования сиротских произведений», принятой
Европарламентом в 2012 году, была организована единая база сиротских работ Orphan Works Database, которая содержит информацию о самих работах и их правообладателях. Также библиотека может отправить запрос о том, является ли то или иное произведение
сиротским. Кроме этого, в некоторых странах (например, Индии
и Канаде) были образованы специальные ведомства, которые дают
разрешение на использование сиротских произведений при условии, что до этого организация или частное лицо провело обширную
работу по поиску правообладателя (осуществила так называемый
«добросовестный поиск») [21].
В России предложения по созданию единого реестра сиротских
произведений выдвигались в 2015 году Министерством связи РФ,
однако до сих пор такой реестр создан не был. Нет и юридических
аспектов, помогающих разобраться в проблеме, поэтому все, что
остается библиотекам, — осуществлять самостоятельный поиск авторов и/или правообладателей и договариваться об использовании
[19]
Copyright Laws Severely Limit Availability of Music. [Электронный ресурс]. URL: https://goo.gl/316Ka1
[20]
Левова И. Ю., Винник Д. В., Моисеева А. Ю. Сиротские произведения
в России: статус, пути решения проблемы. [Электронный ресурс].
URL: https://goo.gl/nDFT4N
[21]
Там же.
11
произведений с ними, что требует времени и средств. По словам генерального директора Всероссийской государственной библиотеки
иностранной литературы имени Рудомино Вадима Дуды, библиотеки стараются избегать таких произведений, занимаясь в основном
оцифровкой того, что находится в общественном достоянии [22].
Таким образом, на этапе подготовки электронных библиотек
и архивов учреждениям культуры необходимо разделить фонды на
произведения, охраняемые авторским правом, сиротские произведения и те, которые перешли в общественное достояние. В отношении первых придется договариваться о возможности электронной
публикации с правообладателями, в отношении вторых — осуществлять поиск, третьи же можно свободно оцифровывать и помещать в открытый доступ.
Технологические и финансовые проблемы
Наряду с правовыми проблемами при создании электронных библиотек у учреждений культуры возникают и технологические
проблемы, связанные как с оцифровкой произведений, так и с созданием адекватной платформы для публикации больших объемов
данных, их описанием, выбором форматов файлов и т.п. Например,
на данный момент одним из самых популярных форматов файлов
электронных документов является формат DjVu, который поддерживается далеко не всем программным обеспечением. Формат TXT,
как отмечают исследователи, «самый устойчивый для воспроизведения, однако не содержит в себе метаданных для описания документа, в том числе для выбора правильной кодировки» [23]. Для
форматов Microsoft Word (DOCX) пока еще нет адекватного программного обеспечения, а формат HTML вызывает сложности при
сохранении и индексации файлов [24].
[22]
Механцев Ж. «Если библиотеки не смогут стать значимыми для
пользователей, они вымрут». [Электронный ресурс]. URL: https://
goo.gl/4zGt4t
[23]
Там же.
[24]
Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/FC5zrr
12
Таким образом, одними из наиболее приемлемых форматов для
публикации электронных произведений являются форматы PDF
и EPUB — они поддерживаются большинством платформ или кроссплатформенным программным обеспечением. Тем не менее, здесь
тоже есть сложности: например, некоторые файлы PDF могут быть
слишком «тяжелыми», так что загрузить и открыть их, например,
на мобильном устройстве, читателю будет непросто.
Помимо того, у библиотек отсутствуют компетенции с платформами, на которых можно публиковать большие объемы того или
иного цифрового контента. На данный момент большинство учреждений культуры в России имеют свои сайты, однако не размещают на них электронные копии: это чаще всего некий сайт-визитка, который дает представление читателю об истории библиотеки
и ее фондах. Иногда на таких сайтах представлена информация
о мероприятиях и каталог, в котором можно посмотреть наличие
того или иного произведения. Поэтому технологические сложности
при создании полноценной электронной библиотеки в первую очередь связаны с выбором программного продукта, его развертыванием и поддержанием.
Наиболее крупные библиотеки создают платформы самостоятельно: например, те же НЭБ или РНБ. При этом они не всегда удобны для читателей: пользователю достаточно трудно разобраться
в структуре сайта РНБ — непонятно, как искать необходимую книгу, после того, как она все-таки найдена, необходимо несколько раз
кликать по ссылке для того, чтобы ее открыть. После этого читателя ждет достаточно неповоротливая система Vivaldi, через которую приходится читать книгу. Скачать ее целиком, к слову, нельзя —
только 25% от объема.
Тут возникают новые проблемы, связанные в первую очередь
с финансированием библиотек: например, на разработку пилотного проекта портала для НЭБ в 2013 году было потрачено 7,8 млн из
бюджета Министерства культуры [25], в 2016 — 73 млн на продолжение разработки портала нэб.рф и создание Библиотеки электронных книг (БЭК) [26]. Такими финансами не обладает ни одна менее
[25]
Открытый конкурс № 0173100007713001261. Сайт Министерства
культуры Российской Федерации. [Электронный ресурс]. URL:
https://goo.gl/QDqBZj
[26]
Открытый конкурс № 0173100007715001211. Сайт Министерства
13
масштабная библиотека, а те деньги, что выделяются, к примеру, из
городского бюджета, чаще всего идут не на создание электронных
библиотек, а на комплектацию фондов, т. е. закупку новых книг.
К тому же, для создания такой платформы в штате библиотеки
должен быть программист (а то и не один), который имеет представление о том, как должна выглядеть электронная библиотека
и как она должна быть устроена изнутри.
В качестве альтернативы библиотека может выбрать платную
платформу, которая, с одной стороны, является наиболее простым
вариантом — она не требует специальных знаний в области программирования и системного администрирования от самих библиотечных работников, т. к. ее, как правило, настраивает компания-разработчик. С другой стороны, такая платформа все равно
может быть достаточно дорогой для бюджета городской или сельской библиотеки.
Еще один вариант — установить платформу с открытым исходным кодом, которых на данный момент достаточно много. Она
будет бесплатной, но инструкции по установке доступны, как
правило, только на иностранных языках (английский, немецкий,
французский), и достаточно сложны для понимая людей без соответствующих знаний в области программирования и системного
администрирования.
1.2. Методика исследования
Цель данного исследования — обеспечить библиотеки доступными
инструкциями по установке платформ для хранения и распространения электронных произведений. Для достижения цели исследования необходимо решить следующие задачи:
• изучить историографию темы, ее разработанность, выявить основные исследования, посвященные сравнению разных типов платформ для построения цифровых библиотек и репозиториев;
• разработать критерии оценки, опираясь на уже существующие
исследования в этой области и экспертное мнение;
культуры Российской Федерации. [Электронный ресурс]. URL:
https://goo.gl/r5iiwh
14
• провести сравнительный анализ наиболее популярных платформ, использующихся в России и за рубежом, выявить их основные характеристики;
• составить сравнительные таблицы, иллюстрирующие наличие
или отсутствие данных по важнейшим критериям;
• на основе проведенного анализа выявить не менее трех платформ,
ориентированных на разные группы пользователей;
• подготовить инструкции, необходимые для установки платформы, ее развертывания и адаптации под требования учреждения;
• подготовить рекомендации для описания метаданных;
• подготовить общие рекомендации по интеграции платформ
с проектами открытого доступа для последующего распространения электронных копий произведений.
Критерии оценки
1. Простота и удобство платформы
Поскольку первоочередная задача, поставленная в данном исследовании, заключается в обеспечении подробных инструкций по организации платформы электронной библиотеки или архива, одним
из важнейших критериев оценки является простота программного
продукта. Это значит, что платформа должна быть проста в установке и удобна в использовании, например, при импорте и экспорте
больших объемов данных.
2. Поддержка большинства популярных форматов файлов
Современная электронная библиотека или архив — это не просто
книги, представленные в цифровой форме. Это научные статьи,
диссертации, монографии, карты, нотные записи, видео- и аудиофайлы, зачастую объединенные в коллекции. Как показывает практика крупнейших электронных порталов учреждений культуры,
именно такие «мультимедийные» коллекции и привлекают пользователей больше всего, особенно если коллекция снабжена необходимым справочным материалом.
Для того, чтобы электронная библиотека была востребованной
и современной, платформа должна позволять загрузку всех необходимых форматов: из текстовых файлов — PDF, TXT, DOC (DOCX),
15
EPUB, DJVU; из файлов изображений — JPG (JPEG), GIF, TIFF, PNG;
из аудиофайлов — MP3, FLAC, M4A; из видеофайлов — MP4, AVI,
FLV, MPEG. Также она должна поддерживать файлы презентаций
(PPT/PPTX), таблицы (например, сделанных в формате EXCEL).
3. Наличие перевода
Одна из сложностей в установке платформ заключается в том, что
многие из них не имеют перевода на русский язык. Причем перевода нет ни для инструкций, ни для работы внутри платформы, ни
для интерфейса. Первые две проблемы можно решить, если в учреждении есть человек, знающий английский язык. Вторая решается более сложно: как правило, на платформы с открытым исходным
кодом можно загрузить свой перевод интерфейса, но это требует
дополнительных финансовых и ресурсных затрат. Поэтому при выборе наилучшей платформы не будут учитываться те из них, в которых отсутствует перевод интерфейса на русский язык.
4. Стоимость внедрения
Как правило, большинство библиотек и архивов не обладают достаточным финансированием для покупки некоторых российских
или зарубежных платформ (например, стоимость российской платформы T-Libra превышает 1 млн рублей, а стоимость зарубежной
платформы SimpleDL доходит до 4,5 тысяч долларов). В связи с этим
в данном исследовании будут рассматриваться только те программные продукты, чья стоимость и поддержка не превышают 500 тысяч рублей в год.
5. Количество найденных внедрений
Один из важнейших критериев — популярность того или иного
программного продукта. Во-первых, в этом случае библиотека может опираться на опыт коллег, посмотреть, как выглядит электронный портал, построенный на той или иной платформе. Во-вторых,
такие платформы, как правило, постоянно совершенствуются или
самими разработчиками, или сообществом, выпускаются новые
версии, обеспечивается широкая поддержка пользователей и оперативное устранение найденных ошибок.
16
6. Наличие демоверсии
Вне зависимости от того, платным является тот или иной продукт
или нет, перед установкой желательно ознакомиться с его содержимым, понять, как выглядит административная панель и как она работает. Для этого некоторые копании предлагают демоверсии своих
программных продуктов, при этом рассмотреть платформу можно
со всех сторон: и глазами администратора, и глазами пользователя.
При определении лучших решений будет учитываться то, имеет ли
учреждение культуры возможность протестировать платформу до
ее установки или же нет.
7. Расширяемость и развитие
Важная функция каждой платформы — возможность удовлетворить потребности того или иного учреждения культуры. Например,
для некоторых библиотек и архивов важна интеграция платформы
с другими порталами и проектами (например, Google-картами),
а для других — определенный функционал.
8. Поддержка метаданных
Для создания полноценных электронных фондов библиотеке необходима поддержка метаданных — упорядоченной информации,
всестороннее описывающей контент и его основные элементы [27].
Как правило, метаданные в обязательном порядке включают в себя
информацию о названии произведения, его авторе, годе создания,
типе произведения, физических характеристиках и содержании.
Отдельно стоит учитывать возможность добавления шаблонов метаданных, применимых к большим объемам данных, импортируемых на платформу, поддержку основных стандартов — Dublin Core,
MARC, PREMIS, поддержку дополнительных метатегов.
9. Страна происхождения платформы
При определении наилучшего решения для установки платформы
будет также учитываться страна ее происхождения. Это важно для
[27]
Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/FC5zrr
17
решения технических вопросов, возникающих при ее установке
и дальнейшей поддержки.
10. Наличие открытого исходного кода и тип лицензии
Открытый исходный код позволяет пользователям принимать участие в доработке программного обеспечения или продукта, вносить
изменения и улучшать его. Кроме этого, платформы с открытым
исходным кодом бесплатны для пользователей и направлены на
развитие открытого доступа к произведениям науки и культуры.
В зависимости от лицензии разработчики будут иметь разные возможности при использовании продукта.
11. Наличие подключения к Github (для платформ с открытым
исходным кодом)
Github — это крупнейший сервис для совместной разработки
IT-проектов. Подключение к Github означает, что платформу могут
разрабатывать и улучшать независимые программисты, коллективно решать проблемы, комментировать правки и искать наиболее
оптимальные решения.
12. Тип применения и основная аудитория
Некоторые платформы в большей степени используются научными
учреждениями или государственными организациями. Предпочтение будет отдаваться тем платформам, которые используются
библиотеками, архивами, музеями, репозиториями при университетах и другими учреждениями культуры и образования для создания электронных коллекций.
Глава 2. Платформы для
построения цифровых библиотек
и репозиториев
2.1. Обзор платформ
Платформы для построения цифровых библиотек и репозиториев
— это электронные платформы, позволяющие обеспечивать хранение научных статей, диссертациям, учебным материалам, книгам,
изображениям, аудио- и видеофайлам, статистическим материалам
и отчетам и долгосрочный доступ к ним.
Первые платформы начали появляться еще в 80-х годах 20
века: например, корпорация VTLS Inc., которая предоставляла
программное обеспечение и услуги по автоматизации для более
1900 библиотек в 44 странах, была основана в 1985 году. В 2014 году
она была приобретена компанией Innovative Interfaces, которая и сегодня занимается разработкой программных продуктов, основные
из которых — Sierra, Polaris, Millennium и Vital [28].
Vital — это программный продукт, который был основан на репозитории с открытым исходным кодом Fedora, к которому разработчики добавили дополнительные расширения и утилиты. Эта
платформа фокусируется на индивидуальных потребностях пользователей и позволяет включать в коллекции фотографии, слайды, клипы, видеозаписи, материалы конференций, научные статьи,
электронные журналы, диссертации и другие типы информации.
Платформа может предоставить доступ к материалам, а также ограничить его в случае необходимости для какой-либо группы пользователей.
[28]
Сайт компании Innovative. [Электронный ресурс]. URL: https://
www.iii.com/products/
19
Vital использует XML, TEI, EAD, Dublin Core, OAI-PMH, VRA
и SRU / SRW для описания и индексирования электронных ресурсов. На данный момент Vital использует веб-сервисы и программное обеспечение с открытым исходным кодом, такие как Apache,
MySQL и McKOI [29].
Если раньше такие продукты появлялись только на Западе, то
на данный момент они с успехом выпускаются и на Востоке: например, платформа NewGenLib — это интегрированная система управления библиотекой, разработанная Verus Solutions Pvt Ltd. Первая
версия NewGenLib появилась в 2005 году, с 2008 года она распространяется под лицензией GNU GPL. Программа написана на языке
программирования Java, работает в операционных системах Linux
и Windows [30].
Платформа поддерживает международные стандарты метаданных (MARC-21, MARC-XML), осуществляет ввод данных, хранение
и извлечение файлов на любом языке, обладает расширениями для
поддержки других языков (помимо английского).
Платформу используют в большей степени архивы, музеи и библиотеки в развивающихся странах, например, библиотека Индийского технологического института (Индия), Институт технологии
имени Индиры Ганди (Индия), Lumen Christi International High
School (Нигерия) и другие [31].
Помимо платформ с открытым исходным кодом (то есть по сути
бесплатных) существуют и платные платформы. Учреждению не
придется самостоятельно устанавливать такие платформы, разбираясь в зачастую достаточно сложных руководствах, опубликованных на сайтах. Примером подобной платформы может быть
SimpleDL — программное обеспечение для управления цифровыми
коллекциями, которое позволяет загружать, описывать, управлять
[29] About Vital. [Электронный ресурс]. URL: https://www.iii.com/
products/digital-asset-management/
[30]
Rabishankar G. NewGenLib 3: An Integrated Open Source Library
Management System that Makes your Library Visible in Web. Library
Hi Tech News, Vol. 29. [Электронный ресурс]. URL: http://www.
emeraldinsight.com/doi/abs/10.1108/07419051211294464#
[31]
NewGenLib. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://en.wikipedia.org/wiki/
NewGenLib
20
и обеспечивать доступ к документам, PDF-файлам, изображениям,
видео- и аудиофайлам. SimpleDL в основном используется библиотеками, архивами, музеями, правительственными учреждениями, университетами, корпорациями, историческими обществами и т. п. [32].
Администраторам платформы разработчики обещают удобную
и гибкую панель, понятную интуитивно, мультиформатную систему (платформа поддерживает все форматы файлов), возможность
загрузки и редактирования больших объемов файлов и метаданных (работающих на основе Dublin Core) [33].
Файлы могут быть добавлены в цифровую коллекцию SimpleDL
через веб-браузеры. Цифровые коллекции хранятся на сервере
SimpleDL. Дополнительные функции включают в себя создание и
редактирование шаблонов метаданных, импорт метаданных, экспорт метаданных в XML, создание OCR и просмотр статистических
отчетов [34].
SimpleDL предоставляет возможность бесплатного 30-дневного
использования платформы. Стоимость программного обеспечения
достаточно высока: до 1000 файлов (10 ГБ) — 2500$ в год (примерно 148 тысяч рублей), 2000 файлов (20 ГБ) — 3500 тысячи долларов
в год (около 207 тысяч рублей), до 5000 файлов (50 ГБ) — 4500 тысячи долларов в год (около 265 тысяч рублей) [35].
Среди подобных проектов есть и российские. Например, T-Libra —
это информационная система, предназначенная для создания многофункциональных электронных полнотекстовых библиотек. Она
была создана в 2005 году компанией ООО «Константа» при поддержке Комитета по культуре Архангельской области, Архангельским областным центром повышения квалификации специалистов
культуры и Архангельским краеведческим музеем. Функционирует
на русском и украинском языках [36].
[32]
Сайт компании SimpleDL. [Электронный ресурс]. URL: http://www.
simpledl.com/
[33]
Там же.
[34] SimpleDL. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://en.wikipedia.org/wiki/
SimpleDL
[35]
Там же.
[36] Сайт информационной системы T-Libra. [Электронный ресурс].
21
Информационная система позволяет осуществлять «импорт
и экспорт метаданных в форматах ISO 2709 UniMarc/RusMarc; импорт и индексацию электронных полнотекстовых ресурсов в формате RTF или PDF (символьный) для полнотекстового представления
ресурса, сохраняющего базовое форматирование текста (разбивка
на абзацы, сноски, вложенные изображения и таблицы, жирность,
курсив, подчеркивание, разрядка); импорт постраничного графического представления ресурса (в виде совокупности jpg-файлов);
импорт файлов других форматов для депозитарных представлений
ресурса» [37]. Кроме этого, администратор может задать статус доступа к тому или иному файлу или коллекции (открытый или закрытый). Платформа предоставляет статистические данные по аудитории.
Система функционирует на сервере Windows 2000/2003/XP/Vista.
При этом пользователю необходимо иметь браузер Internet Explorer,
Mozilla Firefox, Opera или Apple Safari [38]. На сторонних ресурсах
указано [39], что система является платной, однако на самом сайте
информации о стоимости продукта нет.
Помимо готовых программных продуктов на рынке существуют и платформы, разработанные на заказ. Чаще всего они делаются
для крупных проектов, например, НЭБ. Поскольку информация об
архитектуре и функциональности таких проектов недоступна, в исследовании они учитываться не будут.
На основе зарубежных и российских исследований было выявлено, что наиболее популярными библиотечными системами
в мире являются DSpace, Omeka, Eprint, Invenio, Dataverse, CKAN,
Zenodo, Islandora, Fedora, Greenstone, ResCarta и MyCore. Наиболее
популярные в России — DSpace, Omeka, Eprint и ИнфоРост.
URL: http://demo.tlibra.ru/bin/tlibra/TauC.exe?DSN=tlibra
[37]
Информационная система T-Libra. Описание системы. [Электронный ресурс]. URL: http://www.softconst.ru/tlibra/
[38]
Там же.
[39]
Создание электронных библиотек. Сайт научно-технического объединения «Информационные наукоемкие технологии». [Электронный ресурс]. URL: http://www.ntoint.ru/info/sozdanie-elektronnihbibliotek.shtml
22
2.2. Параметры платформ
Зарубежные платформы
DSpace
Одна из наиболее популярных платформ с открытым исходным кодом — платформа для создания институциональных репозиториев
DSpace. Она была разработана компанией Hewlett-Packard при сотрудничестве с библиотеками Массачусетского технологического
института (MIT) и открыто под лицензией BSD [40]. Официальный
запуск состоялся 4 ноября 2002 года. На разработку платформы
было выделено 1,8 млн долларов [41].
Цель платформы заключалась в удовлетворении потребностей
библиотек MIT: ученые и исследователи регулярно создавали научные публикации в сложных цифровых форматах. Их необходимо
было собирать, сохранять, индексировать и распространять, что
достаточно сложно и дорого для отдельных преподавателей, лабораторий и исследовательских центров. DSpace стала способом
управления исследовательскими материалами и публикациями,
обеспечивающим более надежную систему хранения и доступность
материалов в сети.
Разработчики отмечают, что DSpace поддерживает все функции,
которые необходимы исследовательской организации или учреждению культуры для создания цифрового репозитория. Открытый
исходный код позволяет работать над улучшением этих функций
[40]
BSD — это лицензионное соглашение, которое на данный момент
является одним из самых популярных для свободного программного обеспечения. При наличии этой лицензии ПО можно использовать как в виде исходного кода, так и в двоичной форме, с изменениями или без, при этом пользователь должен соблюдать ряд
условий, таких как указание об авторском праве или недопустимость использования наименования организации, разработавшей
ПО, для продвижения продуктов, созданных на их основе.
[41]
DSpace. An Open Source Dynamic Digital Repository. D-Lib Magazine.
ISSN 1082-987. [Электронный ресурс]. URL: http://www.dlib.org/dlib/
january03/smith/01smith.html
23
вместе с другими организациями и создать наиболее удобную платформу для пользователей [42]. При этом разработчики не предлагают официальную поддержку платформы, рассчитывая на то, что
учреждения сами найдут необходимые ресурсы для ее использования.
На данный момент платформа сохраняет и обеспечивает доступ
ко всем типам цифрового контента: текстовым файлам, изображениям, форматам GIF, PDF, MPEG, TIFF. Система предназначена для
работы на платформе Unix и написана на языке программирования Java. Она предоставляет DOI, подключена к GitHub и поддерживает API. Для предоставления возможности интегрированного
поиска документов поддерживается протокол сбора метаданных
OAI-PMH [43].
На сайте проекта указано, что пользователи могут самостоятельно настроить интерфейс под нужды проекта, чтобы тот соотносился с веб-сайтом учреждения и был интуитивно понятен. Сама
платформа предоставляет два основных варианта интерфейса: традиционный (JSP-интерфейс) и Manakin (на основе XML) [44]. Стандарт метаданных, использующийся платформой, — Dublin Core [45].
Пользователь может изменить любую строку и добавить новую,
а также выбрать те метаданные, которые необходимо отображать
при поиске на сайте. Тем не менее, в исследовании «Открытое программное обеспечение для создания электронных библиотек», опубликованном в журнале Journal of Library & Information Technology,
говорится о том, что с метаданными DSpace работать сложно: «создатель каталога должен знать HTML или XML, и только опыт в работе с этими языками может помочь сделать эту работу быстро» [46].
[42]
Там же.
[43]
The Open Archives Initiative Protocol for Metadata Harvesting — это
протокол, разработанный для сбора метаданных.
[44]
Top Reasons To Use DSpace. [Электронный ресурс]. URL: http://www.
dspace.org/why-use
[45]
Dublin Core — словарь основных понятий английского языка,
предназначенный для унификации метаданных. Это один из самых популярных форматов для описания ресурсов.
[46]
Шварцман М. Е. Открытое программное обеспечение для создания
электронных библиотек: сравнительное исследование. 2014. [Электронный ресурс]. URL: http://www.aselibrary.ru/blogs/archives/1373/
24
В исследовании «Сравнение систем электронных библиотек»
приводятся данные по архитектуре платформы: «Архитектура
DSpace происходит из фреймворка Кана и Виленского для сервисов
распределенных электронных объектов, а также из работ Армса по
архитектуре электронной библиотеки. DSpace основывается на работе Лагозе и прототипе реализации Fedora в университете Вирджинии. Другая существенная часть работы по созданию DSpace связана с OAIS (Open Archival Information System), где определены все
основные понятия и термины, используемые в DSpace» [47].
Платформа поддерживает собственную систему аутентификации, которая может быть изменена в случае, если учреждение
использует иные механизмы для проверки подлинности пользователя.
Нужно отметить, что DSpace доступен на более чем двадцати
языках, при этом учреждение может не просто выбрать подходящий язык, но и настроить поддержку нескольких языков, чтобы
пользователь смог выбрать тот, который является для него предпочтительным [48].
На данный момент платформа в основном используется архивами, библиотеками и высшими учебными заведениями для хранения и обеспечения доступа к научным статьям и исследованиям.
Среди пользователей — Кембридж (Великобритания), Университет
Джорджа Мейсона (США), Электронная библиотека Афганистана
при Нью-Йоркском университете (США), Онлайн-хранилище совета университетских библиотек (Канада) и другие [49].
Разработчики и пользователи постоянно работают над улучшением платформы. Просмотреть список ошибок и возможные варианты их решения можно с помощью специального приложения
JIRA [50]. Создать учетную запись может каждый член сообщества,
при этом у него появится возможность добавлять новые проблемы,
[47]
Проскудина Г. Ю, Резниченко В. А., Кудим К. А. Сравнение систем
электронных библиотек EPrints 3.0 и DSpace 1.4.1. [Электронный
ресурс]. URL: http://rcdl.ru/doc/2007/paper_66_v2.pdf
[48]
Top Reasons To Use DSpace. [Электронный ресурс]. URL: http://www.
dspace.org/why-use
[49]
Use Cases. [Электронный ресурс]. URL: http://www.dspace.org/usecases
[50]
[Электронный ресурс]. URL: https://goo.gl/4zfzSd
25
следить за ходом их решения, голосовать и комментировать. Наряду с добавлением проблем в JIRA доступна и страница с улучшениями, из последних, к примеру, — анонимизация IP-протоколирования [51].
Проект нацелен на достижение наилучшего результата, а потому
призывает разработчиков, учреждения культуры, учебные заведения и коммерческие компании участвовать в конференциях, библиотечных мероприятиях и встречах, устанавливать бета-версию,
оставлять отчеты об ошибках и пожелания, содействовать развитию платформы, например, переводить пользовательский интерфейс DSpace на другие языки. На сайте имеются все необходимые
руководства для установки и изменения продукта [52].
В России на базе DSpace работает Электронный архив открытого
доступа Белгородского университета, Электронный архив ЮУрГУ,
Электронный архив Казанского федерального университета, Электронная библиотека Тольяттинского государственного университета и Научно-техническая библиотека ФГБНУ «ВНИРО» и другие.
На сайте доступна демонстрационная версия DSpace 6.2, воспользоваться которой можно без предварительной регистрации [53].
Нужно отметить, что многие организации на основе DSpace разрабатывают собственные платформы.
Omeka
Omeka — это система управления контентом с открытым исходным
кодом, опубликованная под лицензией GNU (GPL) [54]. Платформа
была разработана в 2008 году Центром истории Роя Розенцвей [51]
Приложение Jira. The message "The file is restricted" showed when
attempting to login. [Электронный ресурс]. URL: https://goo.gl/
yN2UH5
[52]
Приложение Jira. Add existing item to a collection / linking items to
multiple collections via REST. [Электронный ресурс]. URL: https://
goo.gl/rogwEu
[53]
Сайт проекта DSpace. [Электронный ресурс]. URL: https://demo.
dspace.org/
[54]
Это лицензия, согласно которой автор передаёт программное обеспечение в общественную собственность. При этом пользователь
может изменять продукт при условии наличия информации об авторских правах и распространять его с гарантией предоставления
исходного кода.
26
га (CHNM) в Университете Джорджа Мейсона [55]. Это бесплатная,
гибкая и открытая веб-платформа для публикации контента библиотек, музеев, архивов и университетов. Одно из важнейших отличий от других платформ — ее настройка также проста, как и запуск
блога. На сайте проекта указано, что «до сих пор ученые и библиотекари, желающие опубликовать сборники исследований или создать онлайн-выставки, должны были иметь обширные технические навыки или значительное финансирование. Omeka позволяет
обойтись без этого, сосредоточив управление в руках исследователей и работников библиотек и архивов» [56]. Проект финансируется
фондом Эндрю У. Меллона, Институтом музейных и библиотечных
услуг, фондом Альфреда П. Слоана и фондом Сэмюэля Х. Кресса [57].
Разработчики постоянно улучшают свою платформу: например, за первые три года существования она была перевыпущена
18 раз [58]. Платформа была загружена более 10 000 раз, на ее основе было сделано более 100 веб-сайтов [59], в числе которых — Архив истории Брасеро (виртуальный архив, в котором собраны материалы из Смитсоновского национального музея американской
истории, Университета Брауна и Института истории устной речи
в Техасском университете (Эль-Пасо)), Цифровая библиотека университета Бордо (Франция), Центр истории образования женщин
Альберта М. Гринфилда, Австралийский справочник по электронной литературе и текстовому искусству (ADELTA) и другие [60]. Увидеть, как выглядят веб-сайты, построенные на Omeka, можно на
одной из страниц проекта [61].
[55] Omeka. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://en.wikipedia.org/wiki/
Omeka
[56]
Сайт платформы Omeka. [Электронный ресурс]. URL: https://omeka.
org/about/
[57]
Там же.
[58]
Сайт платформы Omeka [Электронный ресурс]. URL: https://omeka.
org/about/imls-final-grant-report/development-and-use/
[59]
Там же.
[60]
Характеристики Omeka Classic User Manual. [Электронный ресурс].
URL: http://omeka.org/codex/View_Sites_Powered_by_Omeka
[61]
Omeka Classic. Showcase. [Электронный ресурс]. URL: http://omeka.
org/showcase/
27
С 2010 года платформа запустила публичную бета-версию
Omeka.net. Она позволяет любому учреждению или частному лицу
создать веб-сайт без сервера или опыта программирования, имея
исключительно имя пользователя и пароль. Для упрощения работы
с платформой разработчики регулярно публикуют видеоролики на
сайте Vimeo и общаются с пользователями. При этом, в отличие от
других программных продуктов разработчика, Omeka.net платная.
Есть 4 варианта использования:
• для отдельных пользователей (2 ГБ памяти, 20 плагинов, 8 тем),
стоимостью 35 долларов США в год (примерно 2 тысячи рублей);
• для нескольких пользователей (5 ГБ памяти, 29 плагинов, 8 тем),
стоимостью 75 долларов США в год (примерно 4,5 тысячи рублей);
• для команд и групп (10 ГБ памяти, 32 плагина, 11 тем), стоимостью 350 долларов США в год (примерно 20 тысяч рублей);
• для учреждений (50 ГБ памяти, 32 плагина, 11 тем), стоимостью
1000 долларов США в год (примерно 60 тысяч рублей) [62].
Последняя версия программного обеспечения — Omeka 2.5.1 —
предлагает три основных темы, которые можно адаптировать с помощью CSS, плагина Exhibit Builder с универсальными параметрами
дизайна страницы, плагина COINS, создающего элементы, доступные для чтения Zotero, REST API и каналы RSS и Atom. Платформа
подключена к GitHub, но, в отличие от DSpace, не предоставляет
DOI.
Основной контент, опубликованный на платформе, — архивы
документов и изображений. Основная группа пользователей —
небольшие музеи, исторические общества, библиотеки и архивы.
Для каждой группы пользователей, в зависимости от их целей, на
сайте предлагаются специальные рекомендации: например, музейные работники могут использовать Omeka для обмена коллекциями, создания онлайн-выставок. Для них был бы полезен плагин ExhibitBuilder 3.0, позволяющий разрабатывать специальные
веб-страницы, которые объединяют элементы архива и позволяют
дополнить их описанием, плагин Posters, плагин Contribution 2.0,
с помощью которого можно собирать истории, изображения и другие файлы от аудитории. Участники могут публиковать и загружать
[62]
Сайт Omeka.net. [Электронный ресурс]. URL: https://www.omeka.
net/signup
28
контент анонимно, информация о них будет доступна только администраторам сайта [63]. Один из веб-сайтов, построенных на этой
платформе, — проект «ГУЛАГ: много дней, много жизней», созданный Университетом Джорджа Мейсона при поддержке Международного историко-просветительского благотворительного и правозащитного общества «Международный мемориал» и пермского
Музея истории ГУЛАГа [64].
Библиотекам Omeka предлагает такие инструменты, как CSV
Import, а для архивов — Docs Viewer и тегирование [65].
Помимо этого, среди плагинов, которые может загрузить пользователь, есть Bulk Metadata Editor, с помощью которого администратор может быстро обновлять поля метаданных, Commenting,
благодаря которому пользователи смогут комментировать объекты
в коллекции, Corrections, с помощью которого можно добавлять
внесенные пользователем исправления в метаданные, инструмент
Docs Viewer, который позволяет встроить программу просмотра
документов Google на страницы со статьями (поддерживает документы PDF, презентации Power Point, файлы TIFF и некоторые документы Microsoft Word), Flickr Import, с помощью которого можно
импортировать фотографии и галереи с сайта Flickr [66].
На данный момент платформа доступна на каталонском, французском, немецком, монгольском, португальском, сербском, испанском, шведском и английском языках. На сайте создана специальная
таблица, в которой можно посмотреть статус перевода платформы
на ваш язык и инструкции, с помощью которых его можно включить. В этой таблице русский указан под статусом «переведен почти
полностью» [67].
[63]
Сайт компании Omeka. [Электронный ресурс]. URL: https://omeka.
org/about/
[64]
Project Gulag. [Электронный ресурс]. URL: http://gulaghistory.org/
about
[65]
Сайт компании Omeka. [Электронный ресурс]. URL: https://omeka.
org/about/
[66]
Сайт компании Omeka. Список плагинов. [Электронный ресурс].
URL: https://omeka.org/add-ons/plugins/
[67]
Omeka Classic User Manual. [Электронный ресурс]. URL: https://
omeka.org/codex/Configuring_Language
29
The Comprehensive Knowledge Archive Network (CKAN)
CKAN — это платформа данных с открытым исходным кодом. Она
была разработана некоммерческой организацией Open Knowledge
Foundation для запуска публичного реестра открытых данных
TheDatahub.org [68], последняя версия вышла в апреле 2017 года.
В основном она используется создателями каталогов данных, национальными и местными органами власти, исследовательскими
институтами — в общей сложности, более 40 информационными
порталами, среди которых — правительственные порталы Великобритании, США, Австралии и Европейского союза [69].
Программное обеспечение написано на языке программирования Python. Веб-страницы включают Javascript. CKAN поддерживает цитирование через плагины, подключена к Github, но не предоставляет DOI. Платформа имеет модульную архитектуру, которая
позволяет включать в нее новые функции, необходимые пользователю [70], или выбирать из представленных разработчиками.
С помощью этой платформы пользователь может:
• публиковать и редактировать данные (напрямую через веб-интерфейс, используя JSON API, импортируя таблицы);
• хранить данные и управлять ими (CKAN обеспечивает безопасное хранение не только метаданных и ссылок на данные, но и самих
данных, если они были загружены на CKAN. При этом данные могут быть сохранены в любом формате);
• взаимодействовать с другими пользователями (пользователи
могут комментировать данные, при этом функцию комментирования можно в любой момент отключить. Благодаря интеграции
с Facebook и Twitter пользователи могут обсуждать данные в социальных сетях);
• настроить ресурс «под себя» (платформа предлагает пользователю огромное количество тем и более 60 различных расширений) [71].
[68]
Изместьева Е. «CKAN» — платформа данных с открытым исходным кодом. [Электронный ресурс]. URL: https://goo.gl/ZDEzZd
[69]
Там же.
[70]
Сайт платформы CKAN. [Электронный ресурс]. URL: https://ckan.
org/about/
[71]
Изместьева Е. «CKAN» — платформа данных с открытым исходным кодом. [Электронный ресурс]. URL: https://goo.gl/97RFH3
30
У платформы есть и другие плюсы: например, она обеспечивает
возможность поиска по ключевым словам, тегам и метаданным: от
заголовка до имени человека, опубликовавшего эти данные. Платформа помогает визуализировать данные: например, если они были
загружены в виде таблицы Excel, отобразить их можно в виде графика. Также платформа имеет геопространственные инструменты,
то есть если данные были загружены с указанием геолокации, платформа может нанести местоположение на интерактивную карту,
при этом поиск позволяет отфильтровать данные по той или иной
области на карте [72].
При этом наборы данных, которые загружаются в CKAN, могут
быть общедоступными или частными. Во втором случае данные будут видны только определенным группам пользователей.
На сайте представлена подробная инструкция для установки и
обновления платформы. На каких языках она работает, к сожалению, не указано: это можно проверить, если зайти в исходный код
ckan/i18n для файлов перевода. Языки называются с использованием двухбуквенных кодов языка ISO (например, fr, es, de, ru и т. п.).
Если язык пользователя не поддерживается, интерфейс можно перевести с помощью Transifex, ПО для перевода с открытым исходным кодом, или же осуществить перевод вручную и зафиксировать
его [73]. Демоверсии платформы нет.
Dataverse
Это еще одна платформа с открытым исходным кодом для совместного использования и хранения данных. Она была разработана Институтом социальных наук (IQSS) при Гарвардском университете
в 2006 году. Финансируется Гарвардом при дополнительной поддержке Фонда Альфреда П. Слоана, Национального научного фонда, Национального института здоровья, Благотворительного фонда
Хелмсли, Исследовательского архива Генри А. Мюррея и других [74].
[72]
Изместьева Е. «CKAN» — платформа данных с открытым исходным кодом. [Электронный ресурс]. URL: https://goo.gl/uyWy5P
[73]
CKAN 2.2.3 documentation. Сайт платформы CKAN. [Электронный
ресурс]. URL: http://docs.ckan.org/en/ckan-2.2.3/i18n.html
[74] Сайт платформы CKAN. [Электронный ресурс]. URL: https://
dataverse.org/about
31
Создатели проекта отмечали, что многие исследователи предпочитают самостоятельно публиковать свои работы через собственный веб-сайт, или — что происходит значительно чаще — не публиковать их вообще. Это связано, с одной стороны, с желанием
ученых получить больше признания, а с другой — не передавать
свои исследования архивам, поскольку те не обладают необходимыми возможностями для обеспечения их сохранности [75].
Это программное обеспечение, как и CKAN, поддерживает ограниченные условия публикации для тех случаев, когда этого хочет
автор. Существует три уровня доступности:
• публично опубликованное исследование. В этом случае работа
может быть просмотрена без каких-либо условий, но файлы могут
быть доступны только после того, как пользователь согласится с условиями использования работы;
• исследование с доступом к ограниченному числу файлов. В этом
случае часть информации (например, описание) остается открытой,
но доступ к одному или нескольким файлам ограничен. Он может
быть открыт для определенной группы пользователей, например,
тем, кто зарегистрировался на сайте;
• исследование с ограниченным доступом. В этом случае пользователю будут доступны только метаданные.
Создатели платформы считают, что исследования все чаще содержат конфиденциальную информацию, но тем не менее будут
чрезвычайно полезны для развития науки. Подобные работы предлагается хранить в отдельных репозиториях, которые смогут обеспечить их безопасность, но при этом будут включать в себя инструменты для ограниченного раскрытия информации [76].
Программное обеспечение написано на языке программирования Java. Платформа поддерживает цитирование, подключена
к Github, но не предоставляет DOI. Платформа поддерживает три
уровня метаданных (описание / цитата, доменные или пользовательские поля, метаданные файлов), имеет возможность сопоставления геопространственных файлов через интеграцию с WorldMap.
[75]
Crosas M. The Dataverse Network: An Open-Source Application for
Sharing, Discovering and Preserving Data. D-Lib Magazine. [Электронный ресурс]. URL: https://goo.gl/GwLV8K
[76]
Там же.
32
У проекта есть ряд особенностей: например, файлы в определенных форматах — Stata, SPSS, R, Excel (xlsx) и CSV — могут восприниматься как табличные данные. Они могут быть обработаны
с помощью TwoRavens — приложения для исследования, анализа и
метаанализа данных [77]. Файлы изображений — JPG, PNG и TIF —
могут быть выбраны в качестве миниатюры по умолчанию для набора данных. Выбранное изображение появится на странице поиска [78].
На данный момент проектов, работающих на этой платформе
в России, нет, возможно, это связано с отсутствием интерфейса на
русском. Среди проектов, работающих на Dataverse, есть DataverseNL
(сюда входят 11 голландских университетов), Университет Фудана,
Библиотеки Университета Альберты, Департамент межкультурных
и региональных исследований, Копенгагенский университет (ToRS),
Арктический университет Норвегии (UiT) [79].
Zenodo
Название проекту дали в честь греческого ученого, поэта и философа Зенодота, основателя текстологии, первого библиотекаря
в Александрийской библиотеке. Это универсальный репозиторий
с открытым исходным кодом, разработанный совместно проектом
OpenAIRE и CERN (Европейская организация ядерных исследований) в 2013 году [80]. Платформа финансируется Европейской комиссией через проекты OpenAIRE, CERN, фонд Альфреда П. Слоана и пожертвованиями через Фонд CERN & Society.
Основные пользователи платформы — ученые и исследователи. Как отмечается на сайте проекта, «публикация научных работ
может происходить через несколько месяцев или лет после завершения исследования. Zenodo предлагает возможность размещения
“закрытого” контента из исследований, и он будут надежно сохра [77] Data Exploration, Analysis, Meta-Analysis a modern system of
interlocking tools for quantitative analysis. [Электронный ресурс].
URL: http://2ra.vn/
[78]
Dataset + File Management. Dataverse Project. [Электронный ресурс].
URL: https://goo.gl/wMCmWj
[79]
Dataverse. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://goo.gl/9y1ffR
[80]
About Zenodo. [Электронный ресурс]. URL: http://about.zenodo.org/
33
нен. При этом исследовательские материалы можно безопасно загрузить на платформу, а потом предоставить защищенные ссылки
рецензентам» [81].
Загрузить на Zenodo можно результаты исследований из всех
областей науки. В форме загрузки пользователь может выбирать
между типами файлов: публикация (книга, раздел книги, документ,
статья журнала, патент, препринт, доклад, тезис и т.п.), плакат, презентация, набор данных, изображение (рисунок, графика, диаграмма, фотография), программное обеспечение, видео / аудио и интерактивные материалы, например, онлайн-курсы.
Для размещения на платформе подходят все виды исследовательских работ, при этом они не должны нарушать авторское право
или соглашения о неразглашении информации. Пользователем может быть любой человек, при этом при загрузке контента никакие
права собственности не передаются в CERN. Все загруженные материалы остаются собственностью сторон.
Загружать можно любые форматы файлов, при этом размер одного набора данных не должен превышать 50 ГБ. Все метаданные
экспортируются в нескольких стандартных форматах, таких как
MARC-XML, Dublin Core и DataCite Metadata Schema [82].
Файлы могут быть депонированы как в закрытом, так и в открытом доступе. «Закрытые» файлы защищены от несанкционированного использования. При этом можно указать дату, когда файл
может быть опубликован. В этом случае платформа будет ограничивать доступ до окончания периода эмбарго, после этого контент
станет общедоступным. При этом все данные будут хранится в центрах данных CERN. Разработчики предупреждают, что «в случае
закрытия хранилища будут предприняты все усилия для интеграции всего контента в подходящие альтернативные репозитории» [83].
При этом файлы с «закрытым» доступом хранятся в незашифрованном виде и могут быть просмотрены персоналом Zenodo при
[81]
Там же.
[82]
General Policies. [Электронный ресурс]. URL: http://about.zenodo.
org/policies/
[83]
Там же.
34
определенных условиях, то есть платформа не подходит для хранения секретных данных [84].
Сервера Zenodo работают с помощью OpenStack (комплекс проектов свободного программного обеспечения для создания облаков) и Puppet (управление конфигурациями операционных систем
и программ на нескольких компьютерах), благодаря чему файлам
обеспечивается безопасность. Наблюдение за серверами происходит с помощью программного обеспечения CERN, построенного на
базе Flume, Elasticsearch (бесплатная программная поисковая система), Kibana (плагин для мониторинга за процессами/информацией) и Hadoop. Сообщения об ошибках сохраняются и передаются
в специальный отдел, а регулировка трафика осуществляется с помощью совместного сочетания программ DNS и HAProxy (серверное программное обеспечение для балансировки нагрузки за счет
распределения входящих запросов на несколько разных серверов).
Все изменения и на уровне инфраструктуры, и на уровне программного кода предварительно одобряются системой контроля качества,
а после этого внедряются системой производства [85].
Все файлы, загруженные в Zenodo, хранятся в службе EOS CERN
объемом в 18 петабайт. Каждый файл имеет две копии, расположенные на разных серверах.
Особенное внимание разработчики уделили безопасности: весь
доступ ограничен числом сотрудников с соответствующей подготовкой. При этом доступ к пользовательским данным должен всегда
соответствовать их профессиональным обязанностям и может быть
разрешен только для выявления и решения проблем безопасности,
мониторинга ресурсов и т.п. Серверы управляются в соответствии
с базой безопасности CERN, операционная система и приложения
обновляются автоматически. Zenodo хранит пароли с использованием алгоритмов хеширования (PBKDF2 + SHA512) [86].
Платформа позволяет присвоить каждому объекту уникальный
цифровой идентификатор (DOI или ARK), с помощью которого
можно цитировать объект. Для того, чтобы работа появилась на
[84]
About Zenodo. [Электронный ресурс]. URL: http://about.zenodo.org/
[85]
Infrastructure. Сайт Zenodo. [Электронный ресурс]. URL: http://
about.zenodo.org/infrastructure/
[86]
Там же.
35
платформе, нужно добавить ее кнопкой upload на главной странице,
ввести метаданные и опубликовать. Если вы хотите, чтобы данные
были опубликованы в открытом доступе, в пункте «Access right»
нужно выбрать «Open Access» [87]. Платформа работает на английском языке [88] и поддерживает метаданные на любом языке, определенные в стандарте ISO 639-3 [89]. Демоверсии Zenodo нет.
Invenio
Invenio — это платформа с открытым исходным кодом, которая
предоставляет возможность управления цифровыми активами
и построение институциональных репозиториев, написанная на
языке программирования Python. Основным разработчиком платформы, как и в случае с Zenodo, является CERN при поддержке
AUTH, CFA, DESY, EPFL, FZJ, GSI, RERO, SLAC и других. Сегодня
Invenio используется научными институтами и библиотечными сетями по всему миру.
Invenio соответствует стандартам протокола сбора метаданных OAI-PMH, поддерживает несколько форматов метаданных,
таких как MARC21 [90], BibTeX, DataCite, Dublin Core, EndNote,
RefWorks [91]. Платформа использует несколько сервисов, таких как
сервер базы данных PostgreSQL, Redis, Elasticsearch для индексирования и поиска информации, RabbitMQ для обмена сообщениями [92]. Предоставляет DOI, подключена к GitHub.
Разработчики особенно выделяют поисковую систему, которая
может осуществлять поиск по нескольким миллионам записей еди [87]
Инструменты публикации кода в научных исследованиях. [Электронный ресурс]. URL: https://goo.gl/GoWU59
[88]
Сайт re3date.org. [Электронный ресурс]. URL: https://goo.gl/i9WTGn
[89]
ISO 639 — набор стандартов языковых кодов, используемых для
библиографических целей. Они открыты и могут постоянно дополняться. Стандарт ISO 639-3 был выпущен в 2007 году, сейчас
доступен ISO 639-6.
[90]
Machine-readable cataloguing — формат для описания библиографических данных, данных о фондах, классификации и обмена ими.
[91] Invenio Digital Library Framework. [Электронный ресурс]. URL:
http://invenio-software.org/
[92] Install prerequisites. [Электронный ресурс]. URL: http://invenio.
readthedocs.io/en/latest/usersguide/tutorial/prerequisites.html
36
новременно, а также обращают внимание на «настраиваемость» системы: поскольку Invenio состоит из сотен подключаемых программ,
которые взаимодействуют друг с другом через API, каждый пользователь может расширить возможности платформы и настроить рабочие процессы под себя. Платформа позволяет загружать контент
любого формата, в том числе аудио- и видеоматериалы, создавать из
них коллекции, плейлисты и альбомы. Кроме этого, платформа позволяет организовывать пользователей в определенные сообщества,
делиться с ними документами и настроить автоматические оповещения через почту или RSS [93].
Платформа предоставляет пользователю возможность ознакомиться с демоверсией. Сделать это можно по адресу https://atlantis.
unidep.org/?ln=en.
На данный момент платформу используют библиотеки и музеи
по всему миру: например, Библиотека высшего образования и научных исследований Кот-д'Ивуара, Чещская национальная техническая библиотека, Калифорнийский технологический институт
и другие [94].
Fedora
Fedora — это гибкая, модульная платформа с открытым исходным
кодом и встроенной системой поддержки данных. Как указывают
разработчики платформы, она отлично подходит для хранения
материалов цифровых архивов и библиотек и обеспечения доступа к ним. Платформа используется для предоставления доступа к
очень крупным и сложным цифровым коллекциям исторических
и культурных материалов, а также к научным данным. Основные
категории пользователей — архивы, университеты, исследовательские институты, университетские библиотеки, национальные библиотеки и правительственные учреждения [95].
Проект Fedora был создан некоммерческой организацией
DuraSpace. Платформа была разработана Корнельским университетом и Университетом Вирджинии, получившим грант от Фонда
[93] Invenio Digital Library Framework. [Электронный ресурс]. URL:
http://invenio-software.org/
[94] Invenio instances around the world. [Электронный ресурс]. URL:
http://invenio-software.org/showcase
[95]
About Fedora. [Электронный ресурс]. URL: https://goo.gl/2WQBzM
37
Меллона. Бета-версия программного обеспечения была написана
на языке программирования Java в 2002 году, на данный момент
пользователям доступна версия Fedora 4.7.4. Платформа финансируется через членские взносы [96]. Сегодня ее использует более
300 организаций в 35 странах мира [97].
Платформа предоставляет набор основных услуг через API
RESTful с использованием современных веб-стандартов. На платформе может храниться любой тип файлов, при этом существует
множество вариантов хранения файлов и метаданных, включая
файловые системы и базы данных. Цифровые активы могут быть
защищены с помощью подключаемых модулей. Платформа не поддерживает цитирование и не предоставляет DOI, но подключена
к GitHub [98].
Fedora основана на принципе, что полноценный цифровой репозиторий лучше всего строить с помощью интеграции различных
интерфейсов и механизмов, а потому представляет собой в большей степени платформу для управления цифровыми архивами.
При этом Fedora поддерживает импорт и экспорт цифровых объектов в различных форматах. Это позволяет осуществлять обмен
объектами между платформой и другими приложениями, а также
облегчает хранение и архивирование цифровых данных [99]. Демоверсию платформы найти не удалось.
В России цифровых проектов, которые используют эту платформу, нет.
Islandora
Fedora является частью большого проекта — Islandora. Это платформа с открытым исходным кодом, работающая на основе Fedora
Commons, Drupal, Solr и других приложений [100]. Она была разра [96]
Там же.
[97] Who's Using Fedora. [Электронный
fedorarepository.org/whos-using-fedora
ресурс].
URL:
http://
[98] Download Description. Fedora 4.7.4. [Электронный ресурс]. URL:
http://fedorarepository.org/download
[99]
Fedora Commons. [Электронный ресурс]. URL: https://goo.gl/wDSg8d
[100] About Islandora. [Электронный ресурс]. URL: https://islandora.ca/
about
38
ботана Библиотекой Робертсона при университете острова Принца
Эдуарда (Канада) и выпущена под лицензией GNU [101].
В 2008 году университетом была выпущена «Стратегия развития
на 2008-2018 год». Одним из пунктов документа стала разработка
«общедоступного институционального хранилища, в котором будут содержаться материалы для всех исследователей, копии документов, публикаций и отчетов» [102]. Вскоре была создана первая
версия IslandScholar.ca, которая включала возможность добавлять
цитаты и публикации.
В феврале 2012 года университет выпустил новую стратегию под
названием «Открытый доступ и распространение результатов исследований». Согласно ей, ученые должны отдавать свои научные
исследования в IslandScholar, публиковаться в журналах, которые
позволяют им сохранить авторские права на свои работы, а после
этого выкладывать свои труды в IslandScholar (препринты, данные
исследований и т. д.). В эту же систему должны попадать дипломные работы, магистерские и кандидатские диссертации [103]. Таким
образом, основной целью платформы стало помочь учреждениям культуры, научным организациям и их аудитории совместно
управлять и находить новые цифровые материалы.
Платформа «строится» на нескольких приложениях. Она может
быть расширена за счет дополнительных программных продуктов. Интерфейс создан на базе популярной платформы управления
контентом Drupal. Код платформы Islandora позволяет взаимодействовать со множеством софт-обеспечения, созданного сторонними организациями, например, ImageMagick, FITS, LAME, Tesseract,
Internet Archive Bookreader, Open Seadragon [104].
Ключевые особенности проекта:
• поддержка любых типов файлов;
• поддержка нескольких языков (к сожалению, русского языка нет);
• поддержка любого стандарта метаданных XML, включая уни [101] Islandora. [Электронный ресурс]. URL: https://goo.gl/Bt7qa3
[102] Moses D., Stapelfeldt K. Renewing UPEI’s Institutional Repository: New
Features for an Islandora-based Environment. ISSN 1940-5758. [Электронный ресурс]. URL: http://journal.code4lib.org/articles/8763
[103] Там же.
[104] Там же.
39
кальные схемы;
• поддержка семантических онтологий и создание связей между
объектами;
• гибкий поиск под управлением Apache Solr.
Исходный код Islandora доступен для загрузки из Github [105].
Платформа установлена в университетах, библиотеках и архивах
по всему миру, среди наиболее заметных пользователей — Национальный институт антропологии и истории Мексики, Иллинойский технологический институт, Геологическая служба США (всего
213 учреждений). В России платформа установлена в Санкт-Петербургском колледже [106]. Демоверсии платформы нет.
Archivematica
Archivematica — это бесплатная цифровая система хранения с открытым исходным кодом, которая предназначена для поддержания долгосрочного доступа к онлайн-материалам. Все программное обеспечение и документация доступны бесплатно и выпущены
в соответствии с лицензиями GNU Affero General Public License
(AGPL 3.0) и Creative Commons. Платформа взаимодействует с такими проектами, как AtoM, DSpace, CONTENTdm, Islandora, LOCKSS,
DuraCloud, OpenStack и Archivists Toolkit [107].
Разработчик платформы — Artefactual Systems. Проект финансируется Музеем современного искусства (MoMA), библиотекой
Йельского университета, Мичиганским университетом и другими [108].
Цель создания платформы — предоставить архивам и библиотекам с ограниченными техническими и финансовыми ресурсами
инструменты, которые помогли бы им сохранить цифровую информацию и сделать ее доступной. Нужно отметить, что проект осуществляет техническую поддержку для учреждений, которые хотят
установить платформу.
[105] Islandora Сайт GitHub. [Электронный ресурс]. URL: https://github.
com/islandora/
[106] Islandora Installations Map. [Электронный ресурс]. URL: https://
islandora.ca/islandora-installations
[107] What is Archivematica? [Электронный ресурс]. URL: https://wiki.
archivematica.org/Main_Page
[108] Там же.
40
Платформа состоит из множества «микросервисов» — крохотных системных задач, которые работают на модели данных, являющейся эквивалентом информационного пакета Open Archival
Information System (OAIS) — базовой модели открытых архивных
информационных систем: SIP — пакет предоставления информации, AIP — пакет архивной информации, DIP — пакет распространения информации. Система включает в себя файлы, контрольные
суммы, логи, предоставляемые документы, метаданные XML.
Все функции Archivematica доступны через панель управления,
к которой можно получить доступ из любой точки мира. Она разработана с использованием Django MVC на основе языка программирования Python. Платформа позволяет пользователям добавлять
или редактировать метаданные. Уведомления включают отчеты об
ошибках и мониторинг задач [109]. Панель управления даёт доступ
к мультипользовательскому интерфейсу, который будет показывать состояние системы, а также упростит управление и запуск микропроцессов. В уведомлениях показываются отчеты об ошибках,
статистика задач сервера MCP, а также решения, приятые пользователем в процессе работы [110].
Archivematica использует специальный формат загруженных
файлов. Стратегия платформы состоит в том, чтобы нормализовать файлы для последующего сохранения и доступа после загрузки. Платформа группирует форматы файлов (к примеру, текстовые,
аудио-, видео-, растрированные изображения, векторные изображения и т.д.). Выбор формата основывается на наиболее удачной
практике пользователей, на доступности бесплатных (свободно
распространяемых) и открытых (с открытым кодом) средств для
нормализации, а также на анализе характеристик в каждом формате мультимедийных файлов [111].
Для работы с более ранними версиями платформы потребуется
операционная система на базе Linux. Последняя версия была протестирована на операционных системах Ubuntu 14.04.5, Ubuntu
16.04.2, CentOS 7.3.1611. Разработчики отмечают, что работа плат [109] Open source OAIS. [Электронный ресурс]. URL: https://wiki.
archivematica.org/Overview
[110] Micro-services of Archivematica 1.6. [Электронный ресурс]. URL:
https://goo.gl/ZDKTc6
[111] Там же.
41
формы возможна в Mac OS X со значительными отклонениями
в инструкции, и точно не будет работать на базе Windows [112]. Минимальные требования к оборудованию для запуска платформы
в тестовом режиме или ее функционирования в рамках поддержи
небольших коллекций (менее 100 файлов весом в 1 ГБ или меньше)
потребуется двухъядерный процессор, память более 2 ГБ и дисковое
пространство в размере 7 ГБ. Для полноценной работы платформы
требуется двухъядерный процессор, память более 4 ГБ и дисковое
пространство не менее 20 ГБ (в зависимости от величины коллекции) [113].
Archivematica поддерживает несколько стандартов метаданных,
например, Dublin Core и PREMIS, а также дополнительные метатеги. Она подключена к GitHub, не поддерживает цитирование
и не предоставляет DOI.
На сайте проекта доступна демоверсия, поработать в которой
может любой пользователь. Для этого нужно ввести логин и пароль,
также доступные на сайте проекта [114].
Разработка и обсуждение проекта ведется в США, Европе (Великобритании и Нидерландах), Австралии при поддержке различных
университетов и библиотек. На встречах обсуждается работа платформы и необходимые улучшения [115].
EPrints
EPrints — это одна из ведущих платформ для построения цифровых репозиториев с открытым исходным кодом. Она была разработана в Школе электроники и информатики Университета Саутгемптона (Великобритания) и предназначена для создания архивов
научных исследований, состоящих из разного типа информации:
научных статей, отчетов, диссертаций, монографий, учебно-мето [112] Installation. [Электронный ресурс]. URL: https://goo.gl/aqvky4
[113] Там же.
[114] Для использования демоверсии необходимо пройти по ссылке
http://sandbox.archivematica.org/transfer/ и ввести в поле
следующие данные: username: demo@example.com, password:
demodemo.
[115] Community/Regional User Groups. [Электронный ресурс]. URL:
https://wiki.archivematica.org/Community/Regional_User_Groups
42
дических пособий, материалов конференций, данных результатов
экспериментов и наблюдений и т.п. [116] Платформа была выпущена
под лицензией GPL, первая версия появилась в 2000 году. Цель проекта заключалась в объединении всех публикуемых данных в различных учреждениях.
EPrints оптимизирована так, чтобы исследователь, ученый или
автор мог самостоятельно вносить материалы. Платформа успешно работает с операционными системами Linux, Solaris, Mac OS X
и Microsoft Windows.
С каждым типом документа в EPrints связан отдельный набор
полей метаданных. Типы документов могут быть следующими:
статья в журнале, газете или интернет-портале; книга или глава
из книги; монография; технический отчет; отчет по проекту, документация, руководство; доклад; постер, речь, лекция или презентация с конференции, семинара или другого события; записи лекций,
упражнения, экзаменационные документы или программы курсов;
категория «другое» [117].
Данные из EPrints могут экспортироваться в формате метаданных BibTeX, OpenURL, ContextObject, OpenURL Dissertation,
OpenURL Journal, Dublin Core, EndNote, HTML Citation, METS,
Reference Manager, Refer, Simple Metadata, ASCII Citation и EP3
XML [118].
EPrints поддерживает файлы разного формата, индексирует
файлы PDF, ASCII, Microsoft Word, HTML. На платформе возможен полнотекстовый и расширенный поиск. Одно из достоинств
платформы — гибкая интеграция с основным сайтом организации
с сохранением его оформления. Ко всему прочему, она подключена
к GitHub и предоставляет DOI.
В России на платформе EPrints функционируют репозиторий
Тверского государственного технического университета, Открытый архив электронных изданий Оренбургского государственного
[116] Новицкий А. В., Кудим К. А., Резниченко В. А, Проскудина Г. Ю. Создание научных архивов с помощью системы Eprints. [Электронный ресурс]. URL: https://goo.gl/YkFs66
[117] Проскудина Г. Ю., Резниченко В. А., Кудим К. А. Сравнение систем
электронных библиотек EPrints 3.0 и DSpace 1.4.1. [Электронный
ресурс]. URL: http://rcdl.ru/doc/2007/paper_66_v2.pdf
[118] Там же.
43
университета, репозиторий ИВиС ДВО РАН, Институциональный
репозиторий НГМУ и другие.
Greenstone
Это программный продукт для создания и распространения коллекций цифровых библиотек. Первоначально платформа была разработана для создания цифровой библиотеки при университете
Ваикато (Новая Зеландия) при сотрудничестве с ЮНЕСКО и Неправительственной организацией по гуманитарной информации
(Бельгия). Распространяется под лицензией GNU GPL v2. Написана
на C++, Java, Perl,XSLT, Javascript [119]. Платформа работает на операционных системах Windows, Unix / Linux и Mac OS -X [120].
Как указано на сайте проекта, «Greenstone — это комплексная
система для создания и представления доступа к крупномасштабным коллекциям библиотек и архивов, состоящих из миллионов
документов в разнообразных форматах, в том числе в виде текста,
изображения, аудио- и видеозаписей» [121].
На данный момент существует две версии: Greenstone2
и Greenstone3. Разработчики указывают, что в целом платформы работают одинаково. Плюсы Greenstone3 — платформа предоставляет
больше возможностей для смены интерфейса, генерирует данные
страницы в XML, который преобразуется в HTML с помощью XSLT.
Все форматирование выполняется с использованием XSLT, поэтому
и сама настройка проще, чем в Greenstone2. Служба Berry Baskets
предлагает способ сбора интересующих документов при просмотре
коллекций, опубликованных на Greenstone. Например, пользователь может перенести интересующий документ в корзину, а позже
просмотреть ее содержимое и даже вставить документ в электронное письмо. Из минусов — платформа не позволяет экспортировать
коллекции на CD-ROM и DVD-ROM, может не отображать только
[119] Greenstone. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://goo.gl/kUFVoD
[120] Overview of Greenstone. Part of the Greenstone Beginner's Guide.
[Электронный ресурс]. URL: https://goo.gl/xuz98m
[121] Там же.
44
что созданные коллекции и ошибаться при форматировании файлов [122].
Платформа позволяет обрабатывать файлы различных форматов: PDF-документы, HTML-страницы, презентации Power Point,
таблицы Excel, изображения, видеозаписи, записи MARC [123]. Для
поддержки остальных типов документов необходимы плагины.
На платформе есть специальный редактор для набора метаданных
GEMS [124]. Платформа является мультиязычной, на русском языке доступен даже сайт проекта. Платформа подключена к GitHub
и предоставляет DOI.
На данный момент на этой платформе работают AHKRC (цифровая библиотека Пакистана), ARCAS (портал, на котором размещены научные материалы по гуманитарным и социальным наукам
в открытом доступе), Научная цифровая библиотека Балеарских
островов, FIA (научная цифровая библиотека Балеарских островов), Национальная библиотека Уругвая, Цифровой архив Намибии — всего 89 порталов. Среди них, если верить сайту платформы,
есть и российские организации — например, на этой платформе
размещено несколько коллекций Российской академии наук [125].
Инструкция по установке платформы также доступна на русском
языке [126], при этом многие исследователи отмечают, что платформа достаточно сложна для установки.
ResCarta
ResCarta — это программное обеспечение, предназначенное для
управления цифровом контентом, его хранения и обеспечения доступа к нему. Платформа была создана некоммерческой организацией ResCarta Foundation для разработки единого набора стандартов по внедрению платформ с открытым исходным кодом, которые
[122] Greenstone2 or Greenstone3. [Электронный ресурс]. URL: http://wiki.
greenstone.org/doku.php?id=en:user:gs2_or_gs3
[123] Там же.
[124] Basic Installation. Part of the Greenstone Beginner's Guide. [Электронный ресурс]. URL: https://goo.gl/6pkiSP
[125] Greenstone didgital library software. [Электронный ресурс]. URL:
http://www.greenstone.org/examples_ru
[126] Цифровая библиотека Greenstone. Инструкция пользователя.
[Электронный ресурс]. URL: https://goo.gl/rWm6bt
45
позволили бы пользователям получить доступ к разрозненным
цифровым коллекциям в простом и удобном формате [127]. Исследователи отмечают, что ResCarta в большей степени подходит для
создания небольшой электронной библиотеки (100 — 1000 документов), состоящей из текстов и/или изображений: «например, это
может быть цифровая коллекция старых книг, фотографий, нот
и т. п.» [128]. Платформа написана на языке программирования Java
и работает на любой операционной системе. Первая версия появилась в 2004 году.
Платформа состоит из двух приложений: ResCarta Toolkit
и ResCarta Web. Первое приложение позволяет создавать цифровые коллекции, в которые могут быть включены файлы JPG, TIFF,
PDF, а также аудиоформаты. Пользователь может добавлять к файлам метаданные, а затем объединять их в коллекции. Доступ к коллекциям осуществляется за счет ResCarta Web, который позволяет
просматривать объекты и икать среди них необходимые документы. Кроме этого, пользователь «может установить приложение jOAI
OVERVIEW, которое позволяет использовать программу ResCarta
как OAI Data-Provider, т.е. отдавать OAI-метаданные другим организациям, располагающим соответствующим программным обеспечением, и как OAI Harvester — т.е. позволяет собирать OAI-метаданные из других организаций» [129]. Платформа подключена
к GitHub, но не предоставляет DOI.
Поиск осуществляется по полному тексту (при условии, что он
распознан) при наличии точных совпадений (без морфологии и усечений), к документу можно добавлять ключевые слова. При этом
скачать документ полностью не получится, т. к. его страницы выдаются последовательно [130]. Самые большие минусы платформы —
очень простой функционал и интерфейс. Сама платформа не переведена на русский язык, однако существует полноценный перевод
[127] Сайт ResCarta Foundation. Version 6.0.5. [Электронный ресурс].
URL: http://www.rescarta.org/
[128] ResCarta — ПО для создания электронной библиотеки. [Электронный ресурс]. URL: https://ideafor.info/?p=2716
[129] Там же.
[130] Шварцман М. Е. Как создать самую простую электронную библиотеку с помощью ResCarta. Сайт Российской ассоциации электронных библиотек. [Электронный ресурс]. URL: https://goo.gl/Znc3QX
46
инструкции по установке, сделанный Н. Козловой и С. Балякиным,
что значительно облегчает ее установку [131].
На данный момент платформа используется даже в России:
например, на ней работает коллекция «Периодические издания
XVIII в.» научной библиотеки Санкт-Петербургского государственного университета.
MyCoRe
Это платформа с открытым исходным кодом для создания хранилищ, цифровых архивов и библиотек. Она была разработана в различных немецких университетских библиотеках и компьютерных
центрах, первая версия появилась в 2001 году. Платформа написана на Java и XML. Доступна в соответствии с General Public License
(GPL) [132].
Платформа состоит из функционального ядра, которое обеспечивает загрузку и публикацию файлов, управление метаданными
(на основе схемы описания метаданных MODS), поиск, интерфейс
OAI, средство просмотра изображений и т.д. Дополнительные функции: настраиваемые веб-страницы, управление всеми распространенными типами файлов, такими как PDF, документы, аудио / видео файлы, изображения, каталоги файлов. Платформа может быть
расширена за счет дополнительных приложений. Документация
существует на немецком и английском, разработчики утверждают,
что язык самого приложения настраивается под нужды пользователя [133]. MyCoRe подключена к GitHub, но не предоставляет DOI.
Платформа работает на операционных системах Linux, Mac OS X,
Unix, Windows. Идентификаторы (URN, DOI, Handle) обеспечивают постоянный доступ к данным. Таким образом, электронные
публикации и цифровые копии получают постоянный уникальный адрес [134]. Для пользователей доступна демоверсия, где можно
[131] Там же.
[132] MyCoRe. [Электронный ресурс]. URL: https://goo.gl/8xxAfs
[133] MyCoRe data sheet. [Электронный ресурс]. URL: http://www.mycore.
de/filecollection/MyCoRe_datasheet.pdf
[134] Das MyCoRe Datenmodell. [Электронный ресурс]. URL: http://www.
mycore.de/features/datamodel.html
47
протестировать платформу в качестве администратора, автора или
редактора [135].
На карте представлены организации, которые используют
MyCore. В основном это немецкие учреждения культуры, науки
и образования, но есть и организации из Великобритании и Италии [136].
[135] MyCoRe MODS Institutional Repository. Sample Application. [Электронный ресурс]. URL: https://goo.gl/36W8rF
[136] Karte der MyCoRe-Anwendungen. [Электронный ресурс]. URL:
http://www.mycore.de/applications/map.html
48
SobekCM
SobekCM — это программный продукт с открытым исходным кодом и набор инструментов для цифровых библиотек и репозиториев. Чаще всего платформа используется библиотеками, архивами,
музеями, колледжами, университетами, научными исследовательскими проектами. Программное обеспечение было разработано
в библиотеке Университета Флориды. Разработка платформы началась в 2005 году, первая версия появилась в 2006. Крупнейшими цифровыми репозиториями, на которых работает SobekCM, является цифровая библиотека Университета Флориды и цифровая
библиотека Карибского моря [137]. В 2011 году платформа SobekCM
была выбрана для создания цифровых библиотек по всему штату.
Разработка платформы проводится до сих пор и финансируется за счет различных грантов. SobekCM был написан на языке
программирования в C# и выпущен в соответствии с лицензией
GNU GPL. На платформе осуществляется полнотекстовый поиск
по коллекциям; загрузка файлов любых типов (текст, изображение,
мультимедиа, аудио- и видеофайлы, наборы данных); поддержка
метаданных с автоматическим преобразованием (METS / MODS,
MARCXML, Dublin Core); поиск на основе Google-карт; полноэкранный просмотр страниц (с возможностью масштабировать изображение); индивидуальный интерфейс (например, dLOC и Matheson
Historical Museum); поддержка OAI-PMH. Интерфейс локализован
на английском, испанском и французском языках [138].
К платформе подключаются плагины, например, Model3D Viewer
предоставляет возможность просмотра 3D-моделей. На сайте платформы указано, что ее можно интегрировать в другие программные продукты, например, Omeka [139].
Платформа работает только на операционных системах Microsoft
Windows. Для использования SobekCM рекомендуется иметь не ме-
[137] Статья SobekCM. Сайт универсальной интернет-энциклопедии
«Википедия». [Электронный ресурс]. URL: https://goo.gl/5jssC6
[138] About SobekCM. [Электронный ресурс]. URL: https://goo.gl/5FdHJS
[139] Plugins & Commonly Used Tools. [Электронный ресурс]. URL: http://
sobekrepository.org/help/tools
49
нее 4 ГБ памяти и 80 ГБ дискового пространства на сервере [140].
Платформа подключена к GitHub, но не предоставляет DOI.
Российские платформы
«ИнфоРост»
Платформа «ИнфоРост» — это специализированная система управления контентом, разработанная для создания электронных библиотек и каталогов, выставок и коллекций. Она была запущена
в 2011 году и протестирована на исторических факультетах МГУ
им. М. В. Ломоносова и «НИУ Высшая школа экономики», в Ассоциации содействия архивному делу, в Центре исследований народов России, Кавказа и Центральной Европы, в Доме наук о человеке
(CNRS-EHESS, Франция), в Итальянской ассоциации исследований
современной истории (SISSCo) [141].
Платформа является платной: стандартная полугодовая лицензия на хранилище размером в 200 ГБ стоит 134 тысячи в год. Такое хранилище вмещает около 300 тысяч страниц формата А4 или
1250 книг средним объемом 200 страниц. Годовая лицензия на хранилище объемом в 500 ГБ стоит почти 269 тысяч рублей, универсальная (1000+ ГБ) — почти 400 тысяч. Существуют лицензии и на
полгода, их стоимость в зависимости от объема хранилища варьируются от 71 тысячи рублей до 213 [142].
Учреждение должно будет заплатить 165 тысяч за дистанционную установку при наличии выделенного сервера библиотеки, а
также 95 тысяч за права на использование в течении года на одном
локальном сервере [143]. Взамен разработчики обещают обновление
платформы, обучение сотрудников, техническую поддержку и стабильную работу хранилища. При этом учреждение имеет право
[140] System Requirements. [Электронный
sobekrepository.org/software/requirements
ресурс].
URL:
http://
[141] Сайт платформы «ИнфоРост». [Электронный ресурс]. URL: http://
inforost.org/ru/docs/1-platforma
[142] Лицензионная стоимость платформы ИнфоРост. [Электронный ресурс]. URL: https://goo.gl/4RetfG
[143] Лицензионная стоимость платформы ИнфоРост. [Электронный ресурс]. URL: https://goo.gl/69ztTU
50
протестировать платформу до покупки лицензии: для этого необходимо прислать запрос в организацию по электронному адресу
info@inforost.org с именем сотрудника и названием организации.
Платформа «ИнфоРост» позволяет наполнять электронные библиотеки и архивы книгами, журналами и газетами, архивными
документами, картами и иллюстрациями (с возможностью увеличивать детали), библиографическими записями, фотографиями, видео- и аудиозаписями. Пользователь может самостоятельно
настроить графический стиль и функциональность электронной
библиотеки, определить доступность контента, создавать шаблоны
метаданных. Это значит, что при загрузке книги администратор
может самостоятельно определить тип метаданных и использовать
созданный шаблон для других документов. «ИнфоРост» предоставляет статистику использования электронного ресурса, а также
предусматривает возможность использования платформы в многопользовательском режиме, то есть сразу несколькими библиотеками [144].
Что немаловажно, использовать платформу можно без привлечения программистов: в административных панелях есть подсказки для тех пользователей, которые не обладают специальными техническими навыками.
«Ядро» платформы — административный модуль. Как указано
на сайте проекта, он отвечает за «создание и настройку электронных коллекций, в том числе режимы доступа к документам (открытый, полуоткрытый, ограниченный по паролю/IP-адресу);дизайн
и определение стилей интерфейсов; настройки функциональности; статистику; определение и редактирование ролей для работы
с коллекциями (примеры ролей: Администратор, Редактор, Читатель); языковые настройки» [145]. Также в состав платформы входит
модуль создания и редактирования метаданных; модуль DocView,
который позволяет увеличивать или уменьшать страницы, поворачивать их, распечатывать и загружать документы; модуль полнотекстового поиска по библиографическим данным и описаниям;
[144] Предоставление в использование программного продукта «Платформа ИнфоРост (версия 4.8.4)» по Лицензии и его техническая
поддержка. [Электронный ресурс]. URL: https://goo.gl/HLa3H9
[145] Там же.
51
и модуль многопоточной загрузки файлов и конвертации имиджей [146]. Платформа написана на языке программирования Ruby.
На данный момент пользователями платформы являются Российский государственный архив социально-политической истории
(РГАСПИ), Центральный архив Министерства обороны (ЦАМО),
Государственная общественно-политическая библиотека (ГОПБ),
Государственная публичная историческая библиотека (ГПИБ), Германский исторический институт в Москве, 12 журнальных издательств и 1 книжное (издательство «Самолет») [147].
АБИС OPAC
Эта платформа для библиотек и архивов была разработана компанией «ДИТ-М». Первая версия — OPAC-R — появилась в 1995 году [148].
Платформа использует формат RUSMARC «для библиографических записей в целях каталогизации документов, авторитетных/
нормативных записей для ведения авторитетных данных, для классификационных данных, для контроля местонахождения документов» [149]. Библиографические записи представляются согласно
ГОСТ 7.1-2003.
На платформе OPAC-Global возможен поиск, каталогизация, ведется запись пользователей и регистрация посещений. Платформа
подходит для сети библиотек, ее стоимость — 3 410 000 рублей. Для
отдельных библиотек в большей степени подходит продукт OPACmidi, стоимость которого составляет 1 320 000 рублей [150].
На данный момент в России данной системой пользуются 35 учреждений, в том числе Министерство здравоохранения Российской
Федерации. Нужно отметить, что с каждым годом она становится
все менее популярной — например, в 2017 году его приобрела только одна организация — Центральная военно-морская библиотека
Санкт-Петербурга.
[146] Там же.
[147] Сайт платформы «ИнфоРост». [Электронный ресурс]. URL: http://
inforost.org/ru/docs/1-platforma
[148] Сайт компании «ДИТ-М». [Электронный ресурс]. URL: http://www.
ditm.ru/
[149] Там же.
[150] Там же.
52
2.3. Сопоставление платформ
Таблица 1. Выбранные платформы
Наименова
ние
Разработчик
Открытый
код и тип
лицензии
Страна
Ссылка
происхождения
DSpace
Hewlett-Pac
kard
Да. BSD
США
http://www.
dspace.org/
Omeka
George Mason Да. GNU (GPL)
University
США
https://ome
ka.org/
CKAN
Open
Knowledge
Foundation
Да. GNU (AGPL)
v3.0
Великобрита ния
https://cka
n.org/
Dataverse
Harvard
Да. GNU (GPL)
v2.0
Великобрита ния
https://dat
averse.org/
Zenodo
CERN
Да
Швейцария
https://zen
odo.org/
Invenio
CERN
Да. GNU (GPL)
Швейцария
http://inve
nio-softwar
e.org/
Fedora
DuraSpace
Да. ECL
США
https://get
fedora.org/
ru/
Islandora
DuraSpace
Да. GNU
США
https://isl
andora.ca/
Archivemati ca
Artefaqtual
Systems
Да. GPL v2.0
Канада
https://ww
w.archivema
tica.org
EPrints
University of
Southampton
Да. GPL
Великобритания
http://www.
eprints.org /
uk/
Greenstone
University of
Waikato
Да. GNU GPL
v2.0
Новая
Зеландия
http://www.
greenstone.
org/
ResCarta
ResCarta
Foundation
Да. GNU v2.0
США
http://www.
rescarta.org/
SobekCM
University of
Florida
Да
США
http://sobe
krepository
.org/
53
Наименова
ние
Разработчик
Открытый
код и тип
лицензии
Страна
Ссылка
происхождения
MyCore
Universität
Duisburg-Es
sen
Да. GNU (GPL)
Германия
http://www.
mycore.de/
ИнфоРост
НП «ИнфоРост»
Нет
Россия
http://inf
orost.org/ru
АБИС OPAC
ДИТ-М
Нет
Россия
http://www.
ditm.ru/
Таблица 2. Технологии
Наименование
Язык программировани я
Метаданные
Поддерживаемый тип
файлов
DSpace
Java
Dublin Core
Все типы файлов, полный список доступен по адресу goo.gl/
dyQxnX
Omeka
PHP
Dublin Core
Поддерживает большинство
типов файлов, в том числе
MP3, MP4, AAC
CKAN
Python
Dublin Core
Нет данных
Dataverse
Java
Dublin Core
Нет данных
Zenodo
Python
Dublin Core
Все форматы файлов
Invenio
Python
MARC21
с BibTeX,
DataCite,
Dublin Core,
EndNote,
RefWorks
Нет данных
Fedora
Java
Dublin Core
Не поддерживает формат DVD
Islandora
PHP
Dublin Core,
PREMIS
GIF, JPG, PNG, TIFF, JP2, PDF,
MP3, WAV, MP4
Archivematica
Python
Dublin Core,
PREMIS
AC3, AIFF, MP3, WAV, WMA,
DOCX, PPTX, XLSX, PDF, AI, EPS,
SVG, DOC, WPD, RTF, AVI, FLV,
MOV, MPEG-1, MPEG-2, MPEG-4,
SWF, WMV, BMP, GIF, JPG, JP2,
PNG, PSD, TIFF, TGA, XLS
54
Наименование
Язык программировани я
Метаданные
Поддерживаемый тип
файлов
Eprints
Python
BibTeX,
Все форматы файлов
OpenURL,
ContextObject,
OpenURL
Dissertation,
OpenURL
Journal, Dublin
Core, EndNote,
HTML
Citation, METS,
Reference
Manager,
Refer, Simple
Metadata,
ASCII Citation
и EP3 XML
Greenstone
C++, Java,
Perl, XSLT,
Javascript
Dublin Core,
DLS
Microsoft Word, Excel, Rich Text
Format, HTML, PDF, ZIP, MP3
ResCarta
Java
Dublin Core,
MarcXML,
MODS
TIFF, JPEG, PDF, Wave Audio
SobekCM
C#
Dublin
Core, MODS,
MarcXML,
METS
BMP, GIF, JPG, PNG, AI, DOC,
DOCX, EPS, PDF, PSD, PUB, TXT,
VSD, VSDX, XLS
ИнфоРост
Ruby
АБИС OPAC
Нет данных
Изображения, документы,
таблицы, карты, видео- и
аудиофайлы
RUSMARC
Нет данных
Таблица 3. Наличие перевода,
стоимость установки платформы, наличие демоверсии
Наименование
Наличие
Стоимость
русскоязычной версии
Наличие демоверсии
DSpace
Да
Да
55
Бесплатна для установки
Наименование
Наличие
Стоимость
русскоязычной версии
Наличие демоверсии
Omeka
Да
Бесплатна для установки
Да
CKAN
Нет
Бесплатна для установки
Нет
Dataverse
Нет
Бесплатна для установки
Да
Zenodo
Нет
Бесплатна для установки
Нет
Invenio
Нет
Бесплатна для установки
Да
Fedora
Нет
Бесплатна для установки
Нет
Islandora
Нет
Бесплатна для установки
Нет
Archivematica Нет
Бесплатна для установки
Да
EPrints
Нет
Бесплатна для установки
Нет
Greenstone
Нет
Бесплатна для установки
Нет
ResCarta
Нет
Бесплатна для установки
Нет
SobekCM
Нет
Бесплатна для установки
Нет
MyCore
Нет
Бесплатна для установки
Нет
ИнфоРост
Да
От 71 до 400 тысяч в зависимости от вида лицензии,
объема хранилища и времени использования.
Да
АБИС OPAC
Да
1 320 000 рублей
Нет
Таблица 4. Интеграция
Наименование
Подключена
к GitHub
Предоставляет
DOI
Есть онлайн API
DSpace
Да
Да
Да
Omeka
Да
Нет
Да
CKAN
Да
Нет
Да
Dataverse
Да
Нет
Да
Zenodo
Да
Да
Да
Invenio
Да
Да
Да
Fedora
Да
Нет
Да
Islandora
Да
Нет
Да
Archivematica
Да
Нет
Да
EPrints
Да
Да
Да
56
Наименование
Подключена
к GitHub
Предоставляет
DOI
Есть онлайн API
Greenstone
Да
Нет
Да
ResCarta
Да
Нет
Да
SobekCM
Да
Нет
Да
ИнфоРост
Нет
Нет
Нет
АБИС OPAC
Нет
Нет
Нет
Таблица 5. Цели использования и основная аудитория
Наименование
Число
внедрений
на базе
Res3Data
Кем используется
Тип материалов
DSpace
57
Архивы, библиотеки, университеты
Научно-исследов
ательские материалы, коллекции книг
и изображений
Omeka
0
Архивы, библиотеки и музеи
Научно-исследов
ательские материалы, коллекции книг
и изображений
CKAN
36
Государственные
учреждения, создатели каталогов данных, библиотеки
Данные, научно-исследов ательские
материалы
Dataverse
46
Библиотеки и архивы при университетах
Научно-исследов
ательские материалы и публикации
Zenodo
1
Библиотеки и архивы при университетах, ученые и
исследователи
Научно-исследов
ательские материалы и публикации
Invenio
5
Библиотеки и архивы при университетах, ученые и
исследователи
Научно-исследов
ательские материалы и публикации
57
Наименование
Число
внедрений
на базе
Res3Data
Кем используется
Тип материалов
Fedora
30
Библиотеки и архивы при университетах, ученые и
исследователи
Научно-исследов
ательские материалы и публикации,
архивы документов
и изображений
Islandora
0
Библиотеки и архивы при университетах, ученые и
исследователи
Научно-исследов
ательские материалы и публикации,
архивы документов
и изображений
Archivematica
0
Архивы и библиотеки
Научно-исследов
ательские материалы и публикации,
архивы документов
и изображений
EPrints
30
Архивы и библиотеки
Коллекции книг, документов и изображений
Greenstone
0
Архивы и библиотеки
Коллекции книг, документов и изображений
ResCarta
0
Архивы и библиотеки
Небольшие коллекции документов и
изображений
SobekCM
0
Архивы, библиотеки и музеи
Коллекции книг и
изображений
ИнфоРост
0
Архивы и библиотеки
Коллекции книг, документов и изображений
АБИС OPAC
0
Архивы и библиотеки
Коллекции книг, документов и изображений
58
2.4. Выбор лучшего решения
При выборе платформы для создания электронной библиотеки или
архива следует руководствоваться первоочередными задачами, которые ставит перед собой учреждение, а также располагаемыми
финансами. Из всех представленных платформ наибольшей привлекательностью обладает система «ИнфоРост»: она поддерживает
все необходимые типы файлов, позволяет создавать шаблоны метаданных, относительно проста в использовании.
Преимущество данной платформы перед остальными состоит
еще и в том, что она разработана в России. Это означает, что и сама
система, и интерфейс будут представлены на русском языке. К тому
же, она не требует никаких специальных технических навыков для
установки и даже специального человека в штате учреждения, поскольку ее устанавливают разработчики, к которым можно обратиться за помощью в случае возникновения каких-либо проблем.
Также до использования платформы ее можно протестировать,
чтобы понять, насколько она подходит для создания той или иной
библиотеки или коллекции.
Поскольку платформа не переведена на английский язык, ареал
ее использования ограничивается Россией. Проектов, сделанных
на данной платформе, не так много, что может быть связано с ее
сравнительно недавним появлением (НП «ИнфоРост» была основана в 2009 году, тогда как другие проекты появились еще в начале
2000-х). Вторая причина — стоимость платформы: она подойдет
скорее для крупных библиотек и архивов, поскольку более мелким
будет не по карману. Тем не менее, ее цена при наличии всех необходимых функций намного ниже, чем у других подобных продуктов — как российских, так и зарубежных.
Если библиотека или архив не обладает необходимыми финансами, однако может позволить себе программиста, то наиболее
приемлемым решением станет платформа с открытым исходным
кодом. Наилучший вариант — DSpace: пожалуй, это одна из наиболее популярных платформ как за рубежом, так и в России.
Один из плюсов платформы — наличие интерфейса на русском
языке. На сайте есть подробные инструкции по установке, в интернете существуют инструкции и на русском: например, инструкция
59
по установке платформы в операционной системе Windows [151],
а также советы по созданию репозитория [152]. В крайнем случае
можно обратиться к сообществу, правда, общаться скорее всего
придется на английском языке.
Платформа постоянно дорабатывается, позволяет добавлять
необходимый функционал и настраивать интерфейс. Она поддерживает все типы файлов и успешно используется российскими и зарубежными проектами. В реестре re3data.org представлено
57 электронных библиотек и архивов, которые работают на платформе DSpacе, на сайте проекта их более нескольких тысяч.
Еще одним программным продуктом, который можно установить в качестве платформы для создания электронной библиотеки или репозитория, является Omeka. Она, как и DSpace, поддерживает русскоязычный интерфейс, разработана достаточно давно
и постоянно улучшается IT-сообществом. Платформа бесплатна
для скачивания и установки, к ней прилагается понятная и сравнительная простая инструкция. К тому же, на YouTube и Vimeo есть
обучающие видео по установке и использованию платформы [153].
Один из несомненных плюсов продукта — его настраиваемость
и расширяемость за счет многочисленных плагинов, а также многочисленные рекомендации по выбору функционала и внешнего вида
в зависимости от целей организации. Нужно отметить, что Omeka
в большей степени подходит для создания локального электронного
архива, библиотеки или музейной коллекции, тогда как на DSpace
ориентирован на создание достаточно крупных проектов.
Еще одним возможным решением может быть разработка собственной платформы для публикации цифровых фондов. Этот вариант требует больших вложений на первоначальном этапе, однако
позволяет сделать платформу «под себя», с эксклюзивным интерфейсом и дополнительными функциями. Стоимость разработки
такой платформы будет варьироваться в зависимости от региона
и сложности продукта.
[151] Установка DSpace 1.8 в операционной системе Windows. [Электронный ресурс]. URL: http://ideafix.name/?p=359
[152] Свой репозиторий цифрового контента на DSpace и Ubuntu. [Электронный ресурс]. URL: https://goo.gl/qW2iDx
[153] Сайт YouTube. [Электронный ресурс]. URL: https://goo.gl/LYYoZX
60
Таблица 6. Сравнение платформ DSpace, Omeka и «ИнфоРост»
Параметры /
платформы
DSpace
Omeka
«ИнфоРост»
Ссылка
http://www.
dspace.org/
https://omeka.org/
http://inforost.org/
ru
Разработчик
Hewlett-Packard
George Mason
University
НП «ИнфоРост»
Открытый код и
тип лицензии
Да. BSD
Да. GNU (GPL)
Нет
Страна происхождения
США
США
Россия
Язык программирования
Java
PHP
Ruby
Тип файлов
Все типы файлов,
полный список
доступен по
адресу goo.gl/
dyQxnX
Поддерживает
большинство
типов файлов, в
том числе MP3,
MP4, AAC
Изображения, документы, таблицы,
карты, видео- и
аудиофайлы
Стандарт метаданных
Dublin Core
Dublin Core
Позволяет вводить
любые метаданные, в том числе
в библиотечных и
архивных стандартах
Наличие перевода
Да
Почти полный
Русскоязычная
Стоимость
Бесплатна
Бесплатна
От 71 до 400 тысяч
в зависимости от
вида лицензии,
объема хранилища
и времени использования
Наличие демоверсии
Да
Да
Да
Подключена к
GitHub
Да
Да
Нет
Предоставляет
DOI
Да
Нет
Нет
Наличие онлайн
API
Да
Да
Нет
61
Параметры /
платформы
DSpace
Omeka
«ИнфоРост»
Число внедрений
на базе Res3Data
57
0
0
Как используется
Архивы, библиотеки, университеты
Архивы, библиоте- Архивы, библиотеки, университеты ки, университеты
Тип материалов
Научно-исследовательские
материалы,
коллекции книг
и изображений
Научно-исследовательские материалы, коллекции
книг и изображений
Коллекции книг,
документов и
изображений
Остальные платформы также могут быть рассмотрены библиотеками и архивами, однако их использование может быть сопряжено с некоторыми трудностями: например, Archivematica очень
сложна как для установки, так и для использования; ResCarta, наоборот, слишком проста и обладает достаточно скудным функционалом, а также не поддерживает некоторые типы файлов. Платформа CKAN в большей степени подходит для публикации данных
и используется государственными учреждениями, Dataverse разрабатывался для публикации научно-исследовательских материалов, а поэтому чаще всего используется в качестве платформы для
создания университетских библиотек и архивов, как и платформа
Zenodo.
Ряд платформ имеют ограничения, так или иначе затрудняющих
работу учреждения: например, Zenodo позволяет загружать пакет
данных объемом не более 50 ГБ, а SobekCM работает только на
операционных системах Microsoft Windows. Еще одна российская
платформа, представленная в исследовании, использует устаревшие технологии и стоит достаточно дорого, так что подойдет далеко
не каждой организации.
Проигрывают платформы и по еще одному, пожалуй, не менее
важному критерию: их административная панель и интерфейс недоступны на русском языке. Некоторые предоставляют возможность включения перевода при его наличии, что требует дополнительных затрат.
Инструкции по установке платформ DSpace и Omeka даны
в Приложении 2.
62
Глава 3. Специфика и
рекомендации по описанию
фондов
В традиционной библиотеке книги на руки читателю выдает квалифицированный специалист. Он же может подсказать информацию
о том, есть ли необходимая читателю книга в наличии, а также посоветовать смежные произведения. В электронной библиотеке такой
возможности нет. Наличие онлайн-консультанта помогает решить
эту проблему, но лишь отчасти, да и время ожидания может существенно увеличиться при условии большого количества запросов.
Таким образом, поиск необходимой книги на сайте электронной библиотеки чаще всего осуществляется самим пользователем,
которому не всегда может быть известно название произведения
(например, он услышал стихотворную строчку и решил найти само
стихотворение), имя и фамилия автора (например, читатель слушал
лекцию или присутствовал на конференции, успел записать название произведения, но прослушал информацию об авторе), и тем более год написания или издания. К тому же, до скачивания или открытия произведения в программе для чтения пользователь может
захотеть ознакомиться с информацией о содержании или правовом
режиме, в котором оно находится.
Все эти проблемы помогает решить правильное описание фондов, которое также необходимо и для удовлетворения в какой-то
мере более глобальных задач: ввода, обработки и организации хранения цифровых объектов, а также их изъятия из электронной
библиотеки; управления правами доступа к цифровым объектам,
включая защиту авторских прав [154]. Осуществлять эти действия
помогают метаданные — структурированная или полуструктурированная информация, включающая описание структуры и содержания того или иного документа. Таким образом, система ме [154] Антопольский А. Б. Системы метаданных в электронных библиотеках. [Электронный ресурс]. URL: https://goo.gl/Qfubfb
63
таданных становится центральным компонентом при построении
электронной библиотеки, организующим совокупность информационных объектов и управление ими. При этом новые метаданные
могут добавляться в систему в течение всей жизни документа, поскольку накапливают информацию о связи документа с другими
документами коллекции, данные об использовании документа и т. п.
Существуют разные стандарты метаданных для каждой отдельной дисциплины (например, музейные коллекции, аудиофайлы,
веб-сайты и т. п.). Описание содержимого и контекста данных или
файлов данных повышает их полезность, помогает пользователям
найти нужную информацию, а администраторам — организовывать электронные ресурсы, обеспечивать цифровую идентификацию и поддерживать архивирование и сохранение ресурсов [155].
Таким образом, основными функциями метаданных являются:
• навигация в информационном пространстве электронных библиотек;
• поиск отдельных цифровых объектов (информационных ресурсов) или их совокупностей;
• ввод, обработка и организация хранения цифровых объектов,
а также их исключение (изъятие);
• управление правами доступа к цифровым объектам, включая защиту авторских прав, организацию платы за доступ и прочие [156].
Формализация метаданных необходима для унификации всех
групп произведений и адекватного взаимодействия внутренней системы электронной библиотеки, пользовательских задач и внешних
свойств сетевой среды.
На данный момент исследователи выделяют следующие типы
метаданных:
• описательный, включающий библиографическую информацию,
например, название произведения, автора, год создания, аннотацию и т. п.;
• структурный, включающий информацию об объеме произведения, его формате и структуре. Например, структурные метаданные,
описывающие цифровое изображение, могут включать информа [155]
Riley J. Understanding metadata. What is metadata, and what is it for?
[Электронный ресурс]. URL: https://goo.gl/N4RcKD
[156] Лаппо П. М., Соколов А. В. Введение в электронные библиотеки.
[Электронный ресурс]. URL: https://goo.gl/6XrFWc
64
цию о размере изображения, глубине цвета, его разрешении;
• административные, включающие информацию об авторских
правах, разрешениях на доступ и т. п [157].
Исследователи отмечают, что «особым типом метаданных является идентификатор, задача которого — однозначное представление цифрового объекта для внешнего мира и различных приложений» [158].
Нужно отметить, что метаданные должны обладать некоторым
набором обязательных характеристик, например, семантичностью.
Это значит, что они должны быть иерархично упорядочены, а также «использовать стандартизированные имена для обеспечения
однозначной идентификации сведений, содержащихся в значениях
компонентов» [159]. Еще одна характеристика — взаимосовместимость, то есть доступность для считывания в разных программных
продуктах.
Системы метаданных могут быть как универсальными (например, Dublin Core), так и специализированными. Выбор системы зависит в первую очередь от задач и функциональности электронной
библиотеки.
3.1. Основные стандарты метаданных
Dublin Core (Дублинское ядро)
Один из наиболее популярных стандартов описания метаданных,
использующийся в качестве базы на многих платформах для построения цифровых библиотек и репозиториев, это набор элементов Dublin Core. В некоторых странах Dublin Core используется в
качестве национального стандарта. Система была разработана в
1995 году группой специалистов, занимающихся кодированием
текста, работающих в библиотечном и музейном деле, а также про [157] Антопольский А. Б. Указ. соч.
[158] Антопольский А. Б. Указ. соч.
[159] Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/X2Eyji
65
граммистов. Формат Dublin Core был одобрен в международных
и российских документах: IETF RFC 5013, NISO Z39.85, а также в
ГОСТ ИСО 15836-2011 «Национальный стандарт Российской Федерации. Набор элементов метаданных „Дублинское ядро“» [160].
Существует два уровня словаря: простой и квалифицированный.
Первый уровень включает описание 15 элементов:
• Title — название;
• Creator — автор;
• Subject — тема;
• Description — описание;
• Publisher — издатель;
• Contributor — внёсший вклад;
• Date — дата;
• Type — тип;
• Format — формат документа;
• Identifier — идентификатор;
• Source — источник;
• Language — язык;
• Relation — отношения, т. е. связанные материалы;
• Coverage — охват;
• Rights — авторские права [161].
Второй уровень дополняется такими параметрами, как
audience — аудитория; provenance — происхождение; rightsholder —
правообладатель.
Критики стандарта утверждают, что при всей его простоте для
описания элементов электронных библиотек Dublin Core не подходит по ряду причин, основная из которых — отсутствие достаточной точности определений [162].
[160] ГОСТ Р ИСО 15836-2011. Информация и документация. Набор
элементов метаданных Dublin Core. Электронный фонд правовой
и нормативно-технической информации. [Электронный ресурс].
URL: http://docs.cntd.ru/document/gost-r-iso-15836-2011
[161]
DCMI Metadata Terms. [Электронный ресурс]. URL: http://dublincore.
org/documents/dcmi-terms/
[162] Антопольский А. Б. Указ. соч.
66
MARC
Формат метаданных, в основном использующийся для описания
библиографических ресурсов. Разработчики формата ставили перед собой несколько целей: формат должен быть применим ко всем
видам электронных документов; должен быть достаточно гибким;
должен быть удобным в применении в различных автоматизированных системах.
Первоначально формат разрабатывался параллельно Библиотекой Конгресса и Советом по Британской национальной каталогизации, в 1968 году проект стал совместным, пока наконец
в 1971 г. не вышла обобщенная версия, которая была принята в качестве международного стандарта ISO 2709. Впоследствии появилось более 20 его различных вариаций, например, UKMARC (Великобритания), INTERMARC (Франция), USMARC (США), AUSMARC
(Австрия), CANMARC(Канада), DanMARC (Дания).
Строго говоря, MARC — это, скорее, целое семейство форматов,
адаптированных под национальные правила каталогизации. Два
основных ответвления — это MARC 21, который в основном используется в США и Великобритании, и UNIMARC, который поддерживается Международной федерацией библиотечных ассоциаций и учреждений (IFLA) и используется в Европе и Азии.
Формат MARC 21 используется для описания библиографических данных; данных о фондах; для классификации данных и для
описания общественной информации. Формат подходит для описания следующих типов материалов:
• книги;
• периодические издания;
• программное обеспечение, цифровые данные, мультимедиа, сетевые системы и службы;
• картографические материалы;
• ноты;
• звукозаписи;
• видеоматериалы;
• двумерная графика (фотографии, рисунки, картины, чертежи);
• трёхмерные объекты (скульптуры, модели, архитектурные сооружения, образцы, метеориты и т. п.).
Формат также подходит для описания разнотипных материалов — например, архивов или коллекций.
67
Как отмечают исследователи, большинство библиотечных систем ориентировано на MARC 21, как и большинство машиночитаемых описаний, что позволяет без труда обмениваться библиографической информацией с другими учреждениями [163].
Формат UNIMARC более алгоритмичен, нежели MARC 21, и превосходит его в описании структур. Еще один плюс этого формата —
он дает возможность более гибкой организации связей между записями [164]. Также, как и другие форматы MARC, он включает в себя
три компонента: структура записи; определение содержания; содержание данных [165].
На основе UNIMARC был разработан российский коммуникативный формат RUSMARC, который многие исследователи и пользователи признают, во-первых, недоработанным, во-вторых, достаточно сложным для использования [166]. Он позволяет создать
описание того или иного материала в виде традиционной библиотечной карточки, указав его автора, наименование (или несколько
наименований, например, английскую версию и русский перевод),
год создания произведения, переводчика (если есть), издательство,
в котором оно вышло и год издания, формат произведения (размер,
количество страниц), индексы библиотечно-библиографической
классификации (ББК) и номер книжного издания (ISBN). Стандартная запись книги с индивидуальным автором будет выглядеть так,
как на иллюстрации [167].
Metadata Object Description Schema (MODS)
Этот стандарт был разработан в 2002 году Библиотекой Конгресса
США в качестве альтернативы слишком сложному формату MARC
[163] Скворцов В. Форматы MARC21, UNIMARC, RUSMARC, их настоящее и будущее. [Электронный ресурс]. URL: https://goo.gl/MULQCm
[164] Скворцов В. Указ. соч.
[165] Международные коммуникативные форматы и стандарты библиографической записи. [Электронный ресурс]. URL: https://goo.gl/
vEN1Rg
[166] Боль. Формат RusMARC. Сайт Geektimes. [Электронный ресурс].
URL: https://geektimes.ru/post/275990/
[167] Приложение B. Примеры полных записей. Сайт Российской государственной библиотеки. [Электронный ресурс]. URL: http://
marc21.rsl.ru/index.php?doc=1133
68
и слишком простому Dublin Core. Он дает возможность переноса
метаданных, созданных в формате MARC 21, а также подходит для
создания исходных записей описания ресурсов. Данный стандарт
включает подмножество полей MARC, но, в отличие от него, использует теги на основе языка, а не на основе чисел. Нужно отметить, что MODS определяет не все поля MARC и не использует теги
полей и подполей, в связи с чем некоторые метаданные могут быть
потеряны при переносе ресурсов с одного портала на другой.
Основные преимущества формата заключаются в высокой совместимости с существующими форматами; более упрощенной системе элементов; возможности улучшения описаний ресурсов, созданных в других, более простых форматах [168].
Metadata Encoding and Transmission Standard (METS)
Это стандарт метаданных для кодирования описательных, административных и структурных метаданных в отношении объектов
цифровой библиотеки, выраженных с использованием языка XML.
Стандарт разрабатывается Федерацией цифровой библиотеки
(DLF).
Один из важнейших плюсов этого формата — высокая интероперабельность, то есть способность стандарта взаимодействовать с
другими системами. В METS не существует обязательного словаря,
что позволяет использовать его разным учреждениям для разных
целей и описания множества различных типов документов.
Элементы METS:
• METS header (metsHdr): информация о том, кто создавал и редактировал метаданные;
• описательные метаданные (dmdSec): данные об авторе, годе соз [168] Gueguen G. MODS and MADS: Current implementations and future
directions. [Электронный ресурс]. URL: https://goo.gl/BZEm21
69
дания произведения, его названии и т. п.;
• административные метаданные (amdSec): содержат информацию о том, как были созданы и сохранены файлы, данные о правах
интеллектуальной собственности, информацию о происхождении
файлов, содержащих объект цифровой библиотеки;
• разделы файлов (fileSec): список всех файлов, содержащих контент. Элементы файла могут быть сгруппированы в элементах
fileGrp. Хотя этот раздел не является обязательным, он обычно
включается в большинство документов METS;
• структурная карта (structMap): описывает иерархическую структуру объекта цифровой библиотеки и связывает элементы этой
структуры с другими файлами. Это единственный обязательный
элемент в METS;
• структурные ссылки (structLink): позволяет записывать гиперссылки между узлами структурной карты;
• поведенческий блок (behaviorSec): используется для связывания
действий с содержимым в объекте METS.
Data Documentation Initiative (DDI)
Это международный стандарт для описания исследований, опросных листов, файлов статистических данных и учебно-методических материалов. DDI был включен в хранилище данных Dataverse.
Компания DDI принимала участие в разработке словарей RDF,
лексики DDI-RDF Discovery для публикации метаданных о наборах
данных в интернете, XKOS — лексики RDF для описания и классификации статистических данных, которая является продолжением
популярного словаря SKOS [169]. На данный момент для использования доступна версия DDI 3.2, созданная в 2014 году. На сайте представлено руководство по внедрению, а также документы, которые
помогают в использовании DDI [170].
PREservation Metadata: Implementation Strategies (PREMIS)
Это словарь метаданных, который был разработан Центром электронных библиотек (OCLC) и группой исследовательских библио [169] DDI RDF Vocabularies. Сайт DDI. [Электронный ресурс]. URL:
http://www.ddialliance.org/Specification/RDF
[170] DDI Lifecycle 3.2. Сайт DDI. [Электронный ресурс]. URL: http://www.
ddialliance.org/Specification/DDI-Lifecycle/3.2/
70
тек (RLG) в 2003 году. Международная рабочая группа состояла из
более чем тридцати представителей культурного, государственного
и частного секторов.
PREMIS — это стандарт метаданных для поддержки цифровых
объектов и обеспечения их долговременного использования. Модель данных PREMIS состоит из пяти взаимосвязанных уровней:
«интеллектуальный» (Intellectual), «объект» (Object), «событие»
(Event), «агент» (Agent) и «права» (Rights).
В интеллектуальном уровне содержатся описательные метаданные. Большинство из семантических единиц в словаре базы
данных относятся к подразделению «объект» или подразделению
«событие», первое из которых делится на три подтипа — файл, битовый поток и вид (группа файлов, среди которых и структурные
метаданные). Подразделение «событие» связано с подразделением
«объект», а также действиями, которые прописываются на уровне
«агент». В подразделении «права» указывается информация о юридических ограничениях, связанных с тем или иным документом.
3.2. Методические рекомендации
В пособии для электронных библиотек и архивов «Открытая библиотека», подготовленном НП «Викимедиа РУ», исследователи
выделяют минимальные требования для описания того или иного
материала. В частности, при описании электронного документа в
обязательном порядке должно присутствовать его название, автор,
годы жизни автора, тематика, аннотация, издатель / источник, дата
публикации, тип произведения, правовой статус, смежные права,
формат документа, идентификатор и язык. Кроме этого, исследователи предлагают указывать дату реабилитации автора и его участие
или работу во время ВОВ, т. к. это помогает понять, истекли ли на то
или иное произведение имущественные права или нет [171].
При этом тому или иному учреждению культуры совсем необязательно создавать новый стандарт метаданных: гораздо удобнее и
менее ресурсозатратно опираться на уже существующие стандар [171] Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
71
ты. Выбор стандарта зависит от целей учреждения. В подавляющее
большинство описанных во II главе данного исследования платформ с открытым исходным кодом включен стандарт метаданных
Dublin Core как наиболее простой и популярный, в некоторых из
них используется стандарт MARC, который не только включает все
элементы Dublin Core, но и значительно дополняет его, и PREMIS.
При этом большинство национальных и федеральных библиотек использует стандарты MARC. Например, Российская государственная библиотека, как и Российская национальная библиотека,
представляет метаданные в формате MARC 21 [172]:
00X — Контрольные поля (содержат контрольные номера и другие виды управляющей и кодированной информации), которая используется при обработке машиночитаемых библиографических
записей): контрольный номер записи, принадлежность контрольного номера, дата и время последней транзакции и другие;
01Х-09Х — Номера, индексы, коды (контрольные сведения о патенте, номер в национальной библиографии, номер регистрации
авторского права или обязательного экземпляра, издательский номер, международный стандартный номер книги, код языка, код географического региона и другие);
1ХХ — Основные поисковые признаки (заголовки, точки доступа);
20Х-24Х — Поля заглавий;
25Х-28Х — Сведения об издании, выходные данные и т.д.;
3ХХ — Количественная/физическая характеристика;
4ХХ — Область серии;
5ХХ — Область примечания;
6ХХ — Поля предметного входа;
7ХХ — Добавочные поисковые признаки (точки доступа);
76Х-78Х — Связывающие поисковые признаки;
8ХХ-840 — Добавочные поисковые признаки (точки доступа);
841-878 — Фондовые данные;
880 — Данные в иной графике;
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/nojFe7
[172] Соколова Д., Зуйкина К., Скалабан А. Электронные библиотеки в
России: текущий статус и перспективы развития. М., 2017. ISBN:
9785906982384.
72
886 — Поле MARC-формата, отличного от MARC 21;
887 — Поле формата, отличного от MARC.
Минус собственного стандарта метаданных состоит еще и в том,
что впоследствии при переносе данных на другую платформу могут
возникнуть технические трудности при «стыковке» разных стандартов.
В работе «Метаданные — описание пространственных данных»
подробно рассказывается о порядке действий при создании метаданных: «Прежде всего, нужно иметь четкое понимание данных,
которые будут документироваться, и разбираться в стандартах, которые будут использоваться для создания метаданных, а также выбрать метод кодирования информации. Обычно для каждой записи метаданных создается отдельный текстовой файл, то есть один
файл метаданных для набора данных. Чаще всего для ввода информации применяется определенная программа, которая обеспечивает соответствие новых метаданных стандартам. Порядок действий,
как правило, таков:
• выбор наборов данных для их документирования;
• сбор всех сведений об этих наборах;
• создание цифрового файла метаданных с использованием стандартных форматов;
• проверка и корректировка синтаксической структуры файла;
• просмотр содержания метаданных для определения того, насколько полно и корректно информация описывает данные» [173].
[173] Метаданные — описание пространственных данных. [Электронный ресурс]. URL: https://goo.gl/8hjLci
73
Глава 4. Рекомендации
по интеграции библиотек
и репозиториев с проектами
открытого доступа
4.1. Особенности проектов
открытого доступа
Открытый доступ — это бесплатный, быстрый, постоянный, полнотекстовый доступ к материалам научных исследований, произведениям из области науки и искусства, учебным пособиям. Впервые
термин «открытый доступ» был упомянут в 2002 году на Будапештской конференции по открытому доступу, после этого последовало заявление Bethesda о публикации в режиме открытого доступа,
а в 2003 году была принята Берлинская декларация об открытом
доступе к научным и гуманитарным знаниям, в которой прописывались основные требования к публикации материалов, например, наличие обязательного разрешения на копирование, использование, распространение и воспроизведение таких произведений,
а также цели и задачи движения [174].
Открытый доступ к результатам интеллектуального труда позитивно сказывается на развитии науки и культуры, ускоряет процесс
инноваций и технологический прогресс. Одними из сторонников
открытого доступа являются библиотеки и архивы по всему миру,
т. к. открытый доступ убирает ценовые и правовые барьеры, которые стоят на пути распространения информации.
[174] Берлинская Декларация об открытом доступе к научному и гуманитарному знанию. [Электронный ресурс]. URL: http://intellectpravo.ru/documents/berlin_declaration.php
74
Интеграция с проектами открытого доступа позволяет библиотекам распространять знания более продуктивно хотя бы за счет
охвата дополнительной аудитории. К тому же, при интеграции с
проектами открытого доступа увеличивается и собственная аудитория библиотек, архивов и музеев: люди переходят на сайт первоисточника за дополнительной информацией.
На данный момент в России существует три наиболее популярные площадки, работающие по модели Open Access: свободная
электронная библиотека «Викитека», собрание медиафайлов «Викисклад» и «Федеральная резервная система банков знаний».
4.2. Свободная библиотека
«Викитека»
Это проект некоммерческого фонда «Викимедиа», электронная библиотека, на которой размещаются произведения, находящиеся
в открытом доступе. Открытие ресурса состоялось в июне 2013 года,
а спустя пару месяцев появился и российский аналог библиотеки.
Цель проекта — создать пополняемую библиотеку свободно распространяемых текстов на всех языках. На данный момент на русскоязычном портале находится 422 503 произведения [175].
Требования к публикации
Загрузить книгу в онлайн-библиотеку может любой желающий,
будь то частное лицо или организация, однако она должна соответствовать ряду требований. Во-первых, в библиотеку нельзя загружать произведения, авторские права на которые еще не истекли,
или те, которые нельзя свободно использовать и распространять
(в том числе коммерческим путем), а также изменять. При этом
материалы, размещенные на портале, должны свободно распространяться не только согласно законодательству Российской Федерации, но и согласно законодательству США и штата Флорида, т. к.
там расположены основные серверы фонда [176].
[175] Данные указаны на 02.12.2017.
[176] Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
75
Во-вторых, ресурс вводит ограничения на публикацию оригинальных работ. Это значит, что если вы сами являетесь автором
той или иной книги и она еще нигде не публиковалась, помещать ее
в «Викитеку» не нужно.
Здесь есть оговорка: проект нацелен на увеличение ценности уже
опубликованных на ресурсе произведений. В связи с этим пользователь может опубликовать текст с пояснением (например, с примечаниями и ссылками) к тому или иному литературному произведению, уже загруженному на портал. Все примечания и ссылки
должны быть четко отделены от текста оригинальной работы.
Еще одним исключением являются собственные переводы и двуязычные тексты, одним из языков которых является русский [177].
До публикации перевода рекомендуется опубликовать оригинал
в соответствующем языковом разделе.
Также приветствуется снабжение того или иного текста мультимедийными материалами. Это могут быть иллюстрации, нарисованные к тому или иному художественному тексту, видео- и аудиозаписи, фотографии и т.п.
В-третьих, на ресурсе нельзя размещать рекламные материалы
при условии, что эти материалы не являются самостоятельной публикацией. Нужно отметить, что реклама запрещена на ресурсе и
в виде комментариев и внешних ссылок.
В-четвертых, на ресурсе нельзя размещать сиротские произведения, то есть тексты с недоступным правообладателем. Это связано
в первую очередь с вопросом об авторских правах на это произведение, для определения которых чаще всего необходимо знать
годы жизни автора или творческого коллектива. Здесь также есть
некоторые исключения: например, в «Викитеку» можно загрузить
произведение, которое обладает исторической ценностью, при этом
неизвестность автора и сроки охраны не ставятся под сомнение.
Также на ресурсе не публикуются работы, которые находятся
в стадии написания, например, компилированные тексты, пополняемые время от времени разными авторами, различные списки.
Не допускаются к публикации и справочные материалы, например,
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/zVjKR8
[177] Справка: Что содержит Викитека. [Электронный ресурс]. URL:
https://goo.gl/9KoUFa
76
математические константы, таблицы данных и результатов, исходные коды. Исключением являются справочные материалы, являющиеся частью более широкой публикации, а также данные, выпущенные в виде отдельного издания [178].
В «Викитеку» можно загрузить любые произведения, созданные
или опубликованные до 1900 года, в том числе тексты, стенограммы выступлений, фотоснимки. В библиотеку могут быть загружены публицистические произведения, художественные книги, аналитические произведения и научно-популярные работы, а также
документальные источники, в том числе документы (конституции,
договоры, дневники, мемуары), стенограммы телефонных разговоров, судебных заседаний, радиопрограмм. По возможности их необходимо загружать в полном виде (за исключением случаев, когда
часть была утеряна или повреждена) [179].
Особое внимание стоит обратить на загрузку переводов: он
не должен нарушать права автора оригинального произведения.
В случае, если автором перевода является третье лицо и сам перевод был создан менее 70 лет назад, перед загрузкой необходимо получить разрешение от переводчика на публикацию работы [180].
Особенности размещения
Если произведение было создано самим пользователем, то оно будет
размещено под лицензией Creative Commons Attribution-ShareAlike
3.0 Unported (CC-BY-SA). Эта лицензия позволяет другим развивать,
перерабатывать и исправлять произведение даже на коммерческой
основе. Два базовых условия лицензии — обязательное указание автора и копилефт [181].
[178] Там же.
[179] Там же.
[180] Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/fsAJyF
[181] Копилефт — это лицензия, которая позволяет использовать оригинальное произведение без разрешения автора, однако итоговая работа должна распространяться под той же лицензией, под которой
было распространено исходное произведение.
77
Если произведение создано не вами, для его правомерной публикации необходимо связаться с автором или наследниками, которые владеют авторскими правами, и получить разрешение. Произведение также будет опубликовано на основе лицензий CC-BY-SA
и GFDL. При этом пользователь должен убедиться, что автор или
владелец авторских прав ознакомился с текстом лицензии и правильно его понял. Если произведение было написано в соавторстве,
разрешение необходимо получить от каждого автора.
Для того, чтобы разрешение имело юридическую силу (правда,
по законам штата Флорида), можно воспользоваться коммуникационной системой OTRS, отправив текст разрешения на электронную почту permissions-ruat@wikimedia.org, в котором будет подтверждаться, что автор с условиями ознакомлен, а также будут указаны
его имя и дата. Все письма сохраняются в системе, и их наличие
может проверит любой участник, имеющий к ней доступ [182]. Размещая произведение в «Викитеке», необходимо будет указать идентификатор запроса (указывается в поле «тема»), поместив в конце
произведения шаблон {{Разрешение|Номер}} [183].
Для того, чтобы разместить произведение в «Викитеке», предварительно необходимо создать учетную запись — ввести имя пользователя и пароль. После этого необходимо «забить» в поиске наименование того или иного литературного шедевра и проверить, нет
ли его на портале.
[182] [Викитека: Получение разрешений. [Электронный ресурс]. URL:
https://goo.gl/jZoNGW
[183] Там же.
78
Если среди вариантов, выданных системой, произведения не
окажется, можно будет добавить его, нажав «Создать страницу».
Перед пользователем появится поле, в которое необходимо будет
вставить текст. В нем можно изменять размер шрифта, выделить
текст жирным или курсивом, добавить ссылки и сноски.
Размер шрифта можно изменить и другим образом: например,
использовать шаблон <div style="font-size: 20px;">Размер шрифта</
div> [184].
Если пользователь загружает стихотворное произведение, то
строфы будут идти сплошной строкой. Для их разделения необходимо использовать шаблон <poem> в начале и </poem> в конце
стихотворения. Для того, чтобы выделить заглавие произведения,
[184] Справка: Руководство по размещению текстов. [Электронный ресурс]. URL: https://goo.gl/bpq5Gd
79
можно использовать шаблон {{poem-on|Заголовок}} [185], поставив
внизу {{poem-off|Дата}} [186] [187].
Тогда произведение будет выглядеть вот так:
В качестве альтернативы оформления стихотворения можно использовать шаблон {{v| Название произведения| в начале произведения и |Год создания}} в конце.
Также необходимо указывать источник, из которого произведения было перепечатано. Для этого необходимо использовать
[185] Например, {{poem-on|Плач одного любовника, разлучившегося
с своей милой, которую он видел во сне}}
[186] Например, {{poem-off|1730}}
[187] В качестве примера используется отрывок из стихотворения «Плач
одного любовника, разлучившегося с своей милой, которую он видел во сне» В. К. Тредиаковского.
80
шаблон {{О тексте|АВТОР=|НАЗВАНИЕ=|| ИСТОЧНИК= [Ссылка на
источник] (со ссылкой на: {{книга|автор=|часть=|заглавие=|оригинал=|ссылка=|издание=|место=|издательство=|год=|том=|страницы=|страниц=|isbn=}})}}.
Внизу произведения необходимо указать категорию, к которой
оно относится. Категоризация осуществляется по трем признакам:
признак языка, вида или размера; признак даты и признак автора. Например, язык — русский; вид — проза или поэзия; размер —
крупные, средние, малые формы; дата написания и автор, который
записывается в формате «Имя, Отчество, Фамилия». Для указания
категории необходимо поставить шаблон [[Категория:Имя категории]] [188].
После этого можно нажать кнопку «Создать страницу», и страница будет создана.
Нужно отметить, что для оформления стихотворений можно использовать и другие шаблоны. Например, для оформления стихотворения «лесенкой» можно использовать шаблон {{Лесенка}}, а для
того, чтобы пронумеровать строки произведения, шаблон {{Nr|Номер строки}}, который помещает номер строки справа от произведения, или {{№|Номер строки}}, который помещает его слева. Более
подробную информацию о шаблонах для оформления произведений можно найти в статье «Справка: Руководство по размещению
текстов» [189].
Процесс загрузки прозаического произведения в целом не отличается от процесса загрузки стихотворения. Если произведение небольшое, его можно поместить на одну страницу, также, как и стихотворение. Если оно достаточно объемное, то создатели проекта
рекомендуют публиковать главы на отдельных страницах, объединив их на одной, где будут указаны все главы [190]. Если и сами главы
достаточно велики по объему, редакторы «Викитеки» советуют разделить и их, например, по принципу смены сюжетных линий [191].
[188] Справка: Категории. [Электронный ресурс]. URL: https://goo.
gl/3cW1tW
[189] Справка: Руководство по размещению текстов. [Электронный ресурс]. URL: https://goo.gl/v3ZmEp
[190] Там же.
[191] Открытая библиотека. Рекомендации для библиотек по использо81
Для оформления абзацев в произведении необходимо использовать
шаблоны <div class="indent"></div> или <div class="text"></div>.
Иногда возникает необходимость проставить в тексте сноски.
Для этого перед поясняемым словом необходимо поставить <ref>
текст сноски </ref>, а в конце текста — <references/>.
Каждое произведение должно быть снабжено информацией об
авторских правах. В методическом пособии «Открытая библиотека» авторы приводят в пример следующие шаблоны:
1. {{PD-simple}} — для литературных произведений, перешедших
в общественное достояние (автор умер 70 лет назад и более, само
произведение обнародовано при его жизни или посмертно, но более семидесяти лет назад);
2. {{RusGov}} — для официальных документов РФ, не являющихся
объектами авторских прав;
3. {{Uncertain}} — для текстов, источник которых не указан и в которых могут содержаться ошибки;
4. {{Violation}} — для текстов, помещенных на сайт с возможным нарушением авторских прав;
5. {{PD-self-RU}} — для текстов, помещенных на сайт обладателями
авторских прав на них и выпустивших их в общественное достояние [192].
Информация появится внизу загруженных произведений в виде
таблички с информацией о правах:
ванию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/oG8pkV
[192] Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/qfRQcu
82
Нужно отметить, что у каждого автора на портале создана
специальная страница, где публикуется краткая информация о
нем и список произведений. После добавления произведения желательно добавить ссылку на него на страницу автора. Для этого
необходимо найти его на индексной странице [193], открыть статью
и нажать кнопку «Править» в том разделе, к которому относится
произведение автора (например, «Стихи», «Проза», «Стихи на других языках» и т.п.). Ссылка на целевую страницу дается в двойных
квадратных скобках, при этом в них нужно заключать только часть
URL после /wiki/.
4.3. Централизованное виртуальное
хранилище «Викисклад»
«Викисклад» (англ. Wikimedia Commons) — это общее централизованное хранилище мультимедийных файлов (изображений, аудиои видеозаписей), которые включаются в страницы проектов фонда.
Их можно свободно использовать, изменять и распространять не
только в пределах проектов, но и на внешних веб-сайтах.
«Викисклад» сотрудничает с музеями и архивами по всему миру,
выкладывающими свои произведения в открытый доступ. Например, в 2005 году немецкий сайт Directmedia передал сообществу «Викисклада» более 10 тысяч рисунков; в 2009 году этнографический
[193] Доступна по адресу: https://goo.gl/MrWJLe
83
музей Амстердама Tropenmuseum передал 35 тысяч изображений,
связанных с Индонезией; в 2011 году Национальное управление архивов и документации США передало более 100 тысяч исторический фотографий и документов [194]. На данный момент на портале
доступно более 43 млн медиафайлов [195].
Для загрузки файла на «Викисклад» необходимо зарегистрироваться (или использовать идентификационный данные из других
проектов, например, «Викитеки»). После этого необходимо нажать
кнопку «Загрузить», расположенную на главной странице ресурса.
После загрузки файла на «Викисклад» необходимо будет указать
информацию об авторских правах, выбрав один из двух пунктов —
«Этот файл является моим собственным произведением» или «Этот
файл не является моим авторским произведением».
Если произведение написано самим пользователем, ему необходимо будет вставить в свободное поле данные о себе (например, имя
и фамилию, причем указать можно как имя участника (псевдоним),
так и настоящее имя), и подтвердить, что он знаком с условиями
лицензии. Также пользователь может выбрать одну из пяти лицензий: Creative Commons Attribution ShareAlike 4.0, Creative Commons
Attribution ShareAlike 3.0, Creative Commons Attribution 4.0, Creative
Commons Attribution 3.0, Creative Commons CC0 Waiver [196].
Если произведение написано не самим пользователем, необходимо указать источник (им может быть сайт электронной библиотеки, интернет-портал и т.п.), ФИО автора и выбрать причину, по
[194] Викисклад. [Электронный ресурс]. URL: https://goo.gl/iA97Q8
[195] 43 056 904 файла по состоянию на 03.12. 2017.
[196] Подробнее о каждой лицензии можно прочитать в Приложении 1.
84
которой произведение может быть размещено на «Викискладе»: например, срок авторских прав на него истек, оно было опубликовано
под открытой лицензией и т.п.
После этого необходимо будет заполнить поле с наименованием
произведения. Название должно быть указано полностью (сокращение возможно лишь в том случае, если оно очень длинное), желательно без кавычек. Если пользователь загружает стихотворное
произведение без названия, то его наименованием может быть его
первая строка. К произведению можно добавить описание — например, автора, год создание, содержание. Также необходимо указать дату создания и выбрать соответствующую категорию.
После загрузки файла его можно использовать на других проектах библиотеки и на сторонних веб-сайтах. Для этого система автоматически предоставляет пользователю две ссылки, одна из которых подходит для добавления в HTML.
85
Одновременно можно загрузить до 50 файлов (из расчета
1 файл = 1 произведение). При этом описывать каждый файл придется отдельно (за исключением некоторых полей в том случае,
если, например, автор произведений совпадает или произведения
относятся к одной категории).
В рамках «Викитеки» и «Викисклада» существует проект OCR,
целью которого является совместная работа по распознаванию и
вычитке отсканированных произведений и документов. Для сверки текста и скана необходимо создание специальных пространств
имен Индекса и Страницы [197]. Цель индекса — создать навигацию по сканированным листам, представленным в формате DjVu
или PDF. Подробные инструкции можно найти в соответствующей
справке на сайте проекта [198].
[197] Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме
открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный
ресурс]. URL: https://goo.gl/vxMrdB
[198] Справка: Индекс. [Электронный ресурс]. URL: https://goo.gl/9vPz6o
86
Принять участие в процессе распознавания отсканированных произведений может любой желающий. Для этого нужно
зайти в раздел «Проект: OCR», представленный на сайте «Викитеки», и выбрать произведение из списка (они подразделяются
на три цветовые группы: красный — нужно распознать сканы;
желтый — нужно вычитать; зеленый — нужно проверить). После открытия произведения из списка справа появятся сканированные страницы, а слева — редактор, куда можно вписывать
текст.
Нужно отметить, что в справочной информации «Викитеки»
также есть технические рекомендации по оцифровке, распознаванию и вычитке текста. В частности, для оцифровки бумажных аналогов рекомендуется выбрать программу ABBYY FineReader, которая имеет словари распознавания даже дореволюционного языка,
а для вычитки дореформенного текста — использовать типографскую раскладку Ильи Бирмана [199].
4.3. Проект «Федеральная резервная
система банков знаний» (ФРС)
«Федеральная резервная система банков знания» была создана в 2017 году Ассоциацией интернет-издателей при поддержке
НП «НЭИКОН», НП «Викимедиа РУ», площадки для открытой
публикации «Научный корреспондент», АНО «Инфокультура»,
электронной научной библиотеки «КиберЛенинка», «Библиотеки
Максима Мошкова» и интернет-издания «Частный корреспондент». На данный момент с проектом также сотрудничает свободная вики-библиотека «Викитека» и платформа для научных
журналов elpub. На сайте проекта доступно 1 174 278 произведений [200].
Цель проекта — «создание инфраструктуры открытых и интероперабельных баз данных (репозиториев) с различными типами
[199] Типографская раскладка Ильи Бирмана. [Электронный ресурс].
URL: https://ilyabirman.ru/projects/typography-layout/
[200] По состоянию на 03.12.2017.
87
контента для использования в научной среде и медиаиндустрии,
а также любыми пользователями сети» [201].
Поскольку система создавалась для расширения доступа к знаниям и культурным ценностям, один из основных принципов
проекта — все содержащиеся в базе ФРС произведения должны
распространяться на условиях открытых лицензий или быть в общественном достоянии. При этом расширение доступа не должно
нарушать законодательство РФ или затрагивать интересы авторов
и правообладателей. В частности, при обнаружении своей работы на портале автор может или заявить о своем авторстве, нажав
кнопку «Я автор» на странице произведения, или же отправить
претензию, если хочет, чтобы его произведение было изъято из открытого доступа.
Обогатить базу информационными ресурсами могут как
юридические, так и физические лица (через сторонние проекты,
например, научные работы можно загрузить на интернет-портал «Научный корреспондент»). Пользователи также могут внести свои правки через соответствующую кнопку «Предложить
изменения», расположенную справа от текста произведения.
В открывшейся панели можно поменять название, лицензию,
описание, язык, тематику работы и поставить ссылку на первоисточник — все эти данные будут проверяться модераторами
проекта.
На сайте ФРС также работает база данных с информацией о датах жизни авторов, их реабилитации, варианты написания имени,
краткая информация о жизни писателя или поэта, а также калькулятор правового статуса, в котором можно рассчитать срок охраны
произведений науки и литературы — для этого необходимо ввести
ФИО автора, годы его жизни и данные о работе во время ВОВ или
дату последней реабилитации [202].
Загружаться на портал могут только те произведения, которые:
1. находятся в общественном достоянии;
[201] Идеи и цели проекта. Сайт «Федеральной резервной системы банков знаний». [Электронный ресурс]. URL: https://goo.gl/htkTCp
[202] Калькулятор правового статуса. Сервис для расчёта срока охраны
авторских прав произведений науки и литературы. Сайт «Федеральной резервной системы банков знаний». [Электронный ресурс]. URL: http://calc.noosphere.ru/
88
2. нпубликованы на условиях открытых лицензий;
3. можно использовать и распространять согласно разрешению
автора (правообладателя).
Также создатели проекта приглашают к участию издателей, готовых «предоставить информацию о произведениях (метаданные)
для охраняемых и сиротских произведений в целях уточнения их
правового статуса» [203].
Загрузка работ
Для того, чтобы подключиться к системе, организации в первую
очередь необходимо связаться с командой проекта. Сделать это
можно через соответствующую форму [204] на сайте проекта, в которой необходимо указать ФИО контактного лица, наименование
организации, электронную почту и номер телефона.
Далее необходимо реализовать один из интерфейсов передачи и обмена данными — JSON или Open Archive Interface
(OAI-PMH) [205] — и сообщить о его готовности разработчикам
проекта, предоставив ссылку [206], которая будет добавлена в
загрузчик данных ФРС. Также учреждению необходимо обеспечить доступность метаданных для загрузчика ФРС, который
периодически будет обращаться к банку знаний для проверки
обновлений.
Схема работы ФРС следующая: когда произведение попадает
в базу данных, подключенную к системе, ФРС получает информацию об этом и запрашивает метаданные и сам файл. После передачи файла ему присваивается уникальный идентификатор — Russian
Archive Identifier (RAI) — и происходит регистрация объекта, а его
метаданные отображаются в реестре.
[203] Информация для организаций. Сайт «Федеральной резервной
системы банков знаний». [Электронный ресурс]. URL: http://
noosphere.ru/join_org#connect_form
[204] Там же.
[205] Подключение к ФРС для DSpace и Omeka будет происходить через
протокол OAI-PMH.
[206] Постраничное отображение мета-данных объектов в формате
JSON в соответствии с разметкой и пример разметки OAI можно
посмотреть в Приложении 3.
89
Один из немаловажных плюсов ФРС — каждый объект хранится в 3-х копиях (они появляются как в основном репозитории, так
и в резервном хранилище). Система регулярно осуществляет мониторинг копий и восстанавливает удаленные или поврежденные
файлы [207].
[207] Схема работы. Сайт «Федеральной резервной системы банков знаний». [Электронный ресурс]. URL: https://goo.gl/rdphXR
90
Глава 5. Общие рекомендации
Создание электронной библиотеки — это трудоемкий процесс, который требует значительных усилий со стороны учреждения культуры для решения множества правовых и технических проблем.
В первую очередь перед библиотеками встают вопросы, связанные с авторским правом. Суммируя опыт, накопленный в многочисленных исследованиях, посвященных вопросам оцифровки и
предоставления доступа к цифровым коллекциям библиотек, репозиториев и архивов, можно сделать вывод о том, что оцифровку
лучше всего начинать с наиболее древних экземпляров коллекции.
Если речь идет о региональной библиотеке, в которой содержатся
редкие издания, написанные на различных диалектах, то оцифровку разумнее всего начинать с них. При этом необходимо проследить,
имеются ли электронные копии этих изданий в других библиотеках.
На следующем этапе разумнее всего оцифровывать книги, уже
перешедшие в общественное достояние или опубликованные на условиях открытых лицензий: они не требуют специального разрешения от авторов или правообладателей. Параллельно с этим разумно
вести работу, связанную с поиском авторов или правообладателей
сиротских произведений — как ни странно, иногда это можно сделать с помощью поискового запроса [208]. Также можно попробовать
договориться с авторами или правообладателями о публикации
произведений, которые находятся под защитой копирайта.
Нужно учитывать, что в электронные библиотеки разумнее всего выкладывать не отсканированные копии, а распознанные тексты:
во-первых, так пользователи смогут осуществлять полнотекстовый
поиск по экземплярам изданий, во-вторых, это дает возможность
скопировать необходимый отрывок произведения или поделиться
цитатой на сторонних ресурсах, например, в социальных сетях, что
в большинстве случаев благотворно сказывается на увеличении аудитории портала.
[208] Roberts J. Can’t Find ‘Orphan’ Authors? Writers Group Says It Had No
Trouble. [Электронный ресурс]. URL: https://goo.gl/yPAKbX
91
Выбор платформы для построения электронной библиотеки или
архива следует начинать с определения целей учреждения. Прежде
всего стоит ответить на следующие вопросы:
Какие типы файлов будут публиковаться на портале?
Если библиотека планирует выкладывать исключительно текстовые форматы, например, книги, монографии, статьи, то платформа
должна поддерживать наиболее популярные из них — PDF, EPUB
и т. п. Если библиотека ориентируется на создание мультимедийных коллекций, состоящих из изображений, видео- и аудиозаписей,
необходимо уточнить, поддерживает ли необходимый формат тот
или иной программный продукт.
2. Есть ли ограничения по объемам загружаемых данных?
Также библиотека должна понять, каковы планируемые объемы
электронных фондов. Как было выявлено в исследовании, некоторые платформы имеют ряд ограничений по объемам загружаемых
файлов. При этом даже платные программные продукты имеют
различную стоимость в зависимости от размеров хранилища; при
недостатке места чаще всего приходится покупать новую лицензию,
что связано с дополнительными финансовыми расходами.
3. Какие стандарты метаданных являются для библиотеки
предпочтительными?
Чаще всего платформы для построения электронных библиотек и репозиториев работают со стандартами метаданных Dublin
Core и системой форматов MARC. При выборе стандарта необходимо понять, как должны быть описаны электронные экземпляры
коллекции, какая информация о них должна находиться в системе,
подразумевается ли в будущем интеграция с другими проектами
и т. п. Стоит учитывать, что стандарт Dublin Core является более
простым, нежели стандарты группы MARC, однако по мнению экспертного сообщества и более непроработанным.
Также при выборе платформы для построения электронной
библиотеки или архива необходимо оценить финансовые затраты,
необходимые для установки, адаптации, развертывания платформы и ее дальнейшей поддержки. Обойтись без привлечения специалиста (если его нет в штате учреждения) скорее всего не получится:
92
даже самые простые инструкции требуют соответствующих знаний в области программирования и системного администрирования. Здесь можно выбрать один из четырех вариантов:
Самостоятельное развертывание ПО для библиотеки на
хостинге
Для самостоятельного развертывания DSpace потребуется привлечение специалиста со следующими знаниями:
• чтение на английском языке;
• язык разработки Java;
• СУБД PostgreSQL;
• операционная система Unix (Linux/FreeBSD);
• сервер приложений Apache Tomcat 7 и выше, Jetty, Caucho Resin
или эквивалент).
Ресурсы для самостоятельного изучения:
• инструкция на английском языке: https://wiki.duraspace.org/
display/DSDOC6x/Installing+DSpace;
• руководство по быстрому старту: http://www.dspace.org/quickstart-guide.
Программный продукт Omeka поставляется в двух вариантах:
Omeka Classic и Omeka S. Для самостоятельного развертывания
Omeka Classic, который подходит для создания большинства простых электронных библиотек, потребуется привлечение специалиста со следующими знаниями:
• язык программирования PHP;
• веб-сервер Apache;
• СУБД MySQL;
• операционная система Unix (Linux/FreeBSD);
• программная библиотека ImageMagick.
Ресурсы для самостоятельного изучения:
• инструкция по установке Omeka Classic: https://omeka.org/classic/
docs/Installation/Installation/;
• инструкция по установке Omeka S: https://omeka.org/s/docs/usermanual/install/.
Сотрудничество с онлайн-сервисами («ПО-как-услуга»)
В этом случае специализированный провайдер предложит учреждению культуры развернуть электронную библиотеку на его хо93
стинге. Такое решение позволяет создать библиотеку в очень короткие сроки, но имеет свои ограничения:
• провайдеры расположены за пределами Российской Федерации;
• эти решения имеют ограничения по использованию дискового
пространства.
У DSpace есть множество сертифицированных провайдеров,
общий каталог которых собран по ссылке http://www.dspace.org/
service-providers/. Стоимость услуг варьируется от $4000 до $9000
в год (примерно 236-531 тысяч рублей)
Omeka предоставляется провайдером Omeka.net (https://www.
omeka.net/). Стоимость сервиса варьируется от $75 (4,5 тысяч рублей) до $1000 (59 тысяч рублей) в год.
Заказ разработки/настройки у IT-компании
Разработку библиотеки также можно заказать в специализированной IT-компании. Стоимость работы будет варьироваться от 50 до
500 тысяч рублей в зависимости от выбранного продукта или разработки с нуля.
Привлечение ресурсного центра поддержки некоммерческих
организаций
В случае, если проект является некоммерческим и организация готова публиковать материалы под свободными лицензиями Creative
Commons, есть возможность привлечения ресурсных центров, которые будут готовы взять на себя расходы по хостингу и настройке
библиотеки.
Одним из таких ресурсных центров является АНО «Информационная культура». (http://infoculture.ru). Отправить заявку можно
на адрес электронной почты infoculture@infoculture.ru с пометкой
«Запрос поддержки ресурсного центра на создание электронной
библиотеки». В письме необходимо подробно описать задачу, с которой столкнулась организация.
Если библиотека не обладает внушительным бюджетом, то удобнее всего выбрать программу с открытым исходным кодом — они
распространяются на условиях открытых лицензий, поэтому учреждению не придется оплачивать лицензию. У таких платформ
есть и другие плюсы: во-первых, они постоянно дорабатываются
участниками сообщества, выходят новые версии, финансируемые
94
различными грантовыми учреждениями, заинтересованными
в распространении знаний. Во-вторых, такие платформы достаточно гибкие, что позволяет обеспечить учреждению необходимый
ему функционал.
При выборе программного продукта с открытым исходным кодом необходимо обратить внимание на наличие перевода. Если его
нет, то продукт придется русифицировать, что связано с дополнительными расходами. Также не следует оставлять без внимания
тип учреждений, которые им пользуются: некоторые платформы
в большей степени подходят для публикации научных исследований или массивов данных, нежели для создания электронных библиотек и архивов.
Для того, чтобы посмотреть, как выглядит та или иная библиотека, можно посетить сайт учреждения — как правило, там есть
раздел, в котором представлены организации, пользующиеся данным программным продуктом со ссылками на порталы. Не стоит
пренебрегать демоверсией платформы: некоторые из них достаточно сложны в использовании, так что отдавать предпочтение стоит
более простым вариантам.
В качестве альтернативы можно выбрать одну из существующих
платных платформ: как правило, ее установит компания-разработчик. В большинстве случаев лицензия на платформу не является
бессрочной, так что оплачивать платформу придется с определенной периодичностью (например, от полугода до года или нескольких
лет). При выборе платной платформы однозначно стоит отдавать
предпочтение российским продуктам: во-первых, они в большинстве случаев значительно дешевле, нежели зарубежные аналоги,
во-вторых, в случае возникновения каких-либо сложностей намного проще будет обратиться к российской службе поддержки.
Пожалуй, наиболее сложный вариант — разработка собственного программного продукта. Скорее всего, стоимость такой платформы будет выше, нежели стоимость установки и поддержки
платформы с открытым исходным кодом или платной системы, однако взамен библиотека получит уникальный продукт, полностью
ориентированный под ее цели и нужды, с эксклюзивным дизайном
и необходимым внутренним устройством. При этом не рекомендуется разрабатывать собственный стандарт метаданных: на это уй95
дут дополнительные средства, при этом проблем, например, при
интеграции с другими проектами будет куда больше.
После создания электронной библиотеки или архива следует
обратить внимание на возможное распространение электронных
копий произведений. Это не отнимет пользователей у портала, а
привлечет дополнительную аудиторию, к тому же, позволит реализовать важнейшую функцию библиотек и архивов, заключающуюся не только в хранении, но и в распространении знаний.
Вне зависимости от того, какая из предложенных в данном исследовании платформ будет выбрана, нельзя ожидать, что процесс
организации электронной библиотеки или архива будет простым.
Однако этот процесс необходим, если учреждения культуры хотят
стать полноценными участниками информационного пространства, участниками, которые во многом несут ответственность за
развитие образования, культуры и науки, а также дают возможность обществу познакомиться с величайшими достижениями человечества.
Библиографический список
Документы
6. Берлинская Декларация об открытом доступе к научному и гуманитарному знанию. [Электронный ресурс]. URL: http://intellectpravo.ru/documents/berlin_declaration.php
7. ГОСТ Р ИСО 15836-2011. Информация и документация. Набор
элементов метаданных Dublin Core. Электронный фонд правовой
и нормативно-технической информации. [Электронный ресурс].
URL: http://docs.cntd.ru/document/gost-r-iso-15836-2011
8. ГОСТ Р 55750-2013. Информационно-коммуникационные технологии в образовании. Метаданные электронных образовательных
ресурсов. Общие положения. [Электронный ресурс]. URL: http://
docs.cntd.ru/document/1200107223
9. Гражданский кодекс Российской Федерации. Часть 4. [Электронный ресурс]. URL: https://goo.gl/9TWB2i
10. Директива 2012/28/EU об определенных случаях разрешенного
использования сиротских произведений. [Электронный ресурс].
URL: http://lexdigital.ru/2012/070/
Российские источники
1. Антопольский А. Б. Системы метаданных в электронных библиотеках. [Электронный ресурс]. URL: https://goo.gl/Qfubfb
2. Боль. Формат RusMARC. Сайт Geektimes. [Электронный ресурс].
URL: https://geektimes.ru/post/275990/
3. Введение к MARC 21 для библиографических данных. Приложение B. Примеры полных записей. Сайт Российской государственной библиотеки. [Электронный ресурс]. URL: http://marc21.rsl.ru/
index.php?doc=1133
4. Викитека: Получение разрешений. [Электронный ресурс]. URL:
https://goo.gl/7wzStG
5. Горбунова А. С. Оцифровка как стратегия обеспечения сохранности коллекций. [Электронный ресурс]. URL: https://goo.gl/Bqjpgs
97
6. Доклад об общественном достоянии с акцентом на произведениях и авторах, работы которых переходят в режим общественного
достояния с 2016 года. НП «Викимедиа РУ». [Электронный ресурс].
URL: https://goo.gl/DvNBuB
7. Изместьева Е. «CKAN» — платформа данных с открытым исходным кодом. [Электронный ресурс]. URL: https://goo.gl/G62rsy
8. Инструменты публикации кода в научных исследованиях. [Электронный ресурс]. URL: https://goo.gl/ha4s44
9. Книги ИНИОНа будут сушить в криокамере госархива научно-технической документации. Сайт информационного агентства
ТАСС. [Электронный ресурс]. URL: http://tass.ru/nauka/1782553
10. Лаппо П. М., Соколов А. В. Введение в электронные библиотеки.
[Электронный ресурс]. URL: https://goo.gl/SqXXDJ
11. Левова И. Ю., Винник Д. В., Моисеева А. Ю. Сиротские произведения в России: статус, пути решения проблемы. [Электронный ресурс]. URL: https://goo.gl/3VKZ7M
12. Метаданные — описание пространственных данных. [Электронный ресурс]. URL: https://goo.gl/EsBN9m
13. Механцев Е. «Если библиотеки не смогут стать значимыми для
пользователей, они вымрут». Интернет-издание «Частный корреспондент». [Электронный ресурс]. URL: https://goo.gl/FQPyCL
14. Новицкий А. В., Кудим К. А., Резниченко В. А, Проскудина Г. Ю.
Создание научных архивов с помощью системы Eprints. [Электронный ресурс]. URL: https://goo.gl/XSJku6
15. Открытая библиотека. Рекомендации для библиотек по использованию открытых лицензий и публикации произведений в режиме открытого доступа/ Под общ. ред. С. А. Козловского. [Электронный ресурс]. URL: https://goo.gl/Ndj8wj
16. Позднякова Ю. «Надо быть готовым к тому, что 8 из 10 проектов не закончатся ничем». [Электронный ресурс]. URL: http://www.
itsmycity.ru/blog/post/id/7057
17. Пресс-выпуск №2850. Как пройти в библиотеку? / ВЦИОМ.
[Электронный документ] URL: https://goo.gl/579oDB
18. Проскудина Г. Ю, Резниченко В. А., Кудим К. А. Сравнение систем
электронных библиотек EPrints 3.0 и DSpace 1.4.1. [Электронный ресурс]. URL: http://rcdl.ru/doc/2007/paper_66_v2.pdf
19. Скворцов В. Форматы MARC21, UNIMARC, RUSMARC, их настоящее и будущее. [Электронный ресурс]. URL: https://goo.gl/g1eWXZ
98
20. Создание электронных библиотек. Сайт научно-технического
объединения «Информационные наукоемкие технологии». [Электронный ресурс]. URL: https://goo.gl/7oTSrY
21. Соколова Д., Зуйкина К., Скалабан А. Электронные библиотеки
в России: текущий статус и перспективы развития. М., 2017. ISBN:
9785906982384.
22. Справка: Индекс. [Электронный ресурс]. URL: https://goo.gl/
Z7Q3gR
23. Справка: Категории. [Электронный ресурс]. URL: https://goo.gl/
zYjEvx
24. Справка: Руководство по размещению текстов. [Электронный
ресурс]. URL: https://goo.gl/p2orZB
25. Справка: Что содержит Викитека. [Электронный ресурс]. URL:
https://goo.gl/pdoytA
26. Шварцман М. Е. Как создать самую простую электронную библиотеку с помощью ResCarta. Сайт Российской ассоциации электронных библиотек. Сайт Российской ассоциации электронных библиотек. [Электронный ресурс]. URL: https://goo.gl/xcirna
27. Шварцман М. Е. Открытое программное обеспечение для создания электронных библиотек: сравнительное исследование. Сайт
Российской ассоциации электронных библиотек. [Электронный ресурс]. URL: http://www.aselibrary.ru/blogs/archives/1373/
28. Шварцман М. Е. Омека как инструмент коллективного создания
электронной библиотеки. Сайт Российской ассоциации электронных библиотек. [Электронный ресурс]. URL: https://goo.gl/aQHdTz
29. Шварцман М. Е. Электронная библиотека моей мечты. Сайт Российской ассоциации электронных библиотек. [Электронный ресурс]. URL: http://www.aselibrary.ru/blogs/archives/1442/
30. Цифровая библиотека Greenstone. Инструкция пользователя.
[Электронный ресурс]. URL: https://goo.gl/snvsmK
Зарубежные источники
1. Andro M., Asselin E., Maisonneuve M. Digital libraries: Comparison of
10 software. [Электронный ресурс]. URL: https://goo.gl/dHFXEy
2. Basic Installation. Part of the Greenstone Beginner's Guide. [Электронный ресурс]. URL: https://goo.gl/3UMndd
3. British Library Digital Scholarship Training Programme: a round-up
of resources you can use. [Электронный ресурс]. URL: https://goo.gl/
99
RTcPBV
4. Cascone S. With ‘Open Access,’ the Met Museum’s Digital Operation
Has a Bona Fide Hit on Its Hands. [Электронный ресурс]. URL: https://
goo.gl/ETLcki
5. Castagné M. Institutional repository software comparison: DSpace,
EPrints, Digital Commons, Islandora and Hydra. [Электронный ресурс]. URL: https://goo.gl/7sEDva
6. Community/Regional User Groups. [Электронный ресурс]. URL:
https://wiki.archivematica.org/Community/Regional_User_Groups
7. Copyright Laws Severely Limit Availability of Music. [Электронный
ресурс]. URL: https://goo.gl/wvcWsY
8. Crosas M. The Dataverse Network: An Open-Source Application for
Sharing, Discovering and Preserving Data. D-Lib Magazine. [Электронный ресурс]. URL: https://goo.gl/sQ2mLT
9. Data Exploration, Analysis, Meta-Analysis a modern system of
interlocking tools for quantitative analysis. [Электронный ресурс].
URL: http://2ra.vn/
10. Dataverse. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://en.wikipedia.org/wiki/
Dataverse
11. Diggore M. DSpace Discovery: Unifying DSpace Search and Browse
with Solr. [Электронный ресурс]. URL: https://goo.gl/3k5hG6
12. Donohue T., Phillips S., Salo D. DSpace How-To Guide. Tips and tricks
for managing common DSpace chores. [Электронный ресурс]. URL:
http://www.dspace.org/sites/dspace.org/files/dspacehowtoguide.pdf
13. DSpace. An Open Source Dynamic Digital Repository. D-Lib
Magazine. ISSN 1082-987. [Электронный ресурс]. URL: http://www.
dlib.org/dlib/january03/smith/01smith.html
14. DSpace. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://goo.gl/D1bBK8
15. Iraqi Libraries Devastated in War. [Электронный ресурс]. URL:
https://goo.gl/JfS13c
16. Greenstone2 or Greenstone3. [Электронный ресурс]. URL: https://
goo.gl/TVYdcv
17. Gueguen G. MODS and MADS: Current implementations and future
directions. [Электронный ресурс]. URL: https://goo.gl/KbKiWE
18. Moses D., Stapelfeldt K. Renewing UPEI’s Institutional Repository:
New Features for an Islandora-based Environment. ISSN 1940-5758.
100
[Электронный ресурс]. URL: http://journal.code4lib.org/articles/8763
19. NewGenLib. Сайт универсальной интернет-библиотеки «Википедия». [Электронный ресурс]. URL: https://goo.gl/P5CSmq
20. Omeka. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://goo.gl/C1xPjH
21. Overview of Greenstone. Part of the Greenstone Beginner's Guide.
[Электронный ресурс]. URL: https://goo.gl/SYwtaV
22. Rabishankar G. NewGenLib 3: An Integrated Open Source Library
Management System that Makes your Library Visible in Web. Library Hi
Tech News, Vol. 29. [Электронный ресурс]. URL: https://goo.gl/tYdB5B
23. Riley J. Understanding metadata. What is metadata, and what is it for?
[Электронный ресурс]. URL: https://goo.gl/92Hyn5
24. DCMI Metadata Terms. [Электронный ресурс]. URL: http://
dublincore.org/documents/dcmi-terms/
25. Roberts J. Can’t Find ‘Orphan’ Authors? Writers Group Says It Had No
Trouble. [Электронный ресурс]. URL: https://goo.gl/TTcSLs
26. SimpleDL. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://goo.gl/qMwV3q
27. SobekCM. Сайт универсальной интернет-энциклопедии «Википедия». [Электронный ресурс]. URL: https://goo.gl/GHJPJD
28. Top Reasons To Use DSpace. [Электронный ресурс]. URL: http://
www.dspace.org/why-use
29. What is Archivematica? [Электронный ресурс]. URL: https://wiki.
archivematica.org/Main_Page
Приложение 1.
Справка об открытых
лицензиях Creative Commons
Лицензии типа Creative Commons называют также открытыми
лицензиями, потому что они позволяют публиковать тексты, сохраняя за автором избранный (настраиваемый) набор прав, в результате чего может быть ограничено или разрешено право на
переработку текста, его коммерческое использование и т.д. Тип лицензии, как правило, указывается на сайтах, которые его используют, в виде значка, схематически изображающего тип выбранных
прав и ограничений. В частности, наиболее широкий набор прав у
Википедии, которая разрешает даже коммерческое использование
текстов и любую их переработку. В массовой коммуникации, как
правило, права на коммерческое использование ограничиваются, в
научной, скорее, нет, так как для этого существует отдельный механизм в виде системы патентования, по сути — системы публикации
в защищённом режиме.
Полная справка по лицензиям доступна по официальном сайте
Creative Commons — https://creativecommons.org/licenses/.
Открытые лицензии в России
Федеральным законом от 12 марта 2014 года № 35-ФЗ «О внесении
изменений в часть первую, вторую и четвертую Гражданского кодекса Российской Федерации и отдельные законодательные акты
Российской Федерации» были приняты поправки, которые коснулись защиты интеллектуальных прав.
Введена новая статья 1286-1 об открытой лицензии на использование произведения науки, литературы или искусства. В частности,
предусмотрено, что лицензионный договор, по которому автором
или иным правообладателем (лицензиаром) предоставляется лицензиату простая (неисключительная) лицензия на использование
102
произведения науки, литературы или искусства, может быть заключен в упрощенном порядке (открытая лицензия).
Открытая лицензия является договором присоединения. Все
её условия должны быть доступны неопределенному кругу лиц и
размещены таким образом, чтобы лицензиат ознакомился с ними
перед началом использования соответствующего произведения.
В открытой лицензии может содержаться указание на действия, совершение которых будет считаться акцептом её условий (ст. 438 ГК).
В этом случае письменная форма договора считается соблюденной.
Предметом открытой лицензии является право использования
произведения науки, литературы или искусства в предусмотренных договором пределах.
Разработка поправок была инициирована Д. А. Медведевым,
статья о свободных лицензиях в Гражданский кодекс портирована
Минкомсвязи РФ.
Общая информация
Creative Commons — некоммерческая организация, которая создаёт
бесплатные для использования типовые договоры — свободные и
несвободные публичные лицензии, с помощью которых авторы и
правообладатели могут выразить свою волю и распространять свои
произведения более широко и свободно, а потребители контента
легально и более просто пользоваться этими произведениями.
Лицензии Creative Commons используют крупнейшие международные электронные научные библиотеки и банки знаний: PLOS,
BioMed Central, Hindawi, Nature Publishing Group, Massachusetts
Institute of Technology Libraries, CyberLeninka (КиберЛенинка, российская электронная научная библиотека, благодаря которой Россия стала 5-й в Европе по количеству научных статей в открытом
доступе — ресурс включает более 750 тысяч статей, опубликованных на основе открытых лицензий). Таким образом, открытые
лицензии являются де-факто стандартом научной коммуникации
в мире.
О лицензиях
Лицензии Creative Commons являются неисключительными. Правообладатель может разрешить использование своего произведения по лицензии Creative Commons и после этого заключить другой
103
отдельный, неисключительный договор с кем-либо ещё, например,
в обмен на деньги.
Лицензии Creative Commons имеют силу в течение всего времени
действия полученных прав (в большинстве стран — 70 лет с момента смерти автора). Если работа однажды лицензирована, то её лицензия уже не может быть аннулирована впоследствии. Нельзя запретить кому-то, кто использует произведение согласно лицензии,
продолжить её использование. Правообладатель может прекратить
распространение произведений по лицензиям Creative Commons
в любое время, но те копии, что уже существуют, нельзя будет изъять из обращения и прекратить создание всё новых копий по лицензии Creative Commons.
Организация Creative Commons не является стороной лицензионного договора, и не может выступать гарантом качества лицензируемой работы.
Все лицензии требуют указания авторства (ранее использовались лицензии, не требующие этого, но Creative Commons перестала
их поддерживать).
Все 6 современных лицензий Creative Commons отвечают следующим параметрам:
• сохраняют авторские права на произведения;
• сообщают, что добросовестное использование другими людьми,
первая продажа и права свободы выражения не затрагиваются
данной лицензией.
Каждая лицензия требует от пользователей произведения:
• получать разрешение автора на любое из действий, которые автор
решит ограничить — например, использование в коммерческих целях, создание производного произведения;
• сохранять любое уведомление об авторских правах нетронутым
на всех копиях произведения;
• ставить ссылку на лицензию с копий произведения;
• не изменять условия лицензии;
• не использовать технологию, чтобы ограничить законные использования произведения другими получателями лицензии.
Свободные лицензии — лицензии с разрешением использовать
произведение в любых целях, изучать его, создавать и распространять копии произведения, вносить в произведение изменения, пу104
бликовать и распространять такие изменённые производные произведения.
CC Attribution (сокращённо CC BY). Лицензия «С указанием
авторства».
Главный принцип лицензии — «делайте с моим произведением
всё что угодно, только указывайте моё авторство».
Эта лицензия позволяет другим распространять, перерабатывать, исправлять и развивать произведение, даже в коммерческих
целях, при условии указания автора произведения. Это наиболее
свободная лицензия, с точки зрения того, что могут делать с произведением пользователи.
По этой лицензии доступны часть медиафайлов Викисклада,
часть музыки Jamendo, часть изображений Flickr, Викиновости, Частный Корреспондент, книга «Экономика символического обмена» Александра Долгина, материалы из Публичной научной библиотеки (PLoS), весь контент сайта президента России, сайт президента
США.
В мире CC-BY — де-факто стандарт для научных публикаций.
Его используют, частности, DOAJ — крупнейший каталог открытых
журналов, содержащий 2 млн. статей и 10 тыс. журналов, Crossref
— полмиллиона научных статей, проект OpenAIRE — крупнейшее
объединение европейских организаций, выступающих за открытость науки.
CC Attribution — Share Alike (сокращённо CC BY-SA). Лицензия «С указанием авторства — С сохранением условий».
Эта лицензия позволяет другим перерабатывать, исправлять и
развивать произведение даже в коммерческих целях при условии
указания авторства и лицензирования производных работ на аналогичных условиях. Эта лицензия является копилефт-лицензией.
Все новые произведения, основанные на лицензированном под нею,
будут иметь аналогичную лицензию, поэтому все производные будет разрешено изменять и использовать в коммерческих целях.
Лицензия CC Attribution — Share Alike не даёт кому-либо сделать
монопольным доступ к произведению. Эта лицензия уравнивает
шансы всех пользователей и даёт равные возможности доступа к
произведению
По этой лицензии доступны часть медиафайлов Викисклада, часть музыки Jamendo, часть изображений Flickr, Википе105
дия, Wikia, Wikitravel, OpenStreetMap, книга «Манифест новой экономики» Александра Долгина.
Режим «Zero» — аналог статуса «общественного достояния».
В своей основе, этот правовой инструмент является способом
обозначить графически статус «общественное достояние», то есть
нулевой защиты прав на произведение, за исключением неотъемлемого права автора. Cтатус нулевой охраны позволяет создать условия для «информационной сверхпроводимости», потому что использование произведения создаёт «нулевые» правовые риски. Это
самая «свободная» лицензия Creative Commons
CC0 (CC Zero) — универсальный, действующий во всём
мире инструмент для отказа от своих авторских прав и передачи
произведения в общественное достояние. Воспользоваться им может только владелец авторских прав. В Европе и США лицензия
CC0 используется для метаданных научных материалов. В России
на этой лицензии выпускаются исследования Ассоциации интернет-издателей на Научкор.рф.
Несвободные лицензии
Произведения под данными лицензиями не подходят под определение свободных произведений культуры. Они не предоставляют
пользователям необходимого минимума свобод и создают ограничения, которые недопустимы для свободной лицензии.
CC Attribution — No Derivative Works (сокращённо CC BYND). Лицензия «С указанием авторства — Без производных».
Эта лицензия позволяет свободно распространять произведение, как на коммерческой, так некоммерческой основе, при этом
работа должна оставаться неизменной и обязательно должно указываться авторство.
Данная лицензия запрещает перевод произведения на другой
язык.
По этой лицензии доступны часть изображений Flickr, часть музыки Jamendo, сайты Фонда свободного программного обеспечения (в том числе проекта GNU).
CC Attribution — Noncommercial (сокращённо CC BY-NC).
Лицензия «С указанием авторства — Некоммерческая».
Эта лицензия позволяет другим перерабатывать, исправлять
и развивать произведение на некоммерческой основе, и хотя для
106
производных работ сохраняются требования указания авторов и
некоммерческого использования, не требуется предоставления третьим лицам аналогичных прав на производные от неё.
По этой лицензии доступны часть изображений Flickr, часть музыки Jamendo, книга Свободная культура Лоуренса Лессига.
CC Attribution — Noncommercial — Share Alike (сокращённо CC BY-NC-SA). Лицензия «С указанием авторства — Некоммерческая — С сохранением условий».
Эта лицензия позволяет другим перерабатывать, исправлять и
развивать произведение на некоммерческой основе до тех пор, пока
они упоминают оригинальное авторство и лицензируют производные работы на аналогичных лицензионных условиях. Пользователи могут не только получать и распространять произведение на
условиях, идентичных данной лицензии («by-nc-sa»), но и переводить, создавать иные производные работы, основанные на этом
произведении. Все новые произведения будут иметь одни и те же
лицензии, поэтому все производные работы также будут носить некоммерческий характер.
По этой лицензии доступны часть изображений Flickr, часть музыки Jamendo.
CC Attribution — Noncommercial — No Derivative
Works (сокращённо CC BY-NC-ND). Лицензия «С указанием авторства — Некоммерческая — Без производных».
Данная лицензия имеет наибольшие ограничения среди шести
основных лицензий, разрешающих свободное распространение
произведения. Эту лицензию часто называют лицензией «бесплатной рекламы», поскольку она позволяет другим получать и распространять произведение до тех пор, пока они упоминают автора и
ссылаются на него, но они не могут ни под каким видом изменять
произведение и использовать его в коммерческих целях.
По этой лицензии доступны часть изображений Flickr, часть музыки Jamendo, Star Wreck, подкаст Радио-Т.
Механизм использования открытых лицензий также доступно описан в статье Sara F. Hawkins «Creative Commons Licenses
Explained In Plain English» [209]. Автор указывает читателю на то, что
[209] Hawkins S. Creative Commons Licenses Explained In Plain English.
[Электронный ресурс]. URL: https://goo.gl/ztYd5f
107
любая из лицензий Creative Commons требует указания ряда обязательных атрибутов, а именно:
• имени автора произведения (а также соавторов и пр.);
• правового статуса произведения;
• лицензии, на условиях которой используется материал;
• дисклеймера об условиях использования;
• ссылки на первоисточник.
В случае, если все эти условия не соблюдены, правообладатель
может предъявить недобросовестному пользователю претензию о
незаконном использовании интеллектуальной собственности.
Приложение 2. Инструкции
по установке платформ DSpace,
Omeka и «ИнфоРост»
Установка системы управления Omeka
Для установки потребуются:
• Операционная система Unix. В приведенной инструкции используется система Ubuntu Xenial (16.04 LTS) (GNU/Linux 4.4.95-mainlinerev1 x86_64);
• MySQL версии 5.0 и старше;
• PHP версии 5.3.2 и старше, с установленными расширениями
mysqli и exif;
• ImageMagic.
Установка происходит из-под суперюзера root. Если вы работаете из-под пользователя с правами root, то нужно использовать команды sudo, эти команды будут выполняться с привилегиями root.
В некоторых случаях операционная система будет запрашивать
ваш пароль пользователя. Например,
sudo apt-get update
В процессе установки мы будем использовать nano — консольный текстовый редактор.
Перемещение между строками и символами выполняется с помощью стрелочек на клавиатуре. Чтобы выйти и сохранить файл,
нужно нажать CTRL+X — выход, Y — подтверждение сохранения
изменений, ENTER.
1. Установка Apache
Apache — это полнофункциональный расширяемый веб-сервер,
полностью поддерживающий протокол HTTP/1.1 и распространяющийся с открытым исходным кодом. Apache настраивается с помощью текстовых конфигурационных файлов. Основные параме109
тры настроены «по умолчанию» и будут работать в большинстве
случаев. Более подробную инструкцию по установке можно найти
здесь: https://www.digitalocean.com/community/tutorials/linux-apachemysql-php-lamp-ubuntu-16-04-ru.
apt-get update
apt-get install apache2
Apt сообщит, какие пакеты будут установлены и сколько места
они займут на диске. Нажмите Y и ENTER для продолжения установки.
2. Настройка Apache
Если пользователь запрашивает директорию с сервера, Apache в
первую очередь будет искать файл с названием index.html. Веб-сервер должен отдавал предпочтение PHP-файлам, так что необходимо настроить Apache таким образом, чтобы сначала он искал файлы index.php. Для этого введем команду:
sudo nano /etc/apache2/mods-enabled/dir.conf
Модифицируем файл:
<IfModule mod_dir.c>
DirectoryIndex index.php index.html index.cgi index.pl index.xhtml
index.htm
</IfModule>
После внесения правок необходимо сохранить и закрыть файл
сочетанием клавиш CTRL-X. Для подтверждения места сохранения
файла необходимо ввести Y, а потом нажать ENTER.
Для разрешения перезаписи директив необходимо отредактировать файл apache2.conf:
nano /etc/apache2/apache2.conf
Файл должен стать таким:
<Directory /var/www/>
Options Indexes FollowSymLinks
AllowOverride All
Require all granted
</Directory>
Прописываем символическую ссылку для модуля rewrite:
ln -s /etc/apache2/mods-available/rewrite.load /etc/apache2/modsenabled
110
3. Ставим MySql
MySQL — это система управления базой данных. Она организует
и обеспечивает доступ к базам данных, в которых сайт может хранить информацию.
sudo apt-get install mysql-server
Для продолжения установки необходимо нажать Y. В процессе
установки сервер попросит вас задать и подтвердить пароль для
пользователя root в MySQL.
4. Ставим ImageMagick
ImageMagick — это свободный многоплатформенный пакет программ для неинтерактивной (пакетной) обработки графических
файлов. Поддерживает множество графических форматов, выпущен под лицензией GPL. Может использоваться с языками Perl, C,
C++, Python, Ruby, PHP, Pascal, Java, в скриптах командной оболочки
или самостоятельно.
sudo apt-get install imagemagick
Проверяем, что работает /usr/local/bin/convert logo:
logo.gif
5. Создаем базу данных и пользователя в MySQL
Как создать пользователя в MySQL и настроить права доступа
можно посмотреть здесь: https://www.hostinger.ru/rukovodstva/kaksozdat-polzovatelya-mysql-i-nastroit-prava-dostupa/.
mysql -u root –p
Далее вводим пароль пользователя (из шага 3):
CREATE USER 'non-root'@'localhost' IDENTIFIED BY '123';
В этой команде ‘non-root’ — это имя, которое мы назначаем нашему новому пользователю. А ‘123’ — это его пароль. Вы можете за-
менить на свои значения внутри кавычек.
Назначаем права доступа:
GRANT ALL PRIVILEGES ON * . * TO 'non-root'@'localhost';
Для того, чтоб изменения вошли в силу, необходимо запустить
команду обновления:
FLUSH PRIVILEGES;
Выходим командой EXIT и создаем БД:
CREATE DATABASE mydb;
Устанавливаем кодировки:
111
ALTER DATABASE `mydb` DEFAULT CHARACTER SET utf8 COLLATE utf8_
unicode_ci;
6. Устанавливаем PHP
PHP — это компонент, который будет обрабатывать код для отображения динамического контента. Он может запускать скрипты, подключаться к базам данных MySQL для получения информации и передавать обработанный контент в наш веб-сервер для отображения.
sudo apt-get install php
sudo apt-get install php-mysql
sudo apt-get install php-dom
7. Скачиваем Omeka Classic и загружаем в var/www
Чтобы настроить права для записи:
sudo chown -R username:www-data /var/www/
Переходим в директорию /var/www/:
cd /var/www/
Чтобы скачать последнюю версию платформы, необходимо перейти по ссылке https://omeka.org/classic/download/.
Нажмите правую кнопку мыши на плашке Get Omeka Classic
vX.X.X, «копировать адрес ссылки». Дальше вводим в консоли:
wget ссылка
wget
https://github.com/omeka/Omeka/releases/download/v2.5.1/
omeka-2.5.1.zip
Чтобы распаковать архив скачиваем unzip:
sudo apt install unzip
unzip /var/www/имя_архива
После этого можно переименовать папку в более дружелюбное
имя, например, myomeka.
Меняем права:
sudo chmod -R g+w /var/www/myomeka/files
Прописываем параметры в файле myomeka/db.ini
В файле db.ini меняем "XXXXXXX" на нужные значения
host = "127.0.0.1"
Следующие данные берутся из шага 5 (создание базы данных и
пользователя в MySQL):
username = "db_user"
password = "db_user_pass"
112
dbname = "mydb"
8. Создаем конфигурационный файл для Apache
cd /etc/apache2/ sites-available/
Копируем дефолтный (по умолчанию):
cp 000-default.conf myomeka.conf
Редактируем:
sudo nano myomeka.conf
Меняем строку на DocumentRoot /var/www/myomeka, выходим,
сохраняем.
Прописываем символическую ссылку:
ln -s
enabled
/etc/apache2/sites-available/rewrite.load
/etc/apache2/sites-
И на всякий случай удаляем дефолтную символическую ссылку:
rm /etc/apache2/sites-enabled/000-default.conf
9. Подключаем mode-php для Apache
Для этого устанавливаем aptitude:
apt-get install aptitude
Нажимаем слэш (/), чтобы открыть поиск. Вводим mode-php. На
верхней строке ставим + (должна подсветиться зеленым), два раза
нажимаем g, затем Enter и q, чтобы выйти.
10. Перезапускаем Apache
sudo service apache2 reload
11. Устанавливаем Omeka
Вводим в браузере IP-адрес веб-интерфейса. Нажимаем Install,
затем заполняем установочные поля: имя сайта, логин/пароль суперюзера, электронная почта. Если установка прошла успешно, то
появится форма ввода логина и пароля.
Установка DSpace
DSpace — это программное обеспечение для создания архива электронных ресурсов (цифрового репозитория). DSpace реализован
как J2EE-приложение, поэтому может функционировать в любом
стандартном J2EE-контейнере.
113
Для установки понадобятся:
• Операционная система Unix или Microsoft Windows. В приведенной инструкции используется система Ubuntu Xenial (16.04 LTS)
(GNU/Linux 4.4.95-mainline-rev1 x86_64);
• В качестве базы данных может использоватся Oracle или Postgresql.
В приведенной инструкции используется база Postregsql;
• Oracle Java JDK 6 or 7 или OpenJDK 6 or 7;
• Apache Maven 2.2.x или выше;
• Apache Ant 1.8 или старше;
• Apache Tomcat 5.5 или старше.
1. Устанавливаем Java JDK
sudo apt-get install default-jdk
2. Устанавливаем Apache Maven
Чтобы скачать последнюю версию, необходимо перейти по ссылке
http://maven.apache.org/download.cgi. Далее переходим в директорию /opt:
cd /opt/
wget
ht tp://apache-mirror.rbc.ru/pub/apache/maven/maven-3/3.5.2 /
binaries/apache-maven-3.5.2-bin.tar.gz
114
Распаковываем:
sudo tar -xvzf apache-maven-3.5.2-bin.tar.gz
Переименовываем:
sudo mv apache-maven-3.5.2 maven
Чтобы установить переменные среды (такие как M2_HOME, M2,
MAVEN_OPTS и Path), создаем mavenenv.sh:
sudo nano /etc/profile.d/mavenenv.sh
Добавляем строки:
export M2_HOME=/opt/maven
export PATH=${M2_HOME}/bin:${PATH}
Закрываем и сохраняем с помощью команд CTRL+X, Y, ENTER.
Обновляем права:
sudo chmod +x /etc/profile.d/mavenenv.sh
Запускаем переменные:
sudo chmod +x /etc/profile.d/mavenenv.sh
Проверяем:
mvn –version
3. Устанавливаем Apache Ant
Apach Ant — это инструмент для сборки программного обеспечения.
sudo apt-get install ant
115
4. Устанавливаем PostgreSQL
PostgreSQL или Postgres — это система управления реляционной
базой данных, предоставляющая реализацию языка запросов SQL.
Это популярный выбор для множества больших и малых проектов.
sudo apt-get install postgresql postgresql-contrib
Редактируем конфигурационный файл, нужно раскомментировать listen_addresses = 'localhost':
sudo nano /etc/postgresql/9.5/main/postgresql.conf
Закрываем, сохраняем.
В файле pg_hba.conf прописываем host dspace dspace 127.0.0.1
255.255.255.255 md5
sudo nano /etc/postgresql/9.5/main/pg_hba.conf
5. Устанавливаем Apache Tomcat
Tomcat — контейнер сервлетов и веб-сервер с открытым исходным кодом. Tomcat реализует спецификацию Java Servlet, JavaServer
Pages(JSP), Java Expression Language и Java WebSocket технологий.
В качестве основы контейнера сервлетов Tomcat используют такие
серверы приложений, как JBoss и GlassFish. Подробную инструкцию по установке можно найти по ссылке https://goo.gl/1XGxTw.
Чтобы скачать последнюю версию, необходимо перейти по ссылке http://tomcat.apache.org/download-90.cgi. Щелкаем правой кнопкой мыши по tar.gz и используем ее.
116
Переходим в директорию /opt:
cd /opt
Скачиваем:
wget
http://apache-mirror.rbc.ru/pub/apache/tomcat/tomcat-9/v9.0.1/bin/
apache-tomcat-9.0.1.tar.gz
Распаковываем его в текущую папку:
tar -xvzf apache-tomcat-9.0.1.tar.gz
Переименовываем:
mv apache-tomcat-9.0.1 tomcat
Tomcat скачан и находится в одноименной папке. Теперь нужно
добавить веб-сервер в службы, чтобы его можно было легко запускать и останавливать.
Создаем новый файл tomcat.service:
nano /etc/systemd/system/tomcat.service
Добавляем строки:
[Unit]
Description=Tomcat9
After=network.target
[Service]
Type= forking
Environment=CATALINA_PID=/opt/tomcat/tomcat9.pid
Environment=JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64/jre
Environment=CATALINA_HOME=/opt/tomcat
Environment=CATALINA_BASE=/opt/tomcat
117
Environment="CATALINA_OPTS=-Xms512m -Xmx512m"
Environment="JAVA_OPTS=-Dfile.encoding=UTF-8 -Dnet.
sf.ehcache.skipUpdateCheck=true -XX:+UseConcMarkSweepGC
-XX:+CMSClassUnloadingEnabled -XX:+UseParNewGC"
ExecStart=/opt/tomcat/bin/startup.sh
ExecStop=/opt/tomcat/bin/shutdown.sh
[Install]
WantedBy=multi-user.target
Сохраняем файл и перезапускаем менеджер служб:
sudo systemctl daemon-reload
Вносим изменения в файл server.xml:
nano /opt/tomcat/conf/server.xml
Перезапускаем tomcat:
sudo service tomcat restart
Проверяем:
sudo service tomcat status
118
Создаем группу tomcat:
sudo groupadd tomcat
Создаем пользователя tomcat с домашней директорий /opt/tomcat
и прописываем, чтобы им нельзя было залогиниться /bin/false:
sudo useradd -s /bin/false -g tomcat -d /opt/tomcat tomcat
Прописываем права на директорию установки и conf, webapps/
work/ temp/ logs/:
cd /opt/tomcat
sudo chgrp -R tomcat /opt/tomcat
sudo chmod -R g+r conf
sudo chmod g+x conf
sudo chown -R tomcat webapps/ work/ temp/ logs/
Запускаем
sudo systemctl start tomcat
6. Устанавливаем Git
sudo apt-get install git
Скачиваем DSpace
sudo mkdir /opt/dspace
sudo mkdir /opt/dspace_src
Чтобы скачать последнюю версию, необходимо перейти по ссылке https://github.com/DSpace/DSpace/releases/tag/dspace-6.2 Щелкаем
правой кнопкой мыши по dspace-6.2-release.zip и ее используем
cd /opt/dspace_src
wget
https://github.com/DSpace/DSpace/releases/download/dspace-6.2/
dspace-6.2-release.zip
Распаковываем, переименовываем:
119
unzip dspace-6.2-release.zip
Cоздаем local.cfg
cd dspace-6.2-release/dspace/config/
cp local.cfg.EXAMPLE local.cfg
nano local.cfg
Прописываем:
dspace.dir=/opt/dspace прописываем директорию установки
dspace.hostname — указываем имя/ip веб-сервера или "localhost"
dspace.baseUrl* — указываем имя/ip веб-сервера или "localhost" и
порт
dspace.name — имя
default.language = ru_RU
Выходим, сохраняем.
В этом файл так же можно прописывать другие настройки:
#Каталог установки dspace
dspace.dir = /opt/dspace
#URL главной страницы DSpace вместо localhost:8080 необходимо
прописать полное имя вашего сервера и порт, на котором
работает web-контейнер:
dspace.url = http://localhost:8080/xmlui
120
#Полное имя вашего сервера (порт указывать не нужно)
dspace.hostname = localhost
#Имя вашего сайта (для корректного отображения русского
названия воспользуйтесь утилитой native2ascii из jdk)
dspace.name = \u042d\u043b\u0435\u043a\u0442\u0440\u043e\
u043d\u043d\u0430\u044f \u0431\u0438\u0431\u043b\u0438\
u043e\u0442\u0435\u043a\u0430
#Используемая СУБД
db.name = postgres
#Строка подключения к БД - jdbc:postgresql://[сервер]:[порт]/[имя
БД]
db.url = jdbc:postgresql://localhost:5432/dspace
#Пользователь и пароль для подключения к БД
db.username = dspace
db.password = ПАРОЛЬ_ПОЛЬЗОВАТЕЛЯ
#Имя SMTP сервера
mail.server = ИМЯ_ВАШЕГО_SMTP_СЕРВЕРА
#Обратный адрес сообщений
mail.from.address = ВАШ_ПОЧТОВЫЙ_АДРЕС
#Почтовый адрес для обратной связи
feedback.recipient = ВАШ_ПОЧТОВЫЙ_АДРЕС
#Почтовый адрес администратора
mail.admin = ВАШ_ПОЧТОВЫЙ_АДРЕС
#Почтовый адрес для сообщения об ошибках
alert.recipient = ${mail.admin}
#Кодировка писем
mail.charset = UTF8
121
#Локализация
default.locale = ru
#Язык сообщений
default.language = ru_RU
#Каталог для хранения бинарных потоков (загруженных файлов)
#Рекомендуется разместить на специальном разделе
assetstore.dir = ${dspace.dir}/assetstore
8. Настраиваем PostgreSQL
Создаем пользователя dspace:
sudo -u postgres createuser --username=postgres --no-superuser
--pwprompt dspace
Создаем базу данных с владельцем dspace:
sudo -u postgres createdb --username=postgres --owner=dspace
--encoding=UNICODE dspace
Включаем pgcrypto extension:
sudo -u postgres psql --username=postgres dspace -c "CREATE
EXTENSION pgcrypto;"
9. Начинаем установку
cd /opt/dspace_src/dspace-6.2-release/dspace/
mvn package
cd target/dspace-installer/
ant fresh_install
122
sudo -u tomcat ln -s /opt/dspace/webapps/xmlui /opt/tomcat/
webapps/xmlui
sudo -u tomcat ln -s /opt/dspace/webapps/sword /opt/tomcat/
webapps/sword
sudo -u tomcat ln -s /opt/dspace/webapps/oai /opt/tomcat/webapps/
oai
10. Создаем администратора
Вводим команду:
sudo /dspace/bin/dspace create-administrator
После этого система предложит вам ввести электронную почту
администратора, имя, фамилию, пароль и повтор пароля. После
ввода данных необходимо нажать Y для подтверждения.
Установка «ИнфоРост»
Для установки платформы «ИнфоРост» необходимо обратиться
по контактному телефону +7 (929) 618-49-70 или написать на электронную почту info@inforost.org. По этому адресу также можно запросить демоверсию системы, в письме необходимо указать ФИО
сотрудника и наименование организации. Полный текст лицензии
доступен по адресу http://www.inforost.org/documentation#license_ru.
123
Приложение 3. Инструкции
по реализации интерфейсов
передачи и обмена данными для
подключения к «Федеральной
резервной системе банков
знаний»
Постраничное отображение мета-данных объектов
в формате JSON в соответствии с разметкой
[
{
"identifier":{"название_банка_знаний":["id_объекта_в_
банке_знаний"],"url":["ссылка_на_документ"]},
"title":{"none":["название_объекта"]},
"creator":{"none":["автор_объекта"]},
"subject":{"none":["тематика_обекта"]},
"description":{"none":["описание_или_антотация_к_
объекту"]},
"date":{"none":["дата_и_время_публикации_объекта_в_
банке_знаний"],
"updated":["дата_и_время_последнего_обновления_
объекта"]},
"type":{"none":["тип_объекта"]},
"format":{"none":["формат_объекта"]},
"source":{"none":["общая_ссылка_на_сайт_банка_знаний"]},
"language":{"none":["язык_объекта"]},
"rights":{"none":["текущие_правовой_статус_
использования"]},
"rightsholder":{"none":["правообладатель_объекта"]}
}
]
124
Дополнительные сведения и разъяснения к форматам данных
Необходимо следовать рекомендациям OpenAIRE:
1. Дата и время: YYYY-MM-DD hh:mm, либо YYYY-MM-DD, либо
YYYY-MM, либо YYYY
2. Язык: ISO 639-3
3. Формат: mime-type
4. Текущий правовой статус указывается в одном из представленных ниже обозначений:
• cc-by — CC BY — Creative Commons Attribution 4.0 International
• cc-by-sa — CC BY-SA — Creative Commons Attribution ShareAlike
4.0 International
• cc-by-nd — CC BY-ND — Creative Commons Attribution
NoDeravatives 4.0 International
• cc-by-nc — CC BY-NC — Creative Commons Attribution
NonCommercial 4.0 International
• cc-by-nc-sa — CC BY-NC-SA — Creative Commons Attribution
NonCommercial ShareAlike 4.0 International
• cc-by-nc-nd — CC BY-NC-ND — Creative Commons Attribution
NonCommercial NoDeravatives 4.0 International
• pd — Общественное достояние (Public Domain)
• copyright — Охраняемое произведение, закрытое для свободного
использования (Copyright)
• orphan-work — Статус сиротского произведения - правовой статус неизвестен или автор и правообладатель неизвестны.
5. Сортировка объектов должна осуществляться по полю "updated",
таким образом, что все новые или обновленные объекты находились в начале списка
6. Если у объекта в метаданных есть ссылки на другие объекты (референсы), их необходимо по аналогии записывать в дополнительное поле "relation".
7. Постраничное разбиение массива осуществляется с указанием
номера страницы в гиперссылке, например, таким образом: http://
nauchkor.ru/api/v1/pubs.json?page=2&serializer=nooregistry
8. Дополнительно возможно указание количества объектов на одной странице, например, таким образом: http://nauchkor.ru/api/v1/
pubs.json?page=1&per_page=10&serializer=nooregistry
125
Пример разметки OAI
<schema xmlns="http://www.w3.org/2001/XMLSchema"
xmlns:oai="http://www.openarchives.org/OAI/2.0/"
targetNamespace="http://www.openarchives.org/OAI/2.0/" elementF
ormDefault="qualified"attributeFormDefault="unqualified">
<annotation>
<documentation>
XML Schema which can be used to validate replies to all OAI-PMH v2.0
requests. Herbert Van de Sompel, 2002-05-13. Validated with XML
Spy v.4.3 on 2002-05-13. Validated with XSV 1.203.2.45/1.106.2.22 on
2002-05-13. Added definition of protocolVersionType instead of using
anonymous type. No change of function. Simeon Warner, 2004-03-29.
Tightened definition of UTCdatetimeType to enforce the restriction
to UTC Z notation. Simeon Warner, 2004-09-14. Corrected pattern
matches for setSpecType and metadataPrefixType to agree with
protocol specification. Simeon Warner, 2004-10-12. Spelling correction.
Simeon Warner, 2008-12-07. $Date: 2004/10/12 15:20:29 $
</documentation>
</annotation>
<element name="OAI-PMH" type="oai:OAI-PMHtype"/>
<complexType name="OAI-PMHtype">
<sequence>
<element name="responseDate" type="dateTime"/>
<element name="request" type="oai:requestType"/>
<choice>
<element name="error" type="oai:OAI-PMHerrorType"
maxOccurs="unbounded"/>
<element name="Identify" type="oai:IdentifyType"/>
<element name="ListMetadataFormats" type="oai:ListMetadataForma
tsType"/>
<element name="ListSets" type="oai:ListSetsType"/>
<element name="GetRecord" type="oai:GetRecordType"/>
<element name="ListIdentifiers" type="oai:ListIdentifiersType"/>
<element name="ListRecords" type="oai:ListRecordsType"/>
</choice>
</sequence>
</complexType>
<complexType name="requestType">
126
<annotation>
<documentation>
Define requestType, indicating the protocol request that led to the
response. Element content is BASE-URL, attributes are arguments of
protocol request, attribute-values are values of arguments of protocol
request
</documentation>
</annotation>
<simpleContent>
<extension base="anyURI">
<attribute name="verb" type="oai:verbType" use="optional"/>
<attribute name="identifier" type="oai:identifierType" use="optional"/>
<attribute name="metadataPrefix" type="oai:metadataPrefixType"
use="optional"/>
<attribute name="from" type="oai:UTCdatetimeType" use="optional"/>
<attribute name="until" type="oai:UTCdatetimeType" use="optional"/>
<attribute name="set" type="oai:setSpecType" use="optional"/>
<attribute name="resumptionToken" type="string" use="optional"/>
</extension>
</simpleContent>
</complexType>
<simpleType name="verbType">
<restriction base="string">
<enumeration value="Identify"/>
<enumeration value="ListMetadataFormats"/>
<enumeration value="ListSets"/>
<enumeration value="GetRecord"/>
<enumeration value="ListIdentifiers"/>
<enumeration value="ListRecords"/>
</restriction>
</simpleType>
<!-- define OAI-PMH error conditions -->
<!-- =============================== -->
<complexType name="OAI-PMHerrorType">
<simpleContent>
<extension base="string">
<attribute name="code" type="oai:OAI-PMHerrorcodeType"
use="required"/>
127
</extension>
</simpleContent>
</complexType>
<simpleType name="OAI-PMHerrorcodeType">
<restriction base="string">
<enumeration value="cannotDisseminateFormat"/>
<enumeration value="idDoesNotExist"/>
<enumeration value="badArgument"/>
<enumeration value="badVerb"/>
<enumeration value="noMetadataFormats"/>
<enumeration value="noRecordsMatch"/>
<enumeration value="badResumptionToken"/>
<enumeration value="noSetHierarchy"/>
</restriction>
</simpleType>
<!-- define OAI-PMH verb containers -->
<!-- ============================== -->
<complexType name="IdentifyType">
<sequence>
<element name="repositoryName" type="string"/>
<element name="baseURL" type="anyURI"/>
<element name="protocolVersion" type="oai:protocolVersionType"/>
<element name="adminEmail" type="oai:emailType"
maxOccurs="unbounded"/>
<element name="earliestDatestamp" type="oai:UTCdatetimeType"/>
<element name="deletedRecord" type="oai:deletedRecordType"/>
<element name="granularity" type="oai:granularityType"/>
<element name="compression" type="string" minOccurs="0"
maxOccurs="unbounded"/>
<element name="description" type="oai:descriptionType"
minOccurs="0" maxOccurs="unbounded"/>
</sequence>
</complexType>
<complexType name="ListMetadataFormatsType">
<sequence>
<element name="metadataFormat" type="oai:metadataFormatType"
maxOccurs="unbounded"/>
</sequence>
128
</complexType>
<complexType name="ListSetsType">
<sequence>
<element name="set" type="oai:setType" maxOccurs="unbounded"/>
<element name="resumptionToken" type="oai:resumptionTokenType"
minOccurs="0"/>
</sequence>
</complexType>
<complexType name="GetRecordType">
<sequence>
<element name="record" type="oai:recordType"/>
</sequence>
</complexType>
<complexType name="ListRecordsType">
<sequence>
<element name="record" type="oai:recordType"
maxOccurs="unbounded"/>
<element name="resumptionToken" type="oai:resumptionTokenType"
minOccurs="0"/>
</sequence>
</complexType>
<complexType name="ListIdentifiersType">
<sequence>
<element name="header" type="oai:headerType"
maxOccurs="unbounded"/>
<element name="resumptionToken" type="oai:resumptionTokenType"
minOccurs="0"/>
</sequence>
</complexType>
<!-define basic types used in replies to
GetRecord, ListRecords, ListIdentifiers
-->
<!-- ======================================= -->
<complexType name="recordType">
<annotation>
<documentation>
129
A record has a header, a metadata part, and an optional about
container
</documentation>
</annotation>
<sequence>
<element name="header" type="oai:headerType"/>
<element name="metadata" type="oai:metadataType"
minOccurs="0"/>
<element name="about" type="oai:aboutType" minOccurs="0"
maxOccurs="unbounded"/>
</sequence>
</complexType>
<complexType name="headerType">
<annotation>
<documentation>
A header has a unique identifier, a datestamp, and setSpec(s) in case
the item from which the record is disseminated belongs to set(s). the
header can carry a deleted status indicating that the record is deleted.
</documentation>
</annotation>
<sequence>
<element name="identifier" type="oai:identifierType"/>
<element name="datestamp" type="oai:UTCdatetimeType"/>
<element name="setSpec" type="oai:setSpecType" minOccurs="0"
maxOccurs="unbounded"/>
</sequence>
<attribute name="status" type="oai:statusType" use="optional"/>
</complexType>
<simpleType name="identifierType">
<restriction base="anyURI"/>
</simpleType>
<simpleType name="statusType">
<restriction base="string">
<enumeration value="deleted"/>
</restriction>
</simpleType>
<complexType name="metadataType">
<annotation>
130
<documentation>
Metadata must be expressed in XML that complies with another XML
Schema (namespace=#other). Metadata must be explicitly qualified in
the response.
</documentation>
</annotation>
<sequence>
<any namespace="##other" processContents="strict"/>
</sequence>
</complexType>
<complexType name="aboutType">
<annotation>
<documentation>
Data "about" the record must be expressed in XML that is compliant
with an XML Schema defined by a community.
</documentation>
</annotation>
<sequence>
<any namespace="##other" processContents="strict"/>
</sequence>
</complexType>
<complexType name="resumptionTokenType">
<annotation>
<documentation>
A resumptionToken may have 3 optional attributes and can be used in
ListSets, ListIdentifiers, ListRecords responses.
</documentation>
</annotation>
<simpleContent>
<extension base="string">
<attribute name="expirationDate" type="dateTime" use="optional"/>
<attribute name="completeListSize" type="positiveInteger"
use="optional"/>
<attribute name="cursor" type="nonNegativeInteger" use="optional"/>
</extension>
</simpleContent>
</complexType>
<complexType name="descriptionType">
131
<annotation>
<documentation>
The descriptionType is used for the description element in Identify and
for setDescription element in ListSets. Content must be compliant with
an XML Schema defined by a community.
</documentation>
</annotation>
<sequence>
<any namespace="##other" processContents="strict"/>
</sequence>
</complexType>
<simpleType name="UTCdatetimeType">
<annotation>
<documentation>
Datestamps are to either day (type date) or to seconds granularity
(type oai:UTCdateTimeZType)
</documentation>
</annotation>
<union memberTypes="date oai:UTCdateTimeZType"/>
</simpleType>
<simpleType name="UTCdateTimeZType">
<restriction base="dateTime">
<pattern value=".*Z"/>
</restriction>
</simpleType>
<!-- define types used for Identify verb only -->
<!-- ======================================== -->
<simpleType name="protocolVersionType">
<restriction base="string">
<enumeration value="2.0"/>
</restriction>
</simpleType>
<simpleType name="emailType">
<restriction base="string">
<pattern value="\S+@(\S+\.)+\S+"/>
</restriction>
</simpleType>
<simpleType name="deletedRecordType">
132
<restriction base="string">
<enumeration value="no"/>
<enumeration value="persistent"/>
<enumeration value="transient"/>
</restriction>
</simpleType>
<simpleType name="granularityType">
<restriction base="string">
<enumeration value="YYYY-MM-DD"/>
<enumeration value="YYYY-MM-DDThh:mm:ssZ"/>
</restriction>
</simpleType>
<!-define types used for ListMetadataFormats verb only
-->
<!-===================================================
-->
<complexType name="metadataFormatType">
<sequence>
<element name="metadataPrefix" type="oai:metadataPrefixType"/>
<element name="schema" type="anyURI"/>
<element name="metadataNamespace" type="anyURI"/>
</sequence>
</complexType>
<simpleType name="metadataPrefixType">
<restriction base="string">
<pattern value="[A-Za-z0-9\-_\.!~\*'\(\)]+"/>
</restriction>
</simpleType>
<!-- define types used for ListSets verb -->
<!-- =================================== -->
<complexType name="setType">
<sequence>
<element name="setSpec" type="oai:setSpecType"/>
<element name="setName" type="string"/>
<element name="setDescription" type="oai:descriptionType"
minOccurs="0" maxOccurs="unbounded"/>
133
</sequence>
</complexType>
<simpleType name="setSpecType">
<restriction base="string">
<pattern value="([A-Za-z0-9\-_\.!~\*'\(\)])+(:[A-Za-z0-9\-_\.!~\*'\(\)]+)*"/>
</restriction>
</simpleType>
</schema>
Электронная библиотека:
инструкция по установке
Рекомендации для библиотек
по организации собственных репозиториев
открытого доступа
И. В. Бегтин, А. С. Горбунова
Дизайн — В. Харитонов
Формат 60 × 90 1/16.
Гарнитура Minion Pro и Myriad Pro.
Уч. изд. л. 5,6. Усл. п. л. 8,5.
Подписано в печать 12.12.2017.
Тираж 300 экз.
Отзывы:
Авторизуйтесь, чтобы оставить отзывДобрый день, Ангелина! Спасибо за статью. Не могли бы Вы порекомендовать ещё статьи в частности по верному заполнению полей на платформе Dspase?
Добрый день, Ангелина! Спасибо за статью. Не могли бы Вы порекомендовать ещё статьи в частности по верному заполнению полей на платформе Dspase?
Добрый день, Ангелина! Спасибо за статью. Не могли бы Вы порекомендовать ещё статьи в частности по верному заполнению полей на платформе Dspase?
Добрый день, Ангелина! Спасибо за статью. Не могли бы Вы порекомендовать ещё статьи в частности по верному заполнению полей на платформе Dspase?
Кроме OPAC-Global и ИнфоРоста в России существует ещё целое множество электронных библиотек, в том числе более функциональных и в течении нескольких лет использования более дешевых, чем ИнфоРост. Несколько странно включение OPAC-Global в качестве рассматриваемой системы, т.к. его в целях электронных библиотек увидеть доводится не часто, а в целом это АБИС, а не электронная библиотека. Нельзя согласится с авторами, что ИнфоРост подходит для вузов. Дело в том, что в вузах по разным причинам электронные библиотеки надо комплектовать и контентом, на который требуется защита от скачивания и управление доступом. Это могут быть как покупные учебники, так и требования преподавателей. Также в вузах необходимо хранить ВКР (выпускные квалификационные работы) и в некоторых случаях с ограниченным доступом. Иметь при этом две системы (одну - ЭБС вуза и одну как открытый архив) будет нецелесообразно, т.к. системы имеющие контроль доступа также, как правило, позволяют распространять издания и в открытом доступе. В издании недостаточно внимания акцентируется на задачи, для которых предназначен тот или иной продукт. Например DSpace хорошо справляется с задачами публикации научных статей, но для других задач (например, в качестве представления оцифрованных книг) он может быть не оптимален. У читателя не возникает уверенности, что у каждого продукта представленного в исследовании своя ниша применения, из-за этого есть риск неверного принятия решения. Считаю, публикацию полезной для достаточно опытного пользователя, который сможет найти возможно новые продукты, с которыми стоит познакомиться по ближе. А вот для недостаточно разбирающихся в электронных библиотеках специалистов делать свой выбор основываясь только на этой работе я не советую.