Исследование национальных парков России и мира по
Викиданным
Andrew Krizhanovskya , Nikita Bazhenovb
a
Institute of Applied Mathematical Research of the Karelian Research Centre of the Russian Academy of
Sciences
b
Petrozavodsk State University
Аннотация
Данная статья посвящена исследованию объекта Викиданных ”Национальный парк”.
С помощью SPARQL-запросов, вычисляемых на объектах типа ”национальный парк”
в Викиданных, решены такие задачи: выведен список всех ныне существующих национальных парков, список национальных парков, упорядоченных по дате создания,
диаграмма парков, упорядоченных по количеству за разные годы и по странам мира, а так же карта всех национальых парков, построенная на основе географических
координат. Кроме того, сделаны выводы по поводу полноты Викиданных по данной
теме.
Примечание
Статья распространяется по лицензии Creative Commons Attribution-ShareAlike. Материалы этой статьи использованы в главе курса Викиверситета ”Программирование
Викиданных”[1]. Иллюстрации загружены на Викисклад. Над статьёй в 2017 году работали Крижановский А. А., Баженов Н. А.
Экземпляры объекта "Национальный парк"
Национальный парк - территория, где в целях охраны окружающей среды ограничена деятельность человека. В дальнейшем, возможно, будет использовано сокращение
слова ”национальный парк” до ”парк” с целью лучшего понимания текста.
Построим список всех национальных парков. См. листинг 1.
• Свойство: экземпляр (P31),
• Объект: национальный парк (Q46169).
1
2
3
4
5
6
7
#L i s t o f ‘ i n s t a n c e s of ‘ ” n a t i o n a l park ”
SELECT ? park ? p a r k L a b e l
WHERE
{
? park wdt : P31 wd : Q46169 .
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ” }
}
1: Список парков
Preprint submitted to Elsevier Journal
14 мая 2017 г.
SPARQL-запрос, 1665 записей.
Наиболее полными и проработанными национальными парками на Викиданных являются: Тейде, Тингветлир, Национальный парк имени Александра Гумбольдта.
Почти пустыми и малоинформативными национальными парками оказались: Припышминские Боры, Смольный национальный парк, Хвалынский национальный парк.
Диаграмма парков, упорядоченных по количеству за разные годы и по
странам мира
Выведем диаграмму парков, упорядоченных по количеству созданных парков за
разные годы и по странам мира (начиная с 1900 года и по сей день). См. листинг 2.
1
2
3
4
5
6
7
8
9
10
11
12
#d e f a u l t V i e w : BarChart
#u n d e r s c o r e i s f o r u s i n g a v a r i a b l e more than 1 time
SELECT DISTINCT (SAMPLE( ? y e a r ) AS ? y e a r ) (COUNT( ? y e a r ) AS ? count ) (SAMPLE( ?
p a r k L a b e l ) AS ? p a r k L a b e l ) WHERE {
? o b j e c t ( wdt : P31 ) wd : Q46169 . #i n s t a n c e o f n a t i o n a l park
BIND( s t r (YEAR( ? i n c e p t i o n ) ) AS ? y e a r ) #d e f i n i t i o n o f y e a r
? o b j e c t wdt : P571 ? i n c e p t i o n . #d e f i n i t i o n o f i n c e p t i o n
? o b j e c t wdt : P17 ? c o u n t r y . #d e f i n i t i o n o f c o u n t r y
? country r d f s : l a b e l ? parkLabel .
FILTER ( (LANG( ? p a r k L a b e l ) ) = ” ru ” ) # f i l t e r i n p a r k L a b e l = ru
}
GROUP BY ? i n c e p t i o n ? c o u n t r y
ORDER BY ? y e a r ? i n c e p t i o n
2: Упорядоченная по количеству за разные годы и по странам мира диаграмма парков
SPARQL-запрос, 612 записей.
Данный скрипт выводит количество созданных парков в определенные года, а так
же страны, в которых они были созданы (рис. 1). Например, столбик голубого цвета
за 2006 год означает, что было создано 25 национальных парков в Австралии.
Отсортируем столбцы на гистограмме таким образом, чтобы года отображались
последовательно (рис. 2).
Недостаток полученного скрипта в том, что, возможно, не все национальные парки
мира выведутся. Это связано с тем, что у национальных парков мира существует подкласс национальных парков по странам (например, национальные парки Норвегии).
Дополним предыдущую диаграмму, включив в нее эти подклассы. См. листинг 3.
1
2
3
4
5
6
7
8
9
10
#d e f a u l t V i e w : BarChart
SELECT DISTINCT (SAMPLE( ? y e a r ) AS ? y e a r ) (COUNT( ? y e a r ) AS ? count ) (SAMPLE( ?
p a r k L a b e l ) AS ? p a r k L a b e l ) WHERE {
? o b j e c t ( wdt : P31/wdt : P279 ∗ ) wd : Q46169 . #i n s t a n c e o f n a t i o n a l park o f . . (
R u s s i a a s example )
BIND( s t r (YEAR( ? i n c e p t i o n ) ) AS ? y e a r ) #d e f i n i t i o n o f y e a r
? o b j e c t wdt : P571 ? i n c e p t i o n . #d e f i n i t i o n o f i n c e p t i o n
? o b j e c t wdt : P17 ? c o u n t r y . #d e f i n i t i o n o f c o u n t r y
? country r d f s : l a b e l ? parkLabel .
FILTER ( (LANG( ? p a r k L a b e l ) ) = ” ru ” ) # f i l t e r i n p a r k L a b e l = ru
}
GROUP BY ? i n c e p t i o n ? c o u n t r y
2
11
ORDER BY ? y e a r ? i n c e p t i o n
3: Упорядоченная диаграмма парков с отсортированным столбцами
SPARQL-запрос, 980 записей.
Можно заметить по (рис. 3), что количество национальных парков выросло на 378.
Полнота Викиданных по паркам
Существует много национальных парков мира. Однако, скорее всего, далеко не
у всех заполнено поле ’географические координаты’ (англ. ’location’) Построим список национальных парков, у которых заполнены географические координаты. См. листинг 4.
1
2
3
4
5
6
7
8
9
#L i s t o f p a r k s with f i l l e d ’ l o c a t i o n ’
#d e f a u l t V i e w : Map
SELECT ? park ? p a r k L a b e l ? l o c a t i o n
WHERE
{
? park wdt : P31 wd : Q46169 .
? park wdt : P625 ? l o c a t i o n
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ”}
}
4: Список парков с заполненными географическими координатами
SPARQL-запрос, 1405 записей.
Построим список национальных парков, у которых заполнены географические координаты, расположенных в России. См. листинг 5.
1
2
3
4
5
6
7
8
9
10
#L i s t o f n a t i o n a l p a r k s i n R u s s i a
#d e f a u l t V i e w : Map
SELECT ? park ? p a r k L a b e l ? l o c a t i o n
WHERE
{
? park wdt : P31 wd : Q46169 . #i n s t a n c e o f n a t i o n a l park
? park wdt : P17 wd : Q159 . #c o u n t r y = R u s s i a
? park wdt : P625 ? l o c a t i o n #d i s p l a y l o c a t i o n
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ”}
}
5: Список парков с заполненными географическими координатами России
SPARQL-запрос, 7 записей.
Национальных парков по России (которые вывелись данным скриптом) оказалось
очень мало, всего лишь семь. Хотя, на самом деле, их шесть, потому что один парк
(Национальный парк Бикин) дублируется ввиду повторного заполнения поля ’location’.
На самом деле, эти парки являются ’ошибочными’, так как они должны входить в
подкласс парков конкретной страны.
Построим список национальных парков России, используя подкласс (national park
in Russia). См. листинг 6.
1
2
3
#L i s t o f n a t i o n a l p a r k s i n R u s s i a
#d e f a u l t V i e w : Map
SELECT ? park ? p a r k L a b e l ? l o c a t i o n
3
4
5
6
7
8
9
WHERE
{
? park wdt : P31 wd : Q1969226 . #i n s t a n c e o f n a t i o n a l park i n R u s s i a
? park wdt : P625 ? l o c a t i o n #d i s p l a y l o c a t i o n
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ”}
}
6: Список парков с заполненными географическими координатами в России
SPARQL-запрос, 44 записи.
Полученный список состоит из 44 парков (рис. 4).
Обратимся к статье на Русской Википедии. Список национальных парков России
включает 49 парков.
В книге ”Вокруг Света. Национальные парки России. Поволжье и Северный Кавказ. Путеводитель” говорится на момент написания (2007 год) о действующих 35 национальных парках России.
Викигид показывает результат в 40 национальных парков в России.
Заполнение 100 объектов
Информация на Викиданных говорит о том, что не у всех парков заполнено поле ’географические координаты’ (англ.’location’). Напишем скрипт, который выводит
список всех национальных парков с незаполненным полем ’location’.
SPARQL-запрос, 283 записи.
1
2
3
4
5
6
7
8
#L i s t o f n a t i o n a l p a r k s with u n f i l l e d p r o p e r t y ’ l o c a t i o n ’
SELECT ? park ? p a r k L a b e l ? l o c a t i o n
WHERE
{
? park wdt : P31 wd : Q46169 . #i n s t a n c e o f n a t i o n a l park
FILTER NOT EXISTS { ? park wdt : P625 [ ] } #i f p r o p e r t y l o c a t i o n i s a b s e n t
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ”}
}
7: Список парков с незаполненными географическими координатами
Данный скрипт построил список из 283 национальных парков с незаполненным полем ’location’. См. листинг 7.
Напишем скрипт, который построит список из всех национальных парков, у которых
заполнено поле ’location’.
SPARQL-запрос, 1417 записей.
1
2
3
4
5
6
7
8
9
#L i s t o f n a t i o n a l p a r k s
#d e f a u l t V i e w : Map
SELECT ? park ? p a r k L a b e l ? l o c a t i o n
WHERE
{
? park wdt : P31 wd : Q46169 . #i n s t a n c e o f n a t i o n a l park
? park wdt : P625 ? l o c a t i o n #d i s p l a y l o c a t i o n
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ”}
}
8: Список парков с заполненными географическими координатами
4
После выполнения листинга на карте отобразилось 1417 национальных парка. См.
листинг 8. Необходимо заполнить поле ’location’, чтобы количество выводимых парков
оказалось больше.
Как можно заметить по изображению (рис. 5), количество выведенных парков стало
больше, ввиду заполнения поля. А страной с наибольшим количеством национальных
парков (312) оказлась Австралия.
Figure 1: Гистограмма парков, упорядоченных по количеству за разные года и по странам мира
[1] National Park. Research in programming Wikidata [Programmirovaniye Vikidannykh] // Russian
Wikiversity, https://ru.wikiversity.org/wiki/%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%
D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%92%D0%B8%D0%BA%D0%B8%D0%B4%
D0%B0%D0%BD%D0%BD%D1%8B%D1%85/%D0%9D%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D1%8C%
D0%BD%D1%8B%D0%B9_%D0%BF%D0%B0%D1%80%D0%BA, accessed 23 Feb 2017 (2017).
5
Figure 2: Гистограмма парков, упорядоченных по годам (по всему миру)
Figure 3: Гистограмма парков, упорядоченных по годам и по странам мира
6
Figure 4: Карта национальных парков России
Figure 5: Карта всех национальных парков, построенная на основе свойства ‘географические координаты’ (англ. ‘location’)
7
Отзывы:
Авторизуйтесь, чтобы оставить отзыв