Анализ трёх аспектов современных стран по Викиданным:
возраст стран, популярные формы правления и этнохоронимы
Andrew Krizhanovskya , Elizaveta Smykovab
a
Institute of Applied Mathematical Research of the Karelian Research Centre of the Russian Academy of
Sciences
b
Petrozavodsk State University
Abstract
Эта глава посвящена исследованию стран на основе базы знаний международного проекта
Викиданные. С помощью SPARQL-запросов, вычисляемых на объектах типа "страна"
в Викиданных, получены: выведен список всех ныне существующих стран, перечень
стран, упорядоченных по дате создания, список этнохоронимов стран, пузырьковая
диаграмма с формами правления стран и граф соседних стран. Кроме того, сделаны
отностительно полноты Викиданных по данной теме.
Примечание
Статья распространяется по лицензии Creative Commons Attribution-ShareAlike. Материалы этой статьи использованы в главе курса Викиверситета ”Программирование
Викиданных”[1]. Иллюстрации загружены на Викисклад. Над статьёй в 2017 году работали Крижановский А. А., Смыкова Е. М.
1. Экземпляры объекта Страна
Построим список всех стран.
• Объект: страна (Q6256),
• Свойство: экземпляр (P31).
1
2
3
4
5
6
7
#L i s t o f ‘ i n s t a n c e s of ‘ ” c o u n t r y ”
SELECT ? l a n g ? l a n g L a b e l
WHERE
{
? l a n g wdt : P31 wd : Q6256 .
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ” }
}
1: Список стран
Preprint submitted to Elsevier Journal
15 мая 2017 г.
SPARQL-запрос, 198 записей
”+”: Примерами наиболее полных и проработанных стран на Викиданных являются: Соединённые Штаты Америки, Канада, Испания.
”-”: Почти пустыми и малоинформативными странами оказались: Сахарская Арабская Демократическая Республика, Приднестровская Молдавская Республика, Косово.
2. Возраст стран
Построим список стран, отсортированных по дате основания страны (первом упоминании о стране).
• Объект: страна (Q6256),
• Свойство: дата основания (P571).
1
2
3
4
5
6
#L i s t o f ‘ i n s t a n c e s of ‘ ” c o u n t r i e s s o r t e d by i n c e p t i o n ”
SELECT ? c o u n t r y ? c o u n t r y L a b e l ? i n c e p t i o n
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 .
#c o u n t r y
? c o u n t r y wdt : P571 ? i n c e p t i o n .
#i n c e p t i o n o f c o u n t r y
7
8
9
10
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ” }
}
ORDER BY ( ? i n c e p t i o n )
2: Список стран упорядоченных по дате создания
SPARQL-запрос, 112 записей.
В результате выполнения запроса получен список стран с датами их создания. Например, Абхазия – 1 января 0786, Россия – 1 января 0862, Косово – 17 февряля 2008,
Южный Судан – 9 июля 2011.
Годы, в которые было создано наибольшее количество стран – 1991 (17 стран), 1812
(6 стран) и 1918 (5 стран).
2.1. Полнота Викиданных
Проанализируем полноту Викиданных.
• По данным ”Общероссийского классификатора стран мира” [2] за 2016 год на
земле существует 251 страна.
• В этой задаче не учитываются древние, уже не существующие государства (например: Ассирия (Q41137)), поскольку они являются экземпляром не объекта
”country”, а объекта ”former country” (бывшие страны). Отметим, что количество бывших стран на порядок больше существующих ныне стран (см. SPARQLзапрос, возвращающий более двух тысяч таких стран).
2
• По данным категории "Алфавитный список стран и территорий" Русской Википедии существует 252 страны. (В ”Общероссийском классификаторе стран мира”
недостает Косово)
• По данным категории ”List of sovereign states” Английской Википедии существует
206 стран.
Не всегда можно точно указать дату основания страны по разным причинам: отсутствие, недостаток или противоречие письменных источников. Например, основание
Древнерусского государства связывают с призванием варяжского князя Рюрика в 862
году, но точной даты нет (объект Russia (Q159)). Так же некоторым современным
странам предшествовал ряд других и дату образования какого из них считать за дату
создания современной страны – это вопрос открытый (например, Монголия (Q711)).
2.2. Страны с незаполненной датой основания
Выведем списк стран с пустым свойством ”дата основания”:
• Объект: страна (Q6256),
• Свойство: дата основания (P571).
1
2
3
4
5
#L i s t o f ‘ i n s t a n c e s of ‘ ” c o u n t r i e s w i t h o u t an i n c e p t i o n ”
SELECT ? c o u n t r y ? c o u n t r y L a b e l
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 .
#c o u n t r y
6
MINUS { ? c o u n t r y wdt : P571 [ ] } . #i n c e p t i o n o f c o u n t r y i s empty
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” en ” }
7
8
9
}
3: Список стран с пустым свойством ”дата создания”
SPARQL-запрос, 100 записей.
Итак, на 6 марта 2017 года Викиданные содержат 100 из 198 записей о ныне существующих странах с неизвестным годом основания страны.
3. Этнохоронимы на русском языке
Этнохороним – название жителей определённой местности соотнесённое с топонимом. Например, Россия – россияне, россиянин, россиянка, Чехия – чехи, чех, чешка.
Построим список стран у которых есть этнохоронимы на русском языке.
• Объект: страна (Q6256),
• Свойство: этнохороним (P1549).
3
1
2
3
4
5
6
#L i s t o f c o u n t r i e s with demonyms i n Russian
SELECT ? c o u n t r y ? c o u n t r y L a b e l
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 . #c o u n t r y
? c o u n t r y wdt : P1549 ?demonym . #demonym
7
FILTER ( (LANG( ? demonym ) ) = ” ru ” )
8
9
10
11
12
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” ru ” }
}
GROUP BY ? c o u n t r y ? c o u n t r y L a b e l
4: Список стран с этнохоронимами на русском языке
SPARQL-запрос, 28 записей.
На 19 марта 2017 года Викиданные содежали 28 из 198 стран с заполненными этнохоронимами на русском языке.
3.1. Список этнохоронимов
Выведем список всех этнохоронимом на русском языке.
1
2
3
4
5
6
#L i s t o f demonyms i n Russian
SELECT ? c o u n t r y ? c o u n t r y L a b e l ?demonym
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 . #c o u n t r y
? c o u n t r y wdt : P1549 ?demonym . #demonym
7
FILTER ( (LANG( ? demonym ) ) = ” ru ” )
8
9
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” ru ” }
10
11
}
5: Список этнохоронимов на русском языке
SPARQL-запрос, 83 записей.
На 19 марта 2017 года Викиданные содежат 83 заполненных этнохоронима.
3.2. Страны с незаполненными этнохоронимами
Построим список стран, у которых нет этнохоронимов на русском языке.
1
2
3
4
5
#L i s t o f c o u n t r i e s w i t h o u t demonyms i n Russian
SELECT ? c o u n t r y ? c o u n t r y L a b e l
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 . # c o u n t r y
6
7
8
9
10
MINUS {
? c o u n t r y wdt : P1549 ?demonym . # e x c e p t with demonyms
FILTER ( (LANG( ? demonym ) ) = ” ru ” ) # i n Russian
}
4
11
12
13
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” ru ” }
}
GROUP BY ? c o u n t r y ? c o u n t r y L a b e l
6: Список стран у которых нет этнохоронимов на русском языке
SPARQL-запрос, 170 записей.
На 19 марта 2017 года Викиданные содержат 170 из 198 стран с незаполненными
этнохоронимами.
После заполнения авторами статьи этнохоронимов, число стран, у которых их нет
на русском языке стало 69, а самих этнохоронимов на русском языке теперь 276 (на 20
марта 2017 года).
3.3. Количество заполненных этнохоронимов у стран
Выведем список стран, упорядоченный по количеству заполненных в Викиданных
этнохоронимов.
1
2
3
4
5
6
7
8
9
10
#\ s e l e c t l a n g u a g e { r u s s i a n } \ s e l e c t l a n g u a g e { e n g l i s h } ount o f demonyms i n
countries
SELECT ? c o u n t r y ? c o u n t r y L a b e l ( count ( ∗ ) a s ? count )
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 . # c o u n t r y
? c o u n t r y wdt : P1549 ?demonym . # demonyms
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” ru ” }
}
GROUP BY ? c o u n t r y ? c o u n t r y L a b e l
ORDER BY DESC( ? count )
7: Cтраны упорядоченные по количеству заполненных этнохоронимов
SPARQL-запрос, 199 записей.
Наибольшее число этнохоронимов у Соединённых Штатов Америки (41 этнохороним), затем идут Великобритания (40), Германия (40), Канада (36) и Россия (34).
4. Формы правления стран
Построим пузырьковую диаграмму форм правления стран.
• Объект: страна (Q6256),
• Свойство: форма правления (P122).
1
2
3
4
5
6
7
#b a s i c form o f government r a n k i n g
#d e f a u l t V i e w : BubbleChart
SELECT ? b f o g ? form ( count ( ∗ ) a s ? count )
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 . #c o u n t r y
? c o u n t r y wdt : P122 ? b f o g .
#b a s i c form o f government
5
8
9
10
11
12
13
14
OPTIONAL {
? b f o g r d f s : l a b e l ? form
f i l t e r ( l a n g ( ? form ) = ” ru ” )
}
}
GROUP BY ? b f o g ? form
ORDER BY DESC( ? count ) ASC( ? form )
8: Пузырьковая диаграмма форм правления стран
SPARQL-запрос, 30 записей.
В результате выполнения запроса 8 мы получаем пузырьковую диаграмму с наиболее распространенными формами правления в странах. Основные формы правления
стран: республика (в 20 странах), конституционная монархия (в 18 странах), федеративная республика (в 18 странах), парламентская республика (в 17 странах) и президентская республика (в 12 странах). 1
5. Соседние страны
Построим граф соседних стран.
• Объект: страна (Q6256),
• Свойство: имеет границы с (P47).
1
2
3
4
5
6
#n e i g h b o r i n g c o u n t r i e s graph
#d e f a u l t V i e w : Graph
SELECT ? c o u n t r y ? c o u n t r y L a b e l ? sharesBorderWith ? s h a r e s B o r d e r W i t h L a b e l
WHERE
{
? c o u n t r y wdt : P31 wd : Q6256 .
#c o u n t r i e s
7
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e ” ru ” }
OPTIONAL { ? c o u n t r y wdt : P47 ? sharesBorderWith . } #s h a r e s b o r d e r with
8
9
10
}
SPARQL-запрос, 787 записей.
В результате выполнения запроса мы получаем граф 2 с 787 ребрами, где ребро – это
соседство между двумя странами. Граф представляет из себя несколько связных компонент, так как есть островные страны, у которых нет соседей (например, Маврикий,
Мальдивы, Мадагаскар).
[1] Country. Research in programming Wikidata [Programmirovaniye Vikidannykh] // Russian Wikiversity,
https://ru.wikiversity.org/wiki/%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%
B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%92%D0%B8%D0%BA%D0%B8%D0%B4%D0%B0%D0%
BD%D0%BD%D1%8B%D1%85/%D0%A1%D1%82%D1%80%D0%B0%D0%BD%D1%8B, accessed 23 Feb 2017 (2017).
[2] Russian classification of countries of the world], http://classifikators.ru/oksm, accessed 14 May
2017 (2016).
6
Figure 1: Пузырьковая диаграмма форм правления стран
Figure 2: Граф соседних стран, в центре Россия
7
Отзывы:
Авторизуйтесь, чтобы оставить отзыв