WD: Anime
Andrew Krizhanovskya , Daria Boollievab
a
Institute of Applied Mathematical Research of the Karelian Research Centre of the Russian Academy of
Sciences
b
Affiliation not available
Abstract
Аннотация
Статья посвящена исследованию объекта Викиданных "аниме". С помощью SPARQLзапросов, вычисляемых на объектах типа "аниме"в Викиданных, решены такие задачи:
выведен упорядоченный список сэйю по числу озвученных ими аниме, построена гистограмма по числу сэйю, озвучивших одно и более аниме, построен граф, связывающий
сэйю и озвученные ими аниме.
Примечание
Статья распространяется по лицензии Creative Commons Attribution-ShareAlike. Материалы этой статьи использованы в главе курса Викиверситета "Программирование
Викиданных"[? ]. Иллюстрации загружены на Викисклад. Над статьёй в 2017 году
работали Крижановский А. А., Буллиева Д. М.
Экземпляры объекта "Аниме"
Аниме - японская анимация. У каждого аниме есть актеры озвучивания. В дальнейшем мы будем употреблять слово "сэйю"(т.е. японские актеры озвучивания). Актеры
озвучивания и сэйю являются синонимами, когда речь заходит о Японии и японской
анимации. Слово "тайтл"(название) будет упоминаться при обращении к какому-то
аниме (или японской анимации в целом).
• Объект: аниме (Q1107),
Список всех аниме. См. листинг 1.
1
2
3
4
5
6
7
8
#added 2017−06
#L i s t o f ‘ i n s t a n c e s of ‘ " anime "
SELECT ? anime ? animeLabel
WHERE
{
? anime wdt : P31 wd : Q1107 .
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e " en " }
}
Листинг 1: Список аниме
Preprint submitted to Elsevier Journal
8 июня 2017 г.
SPARQL-запрос, 683 записи.
Наиболее полными и проработанными аниме на Викиданных являются: ГурренЛаганн, Space Battleship Yamato, Project A-ko.
Почти пустыми и малоинформативными аниме оказались: Charlotte, Dagashi Kashi,
KonoSuba.
Упорядоченный список сэйю по числу озвученных ими аниме
Практически в любом аниме присутствуют несколько актеров озвучивания (сэйю).
Большинство сэйю озвучили за свою карьеру несколько тайтлов, а многие даже несколько десятков тайтлов. Талантливых сэйю приглашают озвучивать сразу несколько персонажей в одном аниме.
Построим упорядоченный список сэйю по числу озвученных ими аниме. См. листинг 2.
1
2
3
4
5
6
7
8
9
10
11
#Ordered l i s t o f a c t o r s ( s e i y u ) a c c o r d i n g t o t h e q u a n t i t y o f t h e i r anime
SELECT ? s e i y u (SAMPLE( ? l a b e l ) AS ? s e i y u L a b e l ) (COUNT( ? anime ) AS ? count )
WHERE
{
? anime wdt : P31 wd : Q1107 ;
# I n s t a n c e o f anime
wdt : P725 ? s e i y u .
# Instance of seiyu ( voice actor )
? seiyu rdfs : label ? label . # Subclass of label
FILTER(LANG( ? l a b e l ) = " en " ) .
}
GROUP BY ? s e i y u
# Group by s e i y u
ORDER BY DESC( ? count ) # Order by count o f v o i c e d anime
Листинг 2: Упорядоченный список сэйю
SPARQL-запрос, 148 записей.
Мы видим список, состоящий из 148 сэйю. Список получится немногочисленным, но
и количество аниме на Викиданных было столь же немногочисленным - всего 683 тайтла (речь о полноте будет дальше). В данный список вошли сэйю, озвучившие несколько
аниме (например, Aki Toyosaki - 26 аниме).
Гистограмма по числу сэйю, озвучивших одно и более аниме
Было бы интересно построить гистограмму (линейную диаграмму) из сэйю, озвучивших аниме (чем больше аниме озвучил сэйю, тем дальше на диаграмме он будет
находиться, "правее"в данном случае). См. листинг 3.
1
2
3
4
5
6
7
8
9
10
#added 2017−06
#Histogram o f t h e number o f s e i y u who v o i c e d one o r more anime
#d e f a u l t V i e w : LineChart
# Do l i n e c h a r t a s r e s u l t r e p r e s e n t a t i o n
SELECT ? h a v e s e i y u (COUNT( ? h a v e s e i y u ) AS ? q u a n t i t y ) WHERE { # Count number o f
s e i y u having a v o i c e a c t i n g
{
SELECT (COUNT( ? s e i y u ) AS ? h a v e s e i y u ) WHERE {
# Count q u a n t i t y o f
voice acting
? anime wdt : P31 wd : Q1107 ;
wdt : P725 ? s e i y u .
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e " en " . }
}
2
11
12
13
14
15
16
GROUP BY ? anime
# Group l i s t by q u a n t i t y o f v o i c e d anime
ORDER BY DESC( ? h a v e s e i y u )
# Order by s e i y u q u a n t i t y ( d e s c e n d i n g )
}
}
GROUP BY ? h a v e s e i y u
# Group by s e i y u q u a n t i t y
ORDER BY DESC( ? h a v e s e i y u )
# Order by s e i y u qty ( d e s c e n d i n g )
Листинг 3: Гистограмма по числу сэйю
SPARQL-запрос, 13 записей.
Очевидно, что, чем большее количество аниме берётся в расчёт, тем меньшее количество сэйю участвует в озвучке (рис. 1). Это демонстрирует данная гистограмма.
Большинство сэйю, как показано на диаграмме, озвучили только 1 аниме. Это может
быть связано с неполнотой Викиданных.
Рис. 1: Гистограмма по числу сэйю, озвучивших одно и более аниме
Граф, связывающий сэйю и озвученные ими аниме
Как было сказано ранее, несколько сэйю могут озвучивать сразу несколько персонажей в одном аниме (встречается редко), а так же озвучивать несколько аниме. Построим граф, связывающий сэйю и озвученные ими аниме, чтобы наглядноее показать
это взаимосвязь. См. листинг 4.
1
2
3
4
5
6
7
8
#added 2017−06
#Graph c o n t a c t i n g s e i y u and anime
#d e f a u l t V i e w : Graph
SELECT ? anime ? animeLabel ? s e i y u ? s e i y u L a b e l
WHERE
{
? anime wdt : P31 wd : Q1107
; rdfs : label ? label .
9
10
11
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e " en " }
OPTIONAL { ? anime
3
wdt : P725 ? s e i y u . }
FILTER (LANG( ? l a b e l ) = " en " )
12
13
14
}
Листинг 4: Граф сэйю и аниме
SPARQL-запрос, 826 записей.
Данный граф (рис. 2) показывает все существующие аниме, а так же сэйю, которые
эти аниме озвучивали. Недостаток графа в том, что большое количество аниме остались
"без озвучки".
Рис. 2: Граф, связывающий сэйю и озвученные ими аниме
Полнота Викиданных
Список найденных аниме на сайте shikimori. В списке 559 по 20 аниме. Всего 11173
наименований. В то время как количество найденных объектов на Викиданных всего
683. К тому же, стоит учитывать, что скорость выхода новых аниме довольно велика. Даже зимой-летом 2017-го выходит более 600 аниме. После выполнения некоторых
запросов, упомянутых ранее, некоторые аниме не находились (Useless Animals, Ryuu
no Haisha, Frame Arms Girl). Из этого можно сделать вывод, что Викиданные крайне
неполно отражают данные.
Согласно приведённой статистике от того же сайта shikimori industry в разделе "Индустрия аниме"упоминается 16 разделов по японской анимации, в которые входят 10497
тайтлов. Возможно, приведённые ниже статьи и сайты не будут являться авторитетными источниками, но с помощью них можно привести информацию об имеющихся
аниме и сделать определённые выводы о неполноте.
На сайте anidub приведён список из 7811 аниме.
На сайте animespirit приведён список из 4905 аниме.
На сайте animelend приведён список из 4751 аниме.
На сайте anistar приведён список из 2971 аниме.
На сайте animevost приведён список из 1881 аниме.
На сайте anidesu приведён список из 763 аниме.
Можно сделать вывод, что различные сайты имеют разную информацию об имеющихся аниме. Какие-то сайты появились позже, какие-то раньше, поэтому количество
4
аниме может разниться, причём довольно серьёзно. Так же, количество посетителей
влияет на появление каких-то аниме на сайте. Если упорядочить все приведённые сайты, данные Русской Википедии, Английской Википедии по количеству аниме, то на
последнем месте окажутся Викиданные. На Викиданных нельзя найти все популярные
и известные японские анимации мира, что ещё раз говорит о неполноте.
Вспомним ранее упомянутый запрос, в котором говорилось о 148 сэйю на Викиданных. Дело в том, что они искались в подразделе аниме, поэтому результат оказался
таким немногочисленным. Если поправить скрипт и попытаться вывести всех актёров
озвучивания (то есть, убрать категорию аниме), то результат может измениться. См.
листинг 5.
1
2
3
4
5
6
7
8
9
10
11
#added 2017−06
#Ordered l i s t o f a c t o r s a c c o r d i n g t o t h e q u a n t i t y o f t h e i r v o i c e d p r o j e c t s
SELECT ? a c t o r (SAMPLE( ? l a b e l ) AS ? a c t o r L a b e l ) (COUNT( ? anime ) AS ? count )
WHERE
{
? anime wdt : P725 ? a c t o r .
# Instance of voice actor
? actor rdfs : label ? label . # Subclass of label
FILTER(LANG( ? l a b e l ) = " en " ) .
}
GROUP BY ? a c t o r
# Group by a c t o r
ORDER BY DESC( ? count ) # Order by count o f v o i c e d anime
Листинг 5: Список актёров озвучивания
SPARQL-запрос, 3965 записей.
Нашлось 3965 актёров озвучивания. Сравним результат по сэйю. Прошлый скрипт
вывел у сэйю Aki Toyosaki 26 аниме. Данный скрипт дал результат в 62 аниме. Это
говорит о том, что данные заполнялись не совсем корректным образом и о том, что
нужно было упоминать категорию аниме.
Заполнение 100 объектов
Любитель японской анимации желает знать в каком году вышло его любимое аниме.
Викиданные располагают этой информацией не в полной мере. Напишем скрипт, который бы показывал количество аниме с незаполненным полем "publication date"(дата
публикации). См. листинг 6.
1
2
3
4
5
6
7
8
9
#added 2017−06
#L i s t o f anime with u n f i l l e d p u b l i c a t i o n d a t e
SELECT ? anime ? animeLabel
WHERE
{
? anime wdt : P31 wd : Q1107 .
FILTER NOT EXISTS { ? anime wdt : P577 [ ] } #i f p r o p e r t y p u b l i c a t i o n d a t e i s
unfilled
SERVICE w i k i b a s e : l a b e l { bd : s e r v i c e P a r a m w i k i b a s e : l a n g u a g e " en " }
}
Листинг 6: Аниме с незаполненной датой публикации
SPARQL-запрос, 237 записей.
5
Видим результат в 237 записи. Это говорит о том, что примерно у трети аниме нет
даты публикации.
После заполнения данных и повторного выполнения скрипта выдаётся результат в
134 записи.
[WDAnime] Anime. Research in programming Wikidata [Programmirovaniye Vikidannykh] // Russian
Wikiversity.
https://ru.wikiversity.org/w/index.php?title=%D0%9F%D1%80%D0%BE%D0%
B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%
92%D0%B8%D0%BA%D0%B8%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85/%D0%90%D0%BD%D0%B8%D0%
BC%D0%B5, 2017. Accessed 14 Mar 2017.
6
Отзывы:
Авторизуйтесь, чтобы оставить отзыв