Игры, в которые играли люди

0   8   0

Информатика
21 марта 10:52


56efa83f5f1be751bc00079f

Во вторник, 15 марта, в Сеуле прошла последняя встреча между компьютерной программой AlphaGo и южнокорейскими профессионалом го Ли Седолем. По итогам пяти матчей машина, работающая на технологии нейронных сетей, выиграла со счетом 4-1. Как это было и означает ли это, что искусственный разум окончательно превзошел человеческий?

Представьте: 6 августа 1945 года, последние дни второй мировой войны. Ивамото Каору и Хасимото Утаро, два японских мастера го, играют важную партию в местечке Ицукаити, одном из пригородов Хиросимы. Вдруг — ослепительная вспышка, над городом вырастает зловещий гриб. Разрушительная ударная волна выбивает все стекла в доме и раскидывает камни по игровой доске. Невозмутимые Ивамото и Хасимото по памяти восстанавливают свои позиции и доигрывают партию. Об атомной бомбе они узнали только вечером — игра в го не терпит суеты и не позволяет отвлекаться.

Го возникла в Древнем Китае примерно за тысячу лет до нашей эры и быстро стала популярной в странах нынешней Юго-Восточной Азии. Правила этой стратегической игры просты: игроки по очереди ставят на игровое поле черные и белые камни, стараясь отгородить ими как можно большую территорию. При этом тактика го столь многообразна и сложна, что даже начинающие уже не могут внятно объяснить непосвященному человеку причины своих ходов.

В разное время отношение к го было разным. Одни считали ее пустой тратой времени, другие — элитарным занятием, а третьи — необходимой частью обучения будущих полководцев. Сейчас го вместе с «китайскими шахматами» сянци, шашками, бриджем и шахматами обычными входит в пятерку дисциплин Всемирных интеллектуальных игр. Число возможных партий в игре превосходит количество атомов во Вселенной, и поэтому до недавнего времени мало кто верил, что компьютер когда-нибудь сможет обыграть мастера го. Ведь для этого машине пришлось бы не просто перебирать все возможные варианты и на несколько ходов вперед оценивать их перспективы, как делал Deep Blue в знаменитой шахматной серии против Гарри Каспарова 1997 года, а уже по-настоящему думать. Неуловимо, туманно, подчас иррационально — как игрок в го. Как любой человек.

Мозг из машины

Работа AlphaGo основана на концепции нейронных сетей, предложенной еще в середине XX века. Тогда информатики сообразили, что компьютерные алгоритмы можно не просто навсегда фиксировать в железе, а наоборот, научить их перестраиваться в процессе обработки информации. Похожим образом работают нервные системы живых организмов, в которых при обучении связи между нейронами постоянно образуются, разрушаются или изменяют свою силу.

В XX веке техника еще не была готова к нейронным сетям, и постепенно о них стали забывать, пока в 2012 году не случилась настоящая революция. Алгоритм машинного обучения на нейронных сетях с огромной форой выиграл престижное соревнование в области компьютерного зрения ImageNet.


Суть этого конкурса в следующем: на первом этапе участники обучают свои компьютерные программы, используя огромную базу картинок с привязанными к ним текстовыми описаниями. Затем соревнующиеся получают задания распознать те или иные образы на еще незнакомых их алгоритмам изображениях: например, на одних картинках нужно найти все машины, а на других — отличить друг от друга разные породы котов. После первой победы в 2012 году нейронные сети с большим отрывом от остальных продолжают выигрывать во всех подобных соревнованиях.

И именно на задачах компьютерного зрения проще всего объяснить работу нейронных сетей. Представим, что нам нужно написать программу для распознавания флагов на фотографиях. Как это сделать? Нейронная сеть, выполняющая такую задачу, будет состоять из нескольких слоев — подпрограмм, последовательно обрабатывающих входное изображение и передающих результат своего анализа на следующий слой. Он же, в свою очередь, может состоять из десятков, сотен и тысяч «электронных» нейронов — фрагментов кода, выполняющих свои маленькие задачи.

При этом каждый нейрон тесно связан с другими нейронами. У одних он берет входную информацию для обработки, другим передает информацию, а сами его действия могут меняться под действием этой информации. Например, электронный нейрон может тем больше усиливать проходящий через него сигнал, чем чаще он приходит к нему на вход и, наоборот, «отмирать», если в течение долгого времени работы программы большой сигнал к нему поступает очень редко.

Похожие процессы происходят в нашей голове и потому маленькие фрагменты программ нейронных сетей и называются нейронами.


Так, когда мы разучиваем мелодию на фортепиано, то сигналы проходят примерно по одним и тем же нейронным путям. Постепенно связи между ними усиливаются — мы подсознательно запоминаем последовательность действий и звуков и даже можем дать небольшой концерт. Но заканчивается музыкальная школа, времени на фортепьяно не хватает, и связи постепенно распадаются за ненужностью, а мелодия забывается. Теперь восстановить ее мы можем только усилием сознания — по нотам.

Теперь вернемся к флагам и попробуем представить нейронную сеть для их распознавания. В ее первом слое будут нейроны, отвечающие за все возможные цвета: один из них будет искать на изображении синий, другой — красный, третий — зеленый и так далее. Дальше сигналы с первого слоя будут передаваться на второй, где нейроны уже будет «собирать» комбинации цветов: например, одновременное срабатывание красного и синего нейронов первого слоя возбудит во втором слое «красно-синий» нейрон. Дальше каждый последующий слой будет решать все более сложные задачи вроде поисков полумесяца и звезд или ориентации полосок, пока мы не доберемся до последнего слоя, в котором всего один нейрон собирает все сигналы и дает финальный ответ.

Полный текст на Чердаке.


Автор: Михаил Петров

Источник: Чердак


0



Для лиц старше 18 лет