Разработана система искусственного интеллекта, обученная находить справедливую политику распределения государственных средств в онлайн-игре.

Группа исследователей из DeepMind в Лондоне, работая с коллегами из Эксетерского университета, Университетского колледжа Лондона и Оксфордского университета, обучила систему искусственного интеллекта находить политику справедливого распределения государственных средств в онлайн-игре. В своей статье, опубликованной в журнале Nature Human Behavior, группа описывает подход, который они использовали для обучения своей системы, и обсуждают проблемы, возникшие в ходе их усилий.

То, как общество распределяет богатство, — это проблема, с которой люди сталкивались на протяжении тысячелетий. Тем не менее большинство экономистов согласились бы с тем, что еще не создана система, в которой все ее члены были бы довольны существующим положением вещей. Всегда существовало неравенство в уровне доходов: те, кто был наверху, были наиболее удовлетворены, а те, кто находился внизу, — наименее удовлетворены. В этой последней попытке исследователи из Англии применили новый подход к решению проблемы, попросив компьютер использовать более логичный подход.

Исследователи исходили из предположения, что демократические общества , несмотря на их недостатки, до сих пор являются наиболее приемлемыми из испытанных. Затем они заручились поддержкой добровольцев, чтобы сыграть в простую игру с распределением ресурсов.— участники игры вместе решили, как лучше всего разделить свои взаимные ресурсы. Чтобы сделать это более реалистичным, игроки изначально получали разное количество ресурсов, и на выбор были разные схемы распределения. Исследователи запускали игру несколько раз с разными группами добровольцев. Затем они использовали данные всех сыгранных игр, чтобы обучить несколько систем ИИ тому, как люди работают вместе, чтобы найти решение такой проблемы. Затем они заставили системы ИИ играть в аналогичную игру друг против друга, что позволяло настраивать и обучаться в течение нескольких итераций.

Исследователи обнаружили, что системы ИИ остановились на форме либерального эгалитаризма, при которой игроки получали мало ресурсов, если только они не вносили пропорциональный значительный вклад в общий пул. Затем исследователи завершили свое исследование, попросив группу людей-добровольцев сыграть в ту же игру, что и раньше, только на этот раз им был предоставлен выбор между использованием одного из нескольких традиционных подходов к совместному использованию или того, который был разработан системой ИИ. системой ИИ был последовательным выбором среди игроков-людей.