ТАСС, 28 ноября. Математики разработали систему искусственного интеллекта, которая способна учиться и осваивать новые навыки, наблюдая за действиями других нейросетей или человека в незнакомой ей обстановке, а также передавать полученные знания дальше. Это позволяет использовать концепцию культурно-технологической эволюции для дальнейшего развития ИИ, пишут ученые в статье в журнале Nature Communications.
"Проведенные нами опыты показывают, что для передачи знаний и появления технологической культуры необходим удивительно простой и небольшой набор ингредиентов. Данное открытие открывает дорогу для использования культурно-технологической эволюции в качестве инструмента для развития систем ИИ общего назначения", - пишут исследователи.
"Эволюционирующая" нейросеть и связанная с ней система обучения, получившая название GoalCycle3D, была разработана группой британских математиков под руководством старшего научного сотрудника компании Deepmind (Лондон) Чжана Лея. Deepmind уже много лет лидирует в разработке продвинутых систем ИИ, способных с нуля учиться играть в компьютерные и настольные игры, доказывать теоремы и решать другие сложные задачи, которые раньше считались доступными только для человека.
Недавно Чжан Лей и его коллеги смогли создать систему ИИ, которая освоила еще одну характерную способность человека и некоторых высших приматов и птиц - умение учиться на чужом примере и передавать освоенные навыки другим индивидам. Это умение давно считается основой культурно-технологической эволюции человечества, которая позволила нашим предкам научиться создавать все более сложные орудия труда и создать основы цивилизации.
Технологически эволюционирующая нейросеть
Британским исследователям удалось воспроизвести этот процесс при помощи специально созданной трехмерной компьютерной игры, в которую совместно играли человек-"эксперт" и нейросеть. Игра представляет собой трехмерный мир со сложно устроенным ландшафтом, который случайным образом генерируется при каждом раунде игры. Участники игры должны посетить определенные точки в этом мире в конкретном, но не известном заранее порядке, чтобы получить награду.
Во время игры оба ее участника могли наблюдать за действиями партнера со стороны и пользоваться "подсмотренными" знаниями для поиска правильной стратегии действий. Чжан Лей и его коллеги обнаружили, что подобная обстановка толкает нейросеть к обретению способности учиться на чужих примерах, если она обладает краткосрочной и долгосрочной памятью, а также в нее встроены аналоги человеческого внимания и способности отслеживать и связывать друг с другом действия других игроков.
Первые наблюдения за работой этой нейросети показали, что она осваивает подобную форму обучения и начинает использовать чужой опыт для создания своих подходов для решения ранее неизвестных и более сложно устроенных задач за достаточно короткое время, порядка 20-30 часов. При этом ученые обнаружили, что удаление хотя бы одного из компонентов системы, в том числе памяти, внимания или умения следить за чужими действиями, приводило к полной остановке передачи знаний.
Подобные системы обучения, как считают Чжан Лей и его коллеги, можно использовать не только для создания эволюционирующих систем ИИ, но и для изучения того, как дети приобретают способность учиться по мере их взросления. В дополнение к этому, наблюдения за работой и развитием подобных систем ИИ в перспективе помогут антропологам понять, как предки человека приобрели способность к культурно-технологическому развитию и передаче знаний, подытожили ученые.