Нейронные сети, созданные на основе работы мозга, раскрывают биологические основы реляционного обучения
Люди и некоторые животные, по-видимому, обладают врожденной способностью изучать отношения между различными объектами или событиями в мире. Эта способность, известная как «реляционное обучение», широко рассматривается как критически важная для познания и интеллекта, поскольку считается, что изученные отношения позволяют людям и животным ориентироваться в новых ситуациях.
Исследователи из ML Collective в Сан-Франциско и Колумбийского университета провели исследование, направленное на понимание биологической основы реляционного обучения с использованием определенного типа искусственной нейронной сети, вдохновленной мозгом. Их работа, опубликованная в Nature Neuroscience , проливает новый свет на процессы в мозге, которые могут лежать в основе реляционного обучения у людей и других организмов.
«Во время посещения Колумбийского университета я встретился со своим соавтором Кеннетом Кеем, и мы обсудили его исследование», — рассказал изданию Medical Xpress соавтор статьи Томас Микони.
«Он обучал нейронные сети делать то, что называется «транзитивным выводом», а я тогда не знал, что это такое. Основная идея транзитивного вывода проста: «если A > B и B > C, то A > C». Это концепция, с которой мы все знакомы, и она на самом деле необходима для понимания мира».
Прошлые работы показывают, что когда люди и некоторые животные выполняют определенные психологические задачи, они, по-видимому, улавливают связи между объектами, даже если эти связи явно не указаны. В задачах, известных как задачи транзитивного вывода, они могут самостоятельно выяснить упорядочивающие связи (например, A является ">" или "<", чем B и т. д.) после того, как им предъявляют пары стимулов и видят результаты различных сравнений (например, "A против B", "B против A", "B против C" и т. д.).
«В соответствии с этим, «A», «B», «C» являются совершенно произвольными стимулами, такими как запахи или изображения, которые не «выдают» связь », — объяснил Микони. «Если упорядочивающая связь успешно изучена, то субъекты могут ответить правильно, когда они видят «A против C» — это транзитивный вывод. Давно известно, что люди и многие виды животных (такие как крысы, голуби и обезьяны) получают правильный ответ на «A против C» и другие подобные комбинации стимулов, которые никогда напрямую не встречались ранее (например, «B против F»)».
Прошлые исследования показали, что при обучении на «смежных» парах стимулов (например, AB, CD и т. д.) люди, крысы, голуби и обезьяны могут научиться правильно угадывать упорядоченные отношения для пар, которые им ранее не предъявлялись (например, AE, CF и т. д.). Однако процессы в мозге, лежащие в основе этой хорошо известной способности, остаются плохо изученными.
«Было интересно услышать об этой способности и этих открытиях не только из-за интуитивной, реляционной и комбинаторной природы задачи ( что необычно для популярных в настоящее время задач в нейронауке), но и потому, что, несмотря на значительные исследования, мы до сих пор не знаем, как мозг усваивает порядки таким образом, чтобы автоматически производить транзитивные выводы», — сказал Микони.
«В ходе нашей дискуссии еще более интересным стало одно дополнительное открытие из прошлых работ: а именно, было обнаружено, что люди и обезьяны (но не голуби или грызуны) способны быстро «перестраивать» свои существующие знания о порядках после того, как столкнулись с небольшим количеством новой информации».
Интересно, что дополнительные прошлые исследования показали, что если люди и обезьяны успешно усвоили упорядоченные отношения между различными наборами стимулов, например, «A > B > C» и «D > E > F», то как только они узнают, что «C > D», они сразу же поймут, что «B > E». Это показывает, что их мозг может реорганизовать предыдущие знания на основе новой информации; этот процесс был назван «повторной сборкой знаний».
«Это показалось нам дополнительной способностью, заслуживающей изучения, поскольку это простой, но яркий пример обучения или приобретения знаний», — сказал Микони.
«В какой-то момент мы поняли, что можно получить представление о том, как мозг реализует любую из этих способностей, используя подход из области машинного интеллекта, называемой «метаобучение», которая использует базовую идею «обучения обучению».
«Для искусственной системы идея заключается в том, что вместо того, чтобы обучать систему (например, нейронную сеть) давать правильный ответ на определенный набор стимулов (например, стимулы «A», «B», «C»), мы могли бы вместо этого обучить систему самостоятельно выдавать правильный ответ на любой новый набор стимулов (например, стимулы «P», «Q», «R» и т. д.), подобно тому, как это делают животные в экспериментах».
Чтобы исследовать основы этих различных аспектов реляционного обучения, Микони и Кей попытались сымитировать реляционное обучение, используя недавно разработанный тип искусственной нейронной сети, вдохновленный мозговыми цепями. Микони и Кей оценили, способен ли этот тип сети самостоятельно изучать отношения, потенциально имитируя реляционное обучение и повторную сборку знаний, наблюдаемые у людей и приматов.
«Возможно, самая захватывающая часть этого подхода — и то, что мы действительно ищем как ученые — будет заключаться в том, чтобы проанализировать эту систему и понять, как она работает — делая это, можно фактически обнаружить биологически правдоподобные механизмы», — сказал Микони. «Мы подумали, что было бы довольно удобно, если бы машины могли стать частью процесса, чтобы помочь нам сделать это!»
Искусственные нейронные сети, используемые исследователями, имеют обычную архитектуру, но с ключевой уникальной особенностью. В частности, сети были дополнены искусственной версией «синаптической пластичности», что означает, что они могли изменять свои собственные синаптические веса после завершения своего начального обучения.
«Эти сети могут обучаться автономно, поскольку их связи изменяются в результате постоянной нейронной активности, а эта постоянная нейронная активность включает в себя самогенерируемую активность», — пояснил Микони.
«Целью изучения этих сетей является то, что их базовая архитектура и процессы обучения имитируют таковые в реальном мозге. У меня был некоторый существующий код из предыдущей работы , который, как я думал, можно было бы быстро перепрофилировать для этой проблемы. Каким-то чудом он заработал с первого раза, что никогда не случается».
Используя код, разработанный Микони в рамках его предыдущего исследования, исследователи применили искусственные нейронные сети с расширенной синаптической пластичностью к задачам, используемым для проверки способностей к реляционному обучению у людей и животных.
Они обнаружили, что их нейронные сети способны решать эти задачи, а также последовательно достигать поведения, аналогичного поведению людей и некоторых животных, как было зафиксировано в предыдущих исследованиях.
«Например, одна из поведенческих моделей заключается в том, что производительность лучше для пар стимулов, расположенных дальше друг от друга в порядке (например, B против F имеет более высокую производительность по сравнению с B против C)», — пояснил Микони. «Также было действительно интересно то, что некоторые из этих экспериментально наблюдаемых поведенческих моделей никогда не были объяснены в модели».
В целом, недавняя статья Микони и Кея указывает на несколько механизмов, которые могли бы лежать в основе реляционного обучения и способностей к сбору знаний биологических организмов. В будущем механизмы, которые они определили, могут быть исследованы более подробно, путем дальнейшего изучения либо искусственных нейронных сетей, либо людей и животных.
«Более конкретный вклад нашей работы — это выяснение механизмов обучения для транзитивного вывода: в частности, механизмов обучения, которые могут объяснить набор поведенческих моделей, наблюдаемых на протяжении десятилетий работы над транзитивным выводом», — сказал Микони. «Один поразительный результат заключается в том, что подход метаобучения фактически обнаружил два различных механизма обучения».
Два механизма обучения, раскрытые Микони и Кей, различаются по сложности. Первый более прост и позволяет их нейронным сетям изучать только общие отношения, без повторной сборки знаний. Второй более сложен, позволяя нейронным сетям обновлять информацию о новой паре стимулов, с которой они сталкиваются, а также «вспоминать» стимулы, которые они ранее «видели» вместе со стимулами в этой новой паре.
«Это преднамеренное, целенаправленное «вспоминание» позволяет сети выполнять повторную сборку знаний, в отличие от предыдущего, более простого способа», — сказал Микони.
«Это интригующая параллель с явно различными способностями к обучению у разных видов животных, задокументированными для транзитивного вывода. Опять же, многие животные (грызуны, голуби и т. д.) могут делать простые транзитивные выводы, но только приматы, похоже, способны выполнять эту быструю «сборку» существующих знаний в ответ на ограниченную новую информацию. Это также проясняет, какие обучающие системы должны выполнять сборку знаний».
Это недавнее исследование также подчеркивает потенциал нейронных сетей, дополненных самонаправляемой синаптической пластичностью, для изучения процессов, лежащих в основе обучения у людей и животных. Методы команды могут послужить вдохновением для будущих работ, направленных на изучение биологических механизмов с использованием искусственных нейронных сетей, вдохновленных мозгом.
«В настоящее время довольно распространено обучение и анализ искусственных нейронных сетей на отдельных примерах выполнения задачи, и было показано, что это успешно позволяет обнаружить биологические механизмы для таких способностей, как восприятие и принятие решений», — сказал Микони.
«Благодаря пластичным нейронным сетям этот подход распространяется на обнаружение биологических механизмов когнитивного обучения — более конкретно, для изучения многих возможных примеров данной задачи, а также потенциально нескольких задач».
Первоначальные результаты, собранные Микони и Кей, могут послужить основой для будущих усилий, направленных на то, чтобы пролить свет на тонкости реляционного обучения. В будущей работе исследователи планируют протестировать свои «пластичные» нейронные сети на более широком спектре задач, которые больше соответствуют ситуациям, с которыми люди и животные сталкиваются в своей повседневной жизни.
«В ходе исследования система выполняет только одну задачу — изучает упорядоченные отношения («A > B > C»)», — добавил Микони.
«Это было бы похоже на животное, которое всю свою жизнь только и делало, что обучалось порядку, прежде чем попасть в лабораторию, что явно нереально. Было бы интересно посмотреть, какие способности появятся, если мы обучим пластичную сеть широкому спектру учебных задач.
«Сможет ли такой агент немедленно обобщить новую учебную задачу, с которой он раньше не сталкивался, и что потребуется для появления такой способности?»