Многие пионеры разработки нейронных сетей не имели исчерпывающего представления о том, как они работают, но и в наши дни мы по-прежнему его лишены.
В 1956 году молодой математик и биолог-теоретик Джек Д. Коуэн посетил в Лондоне Уилфреда Тейлора, создателя странной «обучающейся машины». Коуэна поразил представший его взору «огромный набор аппаратуры». Он наблюдал, как машина работает, выполняя «схему ассоциативной памяти» — похоже, она была способна учиться находить связи и извлекать данные.
Аппарат выглядел как неуклюжие блоки схем, спаянных вручную в массу проводов и коробок, но то, что увидел Коуэн, было ранней аналоговой формой нейронной сети – предшественником самого совершенного искусственного интеллекта современности, включая широко обсуждаемый ChatGPT с его способностью генерировать письменный контент в ответ практически на любой запрос. Базовой технологией ChatGPT является нейронная сеть.
Наблюдая за работой машины, Коуэн и Тейлор понятия не имели, как именно она справляется с задачей. Ответ на загадку «мозга» машины Тейлора можно найти в ее «аналоговых нейронах» – ассоциациях, создаваемых ее памятью. Этой модели потребовались десятилетия, чтобы найти свое предназначение и раскрыть свой потенциал.
Нейронные сети включают в себя широкий спектр систем. Согласно определению IBM, эти «нейронные сети, также известные как искусственные нейронные сети или моделируемые нейронные сети, представляют собой подмножество машинного обучения и лежат в основе алгоритмов глубокого обучения». Важно отметить, что сам термин, а также форма и структура нейронных сетей «вдохновлены человеческим мозгом, имитируя способ передачи сигналов биологическими нейронами от одного к другому».
На заре существования нейронных сетей присутствовали некоторые сомнения в их ценности, но с течением времени мода на ИИ распространилась и на нейронные сети. Их часто рассматривают как будущее искусственного интеллекта.
Конечно, было бы ошибкой считать, что нейронные сети предназначены исключительно для новых эффектных гаджетов. Они уже прочно вошли в нашу жизнь. Практичность – сильная сторона многих из них. Еще в 1989 году команда AT&T Bell Laboratories с помощью методов обучения по алгоритму обратного распространения ошибки обучила систему распознавать почтовые индексы, написанные от руки. Недавнее заявление Microsoft о том, что поисковая система Bing будет применять ИИ, показывает, что число сценариев использования ИИ в реальном мире будет только расти.
Выявляя закономерности на основе наборов обширных данных, ИИ может выполнять такие задачи, как быстрое распознавание изображений. Способность выявлять закономерности привела к появлению многих других приложений ИИ –например, для прогнозирования фондовых рынков. Google Translate, разработанный командой Google Brain – еще одно известное приложение нейронной сети.
Вы вряд ли сумеете обыграть нейронную сеть в шахматы или сёги (японская настольная логическая игра шахматного типа). Их понимание правил, запоминание стратегий и всех записанных ходов делает их непревзойдёнными игроками (хотя ChatGPT, похоже, не справляется с Wordle – браузерной игрой в слова). Нейронные сети выступают сильными противниками людей в таких играх, как го (очень сложная стратегическая игра) и шахматы.
Но их сфера применения выходит далеко за рамки вышеназванных сценариев. По состоянию на 2023 год поиск патентов, ограниченный фразой «нейронные сети», выдавал 135 828 результатов. С учетом стремительно развития этих технологий шансы на то, что мы сможем полностью оценить влияние ИИ, тают.
Таинственные слои «непознаваемости»
Изучение истории нейронных сетей до известной степени проливает свет на роль этих сетей в наши дни и на то, какое влияние они, возможно, окажут в будущем.
Фактор необъяснимости относится к самим целям и устройству этих систем. Человечеству присуща давняя погоня за необъяснимым. Чем более непрозрачна система, тем более аутентичной и продвинутой она считается.
Речь идет не только об усложнении этих систем или контроле над интеллектуальной собственностью, ограничивающем доступ к ним. В идеологию, которая движет их разработкой и развитием, заложен интерес к «непознаваемости». Тайна встроена в саму форму и дискурс нейронной сети. Нейронные сети состоят из уложенных «штабелями» скрытых слоев (отсюда термин «глубокое обучение»), и внутри этих глубин присутствуют еще более скрытые слои.
Сейчас мы все больше стремимся понимать, как ИИ работает и приходит к тем или иным решениям и результатам. Европейский союз настолько обеспокоен потенциально «неприемлемыми рисками» и даже «опасными» приложениями, что в настоящее время продвигает новый Закон об искусственном интеллекте, призванный установить глобальный стандарт для «разработки безопасного, заслуживающего доверия и этичного искусственного интеллекта».
Новые законы предусматривают «соблюдение требований к качеству данных, прозрачности, человеческому надзору, точности и надежности для снижения рисков, относящихся к фундаментальным правам и безопасности».
Речь идет не только о таких технологиях, как беспилотные автомобили (хотя их системы безопасности в странах ЕС включают в категорию искусственного интеллекта с высоким риском). Законодатели обеспокоены тем, что в будущем появятся системы, деятельность которых может нарушить права человека.
Это часть более широкой кампании за прозрачность ИИ: создание таких условий, когда его деятельность можно было было бы проверять и оценивать.
Вдохновленные человеческим мозгом
Существуют фундаментальные принципы нейронных сетей. Вдохновленные человеческим мозгом, они копируют или моделируют человеческое мышление. С точки зрения структуры и устройства они состоят из уровней узлов, содержащих входной уровень, один или несколько скрытых слоев и выходной уровень. При этом каждый узел или искусственный нейрон соединяется с другим. Поскольку для создания результатов им требуются входные данные и информация, они полагаются на обучающие данные, которые помогают им развиваться и постепенно повышать свою точность. Эти технические детали имеют значение, но не менее важно и само фундаментальное стремление смоделировать эти системы на основе сложного человеческого мозга.
Это стремление имеет жизненно важное значение для понимания того, что технологические аспекты означают на практике. В интервью 1993 года исследователь нейронных сетей Теуво Кохонен отметил, что его мечта – это самоорганизующаяся система, работающая аналогично тому, как действует человеческая нервная система, т. е. инстинктивно.
По словам Кохонена, система, которая сама себя контролирует и собою управляет, «может использоваться в качестве панели мониторинга в любом устройстве, в каждом самолете, автомобиле и на каждой атомной электростанции». Пользователь, говорит Кохонен, сможет видеть, в каком состоянии находится система.
Главной целью разработчиков нейронных сетей было создание системы, способной адаптироваться к окружающей среде. Она призвана быть автономной и мгновенно реагировать, действуя по принципу нервной системы и справляясь с задачами без вмешательства человека. В основу разработки и проектирования нейронных сетей были положены изощренность человеческого мозга, нервной системы и сложный характер реального мира.
Имитация мозга – уровень за уровнем
При обсуждении нейронных сетей всегда возникает тема сложного устройства человеческого мозга, который они имитируют. Человеческий мозг является своего рода шаблоном для этих систем. Эти экспериментальные новые системы были смоделированы на основе явления, функционал которого сам по себе был и остается загадкой.
Американский ученый Карвер Мид говорит в этой связи о концепции «когнитивного айсберга». Человеческий мозг – лишь верхушка айсберга сознания, который доступен нашему восприятию. Масштаб и форма остального измерения человеческого сознания скрыты под поверхностью.
В 1998 году Джеймс Андерсон, некоторое время работавший над нейронными сетями, отметил, что в ходе исследований человеческого мозга «нашим главным открытием, похоже, стало понимание того, что мы на самом деле не знаем, как он функционирует».
В подробном отчете, опубликованном в Financial Times в 2018 году, исследователь технологий Ричард Уотерс отметил, что нейронные сети «моделируются на основе представлений о том, как работает человеческий мозг: они передают данные через слои или уровни искусственных нейронов до тех пор, пока не появляется идентифицируемая закономерность».
И в этом состоит проблема, отметил Уотерс, поскольку «в отличие от логических схем, используемых в традиционных программах, не существует способа отслеживать этот процесс, чтобы точно определить, почему компьютер выдает тот или иной ответ». Уотерс считает, что это обстоятельство нельзя игнорировать. Применение модели, в которой данные проходят через множество слоев, означает, что происхождение ответа нелегко проследить.
«Вся суть в адаптации»
Мид, Кохонен и их коллеги стремятся создать систему, способную адаптироваться к миру, в котором будет работать, и реагировать на его реалии. По словам Мида, ценность нейронных сетей заключается в том, что они могут облегчить такую адаптацию, «в которой вся суть». Адаптация необходима, по его мнению, «из-за природы реального мира», который «слишком изменчив, чтобы создать что-то абсолютное и неизменное». Системы ИИ, по мнению Мида, должны быть способны реагировать и адаптироваться к обстоятельствам без каких-либо инструкций.
В 1990-х годах Стивен Гроссберг – эксперт по когнитивным системам, работающий в области математики, психологии и биомедицинской инженерии – также утверждал, что адаптация станет важным шагом в долгосрочной перспективе. Гроссберг, работая над моделированием нейронных сетей, размышлял о том, что «биологические системы измерения и управления устроены таким образом, чтобы стабильно и быстро адаптироваться к меняющемуся миру в режиме реального времени».
Как и в случае мечты Кохонена о «самоорганизующейся» системе, понятие «реального мира» становится контекстом, в котором реакция и адаптация кодируются в системах ИИ. То, как этот реальный мир понимается и воображается, определяет то, каким образом эти системы предназначены для адаптации.
Скрытые слои
Нейронная сеть обучается с использованием обучающих данных, которые, как объясняет специалист по информатике Ларри Хардести, «поступают в нижний слой — входной слой — и проходят через последующие слои; в процессе они умножаются и объединяются до тех пор, пока в итоге не поступают в выходной слой в радикально трансформированном виде».
Чем больше слоев, тем более высока степень преобразования и тем больше расстояние от входа до выхода. По словам Хардести, развитие графических процессоров (GPU) – например, в играх – «позволило однослойным сетям 1960-х годов и двух-трехуровневым сетям 1980-х годов превратиться в 10, 15 или даже 50-уровневые сети наших дней».
Нейронные сети становятся глубже. Именно это добавление слоев, по мнению Хардести, и есть «то, что подразумевается под словом «глубокое» в термине «глубокое обучение». По его словам, это важно, потому что «в настоящее время глубокое обучение отвечает за наиболее эффективные системы практически во всех областях исследований искусственного интеллекта».
Однако по мере того, как слои нейронных сетей накапливаются, их сложность растет, что также приводит к росту так называемых «скрытых слоев» внутри этих глубин. Дискуссия об оптимальном количестве скрытых слоев в нейронной сети продолжается. Исследовательница ИИ Беатрис Фази утверждает: «Из-за того, как работает глубокая нейронная сеть, полагаясь на скрытые нейронные слои, зажатые между первым слоем нейронов (входной слой) и последним слоем (выходной слой), методы глубокого обучения часто непрозрачны или непонятны даже для программистов, которые их изначально настраивали».
По мере увеличения слоев (в том числе и скрытых слоев) эти методы становятся еще менее объяснимыми – опять же, даже для тех, кто их создает. Известная американская писательница Нэнси Кэтрин Хейлс высказывает аналогичную точку зрения, отмечая, что существуют пределы того, «как много мы можем знать о системе, и эти ограничения имеют отношение к «скрытому слою» в нейронных сетях и алгоритмах глубокого обучения».
В погоне за необъяснимым
В совокупности все эти многолетние разработки нейронных сетей являются частью того, что социолог технологий Тайна Бухер называет «проблематикой неизвестного». Ее коллега, британский социолог науки Гарри Коллинз отмечает, что смысл нейронных сетей состоит в том, чтобы их могли создавать люди, но «после того, как программа написана, она живет своей собственной жизнью, и то, как именно работает программа, может оставаться загадкой». Это отголоски давних мечтаний о самоорганизующейся системе.
Неизвестное и, возможно, даже непознаваемое рассматривалось как фундаментальная часть этих систем с самых первых дней их существования. Есть большая вероятность того, что чем большее влияние искусственный интеллект будет оказывать на нашу жизнь, тем меньше мы будем понимать, как и почему это происходит.
Но сегодня такая перспектива многих не устраивает. Мы хотим знать, как работает ИИ и как он приходит к решениям и результатам, которые на нас влияют. Поскольку развитие ИИ продолжает формировать наше понимание мира и представление о нем, стремление понимать будет расти. Когда речь заходит об объяснимом и прозрачном ИИ, вся история нейронных сетей подсказывает нам, нам, что в будущем мы, скорее всего, отдалимся от этой цели, а не приблизимся к ней.