• нейросети
  • статьи
  • 23 июн. 24

Нейросети: что это и почему о них все говорят?

Что такое нейросети и какой была первая нейронка в мире. В этой статье мы шагнем на несколько лет назад, чтобы подробнее рассказать об их становлении и развитии.

  • 197
  • 0
  • 0
Ulyana Proskunova
  • рейтинг +12
  • подписчики 7

Современные ИИ-инструменты с нейросетями стремительно меняют нашу жизнь, причем к настоящему времени — уже в многочисленных аспектах. В сфере маркетинга, к примеру, нейросети автоматизируют рутинные задачи, в сфере разработок и исследований — ускоряют обработку большого массива данных, в сфере медицины — помогает в диагностике заболеваний, в сфере медиа— оперативно персонализирует информацию и формирует контент и визуальное оформление.

И это все — лишь единичные примеры использования инновационных инструментов в бизнесе. Согласно исследованию The State of AI in Marketing, более 60% специалистов в области уверены, что внедрение искусственного интеллекта и автоматизацию в работу оптимистично повлияет на бизнес и увеличение показателей компаний.

Так, по состоянию на январь, рынок искусственного интеллекта и нейросетей по всему миру оценивается в более чем $136 млрд. А на ближайшие семь лет эксперты прогнозируют рост этой индустрии практически в 13 раз.

Нейросети порой настолько быстро внедряются в нашу обыденную жизнь, что мы этого даже не всегда замечаем. Условно, странно даже представлять, что какие-то несколько лет назад мы не обращались к чат-ботам за помощью, не генерировали изображения и не автоматизировали создание контента.

В этой статье мы шагнем на несколько лет назад — в самый момент зари нейросетей, чтобы подробнее рассказать об их становлении и развитии.

Что такое нейросети

Нейросети представляют собой математическую модель вместе с ее программным воплощением, притом смоделированную на базе работы мозга человека.

А если более конкретно, то в науке нейронную сеть объясняют как последовательность нейронов, которые соединены друг с другом. А структура нейросети, в свою очередь, пришла к нам и вовсе из мира биологии. Благодаря ей, машины обретают возможность проводить анализы, а также запоминать огромное количество информации. После чего — уже освоенную информацию нейросети используют в анализе и воспроизведении ее в необходимый момент.

Обучается она в общем-то также на основе алгоритмов, которые созданы человеком — механизмов распознавания, различных инструкций, а также посредством уже существующей базы данных (текстов, изображений, видео и формул).

Грубо говоря, обучают нейросети, как детей — сначала закладывают в нее необходимую для выполнения «человеческих» действий, а затем — умению самостоятельно находить вариации решений в тех или иных ситуациях, чтобы по окончанию обучения она могла самостоятельно решать поставленные перед ней задачи.

Как появились нейросети: краткая история

Нейросети начинают отсчет своего развития с 1940-х годов. Им, можно сказать, положили начало два американских ученых — Уоррен Маккаллохит и Уолтер Питтс, которые опубликовали в 1943-м научную работу. Она как раз-таки и была посвящена возможностям создания искусственного интеллекта — в статье содержалась предварительная математическая модель нейронных сетей. Однако до ее практической реализации в то время особо дело не дошло.

Спустя шесть лет была опубликована еще одна книга, посвященная искусственным нейронным сетям. Ее автором является канадский нейропсихолог Дональд Хебб, который впервые предположил, что машины могут обучаться самостоятельно.

И только в 1950-х годах ученый Фрэнк Розенблатт изобрел перцептрон — математическую (компьютерную) версию работы мозга человека. Посредством этого простейшего вида нейронных сетей, как заявлял математик, было возможно прогнозировать погоду и даже работать с идентификацией фотографий. После чего, грубо говоря, научный интерес к нейросетям снизился. Поводом тому стала критика перцептрона и ограничений в его работе.

Однако к 1974 году нейронные сети начали снова набирать популярность: мир увидел десятки научных статей и исследований, которые посвящены разработке моделей машинного обучения. Одним из таких являются алгоритм Пола Вербос, который сосредоточен на обратном распространении ошибок, а также концепция нейросетей Джона Хопфилда, которая способна решать определенные задачи.

И несмотря на то, что и метод обратного распространения ошибки, и механизм обратного прохождения сигнала, и алгоритмы работы нейронных сетей вызвали в научном обществе широкие споры, все же идея была принята с энтузиазмом.

Так, к 2000-м годам компьютерные мощности возросли настолько, что в принципе справлялись с воплощением в жизнь самых смелых идей ученых. В 2006 году, к примеру, начались активные разработки различных методов глубокого обучения нейронных систем. Впоследствии они использовались в рамках работы с промежуточными представлениями: с выходными сигналами и без него. В первую очередь, исследования нулевых годов были направлены на изучение основных особенностей распределения сигналов, которые поступали на слои нейронных сетей.

А уже к настоящему времени, как мы все прекрасно знаем, создано множество различных программ на базе нейронных систем, которые распознают голос, объекты на фото и видео, перерабатывают аудио и многое другое.

Как обучаются нейросети?

Для того, чтобы нейросети «работали» или, говоря другими словами, решали поставленные перед ними задачи, разработчики располагают все нейроны на отдельных слоях. А именно: на входном (начальном слое) модель получает информацию, на скрытых слоях — обрабатывает полученные данные, а уже на выходном слое — раскладывает все по полочкам и выдает конечный результат.

Представим, что перед нами «нулевая» нейронная модель, которая еще ничему не обучалась и, соответственно, ничего и не делала. Если кратко, то алгоритм действия с момента начала ее обучения до конкретных шагов будет следующим:

— Для начала нейросети требуется обучиться. Делается это на основе загруженных в нее данных, которые необходимы для выполнения той или иной задачи. В качестве данных могут быть и тексты, и фотографии, и видеоролики, и аудиозаписи;

— Полученные данные перемещаются от одного искусственного нейрона к другому — между слоями. Более того, один нейрон может обладать даже несколькими соединениями, которые также хранят в себе те или иные данные;

— После того, как каждый нейрон получит необходимую информацию, модель может приступать к выполнению поставленного перед ней запроса.

Причем полученная информация умножена на вес каждого из синопсисов и является суммой всех данных, которые модель и посылает до того момента, пока информация не обработается и не переформатирует я в какой-либо исходный результат.

Иными словами, для того, чтобы нейросеть заработала, в уже созданную сложную математическую модель требуется поместить данные, которые необходимы для решения конкретной задачи — группу изображений, научную литературу, стихотворения, документальные фильмы и так далее. Условно, если от нейросети нам потребуется автоматически созданная литературная заметка, то данными для загрузки, соответственно, будет группа литературных произведений и желательно даже нескольких авторов и различных стилей.

Так, например, для того, чтобы обучить всем известную нейросеть Midjourney сопоставлять изображения с текстом, в нее загружали огромное количество различных картинок вместе с подписями. На одном слое модель обрабатывала текст, а на другом — изображения. После чего самостоятельно училась идентифицировать объекты.

Можно сказать, что в принципе никаким мышлением и сознанием нейросети и не обладают — только математическими алгоритмами и формулами. Единственное, чем они выделяются на фоне других программ, так это способностью обучения и адаптации к новым запросам и поставленным задачам.

Источник: Схематичная модель обучения вымышленной нейросети / habr.com
Источник: Схематичная модель обучения вымышленной нейросети / habr.com

Как работают нейросети?

Объясняем, как работают генеративные модели на примере нейросети «Сбера» Kandinsky — российской диффузионной модели для создания изображений. Метод диффузии получил особую популярность в качестве одного из востребованных подходов к генерации — его используют такие популярные сервисы, как DALLE 2, Midjourney, imagen и другие актуальные модели.

Суть таких нейронок в том, что они сначала портят изображение с помощью зашумления, а после восстанавливают его, генерируя новое. Грубо говоря, диффузионные модели сначала делают «белый шум», чтобы потом на основе текстовых запросов и кодов создать то, что скажет пользователь.

Итак, для начала попросим сгенерировать изображение кота, который печет блинчики, в стиле киберпанк. Нейросеть решит эту задачу поэтапно:

— После того, как нейросеть получает промпт, она расчленяет его на несколько ключевых элементов (в нашем случае, слов «кот», «печет», «блинчики», «киберпанк»), она приступает к работе с поставленной перед ней задачей).

— Ключевые элементы разбиваются в наборы цифр, также называемые векторами. Благодаря этому нейросеть, опираясь на свою уже имеющуюся базу знаний, определяет их смысл. Так, например, для вектора слова «кот» нейронная модель создает силуэт домашнего животного из пикселей.

— Пиксельное изображение попадает в следующий нейрон, где на нашего кота накладываются более сложные элементы, вроде цвета, текстуры, освещения и остальных деталей. За данный этап как раз-таки отвечает диффузионная модель нейросети, которая из пиксельного шума превращает набросок в полноценное изображение.

— А уже выходной слой нейросети, в свою очередь, добавляет последние мазочки к изображению, улучшая его качество и подстраивая под необходимый формат. После чего уже отдает итоговую версию изображения пользователю.

Генерация изображения по запросу «кот печет блинчики, в стиле киберпанк» / Kandinsky
Генерация изображения по запросу «кот печет блинчики, в стиле киберпанк» / Kandinsky

Какие существуют нейросети?

Скажем на берегу: видов нейронных моделей существует несколько десятков, однако в этой статье мы не будем рассказывать о каждом, а остановимся на самых популярных.

— Перцептроны. Это первая нейросетевая модель, которая запустилась на нейрокомпьютерный машине под названием «Марк I». В нее Фрэнком Розенблаттом, о котором мы рассказали выше, были заложены базовые принципы работы. Поэтому, несмотря и на односложность, нейросеть уже умела самостоятельно принимать решения и корректировать ошибки.

— Многослойные нейросети. Если коротко, то буквально сразу после запуска предыдущего вида нейросети, математики обнаружили проблему — перцептрон трудновато распознавал объекты в непривычных для него условиях, вроде чрезмерного засвета или же угла наклона. Так появилась еще одна нейросетевая модель — многослойная, которая способна распознавать необходимые предметы вне зависимости от условий.

В сравнении с предыдущей, данная нейросеть более многофункциональна за счет того, что процесс обработки данных проходит в несколько этапов.

— Рекуррентные нейросети. Это модели, которые заточена на работу с последовательностью текста, речи, аудиозаписей или видеозаписей. Их основная задача заключается в том, чтобы запомнить цепочку обработанных данных, правильно обработать ее и спрогнозировать дальнейшие действия. В основном эта модель сейчас используется в голосовых помощниках, вроде «Алисы» и «Маруси», а также в умных переводчиках для того, чтобы воспроизводить связный текст.

— Сверточные нейросети. Это модели, работа которых полностью сосредоточена на изображениях: они распознают объекты на них, генерируют, обрабатывают, удаляют фон — делают все, что связано с картинками. Такие базируется на двух алгоритмах: свертке, которая разбивает изображение на несколько слоев, и пулинге, который распознает и кодирует на картинках ключевые элементы с признаками.

Сверточные нейросети чаще всего используются в инструментах автопилотирования, в медицинском прототипировании, программах обработки естественного языка и для распознавания лиц.

— Генеративные нейросети. Ну, тут совсем все просто и понятно — речь о самой популярной модели нейросетей на сегодняшний день. Это любые нейронки, которые что-либо генерируют — текст, изображения, аудио или видео — на сегодняшний день вариаций того, что можно создать в нейросети, огромное множество. В числе самых популярных DALL-E и Midjourney, которые создают изображения, чат-боты Bing и ChatGPT, которые генерируют текст.

На текущий момент труднее перечислить сферы, которые нейросети еще не затронули. Их используют и бизнесмены, и маркетологи, и врачи, и даже юристы — порой они действительно могут существенно автоматизировать работу и сэкономить пользователю вагон драгоценного времени. Однако и важно понимать, что ни одна нейросеть пока не гарантирует абсолютно верное решение той или иной задачи, потому что их работа все же базируется на группе исходных данных, которую загрузил в нее именно человек.

  • 197
  • 0
  • 0