2024 год обещает стать эпохальным для искусственного интеллекта. C головокружительной скоростью возникают новые модели, проходят раунды привлечения финансирования и достигаются новые рубежи. Поэтому может быть нелегко в режиме реального времени следить за всем, что происходит в мире ИИ. Давайте детально рассмотрим ключевые события, запуски новых продуктов, научные открытия и тенденции, которые будут определять характер пространства искусственного интеллекта в 2024 году.
- технологии
- мнения
- нейросети
- статьи
- 22 июл. 24
2024 год: дорожная карта искусственного интеллекта
2024 год обещает стать эпохальным для искусственного интеллекта. C головокружительной скоростью возникают новые модели, проходят раунды привлечения финансирования и достигаются новые рубежи.
- 648
- 0
- 1
- рейтинг +11
- подписчики 4
1-й квартал 2024 г.
Первый квартал 2024 года начнется с запуска нескольких крупных моделей и обновлений, которые позволят расширить возможности искусственного интеллекта.
Запуск Gemini Ultra
В начале февраля 2024 года Google наконец-то запустила свою модель искусственного интеллекта Gemini Pro. Эта новая версия их диалогового ИИ-помощника, вероятно, составит GPT-4 достойную конкуренцию благодаря таким методам конституционного ИИ, как конституционное подсказывание и самоконтроль. Возможно, Gemini и не превосходит GPT-4 во всех отношениях, но ее безопасность и способности к рассуждению должны значительно превосходить то, что OpenAI продемонстрировала в случае GPT-3 и GPT-3.5.
Запуск Gemini окажет огромное давление на OpenAI. Компания, скорее всего, постарается выпустить GPT-4.5 раньше, чем планировалось, но вряд ли раньше второго квартала 2024 года.
Достижения в области тонкой настройки с открытым исходным кодом
В первом квартале 2024 года мы увидим впечатляющий прогресс в развитии моделей ИИ с открытым исходным кодом. Исследователи поделятся новыми, более точными методами настройки. Модели, точно настроенные на задачи рассуждения и математические/логические задачи, вероятно, устранят разрыв с проприетарными моделями, такими как GPT-3 – в таких аспектах, как здравый смысл и возможность отвержения ложных утверждений.
К концу первого квартала отдельные модели с открытым исходным кодом смогут даже достичь уровня человеческой производительности (более 75%) в прохождении сложных математических и логических тестов. Конечно, риск мошенничества при прохождении этих тестов по-прежнему вызывает беспокойство. Способности решения задач на естественном языке также должны быть впечатляющими.
Рост финансирования робототехники
Программное обеспечение искусственного интеллекта развивается стремительными темпами, поэтому объем инвестиций в развитие коммерческих приложений, таких как робототехника, будет расти.
Мы увидим как минимум два многомиллионных раунда финансирования стартапов в области робототехники, ориентированных на внедрение достижений ИИ в реальном мире. В 2024 году мы увидим большие успехи в таких направлениях, как роботизация складов, беспилотные автомобили и даже создание универсальных роботов-помощников для жилых домов и офисов.
Распространение небольших моделей с открытым исходным кодом
Несмотря на анонсы OpenAI и другими компаниями гигантских моделей с более чем 100 триллионами параметров, будет продолжать расти популярность меньших моделей с открытым исходным кодом для различных сценариев использования в реальном мире.
Компаниям-производителям становится очевидно, что модели с 10–20 миллиардами параметров, точно настроенные на нишевых наборах данных, могут приносить огромную пользу и оставаться при этом доступными для обучения и развертывания.
Есть смысл искать именно эти микромодели, позволяющие создавать больше интерактивных демонстраций и базовых чат-ботов. Не стоит вестись на ажиотаж, придавая большое значение тому факту, что новостные заголовки пестрят упоминаниями GPT-4.
Создатели стартапов поймут, что гораздо проще удовлетворить потребности пользователей с помощью набора микромоделей, чем полагаться на одну большую модель, такую как GPT-3.
2-й квартал 2024 г.
Цикл ажиотажа вокруг ИИ достигнет очередного пика во втором квартале 2024 года, когда будут запущены новые модели и выделены большие средства на обеспечение безопасности ИИ и исследования характера работы этих моделей.
Релизы LLama 3 и GPT 4.5
Ожидается, что во втором квартале 2024 года Meta выпустит LLama 3, третью версию своей большой языковой модели. Можно предположить, что LLama 3 составит конкуренцию GPT-4 в таких областях, как рассуждение и подтверждение результатов. Отдельные эксперты даже допускают, что LLama 3 может даже превзойти GPT-4 способностью оценивать людей.
Чтобы не отставать надолго от конкурента, скорее всего, вскоре после релиза LLama 3 компания OpenAI запустит GPT-4.5. Модель обещает быть более функциональной, безопасной и надежной по сравнению с непростым периодом стабилизации GPT-4 после запуска.
Mistral привлекает крупный раунд финансирования
На фоне своего бурного роста стартап в сфере искусственного интеллекта Mistral, создающий следующее поколение моделей, наборов данных и инфраструктуры обучения, проведет во втором квартале крупный раунд финансирования.
Популярность открытой экосистемы Mistral заставит технологических гигантов переосмыслить культуру закрытого кода. Можно ожидать, что в 2024 году вырастет число крупных языковых моделей и наборов данных, которые будут бесплатно доступны исследователям.
Достижения в области безопасности ИИ
По мере того, как большие языковые модели (LLM) становятся более продвинутыми (и потенциально опасными), усилия по обеспечению безопасности ИИ будут активизироваться. Вполне возможно, что во втором квартале 2024 года мы увидим публикацию ряда основополагающих документов, которые «взломают» черный ящик больших языковых моделей и помогут нам в большей степени понимать их поведение. Это позволит создать более безопасную архитектуру таких моделей и методы их обучения.
Также будут предприняты согласованные глобальные усилия по сбору обучающих данных, направленные на сохранение пользы программ LLM. Наборы обучающих данных по настройке инструкций, которые включают соответствие определенным ценностям и соблюдение норм, будут ограничивать нежелательное поведение.
Университеты и компании станут совместно, систематизированным образом, документировать уязвимости программ LLM перед лицом кибератак и разрабатывать новые средства защиты. Поскольку модели ИИ задействуются во все более критически важных сценариях, проверка целостности и предотвращение проникновений извне станут не менее значимыми факторами, чем точность.
LLM способствуют научным открытиям
Несмотря на опасения в связи с тем, что LLM сделает безработными «белых воротничков» (наемных работников, занимающихся умственным трудом), модели ИИ продолжат демонстрировать свою эффективность в качестве средств расширения возможностей исследователей и инженеров. Открытая наука – движение за то, чтобы сделать научные исследования (включая публикации, данные, физические образцы и программное обеспечение) и их распространение доступными для всех слоев общества – будет набирать обороты. Все больше старшеклассников будут вносить в него вклад благодаря помощи со стороны ИИ.
LLM ускорит процесс развития математики, открыв новые методы доказательства теорем. Моделирование физической среды, усиленное нейронными сетями, позволит обнаружить явления, невидимые для традиционных исследований. Биология выиграет от прогнозов сворачивания белков с помощью ИИ.
Известные университеты будут вкладывать значительные средства в центры, ориентированные на применение программ LLM.
Grok ждут значительные улучшения
Grok, диалоговый чат-бот с генеративным искусственным интеллектом, разработанный компанией Илона Маска xAI на основе большой языковой модели, значительно улучшится благодаря методам конституционного ИИ. Опираясь в своих предсказаниях и выводах на математические доказательства, Grok будет занимать собственную нишу, отличаясь от LLM, обученных исключительно с прогностическими целями.
Часть экспертного сообщества настаивает на том, что научные утверждения любых LLM должны подкрепляться формальными логическими аргументами или математическими доказательствами, а не просто цитатами из тщательно отобранной литературы. Благодаря этому давлению стартапы, работающие над критериями рациональности и рассуждения, будут процветать.
3-й квартал 2024 г.
После нелегких попыток освоить LLM в первой половине 2024 года сообщество искусственного интеллекта немного восстановит свои позиции в третьем квартале, сосредоточив внимание на тщательном тестировании утверждений моделей ИИ и количественной оценке их реальной производительности.
Запуск GPT 5.0
В третьем квартале 2024 года OpenAI выпустит GPT-5, чтобы компенсировать репутационный ущерб, нанесенный бурным внедрением GPT-4. Обновление модели оправдает ожидания пользователей благодаря большей согласованности, повышенной фактической точности и качеству здравого смысла по сравнению с GPT-3 и GPT-4.
Конечно, планка «улучшенных» возможностей продолжает подниматься, поскольку конкурирующие модели от Anthropic, Google и других повышают ожидания. Тем не менее, GPT-5 должен прочно закрепить за OpenAI роль лидера отрасли.
Проверка эффективности LLM
Связанные с LLM дебаты о вводящих в заблуждение заявлениях моделей в первой половине 2024 года откроют в третьем квартале эру проверки производительности. Группы исследователей в университетах и компаниях выпустят подробные наборы тестов для количественной оценки результатов языковых моделей.
Подключатся и политики, требуя прозрачной отчетности о таких показателях, как согласованность, точность и предвзятость для моделей, используемых в чувствительных областях (здравоохранение, образование и финансы).
В стандартизированных паспортах безопасности для LLM будут перечислены известные виды отказов, как и в случае с оборудованием. Тестирующие органы будут проверять и подтверждать производительность в производственных средах, а не только в контролируемых условиях.
Улучшенные модели с открытым исходным кодом
Благодаря стремлению Mistral к открытости в разработке ИИ улучшенные модели с открытым исходным кодом достигнут или даже превзойдут исходные возможности GPT-4 к третьему кварталу 2024 года. Конечно, ведущие запатентованные модели по-прежнему будут доминировать в передовых когнитивных тестах. Но для многих сценариев использования в реальном мире открытого исходного кода будет достаточно.
Такая товаризация ИИ посредством высококачественных экосистем открытых моделей приведет к волне инноваций, поскольку стартапы и студенты смогут опираться на эти модели, а не воссоздавать основы с нуля.
Модели зрения станут более реалистичными
Хотя LLM привлекают к себе львиную долю внимания, искусственный интеллект также продолжит развиваться. Волна сомнительных изображений, созданных ИИ в 2023 году, спадет, поскольку исследователи сосредоточатся на согласованности метаданных и видео.
К третьему кварталу 2024 года модели зрения станут пригодными для использования в реальных продуктах. Благодаря достижениям в области моделирования данных и улучшенным режимам тестирования на предвзятость они избавятся от досадных ошибок. Остается множество вопросов, связанных с контекстом и намерениями, но модели зрения будут извлекать выгоду из развития моделей языка, и наоборот.
Программы Code Gen LLM набирают обороты
Copilot на GitHub и другие LLM, специализирующиеся на создании компьютерного кода, будут вносить свой вклад в более чем 50% проектов ПО, используемого в реальном мире.
Быстрые итерации между написанием спецификаций на естественном языке и заполнением необходимого кода ускорят разработку.
Конечно, остаются значительные риски, связанные с проверкой правильности, безопасности и происхождения автоматически сгенерированного кода. Но преимущества в производительности настолько огромны, что почти каждый крупный проект с открытым исходным кодом будет содержать машинно-генерируемую логику. Роль инженеров-программистов будет постепенно сводиться к проверке и оптимизации, а не к простому анализу оттока кода.
4-й квартал 2024 г.
Возможно, к концу 2024 года ажиотаж вокруг искусственного интеллекта начнет уступать место реалистичному подходу к проблемам его развертывания. Хотя исходные возможности растут в геометрической прогрессии, процесс интеграции в общество содержит многочисленные узкие места. Управление безопасным и этическим внедрением этих технологий потребует совместной работы ученых-социологов, специалистов по выработке государственной политики и ученых-компьютерщиков.
Запуск следующей версии Gemini
В четвертом квартале 2024 года Google выпустит следующую версию Gemini. В рамках новой программы лидерства генерального директора Google Inc Сундара Пичаи корпорация вкладывает значительные ресурсы в разработку методов конституционного ИИ, таких как самоконтроль и обратная связь от внешних коллег.
Обновленный Gemini существенно сокращает разрыв с лидерами отрасли в аспектах прозрачности, контроля и надежности. Google надеется, что эти строгие меры помогут смягчить опасения политиков, озабоченных соответствием Gemini требованиям антимонопольного законодательства.
Конечно, есть мнение, что это запоздалые и недостаточные меры для компании, которую давно обвиняют в сборе пользовательских данных с целью получения прибыли. Но настроения в отрасли начинают меняться по мере того, как Google становится пионером в разработке эффективных методов искусственного интеллекта без крупномасштабного сбора данных.
Модели с открытым исходным кодом обретут легитимность
К четвертому кварталу 2024 года модели искусственного интеллекта с открытым исходным кодом станут надежным вариантом даже для крупных корпораций. Прогресс Mistral в сочетании с прогрессом стандартов проверки моделей помогает крупным банкам, страховым агентствам и другим регулируемым отраслям постепенно привыкнуть к открытым экосистемам.
Конечно, наиболее чувствительные приложения в сфере обороны и разведки по-прежнему будут использовать модели с закрытым исходным кодом, обученные на секретных данных. Но характеристика открытости становится все более легитимной.
Распространение конкурентов ChatGPT
В конце 2022 года ChatGPT покорил мир. К четвертому кварталу 2024 года пользователи будут буквально перегружены аналогичными инструментами от его конкурентов, поскольку гонка за обладание этим рынком ускоряется. Microsoft запускает чат-бот нового поколения, интегрированный с Teams и Outlook. Google запускает чат-бот Bard, Мета – свои продукты.
Благодаря буму ChatGPT стремительно растут объемы венчурного финансирования стартапов в области диалогового ИИ. В таких отраслях, как психиатрия или преподавание, разработчики, выпускающие узкопрофильные инструменты, обещают пользователям более индивидуальный опыт по сравнению с чат-ботами общего профиля. По этому показателю Cohere, Hugging Face и Anthropic выглядят примитивными по сравнению с яркими «выскочками».
Регуляторы обещают установить баланс между внедрением инноваций и ответственным развитием, чтобы избежать наступления еще одной «зимы ИИ». Но они в основном занимают выжидательную позицию, поскольку ни одна платформа пока не добилась явного доминирования.
Распространение медиа, созданных искусственным интеллектом
Достижениями в области создания текста, изображений, видео и аудио в 2022–2023 гг. наконец-то воспользуются широкие массы профессиональных создателей контента. Медиа-стартапы запускают на базе LLM сервисы, которые создают шаблоны и черновики. Копирайтеры, графические дизайнеры и видеоредакторы прибегают к помощи ИИ, чтобы раскрыть свой творческий потенциал, а не заменить его искусственным интеллектом.
Конечно, риски, связанные с предвзятостью, точностью и плагиатом, остаются в центре внимания. Но инструменты, способные распознать, каков источник вдохновения автора, и маркировать машинный вклад, позволяют безопасно интегрировать ИИ. СМИ с надежной репутацией формируют этические принципы прозрачности. Однако вирусные развлекательные платформы продолжают распространять сомнительный контент, созданный с помощью ИИ. К сожалению, это подрывает общественное доверие к технологиям искусственного интеллекта.
Макроэкономические последствия внедрения ИИ
В 2024 году беспрецедентные темпы прогресса ИИ сделают очевидными разломы на макроэкономическом уровне – последствия внедрения ИИ, которые технологические евангелисты раньше не принимали в расчет. На фоне опасений перед гибелью целых отраслей правительства стабилизируют свободно падающие рынки труда с помощью сдерживающей денежно-кредитной политики. Ничего подобного не наблюдалось все последние десятилетия.
Заключение
2024 год, несомненно, станет еще одним переломным моментом в развитии и внедрении искусственного интеллекта. Вопреки прогнозам, сделанным на основе прошлых циклов бума и спада, этот тренд сохраняет свою экспоненциальную траекторию. Устойчивый прогресс по таким направлениям, как выполнение задач, безопасность и этика, определяет характер усилий, которые предпринимают коммерческие проекты. В течение следующего десятилетия в разных сферах человеческой деятельности, отраслях и академической сфере ИИ продолжит успешно демонстрировать свое фундаментальное качество – способность трансформировать коммерцию, науку и повседневную жизнь.
- 648
- 0
- 1