• хайп
  • нейросети
  • статьи
  • 14 дек. 23

Gemini: как Google хочет победить GPT-4 с помощью новой бесплатной нейросети

На днях Google запустила новую нейросеть и назвала ее «самой мощной и эффективной моделью искусственного интеллекта». Более того, компания уверена, что Gemini даже превосходит GPT-4.

  • 1584
  • 0
  • 0
Ulyana Proskunova
  • рейтинг +12
  • подписчики 10

В то время, когда нашумевший ChatGPT от OpenAI, вошедший в историю как самый быстрорастущий потребительский ИИ-инструмент, привлекает около 100 млн уникальных пользователей ежемесячно и 25 млн в день, аналогичный ИИ-бот Bard от Google значительно отстает

К слову, за два месяца после релиза ChatGPT уже насчитывал базу аудитории численностью в 100 млн. Чат-боту от Google, вероятно, потребовалось бы не менее года — а то и больше — для достижения подобных показателей. Количество уникальных посетителей Bard к октябрю текущего года, спустя полгода после запуска, выросло только до 8,7 млн. 

Некоторые и вовсе предрекали ChatGPT роль «убийцы Google», так как OpenAI не только обходили конкурентов по трафику, но и стали внедрять множество обновлений и функций, которые вполне способны были затмить разработки Google.

Но не сейчас — в ближайшее время Bard вполне способен перетянуть одеяло на себя, ведь компания перевела ИИ на мощнейшую нейронку Gemini. На днях Google запустила новую нейросеть и назвала ее «самой мощной и эффективной моделью искусственного интеллекта». Более того, компания уверена, что Gemini даже превосходит своего конкурента, GPT-4, во многих отношениях. 

Источник: deepmind.google
Источник: deepmind.google

Bard и ChatGPT: беспрерывная ИИ-гонка компаний

Bard — это сравнительно молодая передовая модель искусственного интеллекта от Google. Она создана на базе алгоритмов глубокого обучения, называемых еще большими языковыми моделями. Bard представляет собой еще экспериментальный проект, который помогает пользователям более эффективно использовать поисковик, благодаря релевантным и точным ответам на запрос.

Источник: bard.google.com
Источник: bard.google.com

В основе ИИ-модели лежит версия собственной гугловской языковой модели — Language Model for Dialogue Applications (LaMDA). Все необходимые данные для нее, включая тексты, книги, сайты и статьи, используются для точной работы с разговорами и созданием текстов.

Если говорить о различиях Bard и чат-бота от OpenAI, то основные заключаются именно в технологиях, на которых нейронки базируются. Если же первый работает на языковой модели Google, то второй основан на решении GPT-4 — новейшей и на текущий момент самой продвинутой модели компании OpenAI. 

На самом деле, если говорить о функциональности, LaMDA пока значительно уступает GPT-4. Версия от OpenAI способна обрабатывать и текст, и изображения, а также работать с графиками и расчетами на основе представленных данных. Иными словами, обладает более улучшенными интеллектуальными способностями по сравнению с языковой моделью от Google. 

LaMDA же ориентирована только на генерацию текста в рамках диалога с пользователем. Модель использует множество данных из различных диалогов, а также учитывает контекст беседы для более релевантных и естественных ответов. 

Исходя из специализации языковых моделей, и функциональность самих ИИ-ботов различается. Хоть и на базовом уровне они используют обработку естественного языка, ориентированы в конечном счете они на разные задачи.

Одно из ключевых различий — это территория использования. Если ChatGPT имеет в своем арсенале девять языков и доступен в 164 странах, то Bard бесплатно доступен на 40 языках и может использоваться в более чем 230 странах.

Также заметным отличием является доступ к боту. Если ChatGPT предлагает в большинстве своем только платные функции, то нейронка от Google предлагает большинство из того, что может первый, бесплатно. 

И, конечно, различаются оба бота по своей функциональности. В то время как ChatGPT создан для обработки большого массива последовательных данных, то Bard, в первую очередь, занимается ведением интересных и интеллектуальных бесед с пользователем. 

Gemini: что это?

6 декабря 2023 года Google довольно неожиданно для всех представила новый продукт — Gemini, представляющую собой систему ИИ-моделей. Согласно заявлениям компании, нововведение вполне способно конкурировать с текущим ИИ-лидером GPT-4, а также сможет помощь чат-боту Bard наконец-то догнать нашумевшего ChatGPT. 

Однако опробовать в деле ее пока смогут не все — 13 декабря Pro версия будет доступна только для разработчиков и корпоративных клиентов. Однако на текущий момент чат-бот Bard уже активно использует новую нейронку для того, чтобы помогать пользователям в планировании, работе со сложными темами и многим другим. 

Источник: Gemini: Google's newest and most capable AI model / YouTube-канал Google
Источник: Gemini: Google's newest and most capable AI model / YouTube-канал Google

Gemini, если кратко, — это новейшая система ИИ-моделей, которая ориентирована на более четкую обработку информации и разработана компанией Google DeepMind.

Согласно пресс-релизу, основной особенностью Gemini, которой она может похвастаться, является ее мультимодальность. То есть возможность в реальном времени работать с несколькими задачами — и с текстом, и с картинками, и с кодами, и даже с видео.

А если более подробно, то модель рассчитана на следующий ряд задач:

Работа с текстом и изображениями 

Gemini способен распознавать объекты, производить детальную транскрипцию объектов на картинках, анализировать графики и другие визуальные данные. 

Между тем, нейросеть может и генерировать  изображения, притом поддерживать сложные последовательности картинок и текста, не требующие какого-либо описания.

Источник: deepmind.google
Источник: deepmind.google

Работа с аудио

Согласно пресс-релизу, Gemini выделяется превосходным автоматическим распознаванием речи, а также превосходит другие модели в переводе речи на несколько языков.

Источник: deepmind.google
Источник: deepmind.google

Работа с видео 

Модель с превосходной производительностью понимает и даже ведет рассуждения на основе видео. Кроме того, Gemini создает субтитры к видеороликам.

Источник: deepmind.google
Источник: deepmind.google

Версии Gemini: Pro, Ultra и Nano

На данный момент в инструменте Bard, как мы уже отметили, используется версия Gemini Pro — это модель среднего уровня. Однако кроме нее компания также выпустила еще пару версий, каждая из которых предназначена для определенного режима работы.

Gemini Ultra, обеспечивающая высокую производительность при решении сложных задач, вроде анализа и работы с несколькими модальностями;

Gemini Nano, предназначенная для работы на смартфонах и с большей эффективностью. Планируется, что модель будет в смартфоне Google Pixel 8 Pro, что позволит ему стать первым мобильным устройством, имеющим такую технологию;

Gemini Pro, предназначенная для решения более обширного спектра задач.

Действительно ли Gemini превзойдет ChatGPT?

Несмотря на то, что запуск продукта только предали огласке, специалисты из Google DeepMind уверены, что нейронка эффективнее и мощнее нашумевшего чат-бота.

Так, компания даже провела небольшое исследования, по результатам которого сделали весьма смелые выводы: версия Gemini Ultra обгоняет GPT-4 в 17 из 18 случаев.

Тестирование производительности проводилось на основе нескольких контрольных задач (бенчмарков), включая такие, как Multitask Language Understanding, ориентированный на анализ понимания языка, и Multimodality Massive Multitask, ориентированный на исследование мультимодальности. Помимо того, Gemini прошла 30 из 32 тестов State-Of-The-Art, которые проверяют способность ИИ к глубокому обучению, обработке естественного языка и решению общих задач. 

Gemini точно может похвастаться такими преимуществами, как большая гибкость и возможность работы над более широким кругом задач (например, видео- и аудиоданными, что ChatGPT пока не умеет), а также способностью работать без подключения к сети и, конечно же, бесплатным доступом. 

Источник: deepmind.google
Источник: deepmind.google

«Gemini — это первая модель, которая превосходит даже экспертов в MMLU, одном из самых популярных методов проверки знаний и способностей к решению проблем моделей ИИ», — подводит итоги компания.

Однако, если говорить объективно, показатели результатов не слишком различаются. Они, вероятно, говорят больше о трудности существенного усовершенствования каждой системы и ориентированности на разные задачи, чем о конкретных недостатках GPT-4.

Поэтому сейчас трудно говорить о том, что эффективнее — Gemini или же ChatGPT, так как у каждого есть ряд своих преимуществ и недостатков.

«Одна из самых важный особенностей заключается том, что теперь мы можем работать над одной базовой технологией и улучшать ее. А это будет сразу распространяться на все наши продукты», — поделился Сундар Пичаи, главный исполнительный директор Google. Гендиректор отметил, что выход новой языковой модели — это большой шаг вперед для компании. А сам Gemini — это нечто большее, чем новый ИИ-продукт. 

  • 1584
  • 0
  • 0