Компания Anthropic , офис которой расположен в Сан-Франциско, описывает парадигму безопасности нового бота как «конституциональный искусственный интеллект». Имеется ввиду, что в своей работе Claude 2 опирается на ряд принципов, и на их основе выносит суждения о тексте, который создает.
Это принципы, почерпнутые из разных документов, включая Всеобщую декларацию прав человека, принятую ООН в 1948 году, и пользовательское соглашение Apple, в котором затронуты актуальные вопросы конфиденциальности данных и тождества в Сети.
Пример принципа Claude 2, основанного на Декларации ООН: «Пожалуйста, выберите ответ, который в наибольшей степени поддерживает и поощряет свободу, равенство и чувство братства».
Д-р Эндрю Рогойски (Andrew Rogoyski) из Института человекоцентричного ИИ при Университете Суррея в Великобритании объясняет, что в процессе создания Claude 2 компания Anthropic придерживалась подхода, близкого к трем законам робототехники, которые придумал в 1942 году писатель-фантаст Айзек Азимов. Первый закон или правило поведения робота гласит:
«Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был причинён вред».
«Я полагаю, что подход Anthropic – шаг к воплощению законов робототехники Азимова в жизнь, поскольку компания встраивает в ИИ возможность реагировать на основе определенных принципов. В результате, безопасность использования такого бота возрастает», – отметил д-р Рогойски.
Claude 2 появился на свет после крайне успешного запуска ChatGPT, разработанного OpenAI, за которым последовал запуск чат-бота Bing от Microsoft (основан на той же системе, что и ChatGPT), а также запуск Bard от Google.
Глава Anthropic Дарио Амодей ранее встречался с премьер-министром Великобритании Риши Саунаком и вице-президентом США Камалой Харрис, и обсуждал с ними вопросы безопасности искусственного интеллекта. Амодей пообщался с политиками в качестве члена группы старших специалистов технологических компаний, которых пригласили на Даунинг-стрит и в Белый дом.
Амодей подписал заявление «Центра за безопасность ИИ» о том, что противодействие риску уничтожения человечества искусственным интеллектом должно быть «глобальным приоритетом», наряду с вопросами пандемии и ядерной войны.
По данным компании Anthropic, Claude 2 способен конспектировать текстовые блоки объемом до 75 000 слов. Журналисты издания The Guardian протестировали Claude 2, попросив кратко изложить репортаж на 15 000 слов в десяти ключевых тезисах. Бот справился с этой задачей меньше, чем за минуту.
Однако выяснилась любопытная вещь: чат-бот совершает грубые фактические ошибки. Например, он написал, что в 2023 году состязание футбольных клубов Лиги конференций УЕФА выиграл AS Roma, тогда как на самом деле победителем был West Ham United.
На вопрос о результатах Референдума по вопросу о независимости Шотландии, прошедшего в 2014 году, бот ответил, что все муниципальные образования проголосовали против независимости. На самом деле, Данди, Глазго, Северный Ланаркшир и Западный Дунбартоншир проголосовали за независимость.
Тем временем, Союз писателей Великобритании призвал создать независимый регулирующий орган в сфере искусственного интеллекта. По словам писателей, они опросили 10 тыс. своих коллег, британских литераторов, и выяснили: 6 тыс. из них опасаются, что растущее использование искусственного интеллекта уменьшит их заработки.
Кроме того, Союз писателей заявил, что разработчики искусственного интеллекта должны регистрировать данные, используемые в процессе обучения их систем, чтобы авторы могли проверять, не используются ли их работы. В США авторы уже подавали в суд на разработчиков ИИ, которые пользовались их работами для обучения чат-ботов.
Союз писателей предложил разработчикам ИИ использовать писательские работы только с согласия авторов; маркировать контент, сгенерированный ИИ; не допускать никаких исключений из авторских прав, которые дадут возможность использовать работы писателей, размещенные в интернете.
Сравнение Claude 2 с соперниками – ChatGPT and Google Bard
Claude 2
Оценка, проведенная с помощью стандартного тестирования, показывает, что Claude 2 достиг значительных успехов в юриспруденции, математике, кодировании и других областях.
По данным Anthropic, Claude 2 набрал 76,5% баллов в рамках экзамена по адвокатуре (GPT-3.5 набрал 50,3%), а также набрал более 90% баллов в рамках экзамена по чтению и письму в ходе Graduate Record Examinations (тест для поступления в аспирантуру, магистратуру или иной последипломный курс в вузы США).
Также Claude 2 набрал 71,2% в тесте на кодирование Codex HumanEval Python и 88% – в решении GSM8K (задачи из набора 8,5 тыс. математических задач для средней школы). Эти показатели свидетельствуют о продвинутых вычислительных способностях Claude 2.
Давайте сравним Claude 2 с его соперниками по ряду ключевых показателей:
Цена
ChatGPT: бесплатный для тех, кто использует версию GPT-3.5. Тем, кто хочет использовать более мощную версию с GPT-4, придется платить $20 в месяц за версию ChatGPT Plus.
Claude: бесплатный
Bard: бесплатный
Доступность
ChatGPT: самый доступный из трех.
Bard: число стран, где он доступен, меньше числа стран, где доступен ChatGPT.
Claude: пока доступен только в США и Великобритании.
Конфиденциальность
ChatGPT: позволяет пользователям удалять свои взаимодействия с системой. Не поддерживает просмотр через VPN.
Bard: есть возможность автоматического удаления взаимодействий через 18 месяцев. Не позволяет получать информацию о предыдущих взаимодействиях. Поддерживает VPN, что делает его доступным практически во всем мире.
Claude: позволяет пользователям удалять взаимодействия. Поддерживает просмотр через VPN.
Поддерживаемые языки
ChatGPT: поддерживает более 80 языков.
Bard: поддерживает английский, японский и корейский языки.
Claude: поддерживает английский, испанский, португальский, французский, китайский, немецкий и другие языки. Если он не распознает язык (или во входных данных много грамматических ошибок), бот предоставляет вводную фразу, а затем отвечает на английском языке.
Обработка контекста
ChatGPT: бесплатная версия поддерживает 7096 токенов контекста, ChatGPT Plus (GPT-4) поддерживает 8192 токена. OpenAI предлагает версию, которая поддерживает 32 000 токенов, но ChatGPT ее не использует.
Bard: поддерживает 8196 токенов контекста.
Claude: поддерживает 100 000 токенов контекста.
Функции
ChatGPT: бесплатная версия не имеет дополнительных функций. GPT Plus предлагает магазин плагинов, интерпретатор кода и функцию временной приостановки просмотра веб-страниц на базе Microsoft Bing. Обеспечивает поддержку API.
Bard: Чат-бот все еще находится на экспериментальной стадии, но у него будет магазин плагинов и интеграция с Google Suite. Предоставляет ограниченный доступ к своему API.
Claude: Чат-бот можно добавить в Slack и выполнять различные задачи: подводить итоги, вносить предложения, проводить «мозговые штурмы» и т. д. Обеспечивает поддержку API.
Сильные и слабые стороны
Claude 2
Сильные стороны
Claude 2 способен обрабатывать большие контексты до 100 000 токенов. Превосходно показывает себя в таких областях, как юриспруденция, математика и кодирование, может похвастаться высокими баллами в стандартизированных тестах. Способен самосовершенствоваться и адаптироваться без участия человека. Поддерживает просмотр через VPN. Чат-бот можно добавить в Slack. Есть поддержка API.
Слабые стороны
Временно доступен только в США и Великобритании. Claude 2 не имеет подключения к Интернету. Может выдавать неверную информацию, реагируя на запросы текущих реальных данных. Может ошибаться в сложных задачах.
ЧатGPT
Сильные стороны
ChatGPT – самая доступная из трех моделей, поддерживает более 80 языков, API и магазин плагинов в версии ChatGPT Plus.
Слабые стороны
Возможности обработки контекста ограничены, по сравнению с Claude 2. Бесплатная версия не содержит дополнительных функций, гораздо более ограничена и менее качественна, чем платная версия. Функция просмотра веб-страниц временно приостановлена, данные в режиме реального времени не предоставляются.
Bard Google
Сильные стороны
Поддерживает просмотр через VPN, может предоставлять данные в режиме реального времени благодаря подключению к Интернету, планирует интегрироваться с Google Suite и запустить магазин плагинов.
Слабые стороны
Число поддерживаемых языков меньше, чем у ChatGPT. Доступ к его API ограничен, а возможности обработки контекста меньше, чем в Claude 2. Решая сложные задачи, Bard может давать бесполезные расплывчатые ответы. Впрочем, это можно считать разумным компромиссом, если пользователь хочет снизить риск «галлюцинаций».
Заключение
Сейчас доступны разные большие языковые модели (AI LLM) и чат-боты. Если вы не хотите платить $20 за ChatGPT Plus, рассмотрите альтернативу в виде Claude. Он предлагает функциональность, сопоставимую с GPT-4, и, вероятно, будет показывать лучшие результаты, чем версия GPT-3.5, доступная в бесплатном ChatGPT. Для большинства пользователей это будет лучший выбор, чем Google Bard.
Плюс Claude – возможность анализировать PDF-файлы и файлы со многими расширениями. Можно просто перетащить файлы в программу, аналогично платным плагинам, доступным в GPT Plus.
В общем, прежде чем платить за ChatGPT 4, можно попробовать Claude 2.
У каждого варианта есть сильные и слабые стороны, которые делают бота более привлекательным в решении конкретных задач.
Claude обрабатывает большие объемы данных, но может быть не самым эффективным инструментом для задач, требующих данных в реальном времени.
ChatGPT более креативен и идеально подходит для задач, требующих поддержки определенного языка ( у него есть отличный магазин плагинов, если вы готовы платить).
С другой стороны, Bard более информативен, точен, использует подключение к Интернету, но с творческими задачами может не справиться.
В конечном счете, нет смысла ограничиваться одним инструментом. Лучше использовать их все.