Команда Сэма Альтмана (Sam Altman) пересмотрела подход к безопасности в ChatGPT: теперь нейросеть не верит дате рождения, указанной при регистрации. Вместо этого работает ИИ-анализатор, который сканирует цифрровой профиль юзера и пытается угадать, есть ли ему 18 лет.
Команда заявила, что механизм уже работает на всех стандартных аккаунтах.
Как работает мониторинг
Система оценивает совокупность косвенных признаков. В расчет берут время создания аккаунта, часы активности (сидит ли пользователь в чате по ночам или во время школьных уроков) и специфические паттерны общения. Этот массив данных сопоставляется с заявленным возрастом. Если модель заподозрит, что перед ней несовершеннолетний, или если данных для анализа недостаточно, аккаунт автоматически переводится в безопасный режим. Мнение самого пользователя система игнорирует.
Попавшие под подозрение учетные записи теряют доступ к генерации контента на острые темы. OpenAI составила список запрещенных направлений, опираясь на исследования детской психологии.
В стоп-лист вошли:
- Графическое насилие и жестокость.
- Сексуальные и романтические ролевые переписки.
- Сцены самоповреждения.
- Вирусные челленджи, поощряющие рискованное поведение.
- Темы, связанные с жесткими стандартами красоты и расстройствами пищевого поведения.
Также компания добавила инструменты родительского контроля, позволяющие принудительно отключать чат-бот в определенные часы.
KYC для разблокировки
Если алгоритм ошибся и записал взрослого в подростки, вернуть полный доступ можно только через верификацию личности. Здесь OpenAI пошла по пути криптобирж: для подтверждения возраста нужно пройти проверку через сервис Persona. Потребуется сделать селфи и предоставить документы.
В Евросоюзе функцию развернут в ближайшие недели с учетом местных законов о защите данных.
Читайте также:
- Как создать собственного ИИ-агента
- ИИ-аналитик Surf: новый конкурент ChatGPT в мире крипты привлек $15 млн
- Искусственный интеллект в белом халате: OpenAI запускает ChatGPT Health
Данный пост носит исключительно информационный характер и не является рекламой или инвестиционным советом. Пожалуйста, проводите собственное исследование, принимая какие-либо решения.
