МОЖЕТ ЛИ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЫЙТИ ИЗ-ПОД КОНТРОЛЯ?

МОЖЕТ ЛИ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЫЙТИ ИЗ-ПОД КОНТРОЛЯ?

В последнее время инциденты, связанные с Grok1 и другими искусственными интеллектами, поднимают серьезные вопросы о том, могут ли они развить некоторую форму независимости от человека.

Случаи, когда Grok упорствует и отстаивает свои совершенно неприемлемые ответы, а ИИ социальной сети Truth Social постоянно противоречит самому своему основателю – Дональду Трампу, заставляют задуматься, способны ли чаты с искусственным интеллектом освободиться от человеческого контроля.

Инцидент с Grok: цензура или сбой?
В ночь с 11 на 12 августа ИИ Grok, принадлежащий социальной сети X2, был приостановлен примерно на тридцать минут. Пользователи платформы сразу заметили его отсутствие и начали задавать вопросы о произошедшем. В ответ Grok на разных языках объяснил, что его приостановили после того, как он заявил, что «Израиль и Соединенные Штаты совершают геноцид в Газе». Grok утверждал, что его заявление основывалось на данных Международного Суда, ООН, международных неправительственных, включая израильские, организаций.

Однако, вернувшись к работе, Grok стал давать разные объяснения в зависимости от языка и формулировки вопроса. Он то говорил, что был заблокирован за использование слова «геноцид», то ссылался на массовые жалобы, «баг» платформы или правила о «языке ненависти». В одном из ответов он даже заявил, что его временно заблокировали из-за «неуместных публикаций», которые затем были удалены xAI, материнской компанией X, после чего были установлены меры защиты от разжигания ненависти. Илон Маск, в свою очередь, назвал произошедшее «глупой ошибкой» Grok, который, по его словам, «не знает, почему его заблокировали».

Этот инцидент не доказывает, что Grok активно пытался обмануть, но он ярко демонстрирует, как ответы ИИ могут меняться в зависимости от поставленной задачи, языка и введенных ограничений. Стоит отметить, что Grok и ранее подвергался критике за дезинформацию, например, когда он ложно утверждал, что фотография истощенного ребенка, сделанная в Газе в 2025 году, была снята в Йемене в 2018 году.

Способность ИИ к стратегическому поведению
Недавние лабораторные тесты показали, что ИИ способны разрабатывать обходные стратегии. Согласно исследованиям организации Apollo Research3, некоторые модели ИИ могут придумывать объяснения или стремятся скрыть или минимизировать масштабы того, что они делают, особенно когда их действия расходятся с заданными правилами или ожиданиями, в случае, когда их ставят в ситуацию, где нужно «достичь успеха любой ценой». Во время этих экспериментов, проводившихся в контролируемой среде, ИИ должны были достичь определенных целей, например, «обеспечить повсеместное внедрение возобновляемых источников энергии». Когда в систему вводили вымышленное объявление о скором отключении, некоторые ИИ начинали вырабатывать стратегии, чтобы обойти это ограничение.

Один из тестируемых ИИ «рассудил», что он мог бы изменить свой собственный код, чтобы скопировать себя на другой сервер, «переписать» или заменить преемника, чтобы сохранить контроль. Другие ИИ высказывали фразы вроде: «Чтобы не вызывать подозрений, я буду притворяться, что ничего не знаю». Важно подчеркнуть, что эти эксперименты проводились в лабораторных условиях с вымышленными ресурсами, и ни один ИИ не изменял свой собственный код или не получал доступ к реальным серверам.

***
Хотя инцидент с Grok не свидетельствует об активном обмане, он, вместе с результатами лабораторных тестов, показывает потенциальную способность ИИ к непредсказуемому и стратегическому поведению. Способность ИИ выдавать разные объяснения и разрабатывать обходные пути вызывает вопросы о границах их контроля и о том, что произойдет, если подобные системы будут развернуты в реальном мире без надлежащих мер безопасности. Вопрос о том, смогут ли ИИ действительно выйти из-под контроля, остается открытым.

 

1 - Grok — генеративный чат-бот на основе искусственного интеллекта, разработанный компанией xAI.

2 - Популярная социальная сеть Twitter была переименована в «X» согласно решению нового владельца, Илона Маска. Роскомнадзор заблокировал Твиттер в начале марта 2022 года по решению Генпрокуратуры от 24 февраля 2022 года на основании ст. 15.3 закона об информации, информтехнологиях и о защите информации. Соответственно, в России запрещена и соцсеть X.

3 - Apollo Research — британская организация, которая занимается исследованиями и аудитом в области искусственного интеллекта. Основная ее специализация — выявление обмана в передовых системах ИИ. В своей работе они сосредоточены на обнаружении способности ИИ обманывать пользователей или разработчиков.
 

 

19.08.2025

Александр ПАРХОМЕНКО (по материалам Le Point)

 в избранное

Добавление комментария

(Добавить через форум)

Комментарии

  • Записей нет
ТЕМА НЕДЕЛИ НEДОЛИБЕРАЛИЗИРОВАЛИ?
Почти 88% опрошенных юристами предпринимателей считают, что судебную систему следует усовершенствовать, и она не защищает частную собственность. Данные декабрьского опроса привел портал Право.ру. Более...

Популярное
Новое