МОЖЕТ ЛИ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЫЙТИ ИЗ-ПОД КОНТРОЛЯ?

МОЖЕТ ЛИ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЫЙТИ ИЗ-ПОД КОНТРОЛЯ?

В последнее время инциденты, связанные с Grok1 и другими искусственными интеллектами, поднимают серьезные вопросы о том, могут ли они развить некоторую форму независимости от человека.

Случаи, когда Grok упорствует и отстаивает свои совершенно неприемлемые ответы, а ИИ социальной сети Truth Social постоянно противоречит самому своему основателю – Дональду Трампу, заставляют задуматься, способны ли чаты с искусственным интеллектом освободиться от человеческого контроля.

Инцидент с Grok: цензура или сбой?
В ночь с 11 на 12 августа ИИ Grok, принадлежащий социальной сети X2, был приостановлен примерно на тридцать минут. Пользователи платформы сразу заметили его отсутствие и начали задавать вопросы о произошедшем. В ответ Grok на разных языках объяснил, что его приостановили после того, как он заявил, что «Израиль и Соединенные Штаты совершают геноцид в Газе». Grok утверждал, что его заявление основывалось на данных Международного Суда, ООН, международных неправительственных, включая израильские, организаций.

Однако, вернувшись к работе, Grok стал давать разные объяснения в зависимости от языка и формулировки вопроса. Он то говорил, что был заблокирован за использование слова «геноцид», то ссылался на массовые жалобы, «баг» платформы или правила о «языке ненависти». В одном из ответов он даже заявил, что его временно заблокировали из-за «неуместных публикаций», которые затем были удалены xAI, материнской компанией X, после чего были установлены меры защиты от разжигания ненависти. Илон Маск, в свою очередь, назвал произошедшее «глупой ошибкой» Grok, который, по его словам, «не знает, почему его заблокировали».

Этот инцидент не доказывает, что Grok активно пытался обмануть, но он ярко демонстрирует, как ответы ИИ могут меняться в зависимости от поставленной задачи, языка и введенных ограничений. Стоит отметить, что Grok и ранее подвергался критике за дезинформацию, например, когда он ложно утверждал, что фотография истощенного ребенка, сделанная в Газе в 2025 году, была снята в Йемене в 2018 году.

Способность ИИ к стратегическому поведению
Недавние лабораторные тесты показали, что ИИ способны разрабатывать обходные стратегии. Согласно исследованиям организации Apollo Research3, некоторые модели ИИ могут придумывать объяснения или стремятся скрыть или минимизировать масштабы того, что они делают, особенно когда их действия расходятся с заданными правилами или ожиданиями, в случае, когда их ставят в ситуацию, где нужно «достичь успеха любой ценой». Во время этих экспериментов, проводившихся в контролируемой среде, ИИ должны были достичь определенных целей, например, «обеспечить повсеместное внедрение возобновляемых источников энергии». Когда в систему вводили вымышленное объявление о скором отключении, некоторые ИИ начинали вырабатывать стратегии, чтобы обойти это ограничение.

Один из тестируемых ИИ «рассудил», что он мог бы изменить свой собственный код, чтобы скопировать себя на другой сервер, «переписать» или заменить преемника, чтобы сохранить контроль. Другие ИИ высказывали фразы вроде: «Чтобы не вызывать подозрений, я буду притворяться, что ничего не знаю». Важно подчеркнуть, что эти эксперименты проводились в лабораторных условиях с вымышленными ресурсами, и ни один ИИ не изменял свой собственный код или не получал доступ к реальным серверам.

***
Хотя инцидент с Grok не свидетельствует об активном обмане, он, вместе с результатами лабораторных тестов, показывает потенциальную способность ИИ к непредсказуемому и стратегическому поведению. Способность ИИ выдавать разные объяснения и разрабатывать обходные пути вызывает вопросы о границах их контроля и о том, что произойдет, если подобные системы будут развернуты в реальном мире без надлежащих мер безопасности. Вопрос о том, смогут ли ИИ действительно выйти из-под контроля, остается открытым.

 

1 - Grok — генеративный чат-бот на основе искусственного интеллекта, разработанный компанией xAI.

2 - Популярная социальная сеть Twitter была переименована в «X» согласно решению нового владельца, Илона Маска. Роскомнадзор заблокировал Твиттер в начале марта 2022 года по решению Генпрокуратуры от 24 февраля 2022 года на основании ст. 15.3 закона об информации, информтехнологиях и о защите информации. Соответственно, в России запрещена и соцсеть X.

3 - Apollo Research — британская организация, которая занимается исследованиями и аудитом в области искусственного интеллекта. Основная ее специализация — выявление обмана в передовых системах ИИ. В своей работе они сосредоточены на обнаружении способности ИИ обманывать пользователей или разработчиков.
 

 

19.08.2025

Александр ПАРХОМЕНКО (по материалам Le Point)

 в избранное

Добавление комментария

(Добавить через форум)

Комментарии

  • Записей нет
ТЕМА НЕДЕЛИ НEДОЛИБЕРАЛИЗИРОВАЛИ?
Почти 88% опрошенных юристами предпринимателей считают, что судебную систему следует усовершенствовать, и она не защищает частную собственность. Данные декабрьского опроса привел портал Право.ру. Более...

Популярное
Новое
  • Рубен Маркарьян: Приговоры в отношении предпринимателей находятся в зоне внимания властей Рубен Маркарьян: Приговоры в отношении предпринимателей находятся в зоне внимания властей
    Газета «Коммерсантъ» рассказала о деле Николая Тихоновца, известном читателям ЭСМИ «ЗАКОНИЯ» из журналистского расследования «Пермский захват». Владелец сети заправок...
  • НEДОЛИБЕРАЛИЗИРОВАЛИ? НEДОЛИБЕРАЛИЗИРОВАЛИ?
    Почти 88% опрошенных юристами предпринимателей считают, что судебную систему следует усовершенствовать, и она не защищает частную собственность. Данные декабрьского опроса привел портал Право.ру. Более...
  • Правозащита online: Как владельцам квартир не потерять съемщиков и плату за аренду в пандемию? Правозащита online: Как владельцам квартир не потерять съемщиков и плату за аренду в пандемию?
    Рынок аренды жилья ожидает существенное проседание в части спроса, отметила в интервью порталу «ЗАКОНИЯ» главный юрисконсульт проектов судебной практики Ольга Старых.
  • ТРУДОВОЙ ПЕРЕКОС ТРУДОВОЙ ПЕРЕКОС
    Перекос в трудовых спорах в сторону защиты «слабой» стороны – работника вот уже почти 15 лет является одним из общих мест правосудия. Причем, зафиксированным непосредственно в нормах закона. Например,...
  • Правовое государство  (Детективная сказка) Правовое государство (Детективная сказка)
    1.- Ночью кто-то убил бабку Парасью. Поленом по голове. И надругался над покойной. Не ты? - грозно спросил Воевода. 
    Добрыня исподлобья бросил на Воеводу удивлённый взгляд. 
    - Я был...
  • СУД, У НАС ОТМЕНА! СУД, У НАС ОТМЕНА!
    Отмена судебных решений – это установление справедливости или результат настырных попыток добиться своего, «прокручивая» маховик судебной триады? На площадках адвокатских сообществ встречаются просто уникальные...
  • Алексей Макаркин. Первый вице-президент Фонда «ЦЕНТР ПОЛИТИЧЕСКИХ ТЕХНОЛОГИЙ». Алексей Макаркин. Первый вице-президент Фонда «ЦЕНТР ПОЛИТИЧЕСКИХ ТЕХНОЛОГИЙ».
    Интересный нравственный критерий, серьезно подрывающий основы правовой грамотности – отсутствие доверия – обозначился в выступлении первого вице-президента Фонда «ЦЕНТР ПОЛИТИЧЕСКИХ ТЕХНОЛОГИЙ» Алексея...
  • АНТИДЕМОГРАФИЧСКИЕ СНТ АНТИДЕМОГРАФИЧСКИЕ СНТ
    «Как противостоять поборам и завышению членских взносов в СНТ?!» – с таким вопросом сразу три семьи обратились к главному редактору ЭСМИ «ЗАКОНИЯ» Рубену Маркарьяну на его лекциях в рамках Всероссийской...
  • НИЖЕГОРОДСКИЙ СЛЕДСТВЕННЫЙ МИКС НИЖЕГОРОДСКИЙ СЛЕДСТВЕННЫЙ МИКС
    В этом деле «прекрасно» все: от такой «малости», как переписывание карандашиком на папке статей обвинения без положенного по УПК РФ закрытия одного и возбуждения другого дела, до того, что по всем законам...