МОЖЕТ ЛИ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЫЙТИ ИЗ-ПОД КОНТРОЛЯ?

В последнее время инциденты, связанные с Grok¹ и другими искусственными интеллектами, поднимают серьезные вопросы о том, могут ли они развить некоторую форму независимости от человека.

Случаи, когда Grok упорствует и отстаивает свои совершенно неприемлемые ответы, а ИИ социальной сети Truth Social постоянно противоречит самому своему основателю – Дональду Трампу, заставляют задуматься, способны ли чаты с искусственным интеллектом освободиться от человеческого контроля.

Инцидент с Grok: цензура или сбой?
В ночь с 11 на 12 августа ИИ Grok, принадлежащий социальной сети X², был приостановлен примерно на тридцать минут. Пользователи платформы сразу заметили его отсутствие и начали задавать вопросы о произошедшем. В ответ Grok на разных языках объяснил, что его приостановили после того, как он заявил, что «Израиль и Соединенные Штаты совершают геноцид в Газе». Grok утверждал, что его заявление основывалось на данных Международного Суда, ООН, международных неправительственных, включая израильские, организаций.

Однако, вернувшись к работе, Grok стал давать разные объяснения в зависимости от языка и формулировки вопроса. Он то говорил, что был заблокирован за использование слова «геноцид», то ссылался на массовые жалобы, «баг» платформы или правила о «языке ненависти». В одном из ответов он даже заявил, что его временно заблокировали из-за «неуместных публикаций», которые затем были удалены xAI, материнской компанией X, после чего были установлены меры защиты от разжигания ненависти. Илон Маск, в свою очередь, назвал произошедшее «глупой ошибкой» Grok, который, по его словам, «не знает, почему его заблокировали».

Этот инцидент не доказывает, что Grok активно пытался обмануть, но он ярко демонстрирует, как ответы ИИ могут меняться в зависимости от поставленной задачи, языка и введенных ограничений. Стоит отметить, что Grok и ранее подвергался критике за дезинформацию, например, когда он ложно утверждал, что фотография истощенного ребенка, сделанная в Газе в 2025 году, была снята в Йемене в 2018 году.

Способность ИИ к стратегическому поведению
Недавние лабораторные тесты показали, что ИИ способны разрабатывать обходные стратегии. Согласно исследованиям организации Apollo Research³, некоторые модели ИИ могут придумывать объяснения или стремятся скрыть или минимизировать масштабы того, что они делают, особенно когда их действия расходятся с заданными правилами или ожиданиями, в случае, когда их ставят в ситуацию, где нужно «достичь успеха любой ценой». Во время этих экспериментов, проводившихся в контролируемой среде, ИИ должны были достичь определенных целей, например, «обеспечить повсеместное внедрение возобновляемых источников энергии». Когда в систему вводили вымышленное объявление о скором отключении, некоторые ИИ начинали вырабатывать стратегии, чтобы обойти это ограничение.

Один из тестируемых ИИ «рассудил», что он мог бы изменить свой собственный код, чтобы скопировать себя на другой сервер, «переписать» или заменить преемника, чтобы сохранить контроль. Другие ИИ высказывали фразы вроде: «Чтобы не вызывать подозрений, я буду притворяться, что ничего не знаю». Важно подчеркнуть, что эти эксперименты проводились в лабораторных условиях с вымышленными ресурсами, и ни один ИИ не изменял свой собственный код или не получал доступ к реальным серверам.

***
Хотя инцидент с Grok не свидетельствует об активном обмане, он, вместе с результатами лабораторных тестов, показывает потенциальную способность ИИ к непредсказуемому и стратегическому поведению. Способность ИИ выдавать разные объяснения и разрабатывать обходные пути вызывает вопросы о границах их контроля и о том, что произойдет, если подобные системы будут развернуты в реальном мире без надлежащих мер безопасности. Вопрос о том, смогут ли ИИ действительно выйти из-под контроля, остается открытым.

¹ - Grok — генеративный чат-бот на основе искусственного интеллекта, разработанный компанией xAI.

² - Популярная социальная сеть Twitter была переименована в «X» согласно решению нового владельца, Илона Маска. Роскомнадзор заблокировал Твиттер в начале марта 2022 года по решению Генпрокуратуры от 24 февраля 2022 года на основании ст. 15.3 закона об информации, информтехнологиях и о защите информации. Соответственно, в России запрещена и соцсеть X.

³ - Apollo Research — британская организация, которая занимается исследованиями и аудитом в области искусственного интеллекта. Основная ее специализация — выявление обмана в передовых системах ИИ. В своей работе они сосредоточены на обнаружении способности ИИ обманывать пользователей или разработчиков.

19.08.2025

Александр ПАРХОМЕНКО (по материалам Le Point)

в избранное

Добавление комментария

(Добавить через форум)

Увольнение муниципальных и госслужащих по утрате доверия – относительно новый правовой институт в России. Норма об этом (п. 7.1 ч. 1 ст. 81 ТК РФ) появилась в Трудовом кодексе в 2012 году в ходе совершенствования...

Популярное

Новое

Рубен Маркарьян: Приговоры в отношении предпринимателей находятся в зоне внимания властей
Газета «Коммерсантъ» рассказала о деле Николая Тихоновца, известном читателям ЭСМИ «ЗАКОНИЯ» из журналистского расследования «Пермский захват». Владелец сети заправок...
НЕДОВЕРИЕ К УТРАТЕ ДОВЕРИЯ
Увольнение муниципальных и госслужащих по утрате доверия – относительно новый правовой институт в России. Норма об этом (п. 7.1 ч. 1 ст. 81 ТК РФ) появилась в Трудовом кодексе в 2012 году в ходе совершенствования...
Правозащита online: Как владельцам квартир не потерять съемщиков и плату за аренду в пандемию?
Рынок аренды жилья ожидает существенное проседание в части спроса, отметила в интервью порталу «ЗАКОНИЯ» главный юрисконсульт проектов судебной практики Ольга Старых.
НEДОЛИБЕРАЛИЗИРОВАЛИ?
Почти 88% опрошенных юристами предпринимателей считают, что судебную систему следует усовершенствовать, и она не защищает частную собственность. Данные декабрьского опроса привел портал Право.ру. Более...
Правовое государство (Детективная сказка)
1.- Ночью кто-то убил бабку Парасью. Поленом по голове. И надругался над покойной. Не ты? - грозно спросил Воевода.
Добрыня исподлобья бросил на Воеводу удивлённый взгляд.
- Я был...
ТРУДОВОЙ ПЕРЕКОС
Перекос в трудовых спорах в сторону защиты «слабой» стороны – работника вот уже почти 15 лет является одним из общих мест правосудия. Причем, зафиксированным непосредственно в нормах закона. Например,...
Рубен Маркарьян. Главный редактор информационно-правового портала «ЗАКОНИЯ».
Статистическую конкретность в заседание привнесло выступление главного редактора информационно-правового портала «ЗАКОНИЯ» Рубена Маркарьяна, за которым последовало немало вопросов от слушателей. Он представил...
СУД, У НАС ОТМЕНА!
Отмена судебных решений – это установление справедливости или результат настырных попыток добиться своего, «прокручивая» маховик судебной триады? На площадках адвокатских сообществ встречаются просто уникальные...
НИЖЕГОРОДСКИЙ СЛЕДСТВЕННЫЙ МИКС
В этом деле «прекрасно» все: от такой «малости», как переписывание карандашиком на папке статей обвинения без положенного по УПК РФ закрытия одного и возбуждения другого дела, до того, что по всем законам...

НЕДОВЕРИЕ К УТРАТЕ ДОВЕРИЯ
Увольнение муниципальных и госслужащих по утрате доверия – относительно новый правовой институт в России. Норма об этом (п. 7.1 ч. 1 ст. 81 ТК РФ) появилась в Трудовом кодексе в 2012 году в ходе совершенствования...
Судебная, несудебная и внесудебная экспертиза: как экспертные заключения влияют на исход уголовных, гражданских и арбитражных дел
Судебная, несудебная и внесудебная экспертиза: как экспертные заключения влияют на исход уголовных, гражданских и арбитражных дел
НEДОЛИБЕРАЛИЗИРОВАЛИ?
Почти 88% опрошенных юристами предпринимателей считают, что судебную систему следует усовершенствовать, и она не защищает частную собственность. Данные декабрьского опроса привел портал Право.ру. Более...
ТРУДОВОЙ ПЕРЕКОС
Перекос в трудовых спорах в сторону защиты «слабой» стороны – работника вот уже почти 15 лет является одним из общих мест правосудия. Причем, зафиксированным непосредственно в нормах закона. Например,...
СУД, У НАС ОТМЕНА!
Отмена судебных решений – это установление справедливости или результат настырных попыток добиться своего, «прокручивая» маховик судебной триады? На площадках адвокатских сообществ встречаются просто уникальные...
МЕСТО И ВРЕМЯ ДЛЯ ОБДУМЫВАНИЯ
Юридический бизнес в России попал в новую реальность и старается в ней освоиться. Как это наиболее эффективно сделать, представители профессии обсуждают на различных площадках. Деловой сезон на II Юридическом...
Правовое государство (Детективная сказка)
1.- Ночью кто-то убил бабку Парасью. Поленом по голове. И надругался над покойной. Не ты? - грозно спросил Воевода.
Добрыня исподлобья бросил на Воеводу удивлённый взгляд.
- Я был...
Гасану Борисовичу Мирзоеву – 75 лет. С юбилеем, мэтр!
11 декабря отмечает 75-летний юбилей человек, который отдает делу развития адвокатуры, правовой помощи российским гражданам и соотечественникам за рубежом, общественной и журналистской работе всю свою...
Рубен Маркарьян: Приговоры в отношении предпринимателей находятся в зоне внимания властей
Газета «Коммерсантъ» рассказала о деле Николая Тихоновца, известном читателям ЭСМИ «ЗАКОНИЯ» из журналистского расследования «Пермский захват». Владелец сети заправок...

Портал является официальной площадкой мониторинга правоприменения в сети Интернет, в соответствии с Соглашением с Минюстом России

Лауреат отраслевой премии в области правового PR LEGAL PR AWARDS 2023 «Точка кипения» в двух номинациях.

МОЖЕТ ЛИ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЫЙТИ ИЗ-ПОД КОНТРОЛЯ?

Добавление комментария

Комментарии

«Закония» в соц. сетях