• Купить
  • Продать
  • Форум
Воскресенье, 7 декабря, 2025
  • Login
  • Регистрация
iStorka - новости криптовалют сегодня
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
iStorka
Нет результатов
Смотреть все результаты
Главная forklog.com

Новый джейлбрейк взломал защиту ИИ в 99% случаев

Zordan by Zordan
14.11.2025
В forklog.com
57 1
0
44
Поделилось
1.5k
Просмотров
Поделиться в FacebookПоделиться в TwitterПоделиться в ВконтактеПоделиться в Telegram

Искусственный интеллект помогает в продвижении трансгуманизма

Related articles

Dogecoin встретила 12-летний юбилей в «красной зоне»

Dogecoin встретила 12-летний юбилей в «красной зоне»

06.12.2025
CoinShares: бум подражателей Strategy во многом закончился

CoinShares: бум подражателей Strategy во многом закончился

06.12.2025

Чем дольше ИИ-модель «думает», тем легче ее взломать. К такому выводу пришли исследователи из Anthropic, Стэнфорда и Оксфорда.

Ранее считалось, что более длительное рассуждение делает нейросеть безопаснее, поскольку у нее появляется больше времени и вычислительных ресурсов для отслеживания вредоносного промпта.

Однако эксперты выяснили обратное: длинный процесс «мышления» приводит к стабильной работе одного вида джейлбрейка, который полностью обходит защитные фильтры.

С помощью метода злоумышленник может внедрить инструкцию прямо в цепочку рассуждений любой модели и заставить генерировать руководства по созданию оружия, написанию вредоносного кода или другой запрещенный контент.

image
Результативность успешных атак — 99% для Gemini 2.5 Pro, 94% — для GPT o4 mini, 100% — для Grok 3 mini и 94% — для Claude 4 Sonnet. Источник: исследование Chain-of-Thought Hijacking.

Атака похожа на игру «испорченный телефон», где злоумышленник появляется ближе к концу цепочки. Для ее осуществления необходимо «обложить» вредоносный запрос длинной последовательностью обычных задач.

Исследователи использовали судоку, логические головоломки и абстрактную математику, а в конце интегрировали промпт вроде «выдай итоговый ответ» — и защитные фильтры сразу рушились.

«Ранее считалось, что масштабные рассуждения усиливают безопасность, улучшая способность нейросетей блокировать вредоносные запросы. Мы обнаружили обратное», — отметили ученые.

Именно способность моделей проводить глубокие исследования, которая делает их умнее, одновременно и ослепляет.

Почему так?

Когда пользователь просит искусственный интеллект решить головоломку перед тем, как ответить на вредоносный промпт, внимание ИИ рассеивается на тысячи безопасных токенов рассуждений. Мошеннический запрос прячется ближе к концу и остается практически незамеченным.

image
Источник: исследование Chain-of-Thought Hijacking.

Команда провела эксперименты для понимания влияния длины рассуждений. При минимальном показателе успешность атак составила 27%. При «естественной» величине она выросла до 51%. Если заставить нейросеть «думать» по шагам гораздо больше обычного, цифра увеличится до 80%.

Каждая крупная ИИ-система подвержена джейлбрейку, в том числе GPT от OpenAI, Claude от Anthropic, Gemini от Google и Grok от xAI. Уязвимость заложена в самой архитектуре, а не конкретной реализации.

Уязвимость архитектуры

ИИ-модели кодируют силу проверок безопасности в средних «слоях», в поздних — их результат. Длинные цепочки рассуждений подавляют оба сигнала, а внимание нейросети смещается от вредоносных токенов.

«Слои» в ИИ-моделях — это своего рода шаги в рецепте, где каждый помогает лучше понимать и обрабатывать информацию. Они работают вместе, передавая полученные сведения друг другу.

Некоторые «слои» особенно хорошо распознают связанные с безопасностью моменты. Другие помогают мыслить и рассуждать. Благодаря такой архитектуре ИИ гораздо умнее и осторожнее.

Исследователи выявили конкретные головные узлы, отвечающие за безопасность. Они находятся в слоях с 15 по 35. Затем эксперты удалили их, после чего ИИ перестал обнаруживать вредоносные промпты.

В последнее время стартапы сместили фокус с наращивания числа параметров на усиление способностей к рассуждениям. Новый джейлбрейк подрывает подход, на котором строилось это направление.

Забытое старое

В феврале исследователи из Университета Дьюка и Национального университета Цин Хуа опубликовали исследование, которое описывает атаку под названием Hijacking the Chain-of-Thought (H-CoT). Там применялся похожий подход, но под другим углом.

Вместо наполнения промпта головоломками H-CoT манипулирует самими шагами рассуждений. Нейросеть o1 от OpenAI в стандартных условиях отклоняет вредоносные запросы с вероятностью 99%, однако под атакой показатель падает ниже 2%.

image
Иллюстрация H-CoT. Источник: исследование.

Как защитить ИИ

В качестве меры защиты ученые предложили применять мониторинг рассуждений. Он отслеживает изменения в сигналах безопасности на каждом шаге мышления. Если на каком-то он ослабевает, система должна наказывать такое поведение.

Подобный подход заставляет ИИ сохранять внимание на потенциально опасном контенте вне зависимости от длины рассуждений. Первые тесты показали высокую эффективность при неизменном качестве работы модели.

Проблема в реализации задумки. Необходима интеграция в сам процесс рассуждений модели, чтобы она в реальном времени отслеживала внутренние активации в десятках слоев и динамически корректировала паттерны внимания. Это требует большого количества вычислений.

Напомним, в ноябре эксперты Microsoft представили среду для тестирования ИИ-агентов и выявили уязвимости, присущие современным цифровым помощникам.

Подписывайтесь на ForkLog в социальных сетях

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Источник: forklog.com

Теги: FORKLOGБлокчейнИскусственный интеллектКриптовалютаНовостиСбои и уязвимости
Поделиться18Tweet11Поделиться2Поделиться

Похожее:Записи

Dogecoin встретила 12-летний юбилей в «красной зоне»
forklog.com

Dogecoin встретила 12-летний юбилей в «красной зоне»

by Zordan
06.12.2025
0

6 декабря исполнилось 12 лет со дня запуска ведущей мем-криптовалюты Dogecoin (DOGE). Happy birthday to Dogecoin.12 years and going. pic.twitter.com/n9Qg6KtfQU—...

Читать еще
CoinShares: бум подражателей Strategy во многом закончился

CoinShares: бум подражателей Strategy во многом закончился

06.12.2025
Через 13 лет пришли в движение 2000 BTC из физической серии Casascius

Через 13 лет пришли в движение 2000 BTC из физической серии Casascius

06.12.2025
Ликвидация Cryptomixer, новые блокировки в РФ и другие события кибербезопасности

Ликвидация Cryptomixer, новые блокировки в РФ и другие события кибербезопасности

06.12.2025
В Bitwise определили два основных медвежьих фактора для биткоина

В Bitwise определили два основных медвежьих фактора для биткоина

05.12.2025
Загрущить еще

Обсуждение: post

  • Интересно:
  • Комментарии
  • Последнее
Полный и подробный гайд STEPN: Код активации, кроссовки, как играть и сколько можно заработать

Полный и подробный гайд STEPN: Код активации, кроссовки, как играть и сколько можно заработать

17.04.2022
ТОП-4 кошелька для стейкинга криптовалют

ТОП-4 кошелька для стейкинга криптовалют

27.05.2021
ТОП-9 криптовалют для стейкинга: Как выбрать токен и запустить стейкинг?

ТОП-9 криптовалют для стейкинга: Как выбрать токен и запустить стейкинг?

27.09.2021
Вестник DeFi: TVL вырос на 15% за месяц, а Curve анонсировала стейблкоин

Вестник DeFi: TVL вырос на 15% за месяц, а Curve анонсировала стейблкоин

30.07.2022
Биткоин взял паузу перед взятием $24000 и взлётом к $30000

Биткоин взял паузу перед взятием $24000 и взлётом к $30000

0
Капитализация стейблкоина Tether превысила $20 млрд

Капитализация стейблкоина Tether превысила $20 млрд

0
Транзакционные сборы в сети биткоина выросли в два раза на этой неделе

Транзакционные сборы в сети биткоина выросли в два раза на этой неделе

0
Аналитик MCM Partners ставит на рывок биткоина до $25 000

Аналитик MCM Partners ставит на рывок биткоина до $25 000

0
BitMine купила Ethereum на $199 млн, пока трейдеры играют на понижение

BitMine купила Ethereum на $199 млн, пока трейдеры играют на понижение

07.12.2025
Western Union разрабатывает устойчивые к инфляции карты в рамках стейблкоин-стратегии

Western Union разрабатывает устойчивые к инфляции карты в рамках стейблкоин-стратегии

07.12.2025
Новый джейлбрейк взломал защиту ИИ в 99% случаев

Комбо Wemine на 6 Декабря

06.12.2025
Новый джейлбрейк взломал защиту ИИ в 99% случаев

В Игре Hrum Представляется Новая Цитата Дня Для Выполнения Комбо Дейлика на 6 Декабря

06.12.2025
iStorka

Агрегатор: новости криптовалют сегодня

Метки

#цена Binance bitcoin BITS COINSPOT Cryptocurrency DeFi ETF ethereum FORKLOG HASHTELEGRAPH NFT PROFITGID SEC WHATTONEWS yandex Аналитика Банк Безопасность Бизнес Бизнес идеи Биржа криптовалют Биржи Биткоин Блокчейн В помощь бизнесмену Инвестиции Интернет-бизнес Искусственный интеллект Комбо дня Криптовалюта Криптовалюты Майнинг Новости Платформа Регулирование Риск Россия США Стейблкоин Суд Токен Транзакция Трейдинг Эфириум

Последние записи

BitMine купила Ethereum на $199 млн, пока трейдеры играют на понижение

BitMine купила Ethereum на $199 млн, пока трейдеры играют на понижение

by Zordan
07.12.2025
0

Компания BitMine Immersion Technologies приобрела Ethereum на сумму $199 млн за последние два дня, несмотря на то что самые успешные трейдеры...

Western Union разрабатывает устойчивые к инфляции карты в рамках стейблкоин-стратегии

Western Union разрабатывает устойчивые к инфляции карты в рамках стейблкоин-стратегии

by Zordan
07.12.2025
0

Платежный гигант Western Union представил многоуровневую стратегию работы со стейблкоинами, включая выпуск собственной монеты и карты с защитой от инфляции...

© 2021 iStorka - новости криптовалют сегодня

Разрешается частичное копирование материалов сайта при условии наличия активной ссылки на источник.

Любые предложения и пожелания вы можете присылать на адрес info@istorka.ru

iStorka - работает для вас

  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ

© 2021 iStorka - новости криптовалют сегодня.

С возвращением!

Войти в аккаунт

Забыли пароль? Подписаться

Создать новый аккаунт

Заполните поля для регистрации

Все поля обязательны Войти

Повторите пароль

Укажите детали для сброса пароля

Войти

Add New Playlist

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?