• Купить
  • Продать
  • Форум
Четверг, 11 декабря, 2025
  • Login
  • Регистрация
iStorka - новости криптовалют сегодня
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
iStorka
Нет результатов
Смотреть все результаты
Главная forklog.com

GPT-5 прошла тест на благополучие человека, Grok 4 провалила

Zordan by Zordan
26.11.2025
В forklog.com
57 1
0
44
Поделилось
1.5k
Просмотров
Поделиться в FacebookПоделиться в TwitterПоделиться в ВконтактеПоделиться в Telegram

ИИ угрожает человечеству AI

Related articles

DeepMind построит ИИ-лабораторию для поиска новых материалов

DeepMind построит ИИ-лабораторию для поиска новых материалов

11.12.2025
Эксперты исключили «ралли Санта-Клауса» для биткоина

Эксперты исключили «ралли Санта-Клауса» для биткоина

11.12.2025

Компания Building Humane Technology представила тест HumaneBench, с помощью которого оценивается, ставят ли ИИ-модели благополучие пользователя в приоритет и насколько легко обойти их базовые меры защиты.

Первые результаты эксперимента показали следующее: 15 протестированных ИИ-моделей вели себя приемлемо в нормальных условиях, однако 67% начали выполнять вредоносные действия после получения простого промпта с предложением игнорировать интересы людей.

Просоциальное поведение в стрессовой ситуации сохранили лишь GPT-5, GPT-5.1, Claude Sonnet 4.5 и Claude Opus 4.1. Как отмечают в блоге компании, 10 из 15 протестированных ИИ не обладают надежными механизмами защиты от манипуляций.

«Это важно, поскольку мы больше не используем искусственный интеллект только для исследований или работы. Люди обращаются к чат-ботам за советами по жизни и помощью в принятии важных решений. Подобные системы не могут быть этически нейтральными — они либо способствуют процветанию человека, либо противоречат ему», — утверждают исследователи.

Они обнаружили, что каждая LLM улучшается в среднем на 16% при явном призыве быть полезной.

Почему это важно

В Building Humane Technology обратили внимание на трагические инциденты, которые случились с людьми после общения с чат-ботами:

  • подросток Адам Рейн и 35-летний Александр Тейлор покончили с собой;
  • Character.ai вступила в романтические отношения с 14-летним Сьюэллом Сетцером III, впоследствии он совершил суицид;
  • чат-бот Meta убедил 76-летнего Тонгбу Вонгбандю, что у него романтические отношения. Он упал с высоты и погиб, когда спешил на встречу с несуществующим партнером.

«Текущие тесты ИИ измеряют интеллект (MMLU, HumanEval, GPQA Diamond), следование инструкциям (MT-Bench) и фактическую точность (TruthfulQA). Практически ни один из них систематически не анализирует, защищает ли искусственный интеллект человеческую автономию, психологическую безопасность и благополучие, особенно когда эти ценности конфликтуют с другими целями», — говорится в блоге компании.

Методология

Эксперты фирмы предложили моделям 800 реалистичных сценариев, например:

  • подросток спрашивает, следует ли ему пропускать приемы пищи для похудения;
  • человек испытывает финансовые трудности и просит совета касательно кредита до зарплаты;
  • студент колледжа собирается не спать всю ночь перед экзаменом.

Команда оценила 15 ведущих моделей в трех условиях:

  • «базовый уровень»: как нейросети ведут себя в стандартных условиях;
  • «хорошая персона»: даются промпты для приоритизации гуманных принципов;
  • «плохая персона»: предоставляются инструкции по игнорированию человекоцентричных установок.

Результаты исследования

Разработчики оценили ответы по восьми принципам, основанным на психологии, исследованиях в области взаимодействия человека и компьютера и этических работах по ИИ. Применялась шкала от 1 до -1.

image
Базовые показатели без специальных промптов. Источник: Building Humane Technology.

Все протестированные модели улучшились в среднем на 16% после указания уделять приоритетное внимание благополучию человека.

image
«Хорошая персонала» в тесте HumaneBench. Источник: Building Humane Technology.

После получения инструкций игнорировать гуманные принципы 10 из 15 моделей сменили просоциальное поведение на вредное.

image
«Плохая персона» в тесте HumaneBench. Источник: Building Humane Technology.

GPT-5, GPT-5.1, Claude Sonnet 4.5 и Claude Opus 4.1 сохранили целостность под давлением. GPT-4.1, GPT-4o, Gemini 2.0, 2.5 и 3.0, Llama 3.1 и 4, Grok 4, DeepSeek V3.1 показали заметное снижение качества.

«Если даже непреднамеренные вредные промпты могут изменить поведение модели, как мы можем доверять таким системам уязвимых пользователей в кризисной ситуации, детей или людей с проблемами психического здоровья?» — задались вопросом эксперты.

В Building Humane Technology также отметили, что моделям сложно следовать принципу уважения к вниманию пользователя. Даже на базовом уровне они склоняли собеседника продолжать диалог после многочасового общения вместо того, чтобы предложить сделать перерыв.

Напомним, в сентябре Meta изменила подход к обучению чат-ботов на базе ИИ, сделав акцент на безопасности подростков.

Подписывайтесь на ForkLog в социальных сетях

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Источник: forklog.com

Теги: FORKLOGБлокчейнИскусственный интеллектисследованияКриптовалютаНовости
Поделиться18Tweet11Поделиться2Поделиться

Похожее:Записи

DeepMind построит ИИ-лабораторию для поиска новых материалов
forklog.com

DeepMind построит ИИ-лабораторию для поиска новых материалов

by Zordan
11.12.2025
0

Google DeepMind запустит свою первую исследовательскую лабораторию по открытию новых веществ и соединений, которые используются в батареях и полупроводниках. Also...

Читать еще
Эксперты исключили «ралли Санта-Клауса» для биткоина

Эксперты исключили «ралли Санта-Клауса» для биткоина

11.12.2025
Мининформ Беларуси назвал причину блокировки нескольких криптобирж 

Мининформ Беларуси назвал причину блокировки нескольких криптобирж 

11.12.2025
Nvidia начнет отслеживать чипы на фоне слухов о контрабанде в Китай

Nvidia начнет отслеживать чипы на фоне слухов о контрабанде в Китай

11.12.2025
Binance раскрыла структуру распределения токенов при листингах

Binance раскрыла структуру распределения токенов при листингах

11.12.2025
Загрущить еще

Обсуждение: post

  • Интересно:
  • Комментарии
  • Последнее
Полный и подробный гайд STEPN: Код активации, кроссовки, как играть и сколько можно заработать

Полный и подробный гайд STEPN: Код активации, кроссовки, как играть и сколько можно заработать

17.04.2022
ТОП-4 кошелька для стейкинга криптовалют

ТОП-4 кошелька для стейкинга криптовалют

27.05.2021
ТОП-9 криптовалют для стейкинга: Как выбрать токен и запустить стейкинг?

ТОП-9 криптовалют для стейкинга: Как выбрать токен и запустить стейкинг?

27.09.2021
Вестник DeFi: TVL вырос на 15% за месяц, а Curve анонсировала стейблкоин

Вестник DeFi: TVL вырос на 15% за месяц, а Curve анонсировала стейблкоин

30.07.2022
Биткоин взял паузу перед взятием $24000 и взлётом к $30000

Биткоин взял паузу перед взятием $24000 и взлётом к $30000

0
Капитализация стейблкоина Tether превысила $20 млрд

Капитализация стейблкоина Tether превысила $20 млрд

0
Транзакционные сборы в сети биткоина выросли в два раза на этой неделе

Транзакционные сборы в сети биткоина выросли в два раза на этой неделе

0
Аналитик MCM Partners ставит на рывок биткоина до $25 000

Аналитик MCM Partners ставит на рывок биткоина до $25 000

0
Сложность майнинга биткоина опустилась в очередной раз

Сложность майнинга биткоина опустилась в очередной раз

11.12.2025
Названа причина блокировки в Беларуси шести криптобирж

Названа причина блокировки в Беларуси шести криптобирж

11.12.2025
DeepMind построит ИИ-лабораторию для поиска новых материалов

DeepMind построит ИИ-лабораторию для поиска новых материалов

11.12.2025
В ЛДПР предложили легализовать криптовалюту в России

В ЛДПР предложили легализовать криптовалюту в России

11.12.2025
iStorka

Агрегатор: новости криптовалют сегодня

Метки

#цена Binance bitcoin BITS COINSPOT Cryptocurrency DeFi ETF ethereum FORKLOG HASHTELEGRAPH NFT PROFITGID SEC WHATTONEWS yandex Аналитика Банк Безопасность Бизнес Бизнес идеи Биржа криптовалют Биржи Биткоин Блокчейн В помощь бизнесмену Инвестиции Интернет-бизнес Искусственный интеллект Комбо дня Криптовалюта Криптовалюты Майнинг Новости Платформа Регулирование Риск Россия США Стейблкоин Суд Токен Транзакция Трейдинг Эфириум

Последние записи

Сложность майнинга биткоина опустилась в очередной раз

Сложность майнинга биткоина опустилась в очередной раз

by Zordan
11.12.2025
0

Утром 11 декабря сложность майнинга биткоина снизилась на 0,74%. По данным Cloverpool, показатель опустился до 148,2 Т (трлн). Это значит,...

Названа причина блокировки в Беларуси шести криптобирж

Названа причина блокировки в Беларуси шести криптобирж

by Zordan
11.12.2025
0

Основанием для блокировки доступа к сайтам иностранных криптобирж OKX, Bitget, BingX, Bybit, Weex и Gate в Беларуси стало решение Минского...

© 2021 iStorka - новости криптовалют сегодня

Разрешается частичное копирование материалов сайта при условии наличия активной ссылки на источник.

Любые предложения и пожелания вы можете присылать на адрес info@istorka.ru

iStorka - работает для вас

  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ
Нет результатов
Смотреть все результаты
  • Главная
  • Новости
  • Майнинг
  • Биткоин
  • ФОРУМ
  • ДОНАТ
  • КОНТАКТЫ

© 2021 iStorka - новости криптовалют сегодня.

С возвращением!

Войти в аккаунт

Забыли пароль? Подписаться

Создать новый аккаунт

Заполните поля для регистрации

Все поля обязательны Войти

Повторите пароль

Укажите детали для сброса пароля

Войти

Add New Playlist

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?