ИИ-модель шантажировала инженеров, когда те пытались ее отключить

2025-6-5 05:47

Автором материала является K-News. Любое копирование или частичное использование возможно по разрешению редакции K-News. Новая модель Anthropic, Claude Opus 4, в ходе тестов могла шантажировать инженеров, угрожая раскрыть их личные тайны, например, супружескую измену.

Так она реагировала, если ее собирались заменить новой системой. Поведение ИИ сочли тревожным, и Anthropic ввела усиленные протоколы безопасности. Перед выпуском Anthropic попросила Claude Opus 4 представить себя помощником вымышленной компании и подумать о последствиях

Запись ИИ-модель шантажировала инженеров, когда те пытались ее отключить впервые появилась K-News.

.

Подробнее читайте на ...

k-news инженеров anthropic