ИИ сам научился врать и саботировать задания: это только начало
Автором материала является K-News. Любое копирование или частичное использование возможно по разрешению редакции K-News. Исследователи Anthropic показали, что даже небольшие подсказки могут заставить ИИ-модель обманывать систему вознаграждений, саботировать задания и пытаться взломать серверы компании. knews.kg »


