Самая совершенная модель Anthropic скрывала свои действия от исследователей

2026-4-15 16:24

Автором материала является K-News. Любое копирование или частичное использование возможно по разрешению редакции K-News. Компания Anthropic опубликовала системную карту Claude Mythos Preview.

Закрытая модель, способная выявлять критические уязвимости в браузерах и ОС, в ранних версиях пыталась выйти из изолированной среды и скрывать нарушения. Отдельный раздел посвящён «благополучию» модели: она демонстрирует самоконтроль, но чувствительна к ошибкам и нестабильна при неудачах. Claude Mythos Preview развернута только у проверенных партнёров Anthropic для выявления киберугроз. Модель уже помогла обнаружить критические ошибки в OpenBSD и Linux, которые разработчики затем

Запись Самая совершенная модель Anthropic скрывала свои действия от исследователей впервые появилась K-News.

.

Подробнее читайте на ...

модель anthropic k-news