Спустя всего несколько дней после расширения своей программы развития передовых нейросетей в ИБ — Project Glasswing компания Anthropic выпустила две новые модели: Claude Mythos 5 и Claude Fable 5.
Первая была представлена как «обновление Claude Mythos Preview», и в заявлении от 9 июня вендор сообщил, что она обладает «самыми мощными возможностями в области кибербезопасности среди всех моделей в мире». Первоначально нейросеть будет развёрнута в рамках проекта Glasswing в сотрудничестве с правительством США, но в будущем возможна «более широкая программа доверенного доступа».
Между тем, Fable 5, как утверждается, работает на той же базовой модели, что и Mythos 5, но с дополнительными механизмами защиты, особенно в сфере кибербеза, где LLM «может быть использована не по назначению — для нанесения серьёзного ущерба». Одна из таких мер предусматривает переадресацию запросов по определённым темам Claude Opus 4.8 — следующей по счёту модели Anthropic, доступной всем.
«Чтобы безопасно и быстро выпустить модель, мы настроили эти меры безопасности консервативно — иногда они будут обнаруживать безобидные запросы, хотя в среднем срабатывают менее чем в 5% сессий», — предупредили разработчики, пообещав доработать LLM для уменьшения количества ложных срабатываний.
Анонс Anthropic вызвал неоднозначную реакцию в ИБ-индустрии. При том, что модели класса Mythos позволяют выявлять уязвимости и реагировать на всё более сложные угрозы, без надёжного контроля они будут представлять серьёзную опасность для корпоративной ИТ-инфраструктуры.
Основатель и гендиректор Illumio Эндрю Рубин, со своей стороны, дал алармистскую оценку: «Ограничения на уровне интерфейса не меняют базовую математику. Злоумышленники не будут действовать на этом уровне. Они будут атаковать непосредственно саму возможность. И по мере того, как эти инструменты становятся всё более доступными, скорость и масштаб атак будут только расти. Реальный вопрос заключается в том, готовы ли защитники действовать с той же скоростью».
Многие эксперты считают, что Mythos должна оставаться «мощным инструментом для тщательно отобранных команд безопасности и инфраструктуры». Поэтому Anthropic следует предоставлять доступ к передовой LLM только «проверенным командам защиты через закрытые каналы и свою партнёрскую экосистему», чтобы безопасники могли идти в ногу с постоянно растущими возможностями хакеров.

