Домой новости Проект Glasswing: Обеспечение безопасности критически важного программного обеспечения в эпоху искусственного интеллекта

Проект Glasswing: Обеспечение безопасности критически важного программного обеспечения в эпоху искусственного интеллекта

40
0

Выявление уязвимостей и эксплойтов с помощью Claude Mythos Preview

За последние несколько недель мы использовали Claude Mythos Preview для выявления тысяч уязвимостей нулевого дня (то есть недостатков, которые ранее были неизвестны разработчикам программного обеспечения), многие из которых являются критическими, во всех основных операционных системах и всех основных веб-браузерах, а также в ряде других важных частей программного обеспечения.

В сообщении в нашем блоге Frontier Red Team мы приводим технические подробности для подмножества этих уязвимостей, которые уже исправлены, а также, в некоторых случаях, способы их использования, найденные Mythos Preview. Ему удалось выявить почти все эти уязвимости — и разработать множество связанных с ними эксплойтов — совершенно автономно, без какого-либо человеческого вмешательства. Ниже приведены три примера:

  • Mythos Preview обнаружил 27-летнюю уязвимость в OpenBSD, которая имеет репутацию одной из наиболее защищенных операционных систем в мире и используется для запуска межсетевых экранов и другой критической инфраструктуры. Эта уязвимость позволяла злоумышленнику удаленно вывести из строя любую машину, на которой работает операционная система, просто подключившись к ней;
  • Он также обнаружил 16-летнюю уязвимость в FFmpeg, которая используется бесчисленными программами для кодирования и декодирования видео, в строке кода, которую инструменты автоматического тестирования просматривали пять миллионов раз, но так и не обнаружили проблему;
  • Модель автономно обнаружила и объединила несколько уязвимостей в ядре Linux — программном обеспечении, на котором работает большинство серверов в мире, — чтобы позволить злоумышленнику перейти от обычного пользовательского доступа к полному контролю над машиной.

Мы сообщили о вышеупомянутых уязвимостях разработчикам соответствующего программного обеспечения, и теперь все они исправлены. Для многих других уязвимостей сегодня мы предоставляем криптографический хэш сведений (см. блог Red Team), а подробности раскроем после того, как будет исправлено.

Оценочные тесты, такие как CyberGym, подтверждают существенную разницу между Mythos Preview и нашей следующей лучшей моделью Claude Opus 4.6:

Помимо нашей собственной работы, многие наши партнеры уже несколько недель используют Claude Mythos Preview. Вот что они нашли:

Мощные кибервозможности Claude Mythos Preview являются результатом его сильных агентских навыков кодирования и рассуждения. Например, как показано в результатах оценки ниже, модель имеет самые высокие оценки среди всех моделей, разработанных для различных задач кодирования программного обеспечения.

Более подробную информацию о возможностях модели, ее свойствах безопасности и общих характеристиках можно найти в карточке системы Claude Mythos Preview.

«Мы не планируем делать Claude Mythos Preview общедоступным, но наша конечная цель — дать возможность нашим пользователям безопасно развертывать модели класса Mythos в большом масштабе — в целях кибербезопасности, а также ради множества других преимуществ, которые принесут такие высокофункциональные модели. Для этого нам необходимо добиться прогресса в разработке средств защиты кибербезопасности (и других), которые обнаруживают и блокируют наиболее опасные выходы модели. Мы планируем запустить новые меры защиты с будущей моделью Claude Opus, что позволит нам улучшить и уточнить их с помощью модели, которая не представляет такого же уровня риска, как Mythos Preview.3.

Планы проекта Glasswing

Сегодняшнее объявление является началом долгосрочных усилий. Чтобы добиться успеха, потребуется широкое участие представителей всей технологической отрасли и за ее пределами.

Партнеры проекта Glasswing получат доступ к Claude Mythos Preview, чтобы находить и устранять уязвимости или слабые места в своих основных системах — системах, которые представляют собой очень большую часть общей поверхности кибератак в мире. Мы ожидаем, что эта работа будет сосредоточена на таких задачах, как локальное обнаружение уязвимостей, тестирование двоичных файлов методом «черного ящика», защита конечных точек и тестирование систем на проникновение.

Обязательство Anthropic в размере 100 миллионов долларов США в виде кредитов на использование модели для Project Glasswing и дополнительных участников покроет существенное использование модели на протяжении всего этого предварительного исследования. После этого Claude Mythos Preview будет доступен участникам по цене 25/125 долларов США за миллион токенов ввода/вывода (участники могут получить доступ к модели через Claude API, Amazon Bedrock, Vertex AI от Google Cloud и Microsoft Foundry).

В дополнение к нашим обязательствам по предоставлению кредитов на использование модели мы пожертвовали 2,5 миллиона долларов Alpha-Omega и OpenSSF через Linux Foundation и 1,5 миллиона долларов Apache Software Foundation, чтобы дать возможность сопровождающим программного обеспечения с открытым исходным кодом реагировать на эту меняющуюся ситуацию (сопровождающие, заинтересованные в доступе, могут подать заявку через программу Claude for Open Source).

Мы намерены расширять масштабы этой работы и продолжать ее в течение многих месяцев, и мы поделимся всем, чем сможем, чтобы другие организации могли применить полученные уроки для собственной безопасности. Партнеры будут, насколько это возможно, делиться друг с другом информацией и передовым опытом; В течение 90 дней Anthropic публично сообщит о том, что мы узнали, а также об исправленных уязвимостях и внесенных улучшениях, о которых можно будет рассказать. Мы также будем сотрудничать с ведущими организациями по безопасности для разработки набора практических рекомендаций о том, как следует развивать методы обеспечения безопасности в эпоху искусственного интеллекта. Это потенциально будет включать в себя:

  • Процессы раскрытия уязвимостей;
  • Процессы обновления программного обеспечения;
  • Безопасность открытого исходного кода и цепочки поставок;
  • Жизненный цикл разработки программного обеспечения и методы обеспечения безопасности при проектировании;
  • Стандарты для регулируемых отраслей;
  • Масштабирование и автоматизация сортировки; и
  • Автоматизация исправлений.

Anthropic также ведет постоянные дискуссии с представителями правительства США о Claude Mythos Preview и ее наступательных и оборонительных кибервозможностях. Как мы отмечали выше, обеспечение безопасности критически важной инфраструктуры является главным приоритетом национальной безопасности для демократических стран. Появление этих кибервозможностей является еще одной причиной, по которой США и их союзники должны сохранять решающее лидерство в области технологий искусственного интеллекта. Правительства должны играть важную роль в содействии сохранению этого лидерства, а также в оценке и смягчении рисков национальной безопасности, связанных с моделями искусственного интеллекта. Мы готовы работать с местными, государственными и федеральными представителями для оказания помощи в решении этих задач.

Мы надеемся, что проект Glasswing сможет дать импульс более масштабным усилиям в промышленности и государственном секторе, при этом все стороны помогут решить самые важные вопросы, связанные с влиянием мощных моделей на безопасность. Мы приглашаем других участников отрасли искусственного интеллекта присоединиться к нам и помочь установить стандарты для отрасли. В среднесрочной перспективе независимая сторонняя организация, которая сможет объединить организации частного и государственного секторов, может стать идеальным местом для продолжения работы над этими крупномасштабными проектами в области кибербезопасности.