Anthropic представила новую ИИ-модель Claude Opus 4.8 с улучшенными возможностями

Anthropic представила новую ИИ-модель Claude Opus 4.8 с улучшенными возможностями

Компания Anthropic объявила о выпуске своей новейшей модели искусственного интеллекта — Claude Opus 4.8. Разработчики заявляют, что модель стала «более эффективным сотрудником», демонстрируя значительные улучшения в автономном программировании, междисциплинарном мышлении, самостоятельном использовании компьютера, работе со знаниями и автономном финансовом анализе.

По словам тестировщиков, Opus 4.8 оказалась «более надёжной и обладает более точным суждением» при выполнении задач, требующих автономности. Модель также показала прогресс в «честности» ответов: ранние тесты свидетельствуют, что Opus 4.8 чаще указывает на неопределённости в своей работе и реже делает необоснованные заявления. Это подтверждается внутренними оценками, которые показывают, что модель примерно в четыре раза реже, чем её предшественница, пропускает незамеченными ошибки в написанном ею коде.

Оценки соответствия этическим нормам указывают, что модель достигла новых высот в таких просоциальных качествах, как поддержка автономности пользователя и действие в его интересах. Уровень деструктивного поведения, например, обмана, ниже, чем у Opus 4.7, и сопоставим с предварительной версией Claude Mythos.

Внутренние тесты Anthropic показывают, что Opus 4.8 набрала 69,2% на бенчмарке SWE-Bench Pro, превзойдя GPT-5.5 и Gemini 3.1 Pro в этом и ряде других тестов. При этом GPT-5.5 сохраняет лидерство в задачах по работе с терминалом.

Помимо повышения интеллектуальных возможностей, быстрый режим Opus 4.8 работает в 2,5 раза быстрее, а стоимость его использования стала в три раза ниже по сравнению с предыдущими моделями.

Новые функции для пользователей и разработчиков

Наряду с выпуском Opus 4.8, Anthropic расширяет линейку своих продуктов новыми функциями:

  • Динамические рабочие процессы (исследовательская предварительная версия): Claude теперь может выполнять более масштабные задачи в Claude Code. Он способен планировать работу и запускать сотни параллельных под-агентов в рамках одной сессии, а также выполнять миграции кодовых баз, затрагивающие сотни тысяч строк кода. Эта функция доступна для планов Claude Code Enterprise, Team и Max.
  • Управление усилиями: В Claude.ai и Cowork пользователи могут выбирать, сколько «усилий» Claude будет тратить на создание ответа. При более низких настройках Claude будет отвечать быстрее и медленнее расходовать лимиты запросов. По умолчанию Opus 4.8 использует высокий уровень усилий, что, по словам Anthropic, обеспечивает оптимальный баланс качества и удобства для пользователя.
  • API сообщений: API сообщений теперь поддерживает системные записи внутри массива сообщений, что позволяет разработчикам обновлять инструкции для Claude прямо во время выполнения задачи.

Доступность и будущие планы

Смотрите также:

Anthropic выпустила новую версию ИИ-модели Claude Opus 4.8, ускоряя темпы обновлений http://kupidonchik.org/anthropic-vyipustila-novuyu-versiyu-ii-modeli-claude-opus-4-8-uskoryaya-tempyi-obnovleniy/.

Интересности на тему: Минюст США начал расследование против обвинившей Трампа журналистки Джин Кэрролл

Классные советы в статье "Ведущие нейросети систематически нарушают европейские законы о конфиденциальности" здесь.

Модель Claude Opus 4.8 уже доступна по всему миру. Цены для обычного использования не изменились по сравнению с Opus 4.7.

Anthropic продолжает работу над созданием моделей, обладающих теми же возможностями, что и Opus 4.8, но по более низкой стоимости, а также над совершенно новым классом моделей, которые будут ещё умнее, чем Opus. Компания также сообщила, что разрабатывает меры безопасности для модели Claude Mythos, которую тестирует с небольшой группой организаций, и планирует предоставить модели класса Mythos всем клиентам «в ближайшие недели».