Anthropic представила Opus 4.8 с улучшенной обработкой неопределенных данных и функцией Dynamic Workflows

Anthropic представила Opus 4.8 с улучшенной обработкой неопределенных данных и функцией Dynamic Workflows

В четверг компания Anthropic представила Opus 4.8 – новейшую версию своей наиболее продвинутой модели искусственного интеллекта, доступной широкой публике. Новая модель уже доступна по всему миру по стандартным ценам, аналогичным предыдущей версии Opus.

Быстрый цикл обновлений и конкуренция

Выпуск новой версии состоялся всего через 41 день после релиза Opus 4.7, что значительно быстрее обычного цикла обновлений для Anthropic. Для сравнения, последние модели Sonnet и Haiku были выпущены три и семь месяцев назад соответственно. Столь оперативное обновление может быть связано с прохладным приемом Opus 4.7, которую некоторые пользователи сочли разочаровывающей.

За этот период также произошли значительные релизы новых моделей у конкурентов: OpenAI представила свою модель Codex, а Google — Gemini Flash, что усиливает давление на Anthropic в гонке технологий.

Внимание к точности и новым функциям

Новая версия демонстрирует ожидаемо лучшие результаты в стандартных бенчмарках (тестовых испытаниях для оценки производительности), однако особое внимание уделено тому, как модель обрабатывает неточные или неопределенные данные. В анонсе разработчики Anthropic отметили, что ранние тестировщики Opus 4.8 обнаружили: модель «чаще указывает на неопределенности в своей работе и реже делает необоснованные утверждения».

Подтверждая это, сотрудники компании Bridgewater, тестировавшие модель, заявили, что ключевым отличием обновления стала «тенденция Opus 4.8 активно сообщать о проблемах с входными и выходными данными анализа, что другие модели обычно упускали, оставляя это на усмотрение пользователя».

Одновременно с новой моделью Anthropic представила функцию Dynamic Workflows («Динамические рабочие процессы»), которая будет доступна в тестовом режиме. Эта система призвана помочь крупным моделям, таким как Opus, управлять сложными задачами, распределяя их между сотнями параллельных подзадач или субагентов.

В сообщении компании поясняется: «Claude Code в связке с Opus 4.8 теперь может выполнять миграции целых кодовых баз, насчитывающих сотни тысяч строк кода, от начала до финального слияния, используя существующий набор тестов как эталон качества».

Перспективы Mythos

Смотрите также:

На фестивале «Трайбека» состоится премьера первого полнометражного фильма, созданного нейросетями http://kupidonchik.org/na-festivale-traybeka-sostoitsya-premera-pervogo-polnometrazhnogo-filma-sozdannogo-neyrosetyami/.

Интересности на тему: Xreal представила бюджетные XR-очки xbx a01 с ярким экраном и стабилизацией изображения

Классные советы в статье "Анонсирована Call of Duty: Modern Warfare 4 — капитан Прайс возвращается в мрачной кампании на Корейском полуострове" здесь.

Anthropic по-прежнему не выпускает свою самую передовую модель Mythos, после того как предварительный показ в прошлом месяце вызвал обеспокоенность в области кибербезопасности. Однако в сегодняшнем анонсе Opus компания намекнула, что период тестирования Mythos может скоро завершиться, как только будут завершены необходимые меры безопасности.

По словам представителей Anthropic, «достигнут значительный прогресс в разработке этих мер безопасности, и компания рассчитывает предоставить модели класса Mythos всем своим клиентам в ближайшие недели».