Anthropic представила Opus 4.8 с улучшенной обработкой неопределенных данных и функцией Dynamic Workflows
В четверг компания Anthropic представила Opus 4.8 – новейшую версию своей наиболее продвинутой модели искусственного интеллекта, доступной широкой публике. Новая модель уже доступна по всему миру по стандартным ценам, аналогичным предыдущей версии Opus.
Быстрый цикл обновлений и конкуренция
Выпуск новой версии состоялся всего через 41 день после релиза Opus 4.7, что значительно быстрее обычного цикла обновлений для Anthropic. Для сравнения, последние модели Sonnet и Haiku были выпущены три и семь месяцев назад соответственно. Столь оперативное обновление может быть связано с прохладным приемом Opus 4.7, которую некоторые пользователи сочли разочаровывающей.
За этот период также произошли значительные релизы новых моделей у конкурентов: OpenAI представила свою модель Codex, а Google — Gemini Flash, что усиливает давление на Anthropic в гонке технологий.
Внимание к точности и новым функциям
Новая версия демонстрирует ожидаемо лучшие результаты в стандартных бенчмарках (тестовых испытаниях для оценки производительности), однако особое внимание уделено тому, как модель обрабатывает неточные или неопределенные данные. В анонсе разработчики Anthropic отметили, что ранние тестировщики Opus 4.8 обнаружили: модель «чаще указывает на неопределенности в своей работе и реже делает необоснованные утверждения».
Подтверждая это, сотрудники компании Bridgewater, тестировавшие модель, заявили, что ключевым отличием обновления стала «тенденция Opus 4.8 активно сообщать о проблемах с входными и выходными данными анализа, что другие модели обычно упускали, оставляя это на усмотрение пользователя».
Одновременно с новой моделью Anthropic представила функцию Dynamic Workflows («Динамические рабочие процессы»), которая будет доступна в тестовом режиме. Эта система призвана помочь крупным моделям, таким как Opus, управлять сложными задачами, распределяя их между сотнями параллельных подзадач или субагентов.
В сообщении компании поясняется: «Claude Code в связке с Opus 4.8 теперь может выполнять миграции целых кодовых баз, насчитывающих сотни тысяч строк кода, от начала до финального слияния, используя существующий набор тестов как эталон качества».
Перспективы Mythos
Смотрите также:
На фестивале «Трайбека» состоится премьера первого полнометражного фильма, созданного нейросетями http://kupidonchik.org/na-festivale-traybeka-sostoitsya-premera-pervogo-polnometrazhnogo-filma-sozdannogo-neyrosetyami/.
Интересности на тему: Xreal представила бюджетные XR-очки xbx a01 с ярким экраном и стабилизацией изображения
Классные советы в статье "Анонсирована Call of Duty: Modern Warfare 4 — капитан Прайс возвращается в мрачной кампании на Корейском полуострове" здесь.
Anthropic по-прежнему не выпускает свою самую передовую модель Mythos, после того как предварительный показ в прошлом месяце вызвал обеспокоенность в области кибербезопасности. Однако в сегодняшнем анонсе Opus компания намекнула, что период тестирования Mythos может скоро завершиться, как только будут завершены необходимые меры безопасности.
По словам представителей Anthropic, «достигнут значительный прогресс в разработке этих мер безопасности, и компания рассчитывает предоставить модели класса Mythos всем своим клиентам в ближайшие недели».
