Компания Anthropic представила две новые ИИ-модели Claude 4, которые входят в число лучших в индустрии с точки зрения результатов в популярных тестах.
Claude Opus 4 и Claude Sonnet 4 способны анализировать большие массивы данных, выполнять долгосрочные задачи и совершать сложные действия. Обе модели оптимизированы для работы с задачами программирования, что делает их подходящими для написания и редактирования кода.
Более мощная из двух представленных сегодня моделей, Opus 4, может поддерживать «сосредоточенные усилия» на протяжении многих этапов рабочего процесса, утверждают в Anthropic. Между тем, Sonnet 4 – разработанная как прямая замена для Sonnet 3.7 – улучшена в программировании и математике по сравнению с предыдущими моделями Anthropic и более точно следует инструкциям.
Отмечается, что Opus 4 превосходит Gemini 2.5 Pro от Google и o3 и GPT-4.1 от OpenAI в тесте SWE-bench Verified, который предназначен для оценки способностей модели к программированию. Однако, новая ИИ-модель от Anthropic не может превзойти o3 в мультимодальной оценке MMMU или GPQA Diamond – наборе вопросов уровня PhD по биологии, физике и химии.
Opus 4 и Sonnet 4 могут использовать несколько инструментов, таких как поисковые системы, параллельно, и переключаться между рассуждением и инструментами для улучшения качества своих ответов. Они также могут извлекать и сохранять факты в памяти для более надежного выполнения задач, формируя то, что Anthropic описывает как неявные знания со временем.
Чтобы сделать модели более дружелюбными к программистам, Anthropic развертывает обновления упомянутого Claude Code, который позволяет разработчикам выполнять конкретные задачи через модели Anthropic прямо из терминала.
Модели Claude 4 от Anthropic появляются в то время, когда компания стремится существенно увеличить доходы. По сообщениям, компания, основанная бывшими исследователями OpenAI, нацелена на получение $12 млрд прибыли в 2027 году по сравнению с прогнозируемыми $2,2 млрд в этом году. Anthropic недавно закрыла кредитную линию на $2,5 млрд и привлекла значительные средства от Amazon и других инвесторов в ожидании растущих затрат, связанных с разработкой передовых моделей.