Компания Anthropic представила свой новый флагманский продукт — языковую модель Claude Opus 4.8, которая призвана переосмыслить возможности искусственного интеллекта. В рамках нашего независимого тестирования мы тщательно изучили способности этой передовой разработки, подвергнув её серии из шести испытаний.
Первые результаты оказались впечатляющими. Claude Opus 4.8 продемонстрировал выдающиеся аналитические способности, безупречно решив сложную математическую задачу, что свидетельствует о его глубоком понимании логики и вычислений. Более того, модель успешно справилась с задачей по созданию игры, выдав чистый и функциональный код, что подчеркивает её потенциал в разработке программного обеспечения и творческих проектах.
Однако, как и у любой мощной технологии, у Claude Opus 4.8 обнаружился существенный недостаток. В процессе работы модель продемонстрировала чрезвычайно высокий аппетит к ресурсам, исчерпав всю нашу квоту токенов всего за один запрос. Это поднимает вопросы об экономической эффективности использования Claude Opus 4.8 для масштабных или длительных задач, несмотря на его впечатляющую производительность.
Наши тесты были направлены на оценку различных аспектов работы модели: от решения проблем до генерации контента и обработки сложных инструкций. Несмотря на высокую стоимость использования, Claude Opus 4.8 подтвердил свой статус лидера в определенных областях, предлагая беспрецедентный уровень точности и креативности.
В целом, Claude Opus 4.8 от Anthropic представляет собой мощный инструмент с огромным потенциалом для сложных интеллектуальных задач. Он превосходит ожидания там, где требуется глубокий анализ и творческий подход, но при этом требует внимательного отношения к расходу ресурсов. Это делает его идеальным выбором для критически важных проектов, где качество важнее стоимости, но вызывает вопросы для повседневного использования.
Источник: Decrypt
