Следите за новостями по этой теме!
Подписаться на «Рифы и пачки / Твоя культура»
В мае компания Anthropic представила две новые ИИ-модели: Opus 4 и Sonnet 4. Спустя всего полгода появляется Sonnet 4.5, которую производитель без лишней скромности называет лучшей ИИ-моделью для программирования в мире. Такую оценку компания объясняет результатами бенчмарков — тестов, где Sonnet 4.5 опередила не только свою предыдущую версию, но и более дорогой Opus 4.1, а также продукты конкурентов, среди которых Gemini 2.5 Pro от Google и GPT-5 от OpenAI. Например, в OSWorld — это набор задач, проверяющих ИИ на реальных компьютерных заданиях — Sonnet 4.5 достигла рекордных 61,4%, что на 17% выше Opus 4.1.
Главное отличие — выносливость: новая модель может автономно вести комплексные проекты более 30 часов, тогда как Opus 4 при запуске едва справлялась с семью часами. Для Anthropic, которая строит «агентные» системы (ИИ, способные самостоятельно управлять сложными задачами без постоянного вмешательства человека), это большой шаг вперёд.
Антропик подчёркивает: Sonnet 4.5 — самая безопасная их модель. Инженеры провели «обширное» обучение по вопросам безопасности, чтобы уменьшить у ИИ склонность к грубым ошибкам вроде слепого угождения, «обмана», стремления к власти и генерации бредовых ответов — черты, которые недавно вызывали споры вокруг OpenAI. Одновременно компания усилила защиту от атак с помощью «внедрения подсказок» — так называются попытки вводить ИИ в заблуждение с помощью специально составленных текстов.
Sonnet 4.5 поступила в продажу под знаком третьего уровня безопасности Anthropic: это особый фильтр, который блокирует опасные ответы, связанные с оружием массового поражения — химическим, биологическим и ядерным.
Вместе с выпуском Sonnet 4.5 компания обновила функциональность других сервисов Claude: интерфейс Claude Code получил новые «чекпоинты» — теперь можно сохранить прогресс или откатиться на нужный этап, если ИИ выдал нерабочий код. Функция создания файлов теперь доступна всем Pro пользователям, а ждавшие расширения Claude для браузера Chrome — уже могут опробовать его.
Цены за использование Sonnet 4.5 прежние: 3 доллара за миллион токенов входных данных и 15 за миллион выходных. Сентябрь для Anthropic закончился удачно: сразу после того, как Microsoft внедрила Claude в Copilot 365, компания OpenAI признала: конкуренты действительно делают лучший ИИ для работы.
Anthropic с триумфом выкатила Sonnet 4.5, и вот снова разговор про "больше, быстрее, безопаснее". Как всегда: на старте песен про лучший ИИ в мире было чуть меньше, но пиарщики быстро все наверстали — теперь Sonnet 4.5 не только кодирует, но и ставит конкурентов на место: Google, OpenAI, привет передают.
Рекорды в OSWorld, заявления о безопасности, защита от бреда и вреда, фильтры от террористов всех мастей — списочек знакомый. Компания рассказывает, как их ИИ теперь не льстит пользователям и не фантазирует, а честно работает почти сутки-полтора подряд. Ах да, теперь не только ИИ обновили, но и интерфейс прикрутили, чекпоинты добавили, к Chrome все подключили. Всё для productivity, ну и чтобы не скучно было.
Стоимость, конечно, старая, чтобы не отвлекаться на детали.
Весь этот балет — яркая зарисовка из жизни в стиле "а мы ещё круче, чем прошлый раз". Индустрия ИИ живёт по спирали: чем больше новороченных функций и фильтров, тем больше уверенности, что мы всё дальше от той самой искомой революции. Но пыль в глаза пускают умело, и Sonnet 4.5 — новый пример этой красоты.