Может ли новая модель Claude AI 3.5 Sonnet превзойти ChatGPT-4o?

Anthropic, ведущая исследовательская компания в области искусственного интеллекта, основанная бывшими исследователями OpenAI, объявила вчера о запуске Claude 3.5 Sonnet, последней и наиболее продвинутой модели в семействе Claude AI. Это крупное обновление следует непосредственно за выпуском Open AI GPT-4o, изначально мультимодальной модели большого языка (LLM), которая недавно заняла первое место на арене чат-ботов LMSys.

Claude 3.5 Sonnet позиционируется как модель среднего класса, расположенная между Haiku, компактной моделью, разработанной для эффективных задач, и Opus, высокоуровневой моделью, которая поддерживает платную версию Anthropic по цене 20 долларов в месяц. Прямо сейчас Haiku и Opus предлагаются только в версии 3.0, что делает Sonnet 3.5 их лучшей моделью с точки зрения возможностей, знаний и эффективности.

Компания Anthropic утверждает, что ее новая модель превосходит GPT-4o почти во всех синтетических тестах, особенно при использовании методов многокадровых подсказок — по сути, предоставляя более одного примера.

Эти синтетические тесты измеряют производительность модели в различных областях. Задавая стандартное количество условий и тестов, можно получить количественное значение качественной переменной. Другими словами, эти тесты не говорят, какая модель выглядит или лучше справляется с заданием, они говорят, насколько лучше модель с измеримой точки зрения.

Что касается производительности, Anthropic говорит, что Claude 3.5 Sonnet работает в два раза быстрее предыдущей топовой модели Claude 3 Opus, обеспечивая большую мощность при стоимости всего в пять раз меньшей. Это делает ее идеальным выбором для сложных задач, таких как контекстно-зависимая поддержка клиентов и специализированные задачи, требующие большого количества взаимодействий с моделью.

Ее создатели говорят, что она также демонстрирует заметное улучшение в понимании нюансов, юмора и сложных инструкций по сравнению со своими предшественниками.