BTC 98218.9$
ETH 2732.13$
Tether (USDT) 1$
Toncoin (TON) 3.57$
telegram vk
telegram vk Х
Russian English
"

Grok-3 превосходит все модели ИИ в тесте производительности

Дата публикации:19.02.2025, 10:47
208
208
Поделись с друзьями!

Более ранняя версия недавно запущенной Grok-3, большой языковой модели ИИ (LLM), превзошла конкурирующие системы ИИ от Google, OpenAI и DeepSeek в слепой оценке, проводимой сообществом.

18 февраля Илон Маск объявил о выпуске последней модели ИИ от xAI, Grok-3, во время прямой трансляции на X. В ходе обсуждения команда xAI сообщила, что выпустила раннюю версию Grok-3 на LMarena под псевдонимом «chocolate» для тестирования сообществом.


Источник: LMArena.

Единогласная поддержка возможностей Grok-3

Слепой тест LLM от Chatbot Arena позволял пользователям задавать вопросы двум анонимным чат-ботам ИИ и ранжировать их на основе их ответов. Тесты в общей сложности зафиксировали более миллиона голосов сообщества.

Согласно внутреннему сравнению моделей ИИ xAI, Grok-3 набрал как минимум на 10 баллов больше, чем его крупнейшие конкуренты — ChatGPT o3mini, o1, Deepseek-R1 и Gemini-2 Flash Thinking — в математике, науке и кодировании.


Сравнение Grok-3 с другими моделями ИИ. Источник: xAI.

Grok-3 доминирует среди чат-ботов ИИ во всех категориях

LMArena также отметила, что ранняя модель Grok-3 в настоящее время занимает первое место во всех категориях, включая общий контроль стиля, жесткие подсказки и жесткие подсказки с контролем стиля, кодирование, математику, творческое письмо, следование инструкциям, более длинные запросы и многоходовость.


Производительность Grok-3 во всех основных категориях. Источник: LMArena

Маск и команда xAI повторили выводы LMArena о том, что ранняя модель Grok-3 под кодовым названием Chocolate достигла рекордного показателя в 1400 баллов.

«И он все еще растет. Поэтому нам нужно продолжать его обновлять. Он набрал 1400 баллов и растет», — сказал Маск.

Илон Маск готовит Tesla Bot на базе Grok для исследования космоса

Далее в объявлении Маск рассказал о планах отправить Tesla Bot на базе модели искусственного интеллекта Grok от xAI в следующую миссию SpaceX на Марс к концу 2026 года.

Во время обсуждения он сообщил, что большинство проектов SpaceX по исследованию Марса запланированы примерно на четвертый квартал 2026 года.

Он объяснил, что транзитное окно Земля-Марс происходит каждые 26 месяцев, что делает ноябрь 2026 года следующей идеальной возможностью для запуска ракет на Красную планету.


Источник: xAI.

Маск также сказал, что, возможно, отправит Tesla Bot и Grok на миссию на Марс:

«Если все пойдет хорошо, SpaceX отправит ракеты Starship на Марс с роботами Optimus и Grok».

Инженер Grok-3 уходит после ультиматума

12 февраля инженер xAI уволился из-за поста X, в котором он поставил Grok-3 ниже ChatGPT, поделившись своим личным мнением до выпуска модели.


Источник: Бенджамин ДеКракер.

«Мне нужно было либо удалить процитированный ниже пост, либо меня уволят», — написал ДеКракер.

«Проверив все и много подумав, я решил, что не буду удалять пост — который, очевидно, является безобидным личным мнением», — добавил он.

Подписывайся на наш Telegram канал. Не трать время на мониторинг новостей. Только срочные и важные новости

https://t.me/block_chain24