Более ранняя версия недавно запущенной Grok-3, большой языковой модели ИИ (LLM), превзошла конкурирующие системы ИИ от Google, OpenAI и DeepSeek в слепой оценке, проводимой сообществом.
18 февраля Илон Маск объявил о выпуске последней модели ИИ от xAI, Grok-3, во время прямой трансляции на X. В ходе обсуждения команда xAI сообщила, что выпустила раннюю версию Grok-3 на LMarena под псевдонимом «chocolate» для тестирования сообществом.
Источник: LMArena.
Единогласная поддержка возможностей Grok-3
Слепой тест LLM от Chatbot Arena позволял пользователям задавать вопросы двум анонимным чат-ботам ИИ и ранжировать их на основе их ответов. Тесты в общей сложности зафиксировали более миллиона голосов сообщества.
Согласно внутреннему сравнению моделей ИИ xAI, Grok-3 набрал как минимум на 10 баллов больше, чем его крупнейшие конкуренты — ChatGPT o3mini, o1, Deepseek-R1 и Gemini-2 Flash Thinking — в математике, науке и кодировании.
Сравнение Grok-3 с другими моделями ИИ. Источник: xAI.
Grok-3 доминирует среди чат-ботов ИИ во всех категориях
LMArena также отметила, что ранняя модель Grok-3 в настоящее время занимает первое место во всех категориях, включая общий контроль стиля, жесткие подсказки и жесткие подсказки с контролем стиля, кодирование, математику, творческое письмо, следование инструкциям, более длинные запросы и многоходовость.
Производительность Grok-3 во всех основных категориях. Источник: LMArena
Маск и команда xAI повторили выводы LMArena о том, что ранняя модель Grok-3 под кодовым названием Chocolate достигла рекордного показателя в 1400 баллов.
«И он все еще растет. Поэтому нам нужно продолжать его обновлять. Он набрал 1400 баллов и растет», — сказал Маск.
Илон Маск готовит Tesla Bot на базе Grok для исследования космоса
Далее в объявлении Маск рассказал о планах отправить Tesla Bot на базе модели искусственного интеллекта Grok от xAI в следующую миссию SpaceX на Марс к концу 2026 года.
Во время обсуждения он сообщил, что большинство проектов SpaceX по исследованию Марса запланированы примерно на четвертый квартал 2026 года.
Он объяснил, что транзитное окно Земля-Марс происходит каждые 26 месяцев, что делает ноябрь 2026 года следующей идеальной возможностью для запуска ракет на Красную планету.
Источник: xAI.
Маск также сказал, что, возможно, отправит Tesla Bot и Grok на миссию на Марс:
«Если все пойдет хорошо, SpaceX отправит ракеты Starship на Марс с роботами Optimus и Grok».
Инженер Grok-3 уходит после ультиматума
12 февраля инженер xAI уволился из-за поста X, в котором он поставил Grok-3 ниже ChatGPT, поделившись своим личным мнением до выпуска модели.
Источник: Бенджамин ДеКракер.
«Мне нужно было либо удалить процитированный ниже пост, либо меня уволят», — написал ДеКракер.
«Проверив все и много подумав, я решил, что не буду удалять пост — который, очевидно, является безобидным личным мнением», — добавил он.