Прямо сейчас идет эпичная битва за то, кто сделает лучший код.
Почему? Потому что код — идеальная площадка для ИИ. Если код работает, это сразу видно, а значит, модели учатся быстрее через RL. OpenAI уже использует test-time compute, чтобы выжать из o3 максимум. Google пишет 25% нового кода с ИИ. В последнем интервью Ноама Шазира, главного человека в Google, ответственного за прорывы в ИИ спросили, какое направление самое интересное в ИИ? Куда смотреть в долгосрок? Шазир ответил, что - код.
Смотря, на сегодняшние результаты моделей o3 и o4mini от OpenAI, видно, что они дают жару в задачах кодирования — o3 бьет 71.7% на SWE-bench, а o4-mini лидирует в оптимизации кода. o4-mini обещает быть доступнее, хотя Gemini бьет бесплатным доступом. Более того, сейчас стало известно, что OpenAI ведет переговоры о покупке Codeium за $3 млрд, прошло < 4 года с момента основания этого стартапа.
Это прямой вызов Cursor, который тоже рвет рынок. Google и Anthropic не сдаются. Google с Gemini 2.5 Pro выдает 72.9% на Aider Polyglot. А вот Дарио Амодей из Anthropic говорит, к началу 2026 года ИИ будет писать почти весь код, а люди, будут только контролировать и координировать. Пока Claude 3.7 чуть отстает, но их фишка — безопасность.