Deep Cogito создал ИИ-модели за 75 дней, превосходящие Llama 4

Стартап также запустил Cogito v1 Preview — семейство ИИ-моделей (3B-70B параметров)с открытым исходным кодом, которые, якобы, превосходят лучшие доступные модели с открытым исходным кодом того же размера, включая Llama 4.

Разработчики говорят, что модели обучены методом Iterated Distillation and Amplification (IDA) - позволяет преодолеть ограничение "интеллект модели не может превысить интеллект создателя".

Модели созданы на основе предобученных чекпойнтов Llama и Qwen. Весь процесс занял всего 75 дней силами небольшой команды. Производительность 70B модели превосходит Llama 4 109B MoE. IDA описывается как революционный метод, но, по мнению экспертов, может оказаться просто дистилляцией в стиле R1 с многоходовым поиском.

Отсутствуют технические детали. Также команда говорит о необходимости всего 2-х элементов для достижения AGI-продвинутое рассуждение и итеративное самосовершенствование. Все это выглядит чрезмерно упрощенным. Если Deep Cogito действительно нашли способ создавать конкурентоспособные модели за короткий срок и с меньшими ресурсами, это может серьезно изменить ландшафт ИИ-индустрии.

Демократизация создания сильных моделей снизит барьер входа для небольших компаний.