BTC 85328.7$
ETH 1603.83$
Tether (USDT) 1$
Toncoin (TON) 3$
telegram vk
telegram vk Х
Russian English
"

Deep Cogito создал ИИ-модели за 75 дней, превосходящие Llama 4

Дата публикации:09.04.2025, 18:37
459
459
Поделись с друзьями!

Стартап также запустил Cogito v1 Preview — семейство ИИ-моделей (3B-70B параметров)с открытым исходным кодом, которые, якобы, превосходят лучшие доступные модели с открытым исходным кодом того же размера, включая Llama 4.

Разработчики говорят, что модели обучены методом Iterated Distillation and Amplification (IDA) - позволяет преодолеть ограничение "интеллект модели не может превысить интеллект создателя".

Модели созданы на основе предобученных чекпойнтов Llama и Qwen. Весь процесс занял всего 75 дней силами небольшой команды. Производительность 70B модели превосходит Llama 4 109B MoE. IDA описывается как революционный метод, но, по мнению экспертов, может оказаться просто дистилляцией в стиле R1 с многоходовым поиском.

Отсутствуют технические детали. Также команда говорит о необходимости всего 2-х элементов для достижения AGI-продвинутое рассуждение и итеративное самосовершенствование. Все это выглядит чрезмерно упрощенным. Если Deep Cogito действительно нашли способ создавать конкурентоспособные модели за короткий срок и с меньшими ресурсами, это может серьезно изменить ландшафт ИИ-индустрии.

Демократизация создания сильных моделей снизит барьер входа для небольших компаний.

Подписывайся на наш Telegram канал. Не трать время на мониторинг новостей. Только срочные и важные новости

https://t.me/block_chain24