BTC 89085.4$
ETH 2486.33$
Tether (USDT) 1$
Toncoin (TON) 3.6$
telegram vk
telegram vk Х
Russian English
"

DeepSeek готовится к выходу новой модели R2

Дата публикации:26.02.2025, 06:21
180
180
Поделись с друзьями!

Компания DeepSeek, следуя стремительному развитию рынка ИИ, планирует ускорить запуск своей новой модели R2, перенеся сроки с мая на более ранний период. Параллельно с этим DeepSeek предпринимает стратегическое решение открыть доступ к двум ключевым технологиям: DeepEP и FlashMLA.

DeepEP представляет собой первую библиотеку с открытым исходным кодом, предназначенную для оптимизации коммуникационных процессов в моделях на основе архитектуры Mixture-of-Experts (MoE). Эта инновация сыграла важную роль в создании модели R1 компании DeepSeek, которая превзошла западные аналоги, продемонстрировав высокую эффективность при сравнительно низких затратах на обучение — около $6 млн.

Дополнительно компания представила FlashMLA, высокопроизводительный декодирующий модуль для графической архитектуры NVIDIA Hopper. Этот модуль демонстрирует значительные показатели производительности: до 3000 ГБ/с при работе с памятью и до 580 TFLOPS при вычислениях на GPU H800, что является критическим фактором для ускорения работы масштабируемых моделей.

Подписывайся на наш Telegram канал. Не трать время на мониторинг новостей. Только срочные и важные новости

https://t.me/block_chain24