Компания DeepSeek, следуя стремительному развитию рынка ИИ, планирует ускорить запуск своей новой модели R2, перенеся сроки с мая на более ранний период. Параллельно с этим DeepSeek предпринимает стратегическое решение открыть доступ к двум ключевым технологиям: DeepEP и FlashMLA.
DeepEP представляет собой первую библиотеку с открытым исходным кодом, предназначенную для оптимизации коммуникационных процессов в моделях на основе архитектуры Mixture-of-Experts (MoE). Эта инновация сыграла важную роль в создании модели R1 компании DeepSeek, которая превзошла западные аналоги, продемонстрировав высокую эффективность при сравнительно низких затратах на обучение — около $6 млн.
Дополнительно компания представила FlashMLA, высокопроизводительный декодирующий модуль для графической архитектуры NVIDIA Hopper. Этот модуль демонстрирует значительные показатели производительности: до 3000 ГБ/с при работе с памятью и до 580 TFLOPS при вычислениях на GPU H800, что является критическим фактором для ускорения работы масштабируемых моделей.