Две китайские компании, DeepSeek и Kimi, практически одновременно представили инновационные технологии, способные значительно расширить функциональные возможности языковых моделей. DeepSeek представила NSA, тогда как Kimi выпустила MoBA — оба решения направлены на устранение основной проблемы современных систем искусственного интеллекта (ИИ), связанной с неэффективностью обработки длинных текстов.
Современные ИИ-модели расходуют до 80% времени на механизмы внимания при обработке длинных текстов, что ведет к значительным вычислительным затратам и ограничивает работу с крупными документами, базами кода и продолжительными диалогами.
DeepSeek NSA предлагает трехступенчатое решение:
-
Сжатие токенов для формирования общего контекста;
-
Интеллектуальное выделение значимых фрагментов текста;
-
Локализованный анализ с использованием скользящего окна.
Kimi MoBA основана на следующих принципах:
-
Разбиение контекста на отдельные блоки;
-
Система умного отбора релевантных блоков;
-
Гибкое переключение между плотным и разреженным вниманием.
Результаты впечатляют:
-
NSA обеспечивает ускорение до 11,6 раза при декодировании и оптимизирована для работы с современными графическими процессорами (GPU).
-
MoBA демонстрирует ускорение в 6,5 раза в производственных условиях и предоставляет открытый исходный код.
-
Оба решения сохраняют или даже повышают качество работы моделей и легко интегрируются в существующие системы.
Преимущества для бизнеса включают:
-
Сокращение расходов на использование ИИ;
-
Возможность работы с объемными документами;
-
Повышение эффективности автоматизации процессов.
Эксперты выделяют ключевые аспекты:
-
Технологии переходят от простых улучшений к коренным изменениям в функционировании ИИ.
-
Найден баланс между функциональностью и стоимостью вычислений.
-
Открываются новые перспективы для практических применений.