Вы здесь

DeepSeek и Kimi представили технологии, которые могут изменить возможности языковых моделей

Дата публикации:20.02.2025, 07:34

373

Поделись с друзьями!

Две китайские компании, DeepSeek и Kimi, практически одновременно представили инновационные технологии, способные значительно расширить функциональные возможности языковых моделей. DeepSeek представила NSA, тогда как Kimi выпустила MoBA — оба решения направлены на устранение основной проблемы современных систем искусственного интеллекта (ИИ), связанной с неэффективностью обработки длинных текстов.

Современные ИИ-модели расходуют до 80% времени на механизмы внимания при обработке длинных текстов, что ведет к значительным вычислительным затратам и ограничивает работу с крупными документами, базами кода и продолжительными диалогами.

DeepSeek NSA предлагает трехступенчатое решение:

Сжатие токенов для формирования общего контекста;
Интеллектуальное выделение значимых фрагментов текста;
Локализованный анализ с использованием скользящего окна.

Kimi MoBA основана на следующих принципах:

Разбиение контекста на отдельные блоки;
Система умного отбора релевантных блоков;
Гибкое переключение между плотным и разреженным вниманием.

Результаты впечатляют:

NSA обеспечивает ускорение до 11,6 раза при декодировании и оптимизирована для работы с современными графическими процессорами (GPU).
MoBA демонстрирует ускорение в 6,5 раза в производственных условиях и предоставляет открытый исходный код.
Оба решения сохраняют или даже повышают качество работы моделей и легко интегрируются в существующие системы.

Преимущества для бизнеса включают:

Сокращение расходов на использование ИИ;
Возможность работы с объемными документами;
Повышение эффективности автоматизации процессов.

Эксперты выделяют ключевые аспекты:

Технологии переходят от простых улучшений к коренным изменениям в функционировании ИИ.
Найден баланс между функциональностью и стоимостью вычислений.
Открываются новые перспективы для практических применений.