BTC 99342.3$
ETH 2834.66$
Tether (USDT) 1$
Toncoin (TON) 3.69$
telegram vk
telegram vk Х
Russian English
"

DeepSeek и Kimi представили технологии, которые могут изменить возможности языковых моделей

Дата публикации:20.02.2025, 07:34
148
148
Поделись с друзьями!

Две китайские компании, DeepSeek и Kimi, практически одновременно представили инновационные технологии, способные значительно расширить функциональные возможности языковых моделей. DeepSeek представила NSA, тогда как Kimi выпустила MoBA — оба решения направлены на устранение основной проблемы современных систем искусственного интеллекта (ИИ), связанной с неэффективностью обработки длинных текстов.

Современные ИИ-модели расходуют до 80% времени на механизмы внимания при обработке длинных текстов, что ведет к значительным вычислительным затратам и ограничивает работу с крупными документами, базами кода и продолжительными диалогами.

DeepSeek NSA предлагает трехступенчатое решение:

  • Сжатие токенов для формирования общего контекста;

  • Интеллектуальное выделение значимых фрагментов текста;

  • Локализованный анализ с использованием скользящего окна.

Kimi MoBA основана на следующих принципах:

  • Разбиение контекста на отдельные блоки;

  • Система умного отбора релевантных блоков;

  • Гибкое переключение между плотным и разреженным вниманием.

Результаты впечатляют:

  • NSA обеспечивает ускорение до 11,6 раза при декодировании и оптимизирована для работы с современными графическими процессорами (GPU).

  • MoBA демонстрирует ускорение в 6,5 раза в производственных условиях и предоставляет открытый исходный код.

  • Оба решения сохраняют или даже повышают качество работы моделей и легко интегрируются в существующие системы.

Преимущества для бизнеса включают:

  • Сокращение расходов на использование ИИ;

  • Возможность работы с объемными документами;

  • Повышение эффективности автоматизации процессов.

Эксперты выделяют ключевые аспекты:

  1. Технологии переходят от простых улучшений к коренным изменениям в функционировании ИИ.

  2. Найден баланс между функциональностью и стоимостью вычислений.

  3. Открываются новые перспективы для практических применений.

Подписывайся на наш Telegram канал. Не трать время на мониторинг новостей. Только срочные и важные новости

https://t.me/block_chain24