Команда исследователей Hugging Face объявила о создании полностью открытой версии #DeepSeek R1, включающей все компоненты модели, акцентируя внимание на недостаточной прозрачности текущей версии. Этот шаг примечателен не только использованием мощного кластера из 768 GPU Nvidia H100, но и отражением глубоких изменений в сфере искусственного интеллекта.
Недавние достижения DeepSeek, такие как демонстрация возможности запуска модели R1 на локальной системе стоимостью всего $6000, стали катализатором обсуждения. Система, основанная на двух процессорах AMD EPYC и 768 ГБ оперативной памяти, не требует использования дорогих GPU. Это достижение свидетельствует о значительном сдвиге в отрасли: большая часть вычислительных ресурсов в будущем будет направлена не на обучение моделей, а на их использование (инференс).
Эксперты указывают, что крупным корпоративным пользователям придется выбирать между продолжением эксплуатации дорогостоящих гиперскейлерных дата-центров и переходом на более доступные локальные решения. Развертывание локальных систем позволит компаниям заменить регулярные платежи за облачные API одноразовыми вложениями в оборудование.
Ян ЛеКун считает, что отрасль находится на пороге новой революции: будущие системы будут не только работать с текстом, но также понимать физический мир, иметь постоянную память, способность к рассуждениям и иерархическому планированию. Эти нововведения увеличат требования к вычислительным ресурсам для инференса. При этом ЛеКун подчеркивает важность сотрудничества в развитии технологий, утверждая, что успех инновационных проектов зависит не от конкуренции, а от обмена идеями.
Ситуация позволяет выделить несколько ключевых моментов:
-
В будущем акцент в области вычислений ИИ сместится с обучения моделей на оптимизацию инференса.
-
Локальные решения могут стать предпочтительнее для бизнеса по сравнению с облачными сервисами.
-
Успех в развитии ИИ будет зависеть от сбалансированного подхода к открытости исследований и практическим аспектам применения.
-
Важнейшими факторами станут не только технологические преимущества, но и экономическая эффективность и простота внедрения решений.