Вы здесь

DeepSeek представили новую открытую модель V3:

Дата публикации:27.12.2024, 06:34

120

120

Поделись с друзьями!

DeepSeek представила новое, третье поколение своей языковой модели, что является значительным достижением компании:

1. Высокая производительность:

Скорость обработки увеличена втрое по сравнению с предыдущей версией: модель способна обрабатывать до 60 токенов в секунду.
Масштабируемая архитектура: модель включает 671 миллиард параметров благодаря использованию передовых технологий Mixture of Experts (MoE).
Обучение проводилось на основе 14.8 триллионов высококачественных токенов данных.

2. Доступность и интеграция:

Исходный код модели и сопутствующие исследования полностью открыты для использования.
Привлекательные условия ценообразования: стоимость составляет всего $0.27 за каждый миллион входных токенов.
Поддерживается полная совместимость с предыдущими версиями API, что облегчает интеграцию.
DeepSeek заняла лидирующую позицию в рейтинге BigCode Bench-Hard.
Показатели модели превосходят результаты Claude 3.5 Sonnet на тесте Aider.

Компания Hume AI анонсировала новую голосовую модель — OCTAVE

Глобальный сбой в работе ChatGPT

Казахстан взял курс на ИИ:уже есть KazLLM и запущен международный центр ИИ AlemAI

ChatGPT для медицины. Microsoft представляет BiomedCLIP

Сеть Orochi Сотрудничает с OG Labs в области искусственного интеллекта

World Labs представил ИИ-систему, которая превращает обычные изображения в полноценные 3D-миры

Комментарии

Комментарии для сайта Cackle

Сбор налога на майнинг в Кыргызстане упал на 50% в годовом исчислении в 2024 году

Представитель MiCA Crypto Alliance: «Молчание ЕС не делает USDT совместимым с MiCA»

Tether вкладывает $775 млн в платформу для обмена видео Rumble

Подтвержденные биткоин-платежи достигли годового минимума на фоне праздничной неликвидности

Голосование за использование BUIDL от BlackRock в качестве резервного актива для стеблкоина Frax запущено