Китайский разработчик искусственного интеллекта DeepSeek представил новую версию языковой модели DeepSeek-V4. Об этом компания сообщила в соцсети X.
Модель представлена в двух вариантах: флагманской DeepSeek-V4-Pro и более экономичной V4-Flash. Обе они работают на открытом исходном коде, сообщили в компании. По словам разработчиков, Pro-версия значительно превосходит другие открытые модели в тестах на знание мира и уступает только закрытой модели Gemini-Pro-3.1 от Google, передает Reuters.
Запуск V4 состоялся на фоне усиливающейся технологической напряженности между США и Китаем — буквально на следующий день после того, как Белый дом обвинил Пекин в краже интеллектуальной собственности американских лабораторий ИИ в промышленных масштабах, отмечает Reuters. Такие обвинения также выдвигала американская OpenAI: 13 апреля компания заявила, что китайская DeepSeek использует ведущие американские модели ИИ для обучения своего чат-бота R1 с применением метода дистилляции, при котором одна модель обучается на результатах другой. DeepSeek же утверждала, что не использовала синтетические данные, сгенерированные OpenAI.