Alibaba Cloud выпустила обновленную версию своей флагманской модели ИИ Qwen2.5-Max, которая показала лучшие результаты, чем ведущие конкуренты с открытым исходным кодом, в том числе модель V3 от DeepSeek и модель Llama 3.1 от Meta (META).
Подразделение Alibaba Group, занимающееся облачными вычислениями, также обнаружило, что Qwen2.5-Max показывает сопоставимую производительность с GPT-4 от OpenAI и Claude 3.5 Sonnet от Anthropic – обеими моделями с закрытым исходным кодом.
Китайская компания заявила, что её модель ИИ «продемонстрировала лучшие в мире результаты в основных авторитетных тестах», включая Massive Multitask Language Understanding (MMLU), оценивающий общие знания, а также LiveCodeBench, который проверяет навыки программирования.
Анонс Qwen2.5-Max последовал за запуском DeepSeek моделей DeepSeek-R1, которые продемонстрировали сопоставимую с моделями OpenAI, O1-mini и O1 производительность.
Инвесторов напугал запуск DeepSeek-R1. Хотя Alibaba Cloud не раскрыла информацию о затратах на разработку, заявление команды DeepSeek о том, что они создали свою модель всего за $5,6 млн, привлекло внимание рынка, бросив вызов предположениям о необходимости крупных инвестиций для разработки ИИ. Появление DeepSeek вызвало один из самых крупных обвалов на фондовом рынке США.
Стало известно, что Microsoft и OpenAI подозревают DeepSeek в несанкционированном доступе к большому массиву данных американской компании. Об этом сообщает Bloomberg. В компаниях считают, что китайский стартап мог использовать данные, сгенерированные ИИ-моделями OpenAI для обучения DeepSeek.
Также приложение DeepSeek стало недоступным в магазинах приложений Apple и Google в Италии. Коалиция потребителей под названием Euroconsumers подала жалобу в Управление по защите данных Италии в связи с тем, как DeepSeek обрабатывает персональные данные.