Малоизвестная китайская лаборатория искусственного интеллекта DeepSeek вызвала панику в Кремниевой долине, выпустив модели ИИ, которые могут превзойти лучшие американские модели. При этом, китайская нейросеть дешевле и работает на менее мощных чипах. Лаборатория DeepSeek представила бесплатную модель с открытым исходным кодом для работы с большими языковыми данными, на создание которой ушло всего два месяца и менее $6 млн. Для этого использовались чипы Nvidia H800 с ограниченными возможностями. Новые разработки вызвали опасения по поводу того, что мировое лидерство США в области искусственного интеллекта сокращается, и поставили под сомнение огромные расходы крупных технологических компаний на создание моделей ИИ и центров обработки данных. В […]
Дата публикации: Янв 27, 2025
Малоизвестная китайская лаборатория искусственного интеллекта DeepSeek вызвала панику в Кремниевой долине, выпустив модели ИИ, которые могут превзойти лучшие американские модели. При этом, китайская нейросеть дешевле и работает на менее мощных чипах.
Лаборатория DeepSeek представила бесплатную модель с открытым исходным кодом для работы с большими языковыми данными, на создание которой ушло всего два месяца и менее $6 млн. Для этого использовались чипы Nvidia H800 с ограниченными возможностями.
Новые разработки вызвали опасения по поводу того, что мировое лидерство США в области искусственного интеллекта сокращается, и поставили под сомнение огромные расходы крупных технологических компаний на создание моделей ИИ и центров обработки данных.
В наборе сторонних тестов модель DeepSeek превзошла такие LLM, как Llama 3.1 от Meta, GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic по точности в решении сложных задач, а также в математике и программировании.
Недавно компания DeepSeek выпустила r1 — модель логического мышления, которая также превзошла последнюю модель OpenAI o1 во многих сторонних тестах.
– Новая модель DeepSeek очень впечатляет с точки зрения того, насколько эффективно китайцы создали модель с открытым исходным кодом, которая выполняет вычисления во время логического вывода и является высокоэффективной, – говорит CEO Microsoft Сатья Наделла.
DeepSeek также пришлось столкнуться со строгими ограничениями на полупроводники, которые правительство США ввело в отношении Китая, лишив страну доступа к самым мощным чипам, таким как H100 от Nvidia. Последние достижения говорят о том, что DeepSeek либо нашла способ обойти правила, либо экспортный контроль не оказал того удушающего эффекта, на который рассчитывал Вашингтон.
О лаборатории и ее основателе Лян Вэньфэне известно немногое. DeepSeek была создана китайским хедж-фондом High-Flyer Quant, который управляет активами на сумму около $8 млрд.
Но DeepSeek – не единственная китайская компания, добивающаяся успеха.
Ведущий исследователь в области ИИ Кай-Фу Ли заявил, что его стартап 01.ai был обучен всего за $3 млн. Материнская компания TikTok ByteDance в среду выпустила обновление своей модели, которая, как утверждается, превосходит o1 от OpenAI в ключевом тестовом задании.
– Необходимость – мать изобретения, – отмечает CEO Perplexity Аравинд Шринивас. – Поскольку китайцам пришлось искать обходные пути, в итоге они создали нечто гораздо более эффективное.