Китайский стартап DeepSeek стал всемирно известен в начале 2025 года после релиза своей «рассуждающей» модели DeepSeek R1. Анонс продукта вызвал обвал акций крупнейших американских компаний и вызвал опасения по поводу дальнейшего доминирования западных ИИ-решений в мире. Разберёмся, оправданна ли такая репутация DeepSeek, чем продукты компании так поразили общественность и действительно ли они сопоставимы с лучшими западными разработками.
До 2024 года о разработчике нашумевших моделей знали в основном только в профессиональном сообществе. При этом сама компания DeepSeek берёт своё начало ещё в 2015 году. Именно тогда выпускники Чжэцзянского университета во главе с Ляном Вэньфэном создали хедж-фонд High-Flyer и начали применять алгоритмы машинного обучения для анализа фондовых рынков и торговли на бирже.
К 2019 году High-Flyer управлял активами на сумму 10 миллиардов долларов. К слову, сегодня он считается одним из самых крупных в Китае. Уже тогда искусственный интеллект применялся практически во всех стратегиях компании.
В 2021 году внутри High-Flyer появляется отдельная структура High-Flyer AI для проведения исследований в области ИИ. В 2023 году её переименовали в DeepSeek. В декабре 2024 года прогремел первый анонс — неожиданно для всех компания представила модель DeepSeek-V3 — прямого конкурента популярнейшей модели GPT-4o от OpenAI. А ещё спустя месяц DeepSeek выпустила «рассуждающую» нейросеть DeepSeek-R1 — аналог модели o1 от OpenAI.
С первых дней выхода продукты DeepSeek приобрели небывалую популярность: по качеству модели не уступали лучшим разработкам американских компаний. Больше всего специалистов поразило то, что даже в условиях санкций, которые закрыли Китаю прямой доступ к лучшим ускорителям для обучения ИИ от Nvidia, учёные компании смогли создать очень качественные модели. При этом в обучение нейросети R1 стартап вложил всего $5,5 миллиона. Заявленная стоимость разработки DeepSeek-R1 оказалась сопоставимой — около $5–6 миллионов. Для сравнения: по неофициальным оценкам, GPT-4o обошлась OpenAI более чем в $100 миллионов.
Ещё одним важным преимуществом DeepSeek-R1 стала её экономичность для сторонних разработчиков — при использовании по API она оказалась почти в 30 раз дешевле аналогичной «рассуждающей» модели o1 от OpenAI. Более того, в отличие от большинства западных продуктов, DeepSeek-R1 имеет открытый исходный код. А это значит, что саму модель и её производные версии можно бесплатно скачивать и модифицировать под собственные нужды.
По своему функционалу модели DeepSeek-V3 и DeepSeek-R1 похожи на другие популярные продукты, например нейросети семейства ChatGPT от OpenAI, Claude от Anthropic и GigaChat от Сбера. Обе модели способны анализировать и генерировать текст на разных языках. При этом DeepSeek-V3 отлично справляется с анализом изображений, а DeepSeek-R1 долгое время считалась одним из лидеров в области написания кода и решения математических задач, а также славилась своими навыками поиска необходимой информации в интернете.
Сравнение DeepSeek-R1 с моделями OpenAI, Google и Alibaba на различных тестах
В отличие от некоторых других популярных продуктов, DeepSeek-V3 и DeepSeek-R1 не могут самостоятельно генерировать изображения. Однако китайские разработчики позаботились и об этом, выпустив для своих пользователей отдельную модель Janus Pro.
Самый простой способ начать работать с моделями — зайти через официальный сайт https://chat.deepseek.com/. Зарегистрироваться можно с помощью аккаунта Google или электронной почты.
Также для использования нейросети можно скачать мобильное приложение, которое доступно как для Android, так и для iOS. Приложение поддерживает русский язык. Ещё один метод — локальный запуск на собственном компьютере. Однако для развёртывания DeepSeek-R1 на стандартном ПК потребуется несколько видеокарт с большим объёмом видеопамяти.
В 2025–2026 годах эксперты ожидают выпуск модели DeepSeek-R2, запуск которой, по слухам, откладывается из-за неудовлетворительных результатов нейросети в тестах. В конце апреля компанией были представлены DeepSeek Prover-V2 — две модели, разработанные для доказательства теорем и решения математических задач. Отмечается, что данные продукты превосходят как специализированные решения, так и флагманские модели в области формальной математики. Что не менее важно, компания хочет сохранить статус «открытой» и делиться всеми новыми разработками с сообществом.
Нейросети DeepSeek уже зарекомендовали себя как качественный продукт, несмотря на более скромный бюджет по сравнению с западными компаниями. Модели DeepSeek являются действительно полезным инструментом как для рядовых пользователей, так и в профессиональной сфере.
Воспользоваться ими можно бесплатно, а лимитов на генерацию текста у нейросетей стартапа нет. Поэтому DeepSeek можно назвать одной из немногих действительно демократичных ИИ-систем с высоким качеством генерации.