Как генерировать изображения в нейросети Kandinsky от Сбера
Среди отечественных моделей для генерации изображений лидирует нейросеть Kandinsky. Созданная командой Сбера, эта модель завоевала популярность в сети и обрела миллионы пользователей. Расскажем, что из себя представляет семейство этих моделей, в чём их преимущества и недостатки, а также как получить к ним доступ.
Что такое Kandinsky?
Kandinsky — это флагманское семейство генеративных ИИ-моделей Сбера, названное в честь выдающегося русского художника Василия Кандинского, одного из основоположников абстракционизма. Проект задумывался как отечественная альтернатива ведущим иностранным нейросетями, таким как Midjourney и Stable Diffusion. Разработкой и усовершенствованием решения занимаются специалисты Sber AI в сотрудничестве с Институтом искусственного интеллекта AIRI.
Kandinsky позволяет:
- генерировать изображения по текстовому запросу
- редактировать полученные картинки
- дорисовывать детали на существующих изображениях
- создавать визуальные объекты на основе загруженных файлов
- создавать короткие видео и анимации
Сегодня продукт Kandinsky является одним из самых популярных в России — в марте 2025 года совокупное количество пользователей данной нейросети и чат-бота GigaChat от Сбера достигло 18 миллионов.
Последняя версия Kandinsky
В июне 2025 года вышла актуальная версия Kandinsky 4.1. Новая модель получила существенные улучшения по сравнению с версией 3.1 благодаря переходу на новую архитектуру Diffusion Transformer (DiT), которая пришла на смену U-Net и обеспечила более высокое качество, устойчивость и масштабируемость генерации.
Помимо роста качества, Kandinsky 4.1 стала работать почти в четыре раза быстрее благодаря оптимизации обучения и уменьшению размера модели. Существенно улучшились соответствие промпту, корректность деталей на изображении, а также чёткость образов из русской культуры. Кроме того, модель научилась лучше генерировать текст на изображениях и создавать целые логотипы.
Как получить доступ к Kandinsky
Отличительной особенностью Kandinsky является большое число точек входа. Поработать с Kandinsky можно:
- На платформе Fusion Brain. Здесь доступен полный функционал последней модели Сбера: генерация и редактирование изображений, а также изменение загруженных картинок
- На платформе ruDALL-E. Функционал сайта ограничен — доступна генерация только по текстовым запросам и только до модели Kandinsky 3.1. Но можно попробовать разные модели Сбера, включая ранние архивные — Kandinsky 2.2, 2.1, ruDALL-E и так далее.
- Через бот GigaChat в ВК. Также обладает ограниченным функционалом. Однако подходит для быстрой визуализации идей: например, создать картинку к посту в группе.
- Telegram-бот GigaChat. Может сгенерировать изображение, предложить вариации картинок, создать стикеры, отобразить выбранный стиль и так далее. Также поддерживает генерацию видео.
Также генерировать изображения можно при помощи виртуального ассистента в мобильном приложении «Салют» или на умных устройствах Сбера через команду «Включи художника».
Плюсы Kandinsky
- Нейросеть является абсолютно бесплатной
- Доступна для пользователей из России
- Модели Kandinsky мультиязычны, но особенно хорошо они понимают и реализуют запросы на русском языке
- Создаёт изображения в разных стилях — от реалистичных до мультипликации
- Может воспроизводить известных российскому зрителю персонажей, героев фольклора и так далее
- Имеет множество точек входа
- Позволяет создавать анимацию и видео
- Имеет простой и интуитивно понятный интерфейс
Минусы Kandinsky
- Сгенерированные картинки разрешены только для некоммерческого использования
- Не всегда точно следует промпту
- Хуже западных аналогов справляется с передачей анатомии человека, имеет меньшую глубину изображений, создаёт менее детализированные картинки
В итоге
Сегодня Kandinsky является превосходным ИИ-инструментом для пользователей в России. Нейросети Сбера обладают интуитивно понятным функционалом и помогают воплощать разнообразные творческие идеи. Очевидно, что платформа продолжит развиваться. Основной упор будет сделан на совершенствование визуальных возможностей моделей, а также на развитие видео-модальности, которая приобретает огромную популярность во всем мире.
Kandinsky будет интегрироваться в растущее количество продуктов Сбера и находить новые сферы применения. Ожидается, что модели будут активнее использоваться бизнесом и государственными организациями — при оформлении выставок, создании афиш, баннеров, в архитектурных проектах и многих других областях.