Рамблер
Все новости
Личные финансы
Женский
Кино
Спорт
Aвто
Развлечения и отдых
Здоровье
Путешествия
Помощь
Полная версия

Как генерировать изображения в нейросети Kandinsky от Сбера

Среди отечественных моделей для генерации изображений лидирует нейросеть Kandinsky. Созданная командой Сбера, эта модель завоевала популярность в сети и обрела миллионы пользователей. Расскажем, что из себя представляет семейство этих моделей, в чём их преимущества и недостатки, а также как получить к ним доступ.

© Kandinsky

Что такое Kandinsky?

Kandinsky — это флагманское семейство генеративных ИИ-моделей Сбера, названное в честь выдающегося русского художника Василия Кандинского, одного из основоположников абстракционизма. Проект задумывался как отечественная альтернатива ведущим иностранным нейросетями, таким как Midjourney и Stable Diffusion. Разработкой и усовершенствованием решения занимаются специалисты Sber AI в сотрудничестве с Институтом искусственного интеллекта AIRI.

Kandinsky позволяет:

  • генерировать изображения по текстовому запросу
  • редактировать полученные картинки
  • дорисовывать детали на существующих изображениях
  • создавать визуальные объекты на основе загруженных файлов
  • создавать короткие видео и анимации

Сегодня продукт Kandinsky является одним из самых популярных в России — в марте 2025 года совокупное количество пользователей данной нейросети и чат-бота GigaChat от Сбера достигло 18 миллионов.

Последняя версия Kandinsky

В июне 2025 года вышла актуальная версия Kandinsky 4.1. Новая модель получила существенные улучшения по сравнению с версией 3.1 благодаря переходу на новую архитектуру Diffusion Transformer (DiT), которая пришла на смену U-Net и обеспечила более высокое качество, устойчивость и масштабируемость генерации.

© nikgerasimenko/Хабр

Помимо роста качества, Kandinsky 4.1 стала работать почти в четыре раза быстрее благодаря оптимизации обучения и уменьшению размера модели. Существенно улучшились соответствие промпту, корректность деталей на изображении, а также чёткость образов из русской культуры. Кроме того, модель научилась лучше генерировать текст на изображениях и создавать целые логотипы.

Как получить доступ к Kandinsky

Отличительной особенностью Kandinsky является большое число точек входа. Поработать с Kandinsky можно:

  • На платформе Fusion Brain. Здесь доступен полный функционал последней модели Сбера: генерация и редактирование изображений, а также изменение загруженных картинок
  • На платформе ruDALL-E. Функционал сайта ограничен — доступна генерация только по текстовым запросам и только до модели Kandinsky 3.1. Но можно попробовать разные модели Сбера, включая ранние архивные — Kandinsky 2.2, 2.1, ruDALL-E и так далее.
  • Через бот GigaChat в ВК. Также обладает ограниченным функционалом. Однако подходит для быстрой визуализации идей: например, создать картинку к посту в группе.
  • Telegram-бот GigaChat. Может сгенерировать изображение, предложить вариации картинок, создать стикеры, отобразить выбранный стиль и так далее. Также поддерживает генерацию видео.

Также генерировать изображения можно при помощи виртуального ассистента в мобильном приложении «Салют» или на умных устройствах Сбера через команду «Включи художника».

Плюсы Kandinsky

  • Нейросеть является абсолютно бесплатной
  • Доступна для пользователей из России
  • Модели Kandinsky мультиязычны, но особенно хорошо они понимают и реализуют запросы на русском языке
  • Создаёт изображения в разных стилях — от реалистичных до мультипликации
  • Может воспроизводить известных российскому зрителю персонажей, героев фольклора и так далее
  • Имеет множество точек входа
  • Позволяет создавать анимацию и видео
  • Имеет простой и интуитивно понятный интерфейс

Минусы Kandinsky

  • Сгенерированные картинки разрешены только для некоммерческого использования
  • Не всегда точно следует промпту
  • Хуже западных аналогов справляется с передачей анатомии человека, имеет меньшую глубину изображений, создаёт менее детализированные картинки

В итоге

Сегодня Kandinsky является превосходным ИИ-инструментом для пользователей в России. Нейросети Сбера обладают интуитивно понятным функционалом и помогают воплощать разнообразные творческие идеи. Очевидно, что платформа продолжит развиваться. Основной упор будет сделан на совершенствование визуальных возможностей моделей, а также на развитие видео-модальности, которая приобретает огромную популярность во всем мире.

Kandinsky будет интегрироваться в растущее количество продуктов Сбера и находить новые сферы применения. Ожидается, что модели будут активнее использоваться бизнесом и государственными организациями — при оформлении выставок, создании афиш, баннеров, в архитектурных проектах и многих других областях.

© Kandinsky