Stable Diffusion — единственный профессиональный генератор изображений с полностью открытым исходным кодом. В отличие от Midjourney или DALL-E, его можно установить на свой компьютер, использовать без ограничений, подключать кастомные модели и полностью контролировать процесс генерации. Это выбор тех, кто хочет не просто «пользоваться нейросетью», а по-настоящему разобраться в генерации.
Минимум: GPU с 4 ГБ VRAM (NVIDIA), 8 ГБ RAM — медленно, ограниченное разрешение
Комфортно: GPU с 8 ГБ VRAM, 16 ГБ RAM
Профессионально: RTX 3080/4080 или выше, 24+ ГБ VRAM
Нет GPU: Используйте облачные версии (Google Colab, Mage.space, DreamStudio)
Владельцы Mac с чипом Apple Silicon (M1/M2/M3) могут запускать через Core ML вариант — работает через MPS, не через CUDA.
AUTOMATIC1111 (A1111) — самый популярный, максимум функций, огромное количество расширений. Немного сложен для новичков, но любой вопрос можно найти на форумах.
ComfyUI — node-based интерфейс, полный контроль над пайплайном генерации. Для продвинутых пользователей. Используется в профессиональной разработке и сложных воркфлоу.
Forge — форк A1111, оптимизирован для новых архитектур (FLUX, SD3). Рекомендуется для новых установок в 2026 году.
Fooocus — самый простой вариант, минималистичный интерфейс, автоматические настройки. Идеален для начинающих.
Рекомендация для новичка: Начните с Fooocus (проще всего) или Forge (больше функций, активно поддерживается).
Модели скачиваются с Civitai.com и HuggingFace. Три категории:
Для фотореализма:
Для иллюстраций и арта:
Для концепт-арта:
В отличие от Midjourney, Stable Diffusion лучше работает с перечислением ключевых слов через запятую:
Позитивный промпт: главный субъект, детали, стиль, качество, техника съёмки
Негативный промпт: что не должно появиться в изображении
Позитивный: RAW photo, portrait of a young woman, 30 years old, brown eyes, soft smile, looking at camera, professional studio lighting, bokeh background, 85mm lens, 8k uhd, high quality, photorealistic
Негативный: (deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, ugly, disgusting, blurry, amputation
Позитивный: epic landscape, ancient forest at sunset, golden hour, volumetric light rays, fog, mossy rocks, fantasy atmosphere, ultra detailed, 8k, cinematic
Негативный: ugly, blurry, low quality, watermark, text, signature
Позитивный: concept art, fantasy warrior woman, ornate armor, detailed face, dramatic lighting, digital painting, artstation, highly detailed, professional illustration
Негативный: bad anatomy, deformed, ugly, worst quality, low quality, normal quality, lowres, watermark, signature, text
Steps (шаги): 20–30 для большинства задач. Больше — не всегда лучше, часто 25 шагов достаточно.
CFG Scale: насколько строго следовать промпту. 7–10 для фото, 4–6 для арта. Высокие значения (>12) дают артефакты.
Sampler: DPM++ 2M Karras или Euler a — универсальные. Для FLUX: Euler.
Resolution: 512×512 для SD1.5, 1024×1024 для SDXL и FLUX. Нестандартные соотношения сторон иногда дают артефакты.
ControlNet — управление позой, глубиной, краями. Позволяет генерировать изображения, следуя точной позе референсного фото.
ADetailer — автоматически улучшает лица на изображениях. Убирает искажения и «кашу» на мелких деталях.
Ultimate SD Upscale — увеличивает разрешение с сохранением деталей.
Stable Diffusion — это не быстрый способ получить красивую картинку. Это полноценная творческая мастерская с крутой кривой обучения. Но когда разберётесь — получите полный контроль над генерацией без ограничений и подписок.
Ежедневные подборки промптов, свежие новости и материалы об ИИ — там, где удобно. Без спама, только редакционный отбор.