История·22 июня 2026·8 мин

раздеть девушку нейросетью: история прогресса

Попробуй прямо сейчас

3 бесплатные обработки. Без регистрации.

От размытых артефактов 2019 года до фотореалистичных результатов 2026-го — прослеживаем эволюцию технологии нейросетевого раздевания и понимаем, что именно привело к современному уровню качества.

Предыстория: GAN как фундамент (2014–2018)

Технологическая история нейросетевого раздевания неотделима от истории генеративно-состязательных сетей (GAN). Архитектуру GAN предложил Ян Гудфеллоу в 2014 году, но первые несколько лет она применялась преимущественно для генерации лиц и абстрактных изображений.

К 2017–2018 годам GAN-модели достигли достаточного уровня, чтобы генерировать вполне убедительные изображения лиц (проект StyleGAN от NVIDIA). Это послужило технологическим фундаментом для следующего шага — применения аналогичного подхода к телу целиком.

Ключевые достижения периода:

StyleGAN (2018) — убедительная генерация лиц высокого разрешения
pix2pix (2017) — условная генерация «изображение в изображение», заложившая основу для image-to-image трансформаций
CycleGAN (2017) — перенос стиля без парных обучающих данных

2019: первая волна специализированных сервисов

Попробуй прямо сейчас

3 бесплатные обработки. Без регистрации.

Открыть →

В 2019 году появился DeepNude — первый широко известный сервис, специализированно обученный для генерации обнажённого тела по фотографии с одеждой. Сервис основывался на архитектуре pix2pix и был обучен на специфическом датасете.

Качество результатов по современным меркам было очень низким: характерная размытость, неестественные пропорции, заметные артефакты. Однако сам факт существования подобного инструмента произвёл огромный резонанс, и вскоре после запуска сервис был закрыт авторами под давлением общественности.

Тем не менее исходный код утёк в сеть, что породило волну клонов и дальнейших разработок на этой основе. Джинн вышел из бутылки — технологию остановить было невозможно.

2020–2021: улучшенные GAN и первые попытки диффузии

В 2020–2021 годах разработчики экспериментировали с улучшенными архитектурами GAN: BigGAN, StyleGAN2, VQGAN. Качество генерации росло, но фундаментальные ограничения GAN-подхода никуда не девались — нестабильность обучения, артефакты, ограниченное понимание анатомии.

Параллельно начались первые эксперименты с диффузионными моделями для image-to-image задач. DDPM (Denoising Diffusion Probabilistic Models) от OpenAI показали многообещающие результаты, хотя ещё не были применены для специализированных задач.

2022: Stable Diffusion открывает эпоху

Выход Stable Diffusion 1.4 в августе 2022 года стал переломным моментом. Открытый исходный код означал, что тысячи разработчиков по всему миру получили доступ к мощной диффузионной модели для дообучения под свои задачи.

В течение нескольких месяцев после релиза появились первые специализированные модели для нейросетевого раздевания, построенные на SD 1.4/1.5. Качество по сравнению с GAN-аналогами было принципиально выше — диффузионный подход давал значительно более реалистичные текстуры кожи и лучшее понимание анатомии.

2023: ControlNet революционизирует сохранение позы

В 2023 году появился ControlNet — архитектурное дополнение к диффузионным моделям, позволяющее точно контролировать позу через карту ключевых точек тела. До ControlNet была серьёзная проблема: модель меняла позу человека при генерации, что делало результаты неестественными.

С ControlNet поза сохранялась с точностью, недостижимой ранее. Это стало ключевым прорывом для задачи нейросетевого раздевания. Параллельно вышел SDXL — модель с вдвое увеличенным числом параметров, генерирующая изображения 1024×1024 нативно.

2024–2025: масштабирование и специализация

2024–2025 годы стали эпохой масштабирования и глубокой специализации. Трансформерная архитектура начала вытеснять классический UNet в диффузионных моделях, что дало скачок качества и скорости генерации.

Появились специализированные модели сегментации одежды (на основе Segment Anything), интегрированные в единый конвейер с диффузионным инпейнтингом. Время обработки сократилось с десятков секунд до 2–4 секунд благодаря оптимизации через TensorRT и INT8-квантизацию.

2026: Diffusion v3.4 — современный стандарт

Diffusion v3.4, лежащая в основе RazdevatorFoto, представляет современный пик технологии. Трансформерная архитектура DiT (Diffusion Transformer), нативное разрешение до 2048×2048, точность сохранения идентичности лица 97%+.

Расстояние между 2019 и 2026 годом — это семь лет стремительного прогресса, сжавшего десятилетия традиционного компьютерного зрения в несколько итераций архитектурных инноваций. Тот, кто видел результаты DeepNude 2019 года, с трудом поверит, что смотрит на результаты той же базовой задачи, решённой принципиально иными средствами в 2026-м.