Улучшаем качество ваших генераций в Stable Diffusion в десятки раз. Советы, лайфхаки и полезности
Привет, сегодня поговорим о реальных методах того, как повысить качество результатов работы в нейросети Stable Diffusion во много раз. Я дошел до этих советов через многие месяцы и бессонные недели и сегодня решил поделиться ими с вами.
Также обсудим тренировку моделей LoRA и Dreambooth.
В видео вы найдете для себя полезные расширения, ресурсы, плагины и ссылки.
Мой канал телеграм - t.me/yiu_ai
Чат, где я могу вам помочь - t.me/yiu_chat
Ссылка на блокнот Dreambooth - clck.ru/34TViA
Ссылка на репозиторий LoRA - clck.ru/34TVkG
Ссылка на модель LoRA из видео - clck.ru/34TzxS
Увеличение детализации лица - clck.ru/34TVn6
Figma - www.figma.com
LAION 5B (датасет Stable Diffusion) - clck.ru/34TX5N
Промпт для повышения детализации - extremely high quality RAW photograph, detailed background, intricate, Exquisite details and textures, highly detailed, ultra detailed photograph, warm lighting, artstation, 4k, sharp focus, high resolution, detailed skin, detailed eyes, 8k uhd, dslr, high quality, film grain, Fujifilm XT3
Негативный промпт - (deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation
00:00 - приветствие
1:45 - первый лайфхак (CFG Scale)
3:55 - про генерацию лиц
4:45 - расширение canvas zoom
6:00 - как повысить разрешение генерации с помощью LoRA
7:35 - влияние весов в промпте
9:18 - зачем сбрасывать seed
9:43 - правильный запрос и его влияние
11:35 - как копировать промпт с картинки
12:02 - о работе нейронок и мозга
13:42 - о плагине Revision (чит для нейронщика)
16:30 - как не надо тренировать модель на своем лице
20:50 - датасет лиц в Figma
22:10 - про оригинальную модель Stable Diffusion 1.5
23:30 - как исправить лицо на генерации
25:10 - тренировка на лицах по методу Dreambooth
25:53 - еще про LoRA и работа с датасетом в Figma
28:25 - как немного поменять генерацию
29:06 - про эксперименты
30:45 - про качество датасета и апскейл
33:58 - про пользу критики
#stablediffusion #ai #generation #нейросеть #ии #искусственныйинтеллект #графика #изображение #обработка #гайд #guide #dreambooth #lora
лучшее или одно из лучших, гибкость сильно увеличивается и не только
Спасибо за полезный ролик, было интересно, да и увидеть автора)) Ну что добавить, будем пробовать и экспериментировать💫)
Спасииибо!❤ До новых видео :3
Не смогла нигде найти плагин Revision(
ждем новые видео!
Спасибо за видос. Очень позновательно. Лично я тренил Лору со своим личиком по методу Христа ( на 3х эпохах). Получилось вполне себе сносная картинка, если подключить Адеталиер.
Хорошо начал, не слушай хейт, это легче делать на словах ,мне понравилось
Спасибо большое за поддержку! Набираюсь опыта с лучшими❤
Ребят, я выставил максимально низкие настройки, но при генерации картинка получается плохая(Результат один даже при высоких настройках). Что я только не делал, но 3050 не хватает для приемлемого результата. Я мог что-то упустить и есть ли какое-то волшебное средство?
смотрящим и положенцам! спасибо за лайфхаки
какая-то каша в изложении... вроде важные темы затронуты, но постоянно с темы на тему перепрыгиваете, в итоге нет нормальных пояснений или алгоритмов
Учту, пасиба
Здравствуйте подскажите пожалуйста где скачать скрипт Revision?
скрипт платный
@@user-np1fb6wh8g да, спасибо. Нашёл, что платный, уже приобрёл
Спасибо за ролик. А можешь показать, как сгенерить курящего человека с сигаретой?
Не знаю...с первого раза натренировал модель на 35 фото через колаб на DB. Крупные планы ,портреты получаются не отличишь от фото.
отличный выпуск, пару раз месяц обзор опыта это очень круто
Ты очень добрый человек.По крайне мере подача контента.Ты случайно не нейронкой сделан по промту - чистая душа? У меня прям диссонанс какой то в наше то время.В любом случае спасибо за науку и желаю процветания канала.Главное не меняйся подражая кого-то.Или скажи хозяину чтобы не менял твой промт)))
насчет лор персонажей ,очень многое зависит от исходного материала, чисто мое имхо конечно ,основанное на тренировках по моему с мая месяца штук 300 моделей дримбусом и лорой -) ,для лучшего результата - 1024х1024 датасет ,разбавлять 1024х768 , upper body-full body,и да все это на модели 1.5 для персонажа 80 шагов ,при том пофигу какой датасет по размеру 16-или 40 фоток , вот вообще никакой разницы лучшие результаты у меня получались на realistic vision2.0 и photon на остальных не предсказуемо ,про базовой 1,5 -на выходе всегда лютая дичь и еще нормализационные изображения они у меня лично портят результат , почему не знаю но портят,хотя все обзорщики прям настоятельно рекомендуют ну еще плюс лоры в том что его можно применять в разными моделями
по поводу dreambooth лоры ты чет нагнал, я делал по гайду христа с 14 своими фотками одного плана (крупняк лицо) и на dpm++2m оно генерит мне неотличимого от меня человека из раза в раз на кфг скейл 6.5 и 0.85 силе лоры в промтах то же самое с телом и лицом девушки по пояс, в 90% случаев генераций оно делает очень хороший результат. вообще случай с железным человеком показывает, что ты не понимаешь для чего лора нужна -- она нужна, в первую очередь, чтобы делать что-то очень похожее на то, чему ты ее обучил, а уже потом на обычной модели в инпейнте доделывай костюм ЖЧ и получишь четкий результат
Да как у вас всех так быстро модели переключаются? Я когда другую модель выбираю, можно идти чай пить - минуты 2-3 гарантированно ждать
Это называется магия SSD
У меня видюха gtx1660 super😊, Хотел бы я натренировать дримбуф на одном человеке, но у меня только 20 его фотографий. Этого очень мало, да и сняты они не в одном сеттинге)
Подписался! Шикарный урок, спасибо огромное за некоторые вещи которых у других не найти.
Обожаю❤ Ещё выпустил видосик со вкусностями)
Пасиб за видео. Попробую отталкиваться от вашего опыта. Есть вопросы, как обычно. Настройки Dreambooth в скрипте kohya такие же как у лоры? И еще, в каждом описании к пикче нужно ли вначале вставлять название самой Лоры? Много ли тегов нужно в описании?
Вопрос действительно важный и сложный, спасибо) 1. Да, настройки можно оставить все по умолчанию, разработчик постарался и все оптимизировал) от лоры они немного отличаются, но в целом такие же, да 2. На самом деле не обязательно везде пихать описание лоры, так как в любом случае будет основной токен, который вы укажете в названии папки (100_subject) 3. Для простых объектов нужно немного тэгов, но для сложных и разных стилей уже придется все подробно расписать. Например, простые пейзажи можно описать одним-двумя токенами, а стили борокко + какой-нибудь киберпанк с человеком в кожаной куртке требуют подробного описания (10-15 токенов)
@@yiu_ai получается, "trigger_word", что я ввожу и как назввается папка с input, как-то фигурирует в самой Лоре? Это не просто название папки? о_О я просто назвал это типа "razdvatruv151epoch2clip" и вроде того.
А можешь отдельно подробный гайд по дримбуфу сделать со всеми подробностями и ньюансами
Сделал❤
Да какие дизлайк , однозначно благодарочка, респект и уважуха...
Крутые советы! Спасибо! Хотя местами много воды. А фон ты удалял через сайт на панели закладок? Дай ссылку пожалуйста) А насчёт Хачатура, он говорил про ненужность описания к лицам людей, а не вообще (насколько я помню). Блин, эта боль про бессоные ночи так знакома! 😂 Я вроде как, только картинки хотел генерить, а попутно в Фотошоп и в коды, уже приходится лазить)) И все же, это очень интересно 😂
спасибо
Спасибо за ролик. Много полезной информации для нашего Стайбл Дифьюзного сообщества 🤜🤛 Жалко, что не было гайда по настройке DreamBooth, придется смотреть у кого-нибудь ещё
Просят многие, сделаю)
Запилил видосик❤
Привет! У меня не работает расширение Dynamic tresholding. Оно дает эффект, но делает изображение еще хуже. Используешь ли ты какие либо настройки внутри расширения или может есть какие либо тонкости в его использовании? Заранее спасибо!
Да, неплохо было бы увидеть гайд)
@@Drakonhulio да, по дефолту без внесения изменений расширение странно работает
Не всегда получается его использовать на тех настройках, что я показал( Иногда придётся понижать CFG Scale расширения до 6-7, а оригинальный CFG Scale до 4-5 оригинальный
Подскажи, а если есть цель генерировать не картинки, а 3d, например в формате STL , то стейбл диффьюжн не подойдёт? А что подойдёт? Конечная цель получать модели коттеджей в 3d.
Где брать этот Revision?
почему явно не 4090? у меня 4090 ...хм
Здравствуйте. Из моря роликов по теме SD, решил остановиться на одном и послушать от начала до конца и это оказался вот этот ваш ролик. Ролик, вернее вас можно спокойно слушать и смотреть, вернее можно вас спокойно понимать. По-человечески всё рассказали, спасибо вам!
Вводишь людей в заблуждение. Особенно по LoRA. Посмотреть 3х блогеров и попробовать их настройки, не равно иследованию. Вы хоть понимаете, за что отвечает конкретный параметр при тренировке? Если у вас LoRA выдаёт плохие результаты, проблема не в ней, а в вас.
Прости что? Лоры плохо подходят для людей?
Именно так
Эксперименты это хорошо, но не когда генерит по 7 минут одну картинку, переключает модели подолгу, а иногда выдаёт серый прямоугольник как результат генерации((( GTX 1650, а толку...
тебе минимум надо 3060.
Спасибо за видео. А как сделать максимально быстро и просто(может даже не совсем качественно). Есть два конкретных человека. Как лицо одного человека заменить лицом конкретного другого человека? По работе приходится делать много подобных картинок. Например нужен какой то актер, или простой человек. Но фотографий с ним с лицензией Creative Commons нет! Приходится в фотошопе брать с бесплатных стоков человека, и заменять ему лицо на того который мне нужен. Тогда роботы видят такое изображение как обычное стоковое. Вот собственно и вся суть. Как заменить лицо одного человека, на лицо конкретного другого?
Плагин Revision - что за расширение такое, не нахожу его ?(
Кое-что есть полезное в видео, но гуляй лучше с подругами, а не с друзьями.
Забегая наперед - у меня Lora успешно натренилась на фотах с инстаграмма 30 штук. А вот дримбут на тех же фотах меня расстроил. Хотел больше 30-ти но муза перестала себя снимать в инсте крупным планом.))
репейники хорошие а вот лёд как будто бы стал хуже. Вывод - надо совмещать и комбинировать)
Проблемы со здоровьем у вас не от труда начались, а от негативного влияния г-на историка поносенкова. ))))))))
почему у меня вообще по другому выглядить Stable Diffusion?
все советы Хачатура дельные и правильные, в отличии от тебя он програмист, Лора из 25 картинок работает замечательно, твоя рекомендация просто косяк
далеко не все советы Хачатура дельные и правильные. То что он программист не делает его гуру. Он также часто втирает дичь в духе того как он предлагал установить cuDNN. И рассказывал как они ускоряют процесс генерации в разы. Хотя эти библиотеки и так стоят по умолчанию в А1111. А он запилил самораспак архив, на который ругались все антивирусники и рассказывал что так просто эти библиотеки установить ни у кого не получится, хотя там нужно 5 файлов скачать в определенную папку и все.
Как вы заколебали со своим Хачапури. Как будто только он один во всем ютубе по SD. Если вам нравится хачапури вот и смотрите его, а не делайте ему скрытую рекламу на канале других блогеров.
@@chelicer3471 Мне нравятся Хачапури с сыром они очень вкусные
@@jemov9612 🤣🤣🤣
Мой опыт к сожалению не может соответствовать вашему ответу(
ООчень интересно но ничего не понятно(
Вместо того, что получать результат методом тыка, автору полезно было бы больше поинтересоваться теорией. Лица на Лора получаються отлично. Просто надо понимать то, что делаешь и не придется нести чуш...
Много воды, затянутое видео и при этом нифига нет чо как делать. Типа вот такая штука, а разбирайся сам гыгы