Войти
АртФорумОбщее

Переносимая сборка Stable-Diffusion, достаточно распаковать и запустить (аналог DALLE-2, Midjourney) (4 стр)

Страницы: 1 2 3 4 5 6 Следующая »
#45
14:24, 8 сен 2022

Ну да, это я для тех, кто ошибочно ориентируется только на красивые рисунки из восторженных статей. :)

#46
14:29, 8 сен 2022

Вот что реально не хватает, так это как в нейросети GauGAN2 от NVIDIA можно обозначить то место, где будет генерация (там дерево - здесь человек). Это нужно для того, чтобы лучше контролировать композицию.

#47
14:55, 8 сен 2022

GDR
> Ну да, это я для тех, кто ошибочно ориентируется только на красивые рисунки из
> восторженных статей.
Просто там они умалчивают, что сначала картинка выбирается из 10,000 вариантов с тщательно выверенным промптом, после чего картинка дополнительно доводится нейросетью через img2img, чтобы избавиться от косяков.

711
Всё это есть - img2img

#48
15:11, 8 сен 2022

Интереснее было бы посмотреть кол-во исходников по лексемам, чтобы знать по каким тематикам сеть хорошо обучена, а по каким не очень (танки - явно, недообучена).

#49
19:32, 8 сен 2022

GDR
> танки - явно, недообучена

+ Показать
#50
20:16, 8 сен 2022

Да? Странно, вроде бы по аниме/мангам как раз проще всего было бы научить.

#51
20:18, 8 сен 2022

GDR
> Да? Странно, вроде бы по аниме/мангам как раз проще всего было бы научить.
Ощущение такое как будто по аниме тегам оно обучено еще году в 2010-м гуглом на оригинальной нейросетке.
Тогда просто тохо бум был и количество пикч по нему было огромным.

#52
20:28, 8 сен 2022

Вроде ж балдёжно генерит, или я чего-то не понимаю?

000001-4199280768

#53
20:28, 8 сен 2022

Год сам по себе значения не имеет, но да, если исходники выбран неудачно (а тупая выборка первых 1000 картинок по одному ключевому слову - это почти всегда неудачно), то будут вот такие эффекты.

По аниме проще, потому что ниша очень удачная - несколько десятков основных популярных наименований, большой датасет картинок неплохого (для своего жанра) качества и анализа. В отличие от советских мультиков, наверное.

Для НС хорошо соотношение keyword-data, грубо говоря, 30-70*200-1000, а не 5*1000 или 100*50.

#54
20:30, 8 сен 2022

arte_de_mort
> Вроде ж балдёжно генерит, или я чего-то не понимаю?

Да нормально генерит, зависит от поисковой строки и что хочется получить.

#55
20:31, 8 сен 2022

Просто доп.обработка нужна (неправильное ухо, недорисованное ожерелье, оторванная рука и т.д.)

#56
20:33, 8 сен 2022

arte_de_mort
> Вроде ж балдёжно генерит, или я чего-то не понимаю?
Это не совсем аниме стилистика. Это скорее скормленные аниме контуры обрисованные художественно, с чем оно справлется хорошо.

#57
20:39, 8 сен 2022

В дискорде дифьюжна много всякого аниме генерят, типа таких :) Вроде там ещё форк сделали под вайфу дивьюжн, значит скоро будет хорошо натренированный вайфу генератор.

Изображение
#58
(Правка: 20:50) 20:47, 8 сен 2022

arte_de_mort
> В дискорде дифьюжна много всякого аниме генерят, типа таких :)
хм, может проблема в обрезанном для памяти стейбл дифьюжне и туда просто не попало обучение
на современной аниме стилистике, поэтому оно и выдает 2005-ый год и тоху? :)

+ Показать
#59
20:52, 8 сен 2022

У тебя скорее всего промпты просто кривые, делай лучше! :)
Я в основном более детальные портреты пробовал, поэтому по аниме не знаю хороших промптов.

000001-1442793269

Страницы: 1 2 3 4 5 6 Следующая »
АртФорумОбщее